엔비디아의 H100은 정답이 아니다: AI 비용의 90%를 차지하는 ‘추론(Inference)’의 경제학

AI 모델을 만드는 ‘학습’보다 실시간으로 구동하는 ‘추론’ 비용이 기하급수적으로 증가하고 있습니다. 엔비디아의 독주를 위협하는 LPU(Groq)와 NPU 기술, 그리고 효율성(Efficiency) 중심으로 재편되는 반도체 시장의 흐름