下给英伟达的新年战书，“小”芯片公司们喜迎2025年

水煮鱼 · 2025-1-5 21:32:44

醒醒，这不太现实。

不过，2025年的AI算力市场或将迎来转变。

一方面，行业重点将从“训练模型”转向“模型推理”，意味着对推理基础设施的需求呈现上升趋势。例如，无论是OpenAI的o1和o3模型，还是Google的Gemini 2.0 Flash Thinking，均以更高强度的推理策略来提升训练后的结果。

另一方面，训练好的大模型需要通过AI推理才能落地到各类场景中，随着千行百业的深入采用，AI工作负载格局将发生转变。例如，Open AI创建Sora代表着AI训练，而用户让Sora生成一段视频则代表着一个推理工作负载。

换句话说，大规模训练工作负载是“研发阶段”，推理工作负载是“商业化阶段”，你想在AI领域赚钱，就要扩大推理工作负载。

巴克莱研报显示：目前，AI推理计算需求将快速提升，预计其将占通用人工智能总计算需求的70%以上，推理计算的需求甚至可以超过训练计算需求，达到后者的4.5倍。

2025年，这些演变将为自身“推理”过硬的“小”芯片公司提供发育空间。

这不，别人赶着新年送祝福，而Groq、SambaNova、Positron AI等专注于推理的初创公司则是向霸主英伟达纷纷亮出了虎牙。

一、一次讲透推理芯片&训练芯片

如果我们将AI训练比作让模型“考驾照”，那么推理就是让模型“上路”。

训练阶段，你要请“教练”（优化算法）“指导”（反向传播和参数调整）模型；推理阶段，“驾驶员”（模型）要基于自己学到的知识技能，灵活应对实际路况。因此，推理阶段只涉及前向传播，通常比训练阶段更高效。

对应到芯片，训练芯片具备更高的计算能力，旨在支持训练过程中的大量计算和数据处理；推理芯片通常靠较少的计算能力完成工作。

热点推荐更多