醒醒,这不太现实。
不过,2025年的AI算力市场或将迎来转变。
一方面,行业重点将从“训练模型”转向“模型推理”,意味着对推理基础设施的需求呈现上升趋势。例如,无论是OpenAI的o1和o3模型,还是Google的Gemini 2.0 Flash Thinking,均以更高强度的推理策略来提升训练后的结果。
另一方面,训练好的大模型需要通过AI推理才能落地到各类场景中,随着千行百业的深入采用,AI工作负载格局将发生转变。例如,Open AI创建Sora代表着AI训练,而用户让Sora生成一段视频则代表着一个推理工作负载。
换句话说,大规模训练工作负载是“研发阶段”,推理工作负载是“商业化阶段”,你想在AI领域赚钱,就要扩大推理工作负载。
巴克莱研报显示:目前,AI推理计算需求将快速提升,预计其将占通用人工智能总计算需求的70%以上,推理计算的需求甚至可以超过训练计算需求,达到后者的4.5倍。
2025年,这些演变将为自身“推理”过硬的“小”芯片公司提供发育空间。
这不,别人赶着新年送祝福,而Groq、SambaNova、Positron AI等专注于推理的初创公司则是向霸主英伟达纷纷亮出了虎牙。
一、一次讲透推理芯片&训练芯片
如果我们将AI训练比作让模型“考驾照”,那么推理就是让模型“上路”。
训练阶段,你要请“教练”(优化算法)“指导”(反向传播和参数调整)模型;推理阶段,“驾驶员”(模型)要基于自己学到的知识技能,灵活应对实际路况。因此,推理阶段只涉及前向传播,通常比训练阶段更高效。
对应到芯片,训练芯片具备更高的计算能力,旨在支持训练过程中的大量计算和数据处理;推理芯片通常靠较少的计算能力完成工作。
|