GPT-5的发布反复推迟,部分人怀疑不会再有GPT-5,但有没有一种可能是:GPT-5早已在OpenAI运行起来,被蒸馏成小模型来获取更大收益。

1月17日,AI专栏作家Alberto Romero在The Algorithmic Bridge发表了一篇引人深思的文章,他通过一系列推理分析提出一个令人震惊的猜测:

OpenAI很可能已经开发出了GPT-5,但选择将其内部保留,而不是公开发布。

Romero认为,通过将GPT-5作为内部资源使用,OpenAI可以获得比直接向公众发布更大的投资回报。这种回报不仅仅是金钱,还包括技术进步和竞争优势。

Romero强调,这只是他基于公开信息的推测,并没有内部消息来源,但他认为这个假说能够很好地解释OpenAI近期的一些行为和策略。

无论最终是否证实,这种推测都为我们提供了一个有趣的视角,去审视AI巨头们的竞争策略。

Claude Opus 3.5的神秘消失

Romero首先从Anthropic公司的Claude Opus 3.5模型的“神秘消失”开始谈起:

2024年10月,业界普遍预期Anthropic会发布Opus 3.5作为对GPT-4o的回应,但出人意料的是,该公司只更新了Claude Sonnet 3.5版本。

10月28日,有传言称Sonnet 3.6是Opus 3.5训练失败的中间检查点。r/ClaudeAI subreddit上出现一篇文章,称Claude 3.5 Opus已被废弃,但该页面未提及Opus 3.5,有人猜测这是为融资保持投资者信任的战略举措。

11月11日,Anthropic首席执行官Dario Amodei在Lex Fridman播客上否认放弃Opus 3.5,称计划仍是推出Claude 3.5 Opus,态度谨慎但确认。

11月13日,彭博社报道证实传言,称Opus 3.5训练后表现虽优于旧版,但因模型大小及成本,优势未达预期。Dario未给出日期,因Opus 3.5训练未失败,但结果不佳,重点是成本与性能的平衡。

12月11日,半导体专家Dylan Patel及其团队给出最终解释,称Anthropic完成Claude 3.5 Opus训练且表现良好,但未发布。这是因为Anthropic没有公开发布,而是使用Claude 3.5 Opus来生成合成数据并进行奖励建模(通过各种手段构建奖励函数,引导智能体在强化学习中朝着期望目标学习和决策的过程),显著改进了Claude 3.5 Sonnet。

通过梳理各方信息,Romero推测Anthropic确实完成了Opus 3.5的训练,但由于性能提升不及预期,决定不予公开发布。相反,他们将Opus 3.5用于内部生成合成数据,以显著提升Sonnet 3.5的性能。

道具 举报 回复
您需要登录后才可以回帖 登录 | 注册

本版积分规则