选择你喜欢的标签
我们会为你匹配适合你的网址导航

跳过将删除所有初始化信息

苹果炮轰AI推理模型：全是假思考！所谓思考只是一种假象

智能 2025-06-09 08:41

声明：该文章来自（快科技）版权由原作者所有，K2OS渲染引擎提供网页加速服务。

苹果近日发表了一篇研究论文，称推理模型全都没真正思考，无论DeepSeek、o3-mini还是Claude 3.7都只是另一种形式的“模式匹配”，所谓思考只是一种假象。

有人总结到：苹果刚刚当了一回马库斯，否定了所有大模型的推理能力。

苹果团队认为，现有评估主要集中在既定的数学和编码基准上，看模型最终答案是否正确，但可能存在模型训练时见过类似题目。

并且，这些评估大都缺乏对“思考过程质量”的分析，比如中间步骤是否逻辑一致、是否绕弯路等。

为了更客观测试推理模型的推理能力，他们设计了4类谜题环境：汉诺塔、跳棋交换、过河问题、积木世界，并且这4类谜题的难度可以精确控制.

随着问题变难，推理模型初始会延长思考，但随后思考深度反而下降，尽管仍有充足token预算，它们却在最需要深入思考时选择了放弃！

并且，当问题复杂度继续增加并超过某个临界点时，无论是推理模型还是标准模型都会经历完全的性能崩溃，准确率直线下降至零。

对此，有网友讽刺到：“苹果拥有最多的资金，2年了也没有拿出像样的成果，现在自己落后了，却来否定别人的成果。”

据悉，Apple Intelligence在2024年WWDC正式亮相，在这一年里，苹果宣传中的许多功能都经历延期、不够完善甚至被下架。

不过也有人指出，这篇论文没有看上去那么消极，而是呼吁设立更好的推理机制和评估办法。

关注我们

[超站]友情链接：

四季很好，只要有你，文娱排行榜：https://www.yaopaiming.com/
关注数据与安全，洞悉企业级服务市场：https://www.ijiandao.com/

*文章为作者独立观点，不代表 0XUCN 立场

本文由 neko 发表，转载此文章须经作者同意，并请附上出处(0XUCN)及本页链接。

原文链接 https://www.0xu.cn/article/intelnet/intelligent/60168.html

快科技 DeepSeek o3-mini Claude 3.7 苹果 Apple Intelligence

图库

百度热搜榜

排名热点搜索指数

bgame.cn

分享文章

微信
微信扫码分享

新浪微博
离开
复制链接
返回顶部