机械荟萃山庄

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 441|回复: 8

苹果炮轰推理模型全是假思考

[复制链接]

2万

主题

2万

帖子

18万

积分

超级版主

Rank: 8Rank: 8

积分
187239
发表于 2025-6-11 10:19:58 | 显示全部楼层 |阅读模式
苹果最新大模型论文,在AI圈炸开了锅。
有人总结到:苹果刚刚当了一回马库斯,否定了所有大模型的推理能力。
这篇论文称推理模型全都没在真正思考,无论DeepSeek、o3-mini还是Claude 3.7都只是另一种形式的“模式匹配”,所谓思考只是一种假象。
这篇论文称推理模型全都没在真正思考,无论DeepSeek、o3-mini还是Claude 3.7都只是另一种形式的“模式匹配”,所谓思考只是一种假象。

再遇到真正高复杂度的任务时所有模型都会崩溃,即使给他们足够的时间和计算资源也无济于事。

作者中包括谷歌大脑创始人之一Samy Bengio(图灵奖得主Yoshua Bengio的弟弟)。
苹果团队认为现有评估主要集中在既定的数学和编码基准上,看模型最终答案是否正确,但可能存在数据污染(模型训练时见过类似题目)。并且,这些评估大都缺乏对“思考过程质量”的分析,比如中间步骤是否逻辑一致、是否绕弯路等。
为了克服这些限制,更客观测试推理模型的推理能力,他们设计了4类谜题环境。
巧妙之处在于,四类谜题的难度可以精确控制,同时保持逻辑结构的一致性,研究者能够系统观察模型在不同复杂度下的行为变化,比如生成的每一步移动是否正确、是否重复试错。
https://mp.weixin.qq.com/s/WRPjXZRm4QRGOUzsJ4FxGA




回复

使用道具 举报

301

主题

6915

帖子

3万

积分

论坛元老

Rank: 8Rank: 8

积分
37614
发表于 2025-6-11 10:25:38 | 显示全部楼层
科学和技术都是可以质疑的,在不断质疑中修正和发展,最终造福全人类。
对AI质疑是好事,且绝对有益的,目前的AI不具备人类思维和逻辑推理的
能力。
但是不妨碍AI现在水平已经应用在很多领域了。
回复 支持 反对

使用道具 举报

1

主题

365

帖子

4119

积分

论坛元老

Rank: 8Rank: 8

积分
4119
发表于 2025-6-11 10:28:45 | 显示全部楼层
“AI技术应该叫统计科学而不是推理模型”
回复 支持 反对

使用道具 举报

1万

主题

4万

帖子

28万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
281189
发表于 2025-6-11 12:09:58 | 显示全部楼层
哈 ,我很早说过,我不用!因为影响生意!耽误赚钱,身处唐朝,蒸汽机很遥远,也许有!
回复 支持 反对

使用道具 举报

14

主题

161

帖子

6025

积分

论坛元老

Rank: 8Rank: 8

积分
6025
QQ
发表于 2025-6-12 09:11:29 | 显示全部楼层
思考一个问题啊:假如说将来AI发展成熟了,所有活都让AI和机器人做了。那么人类就没有用了啊。

点评

那球迷有没有用?  发表于 2025-6-12 12:15
开辟新路线,星际殖民,哈哈!  发表于 2025-6-12 09:48
回复 支持 反对

使用道具 举报

319

主题

2308

帖子

2万

积分

论坛元老

Rank: 8Rank: 8

积分
20620
发表于 2025-6-12 18:57:10 | 显示全部楼层
AI太虚了
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|机械荟萃山庄 ( 辽ICP备16011317号-1 )

GMT+8, 2025-6-30 13:43 , Processed in 0.103080 second(s), 24 queries , Gzip On.

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表