寂静回声 发表于 前天 21:39

通过寻找某个科幻小说来说明什么是大模型的幻觉

https://s3.bmp.ovh/imgs/2025/12/17/09f5c379311c5c0c.jpg


千问大模型的回答
https://s3.bmp.ovh/imgs/2025/12/17/9ddc1f3690cf20b3.jpg

Qwen3-Max-Thinking-Preview是千问大模型系列中专为复杂推理与深度思考优化的模型,从回答用时看用了66秒。

但内容却是完全瞎编的
https://s3.bmp.ovh/imgs/2025/12/17/2b65100fb41092af.jpg
还有王晓达的简历也是瞎编的,王晓达(华达),本名王孝达,江苏苏州人。1939年8月生于苏州,1961年毕业于天津大学机械系,先后在成都汽车配件厂、成都工程机械厂从事技术工作,1979年后任教于成都大学,曾任《成都大学自然科学学报》常务副主编、编室主任、编审、教授。1979年王晓达发表处女作科幻小说《波》,后陆续发表50多篇科幻小说及200多篇科昔、科学文艺作品,共约200多万字。有多篇作品被译为英、德、日和世界语在海外发行。曾先后获国家、部省级科学文艺、科普、文学奖五十多项。
人家是任教于成都大学,生成式AI编了个成都科技大学。
1994年,成都科学技术大学与四川大学合并,成立四川联合大学。
至于1980年代初期在中国非常有影响力的一部科幻作品,确实曾在《知识就是力量》等科普杂志上连载。完全瞎编,别看用了确实二字。
这就叫大模型ai幻觉。就是它已经是深度思考的作为复杂推理而诞生的模型还又联网搜索了,结果还是胡编。

豆包大模型的回答
https://s3.bmp.ovh/imgs/2025/12/17/3f282b85eede2d2a.jpg

https://zh.moegirl.org.cn/%E7%9A%AE%E7%9A%AE%E9%B2%81%E6%80%BB%E5%8A%A8%E5%91%98
豆包大模型的回答准确,但这是通过搜索网页加以验证的。
正如发现千问大模型的扯淡一样,你没有搜索引擎,怎么证明生成式ai的回答就一定是对的?
要么就像八爷那样博览群书,无所不知。

这个案例说明哪怕是闲扯淡,都没法完全相信大模型ai的回答。
正如我上次问Kimi大模型五两半是多少克?然后大模型告诉我,一斤等于16两,并巴拉巴拉一顿换算。

最后阅读下30年前的科幻短文吧,当年也不算出彩。毕竟当年变形金刚、麦克瑞一号、百变雄师等美国动画已经风靡中国大陆了。
https://www.doc88.com/p-9532706792850.html
页: [1]
查看完整版本: 通过寻找某个科幻小说来说明什么是大模型的幻觉