机械荟萃山庄

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 310|回复: 0

国产大模型deepseek吹过头了 要露馅的

[复制链接]

2万

主题

2万

帖子

18万

积分

超级版主

Rank: 8Rank: 8

积分
180042
发表于 2025-1-27 14:53:18 | 显示全部楼层 |阅读模式
本帖最后由 寂静回声 于 2025-1-27 21:55 编辑
















下面是我的测试感受,联网搜索功能方面,deepseek的联网搜索功能一大突出问题,不给引用信息源链接。与文心大模型、星火大模型、豆包大模型、kimi大模型完全不同,这些大模型或多或少会给出信息源链接,kimi大模型甚至能给出多达50多个网页链接。给出信息源链接的好处就是让众人明白,回答不准确是信息源的问题,还是大模型自己在胡诌。甚至在使用kimi大模型时,根本不看大模型根据网页整理的答案,而是去阅读大模型引用的那几十个网页。因为这种从联网搜索中获取信息的大模型通常是东抄一条西抄一条给出的回答。如果用于写片汤文章,倒是无关紧要。但只要是办正经事就不行

问”计算器app的弧度与角度转换“,kimi大模型不注重自己的训练数据,直接抄网页,结果那网页都什么答案。
弧度与角度的转换就是rad键代表此时是弧度制,deg键代表此时是角度制。这有人真心提问,那不是直接被坑死吗。

问“orign os4 批量删除短信” kimi大模型这个大聪明,在阅读了39个网页后,直接把一篇关于苹果手机如何批量删除短信的帖子给整理成orign os4 批量删除短信的答案了,属于胡编乱造的那种。 ​​​

基本联网搜索的大模型都是这番操作,所以deepseek也不例外。你不给信息源链接,是怕使用者发现你没有判断好坏的能力而直接瞎抄,还是想把锅都背到自己身上吗。
deepseek还有一个“深度思考模式”,被吹的神乎其技的。然而这个所谓的“深度思考模式”一旦用到文本提问上,也照样拉垮。


问"ISO 21771对应的中国标准" 让deepseek使用深度思考模式回答这个提问时,完全没看出有什么正面帮助。
该胡说照样胡说,正确答案是ISO 21771齿轮.圆柱渐开线齿轮和齿轮副.概念和几何学
Gears - Cylindrical involute gears and gear pairs - Concepts and geometry。



提问“请用三个字解释黑洞?”通义大模型和deepseek深度思考模式分别作了回答,答案都可以接受。但问题是deepseek使用了深度思考模式,花费了很长时间,选了无数个三个字组合,最后的结果与不使用深度思考模式的通义大模型的回答没大差异。



文本内容不适合深度思考,那纯计算呢,比如
http://jixietop.top/forum.php?mo ... 7%E6%A8%A1%E5%9E%8B
别说深度思考了,不深度思考也不支持识图,它只能识别图中的文字,看懂整个图目前不具备这个能力。
http://jixietop.top/forum.php?mo ... 7%E6%A8%A1%E5%9E%8B
所有国产推理模型,包括deepseek的深度思考模式,结果全错,就GPT-o1答对了。国产大模型个个号称超越o1,一实战全趴下。

所以总结下来就是既不使用“深度思考模式”,也不使用“联网搜索”功能的deepseeek,不如通义大模型和豆包大模型。

使用了“联网搜索”功能的deepseek,水平与kimi大模型差不多,但完全看不到信息源链接。
使用了“深度思考模式”的deepseek,文本推理水平一般,与通义大模型没什么差别。
计算推导公式方面,在所有国产推理模型中锉子里拔大个。但想与o1论高低,它还不够级。
当然不管什么大模型,在998面前都是渣渣,大伙同不同意啊^_^





本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|机械荟萃山庄 ( 辽ICP备16011317号-1 )

GMT+8, 2025-2-23 00:43 , Processed in 0.089485 second(s), 21 queries , Gzip On.

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表