机械荟萃山庄

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 182|回复: 0

deepseek之类的推理大模型用处有限

[复制链接]

2万

主题

2万

帖子

18万

积分

超级版主

Rank: 8Rank: 8

积分
180042
发表于 2025-2-1 10:50:33 | 显示全部楼层 |阅读模式
本帖最后由 寂静回声 于 2025-2-1 18:08 编辑

如果是涉及到已经有定论的基础知识,常识规律的,你让推理模型费时费力一通分析,比如deepseek深度思考模式,那答案与不使用推理模型的普通大模型的回答基本一致。




真要问点硬货,deepseek又开始躺平。

其它国产推理模型也没好哪去,胡诌一气。



这一点推理模型反倒不如通义大模型

通义大模型会告诉缺参数,的确998都说了,有些参数是秘而不宣的,大模型就应该无法计算。
但应该老实承认不会,而不是继续唬人。

现在deepseek水军们就是这么使用的

鼓吹deepseek的帖子却什么数学公式微积分的提问都看不到。

而其它类型的问题根本没必要使用deepseek深度思考模式,别家大模型也能做到的。

所以deepseek深度思考模式应用范围很窄的

就是个数学软件和代码处理,还容易不准确。

但不使用深度思考模式,那deepseek立刻泯然于众人,与其它国产大模型没什么区别,甚至更差。

deepseek因为太招摇,被发现使用了模型蒸馏技术,但通义大模型也不比它强到哪。

GPT们在机械设计上胡说八道,国产大模型也跟着胡说八道。

主要是国产大模型在蒸馏数据时竟然不验证数据,毕竟验证得花钱找明白人。

有网友扒出DeepSeek公司股权架构异常的复杂。杭州深度求索人工智能基础技术研究有限公司的上下游分别由四层层层套嵌的股权公司,上层有三个,分别是宁波程恩企业管理咨询合伙企业、宁波程普商务咨询有限公司、宁波程信柔兆企业管理咨询合伙企业,下层有一个,即北京深度求索人工智能基础技术研究有限公司。在上述所有股权公司中,梁文峰占有的总股权约为83.37%。也就是梁文峰是大老板,但他为何要把股权架构搞的如此复杂呢?为什么又要在宁波呢?可能是为了避税,也能是为了规避违规操作后被追诉时金蝉脱壳,还有可能是方便见不得光的资本流动。总之,背后的原因一定不简单,疑团重重。日前又在低度炒作阿里巴巴AI超越Deepseek,这一切是否和二号李强有关,外界不得而知,如果真是这样,李强这回马屁可是拍在了马腿上了。

梁文锋近期还表示,之所以是采用开源方式是因为他的团队致力于对科技创新生态的维护,而不是出于商业目的。梁文锋的表述非常不能自洽,如果不是为了商业目的,为何要选择做幻方私募投资?幻方量化对冲基金成立于2015年,十年前正是中共芯片大跃进时代,梁文锋完全可以杨开理想风帆大干一场啊?为什么不呢?2021年底,幻方量化旗下产品业绩不佳,其旗下100余款产品业绩下跌逾10%,造成投资者资产严重损失。2023年7月成立杭州深度求索人工智能基础技术研究有限公司,梁文峰号称背后有136人的TOP学府年轻科技团队,就算每人年薪50万计算,光人员费用一年也要6800万元,梁文峰所说的560万美元大糢型语言训练成本根本就是胡扯。
DeepSeek宛如一部刚开播就一飞冲天,但瞬间不得不杀青的抗美神剧。它被描述为是一位名不经传的数学怪才叠加私募高手,外挂AI天才少女和一群来自TOP学府科技小清新们的丛林创业与励志故事。

一拨从未跨国洋出过海,从小就被党文化教育阉割过的大脑,只是站在了涂抹鲜艳民族主义色彩的科技创新高点上,貌似反叛而又包容性地扔出了一串所谓开源代码,无须科学积累与基础研究时日,看不到聚沙成塔的变量轨迹,从未有过失败与挫折,更勿须庞大的科技创新资本与优良的体制土壤,赤手空拳赤身裸体,居然就能隔空手撕美帝硅谷科技大佬与华尔街资本大鳄。
整个宛如“神创”的过程,外界看不到任何一点痕迹和听不到一点声向,只能是在突发的某一时间节点,满耳满屏满心惶恐开放的都是舆论核弹爆发的蘑菇云,小粉红们自我陶醉和喧嚣尘上的傲娇糢样,西方媒体惊呼这是AI界的珍珠港事件与斯普特尼克危机。

美国中情局原分析师、现任美国智库詹姆斯敦基金会总裁Peter Mattis本周四在国会听证中,谈到类似DeepSeek的中国平台对美国及国际社会构成的威胁:“首先,这是一种数据收集的努力,人们与系统互动越多,数据就越多。这可以追溯到华为电信设备上的后门软件。……第二,这些模型在国际数据集上训练得越多,我们就越能看到中国使用自动的虚假信息系统和宣传系统的有效性(增加)。这些东西越好用,就越难对付,越难识别,越难关闭。”

Mattis建议,美国应该如禁止TikTok一样封禁DeepSeek这样的平台,因为它们都可同样被用来传播中共的叙事:“这场叙事之争实际上不仅仅是不同叙事之间的斗争,而是一场平台和渠道的竞争。如果愿意的话,这些平台和渠道可以让叙事流动起来,让它们被推出去。”
为何不把监管也执行到模型层面?“因为做到大模型这个层面,它这个大模型的智商就会下降。因为正常的,它都是按逻辑推理的。但是那个(自我审查的)逻辑是一个彻底的毁坏大脑的逻辑。它要按那样训练,那这个系统就完蛋了。“

法国资料监管机构“资讯与自由全国委员会”(CNIL)也表示,法国将向DeepSeek官方询问,以了解其人工智能聊天机器人运作方式以及资料保护的相关风险。
韩国个人资料保护委员会(Personal Information Protection Commission)官员告诉法新社:“我们打算最快在周五提出书面要求,以取得DeepSeek如何处理个资的相关资讯。”


这不是五毛的混账逻辑吗?竟然把这个学会了,不愧被官方大肆推广。







本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|机械荟萃山庄 ( 辽ICP备16011317号-1 )

GMT+8, 2025-2-23 00:54 , Processed in 0.092977 second(s), 21 queries , Gzip On.

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表