机械荟萃山庄

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 377|回复: 5

强如GPT-4o也在这个基础问题上犯蠢

[复制链接]

2万

主题

2万

帖子

17万

积分

超级版主

Rank: 8Rank: 8

积分
174322
发表于 2024-9-26 13:35:23 | 显示全部楼层 |阅读模式
本帖最后由 寂静回声 于 2024-9-26 15:59 编辑

还是那个异步电机的磁极对数与同步转速的关系的计算公式


最下边显示此时的模型是4o



4o在强词夺理方面比国产通义大模型强,通义大模型在这块根本不解释。

关于公式的常数为什么是120,昨天问通义大模型也是这么解释的,怀疑它们使用了同一个训练数据集。

再问国产kimi,还是这个公式。



反正问来问去,4极电机的同步转速又变成了3000rpm

而解释公式中的常数为什么是120,kimi的回答居然与GPT-4o、通义大模型完全一样。


再问国外的Iask AI搜索,回答完全正确。


腾讯元宝大模型好歹给国产大模型挣回脸面,因为元宝AI也是像AI搜索,先搜索网页,后整理结果。
总结起来,目前答对的AI有国产的豆包、元宝、文心一言3.5,及国内国外的AI搜索们。
答错的如通义大模型、智谱大模型、星火大模型、kimi大模型,还有GPT-4o,它们的共同特点是前者成天说自己已经超越了后者,后者也宣称自己是全球第一。而且回答问题的用词竟然很相似,很难不让人怀疑是套壳了还是共用了一套训练数据集。
而o1没法测试,因为在GPT-plus中手动选择,而GPT-plus是每月200美元的付费版。虽然Claude 3.5 Sonnet各项评估号称指数力压Claude 3 Opus 和 GPT-4o,但Claude官网注册比较复杂还容易封号,所以海外的有钱人有兴趣的可以测试一下。
=============================
37大侠建议用英文提问,看看这帮大模型是否还那么中二?

通义大模型

智谱大模型

kimi大模型

星火大模型

minimax的海螺大模型

GPT-4o

不死心又问GPT-4o为什么常数是120啊,人家还叭叭解释一通呢。
照这趋势,以后科学常识真是黑白颠倒啊。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

299

主题

6743

帖子

3万

积分

论坛元老

Rank: 8Rank: 8

积分
36178
发表于 2024-9-26 13:40:42 | 显示全部楼层
天花板大侠,建议你用英文测试一下。
因为他们训练肯定是用中文资料的,简中网内容简直事泥沙聚下,
所以训练出来的AI水平也不行,正常。
我常用的是直接英文提问,回答结果基本上都很满意。
或者您用简中问,要求它用英文答,试试看,效果肯定比简中回答要好。

点评

卧槽,板侠,用GPT之前,先沐浴,斋戒三天,说不定就成了  发表于 2024-9-26 21:42
从国产到4o都用英文问了,还是那个jb样。也许是时辰关系,要不然换个日子提问。  发表于 2024-9-26 16:01
然也,中文AI就是扯淡,逗乐,聊天,干正事太不靠谱  发表于 2024-9-26 14:02
我现在是用CHATGPT检索,然后按照检索去找资料,这个比较爽,但是咨询技术细节不行,经常驴头不对马嘴;对了,从来不用中文的chatgpt,那是垃圾;  发表于 2024-9-26 13:45
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|机械荟萃山庄 ( 辽ICP备16011317号-1 )

GMT+8, 2024-11-22 11:56 , Processed in 0.090556 second(s), 21 queries , Gzip On.

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表