寂静回声 发表于 2025-3-17 15:12:20

指望大模型给个鸡毛赐教


https://s3.bmp.ovh/imgs/2025/03/17/bbf096a9b0efcaee.jpg



测试下国产几个深度思考模型
通义QwQ推理模型,用时14秒。

先给计算公式,然后去找行业标准,最后要求实验测试。

又讲了几个关键因素,最最后来了个建议。

kimi1.5长思考模型
先是查阅标准,然后再给出计算公式。最后也要求实验测试,又提了要参考同行,最最后是要考虑环境因素。

deepseek深度思考,用时23秒。
先给计算公式,然后去找行业标准,最后要求实验测试。

豆包深度思考
先是查阅标准,然后再给出计算公式。最后也要求实验测试。

咱就说这回答有什么差异吗,而且计算公式是从网上抄的。这就像之前问楔键强度校核一样,无论国内国外,大模型都在胡扯。因为它们没搞明白,楔键的工作面在哪。
https://s3.bmp.ovh/imgs/2025/03/17/80e8166bc12385b8.png
https://s3.bmp.ovh/imgs/2025/03/17/6438453da8c5a7f9.png
大模型们也没搞明白螺栓拧紧时整个工作状态


页: [1]
查看完整版本: 指望大模型给个鸡毛赐教