机械荟萃山庄

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 111|回复: 0

全球文生图大模型都分不清左右手

[复制链接]

2万

主题

2万

帖子

18万

积分

超级版主

Rank: 8Rank: 8

积分
186028
发表于 4 天前 | 显示全部楼层 |阅读模式
本帖最后由 寂静回声 于 2025-6-1 09:34 编辑


提示词很简单:“画左撇子喝水的”









这个简单的测试,直接暴露了现在几乎所有 AI 绘图模型都左右不分。Gemini,Grok 和豆包、可灵是完全不分左右,它们画不出来,倒也情有可原。GPT4o 是在能分清左右的情况下,依旧无法生成“左撇子”有关的内容,这就很有意思了。所以,它们依旧不懂物理规律。产生这种现象的最直接原因是左撇子仅占全球人口的 10-15%,因此绝大多数训练图像都右撇子。而且训练 AI 的数据集中,一般也不会标注出“左手拿杯子喝水”这种比较细节的内容。因此,AI 会简单的认为:喝水=右手动作。只是根据其数据集的统计概率生成图像,不是真正的理解。所以,AI 就是稳定的无法画出“左撇子”的任何动作?

点评
用通义文生图试了一下,确实直接就生成了用右手喝水的图片,但是当指出图中的手是右手时,它又生成了左手拿水杯的图片,但是没有喝水的动作了。




回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|机械荟萃山庄 ( 辽ICP备16011317号-1 )

GMT+8, 2025-6-5 04:19 , Processed in 0.094021 second(s), 19 queries , Gzip On.

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表