全球文生图大模型都分不清左右手
本帖最后由 寂静回声 于 2025-6-1 09:34 编辑提示词很简单:“画左撇子喝水的”
https://s3.bmp.ovh/imgs/2025/06/01/7e4a86ef4c2f6843.jpg
https://s3.bmp.ovh/imgs/2025/06/01/d5c95d48d1e18e04.jpg
https://s3.bmp.ovh/imgs/2025/06/01/9caf17ad88315d27.jpg
https://s3.bmp.ovh/imgs/2025/06/01/de3cf099c909b917.jpg
https://s3.bmp.ovh/imgs/2025/06/01/d1bc5e3a356d31e9.jpg
https://s3.bmp.ovh/imgs/2025/06/01/5bc640e8fdefa96a.jpg
https://s3.bmp.ovh/imgs/2025/06/01/cff9133f139d7308.jpg
https://s3.bmp.ovh/imgs/2025/06/01/1eb34c8be9660802.jpg
这个简单的测试,直接暴露了现在几乎所有 AI 绘图模型都左右不分。Gemini,Grok 和豆包、可灵是完全不分左右,它们画不出来,倒也情有可原。GPT4o 是在能分清左右的情况下,依旧无法生成“左撇子”有关的内容,这就很有意思了。所以,它们依旧不懂物理规律。产生这种现象的最直接原因是左撇子仅占全球人口的 10-15%,因此绝大多数训练图像都右撇子。而且训练 AI 的数据集中,一般也不会标注出“左手拿杯子喝水”这种比较细节的内容。因此,AI 会简单的认为:喝水=右手动作。只是根据其数据集的统计概率生成图像,不是真正的理解。所以,AI 就是稳定的无法画出“左撇子”的任何动作?
点评
用通义文生图试了一下,确实直接就生成了用右手喝水的图片,但是当指出图中的手是右手时,它又生成了左手拿水杯的图片,但是没有喝水的动作了。
页:
[1]