全球文生图大模型都分不清左右手

寂静回声 发表于 2025-6-1 09:26:22

本帖最后由寂静回声于 2025-6-1 09:34 编辑

提示词很简单:“画左撇子喝水的”
https://s3.bmp.ovh/imgs/2025/06/01/7e4a86ef4c2f6843.jpg
https://s3.bmp.ovh/imgs/2025/06/01/d5c95d48d1e18e04.jpg
https://s3.bmp.ovh/imgs/2025/06/01/9caf17ad88315d27.jpg

https://s3.bmp.ovh/imgs/2025/06/01/de3cf099c909b917.jpg
https://s3.bmp.ovh/imgs/2025/06/01/d1bc5e3a356d31e9.jpg
https://s3.bmp.ovh/imgs/2025/06/01/5bc640e8fdefa96a.jpg
https://s3.bmp.ovh/imgs/2025/06/01/cff9133f139d7308.jpg
https://s3.bmp.ovh/imgs/2025/06/01/1eb34c8be9660802.jpg
这个简单的测试，直接暴露了现在几乎所有 AI 绘图模型都左右不分。Gemini，Grok 和豆包、可灵是完全不分左右，它们画不出来，倒也情有可原。GPT4o 是在能分清左右的情况下，依旧无法生成“左撇子”有关的内容，这就很有意思了。所以，它们依旧不懂物理规律。产生这种现象的最直接原因是左撇子仅占全球人口的 10-15%，因此绝大多数训练图像都右撇子。而且训练 AI 的数据集中，一般也不会标注出“左手拿杯子喝水”这种比较细节的内容。因此，AI 会简单的认为：喝水=右手动作。只是根据其数据集的统计概率生成图像，不是真正的理解。所以，AI 就是稳定的无法画出“左撇子”的任何动作？

点评
用通义文生图试了一下，确实直接就生成了用右手喝水的图片，但是当指出图中的手是右手时，它又生成了左手拿水杯的图片，但是没有喝水的动作了。

页: [1]

机械荟萃山庄's Archiver

全球文生图大模型都分不清左右手