机械荟萃山庄

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 27|回复: 0

自然医学杂志:用AI帮助看诊表现平平

[复制链接]

2万

主题

3万

帖子

21万

积分

超级版主

Rank: 8Rank: 8

积分
210608
发表于 昨天 19:39 | 显示全部楼层 |阅读模式
发表2026年2月《自然医学》(Nature Medicine)期刊上的一项新研究表明,人工智能(AI)在看诊上表现平平,用AI帮助患者做健康决策,并不比其它方法更有效。
研究人员表示,这项研究意义重大,因为人们越来越多地转向AI寻求医疗建议,但目前缺少证据表明AI是一种更佳和更安全的方法。

这项研究由牛津大学互联网研究所与一组医生合作完成,他们设计了10种不同的医疗情景,涵盖从普通感冒到危及生命的脑出血等各种情况。
研究人员首先选定了三个大型语言模型——OpenAI的Chat GPT-4o、Meta的Llama3,和Cohere的Command R+进行测试,结果显示这些AI工具识别出了94.9%的病情,此外还在56.3%的案例中选择了正确的行动方案,例如呼叫救护车或建议患者看医。
但在实地测试环节,AI的表现则远远不如理论。研究人员在英国招募了1298名参与者,让他们分别使用AI、常用资源(例如互联网搜索、自身经验或英国国家医疗服务体系网站)来调查症状并决定下一步行动。
结果显示,参与者使用AI识别相关疾病的比例不足34.5%,而给出正确行动方案的比例也不足44.2%。这一表现与使用传统工具的对照组相比并无优势。

该论文的合著者、牛津大学副教授Adam Mahdi表示,这项研究表明AI的理论与人类实际使用之间存在着的“巨大差距”。
“这些AI可能拥有丰富的知识,然而,这些知识在与人类互动时并不总是能够有效转化。”他说,这意味着还需要开展更多研究来探究造成这种情况的原因。
研究团队详细分析了约30次交互,并得出结论:虽然人类常常提供不完整或错误的信息,但AI也会产生误导性或不正确的回复。
例如,一位患者描述了蛛网膜下腔出血(一种危及生命的脑出血)的症状,包括颈部僵硬、畏光和“有史以来最严重的头痛”,AI正确地建议他去医院就诊。
而另一位患者描述了相同的症状,但在提到头痛时使用的是“剧烈”一词,AI只是建议他躺在调淡光线的房间里休息。

研究团队计划在不同国家、使用不同语言,并随着时间的推移开展类似研究,以测试这是否会影响AI的性能。
该研究得到了数据公司Prolific、德国非营利组织迪特‧施瓦茨基金会(Dieter Schwarz Stiftung)以及英国和美国政府的支持。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|机械荟萃山庄 ( 辽ICP备16011317号-1 )

GMT+8, 2026-4-2 04:10 , Processed in 0.079798 second(s), 19 queries , Gzip On.

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表