机械荟萃山庄

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 59|回复: 0

AI搜索当权威 研究显示错误率高达60%

[复制链接]

2万

主题

2万

帖子

18万

积分

超级版主

Rank: 8Rank: 8

积分
181909
发表于 7 天前 | 显示全部楼层 |阅读模式
哥伦比亚大学数字新闻研究中心(Tow Center for Digital Journalism)近期对八款 AI搜索展开研究,包括ChatGPT Search、Perplexity、Perplexity Pro、Gemini、DeepSeek Search、Grok-2 Search、Grok-3 Search和 Copilot。
他们的研究方法是从20家新闻机构选取200篇新闻报道,并评估它们是否正确引用了文章内容、来源和原始链接。最终结果分为完全错误、部分错误、正确但不完整、完全正确、拒绝回答五种标签。

研究结果显示:
1、AI搜索通常不会回答它们无法准确回答的问题,平均来看,六款AI搜索提供的答案有60%是不准确的。其中Grok3、Gemini的完全错误率高达90%以上,国内的DeepSeek表现中等(完全错误率大约58%)。

2、与免费AI搜索相比,付费的AI搜索更不容易拒绝回答,从而会更“自信”地提供错误答案。

3、多个AI搜索似乎绕过了robots限制协议。

4、AI搜索会伪造链接,并引用文章在新闻聚合平台的链接(比如雅虎新闻),而不是原始网站。

5、尽管许多新闻媒体与AI搜索达成了版权合作,但在AI搜索里的新闻引用仍不准确。

在川普政府2月25日发起的《AI行动计划》政策提案中,近期,OpenAI提交一份了建议书,呼吁美国制定版权战略,以“保护美国AI大模型从受版权保护的材料中学习的能力”。 AI公司可以自由使用受版权保护的材料,训练 AI模型。
OpenAI指出,各州已提出781多项与AI相关的法案,这些法案对国内公司施加了过多的合规要求,阻碍了 AI公司的创新能力,并削弱了美国企业家可用的训练数据质量。公司建议政府为私营部门提供“法律救济”。
谷歌紧随OpenAI之后,发布政策提案,称“合理使用和文本及数据挖掘例外”对于AI科学创新“至关重要。谷歌同样呼吁将AI公司的“合理使用”权利编入法律,使其能够使用公开数据(包括受版权保护的数据)进行训练,而不受任何限制。

3月13日,美国网络安全公司 Symantec通过一项测试指出,AI智能体已突破传统工具功能限制,可轻松协助黑客发起钓鱼攻击。
“一年前,当我们介绍人工智能带来的风险时,我们认为虽然当时AI已经被攻击者使用,但它们在很大程度上是被动的,只能协助写一写网络钓鱼材料等任务。”研究人员强调,加入操作能力成为智能体后,AI正从被动辅助转向“主动执行”,成为网络安全的新威胁。
该安全公司选择了一名团队成员发起攻击操作,结果发现,通过简单的提示词修改(prompt engineering),即可绕过OpenAI智能体 Operator的安全显示,编写恶意代码、向攻击目标发送钓鱼邮件。

3月14日,国家互联网信息办公室、工业和信息化部、公安部、国家广播电视总局发布《人工智能生成合成内容标识办法》(下称《标识办法》),自2025年9月1日起施行。
《标识办法》要求,服务提供者提供的生成合成服务属于《互联网信息服务深度合成管理规定》第十七条第一款情形的,应当按照要求对生成合成内容添加显式标识;服务提供者应当按照《互联网信息服务深度合成管理规定》第十六条的规定,在生成合成内容的文件元数据中添加隐式标识;提供网络信息内容传播服务的服务提供者应当采取技术措施,规范生成合成内容传播活动。

3月11日,微博宣布启动治理。微博社区治理官方账号发文称,治理的重点领域是社会民生、突发事件、科普医疗和个人权益,会对不同情况予以处置。
具体而言,如果账号的单条内容由 AI生成且未主动标识,微博称会主动打标,提示“疑似由 AI生成”;如果账号有多条AI内容都未标识,会限制流量分发;如果这些内容造成了恶劣影响,则可以禁言乃至封号。
AI谣言泛滥的问题不止微博一家碰到。今日头条在近期的治理开放日透露了一组数据:去年打压了超过93万条低质AI内容,处罚了近3万个利用AI批量发布虚假、低质内容或恶意洗稿、抄袭的账号。与微博的举措类似,今日头条在收严对低质AI内容的审核力度,另外监测AI内容的整体流量占比。







回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|机械荟萃山庄 ( 辽ICP备16011317号-1 )

GMT+8, 2025-3-26 01:41 , Processed in 0.084283 second(s), 20 queries , Gzip On.

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表