在开发者群体中,AI 编程已经有了很高的采用率。比如据 IDC 2025 年 6 月发布的《 中国市场代码生成产品评估,1H25 》,彼时美国已有 91% 的开发者使用 AI 工具,而中国开发者的 AI 覆盖率在 30% 。
但另一方面,有一个核心指标却鲜被提及,这个指标其实更加接近个人和企业是否接受 AI 的核心目标,也就是 ROI 的提升。
这个指标叫采纳率,采纳率是指,AI 生成的所有内容中,人类最终采纳的内容量的比例。比如 AI 生成了 1000 行代码,人类采纳了其中 300 行,那采纳率就是 30% 。
基于 Zoominfo 2024 年 11-12 月的内部调研显示( 团队涉及 400 多名开发者 ),他们对 GitHub Copilot 生成的代码的平均采纳率为 20%( 按接受代码行数衡量 )。
基于 SoftDoc 2025 年上半年的内部调研显示,该公司的 AI 生成代码建议被接受比例在 13% 到 21% 之间( 按接受代码行数衡量 )。
最新数据由 DX AI 提供,他们发布的《 AI-assisted engineering: Q4 impact report 》( 对 13.5 万多名开发人员的分析 )显示,合并代码中有 22% 是由 AI 编写的。
所以,按照目前公开数据显示,虽然从 24 年至今大家觉得 AI 一直在变强,但 AI 编程工具的输出采纳率总体还是偏低的,在 20% 左右。
知危接触并询问国内一些大模型厂商的工作人员,未能得到相关数据。并且不管是使用方还是供应商,都认为这个指标是不容易衡量和获取的。
这一点不难理解,如果每一个用户都回顾一下自己长期使用 AI 的经历,肯定能感受到自己在很多场景下对 AI 输出的采纳率其实并不高。
AI 产品设计师 John 告诉知危,“ AI 输出采纳率是需要被行业重视的,因为现在网络充斥着大量 AI 生成的低质量内容,很多发布者不关心内容是否对用户有价值。但 ‘ 是否提供价值 ’ 应该是所有产品需要面对的问题,也包括 AI 产品。”
“ 如果继续靠点赞、点踩这种方式,本身的边际效益已经很低,在现有的 AI 产品交互方式下,用户很少去做这种反馈。”
John 认为,采纳率指标对衡量 AI 赋能程度、采用 AI 的实际 ROI、资源浪费程度、合理使用 AI 的重要性非常高,“ 并且不仅是采纳率本身,更是要在意定义 ‘ 采纳 ’ 的逻辑,即 ‘ 我因为什么而觉得这个结果有用 ’。”
对于 AI 产品企业而言,需要更多意识到,采纳率最终会极大影响用户付费意愿。
“ 我经常对某知名通用型 Agent 产品有一个评价:如果它的 Token 价格能便宜 10 倍,它其实有机会成为团队内部做 Web Demo 的主流工具。”
“ 当然这句话还需要加很多前置定语,除了成本太高,它在使用过程中也需要大量试错,采纳率低,而这些消耗其实和最终的交付物并不直接相关,更多是Debug、潜在的网络崩溃等问题。”
“ 对于信息型的产品,比如问答或 AI 搜索,我是可以接受不稳定但可能会有极限表现的产品的,虽然不一定会付费,但因为不像劳务型产品一个方向只用一款,信息型我永远会用好几个产品来丰富视角和信源。所以我会把这样的产品尽可能加到我的‘信息池’里,不采纳也没关系。”
在个体体感上来讲,一名字节员工程磊( 化名 )告诉知危,其用 AI 写代码的采纳率基本上是 100%,即便有些微不足,也会用 Agent 来修改,“ 今年年后我已经没有印象自己亲手写过代码了。”
在程磊看来,采纳率本质上依赖模型能力,另外也取决于公司( 或员工自己 )肯不肯给员工花钱用最新最可靠的模型来完成任务,“ 我现在用的模型是 Claude Opus 4.6 + GLM5 + Kimi2.5,都是最新的、最贵的,会用在所有写代码场景。当然目前 AI 的视觉模态还不行,比如无法准确地操作和测试 GUI。” 而从当前行业更一般的认知看来,采纳率的主要影响因素不只是模型能力本身,还有企业的流程成熟度、信息化基础、管理模式等。
白鲸开源 CEO 郭炜则配合知危对公司内部员工使用 AI 编程的采纳率做了初步的调查,其中使用场景分为问答和 Agent。
数据显示,对于问答场景,主要使用 ChatGPT,调用失败率几乎为零,低复杂场景下 AI 输出采纳率( 只看答案是否带来信息增益 )接近 100%,中等复杂场景约 80%,高复杂场景约 60%,其中,三种复杂度场景的任务量占比为 1:7:2 。
“ 场景越复杂,采纳率越低,一般是因为高复杂场景下 AI 对需求的理解不够到位。要提升采纳率,相关经验已经很多,例如写好 Code Wiki、用好 Plan 模式等。”
“ 我们也很重视采纳率这个指标,但重视不是因为钱,因为采纳率低太浪费时间,要用 AI 写代码,就用全球最好的模型。对我们而言,时间比 Token 更值钱。”
“ 我们的 Agent 执行有较大量的高复杂场景,但要让 Agent 改代码很难,一般还是人来改。也可以让 AI 改,但需要掰开了揉碎了给 AI 讲,这个过程不容易,我们大概有 400 多万行代码,目前的 AI 上下文长度还是不太够用。”
“ 如果从 ROI 的角度看,龙虾的高 ROI 场景主要是办公场景,比如飞书群消息统计/群秘书、周报汇总整理、AI 公司团队( 创建多个 AI 员工分工协作 )、飞书文档批量处理、日程/任务管理、PM 项目管理助手等,能把 1-2 小时的工作时长压缩到分钟级,强烈推荐落地;中 ROI 场景主要是开发分析类,比如网页生成、代码片段生成、数据查询分析/透视,可用但有局限;低 ROI 场景比如复杂工作流编排,出错后处理复杂,维护麻烦,还有浏览器自动操作,只能查看页面,无法真正操作,这些都不推荐落地。
要在各种场景把采纳率量化是很难的事情,比如基于代码行数的量化指标肯定不适用于产品设计领域。
John 表示,“ 采纳率不好清晰定义,因为很难将内容颗粒度拆得很细来衡量,毕竟你很难把 AI 的一个输出一刀切分,说这一部分全部是 AI 生成的,那一部分完全不是。目前只能定性描述为主。”
要更精确理解工作场景的采纳率情况,可以先以生活场景为参考。AI 在生活场景中的应用和搜索引擎没太大区别,目前落地是比较成熟的。
“ 在生活场景中,AI 基本只有一类使用方式,就是信息查询,一般是查询比较简单的事实型信息。”
“ 比如挑选男性维生素的时候,会提问:应该注意配料表里的哪些成分?但一般不应该直接将 AI 提供的结果拿来用,而是把它当作一个搜索或了解问题的起点。”
“ AI 对界面的理解,很难做到结构化地拆解再理解再生成,更多是直接给你一个整体性的效果。”
“ 有一个场景我也一直比较期待:在设计早期,只有一些风格关键词,再加上一个很粗略的结构草图,我希望有一个工具能把这些信息结合起来,模拟出一个可能的界面,这样可以帮助我们在早期确定视觉方向。但目前没有产品能做到这一点。”