机械荟萃山庄

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 50|回复: 0

AI Harness工程正在退潮

[复制链接]

2万

主题

3万

帖子

22万

积分

超级版主

Rank: 8Rank: 8

积分
220705
发表于 前天 12:40 | 显示全部楼层 |阅读模式
Harness 的本质是模型不够强的地方,用工程手段补。输出不稳定加评估偏护栏,容易跑偏加护栏,不懂上下文加 RAG.
但这也引出一个根本性问题:模型越强,你需要补的东西越少。你精心设计的 20 个 agent 流水线、500 行 system prompt,很可能在下一代模型面前变成不必要的复杂度。去年搭的复杂 harness,今年新模型跑就能覆盖大部分功能。
复杂 harness 本身也是故障源。多 agent 编排、层层拦截,这些有状态的系统自己也会出 bug。维护 harness 的成本,有时比直接用模型还高。
真正稳定运行的是极简 harness:好的 tool definition、清晰的 prompt、基本校验和日志。这不是新学科,就是基本的工程素养。
审计链条、可追溯流程不会因为模型变强而消失。但它会演化成平台级合规能力,不是开发者自己搭的东西。
看被大量使用的工具如Cursor、Copilot,harness 复杂度其实很低。而那些主打复杂 harness 的项目,采纳率和留存率都不理想。
复杂 Harness 的热度消退是正确的。它会收缩到很窄的领域:合规驱动的高风险场景,和大规模自动化调度。
对开发者来说,正确的投入方向不是学怎么搭 Harness,而是提升自己判断和驾驭模型的能力。
知道什么时候可以信任AI,什么时候质疑AI。
简单、聚焦的 Harness 有价值,但把它包装成一个独立学科,很大程度上是营销行为。

点评
什么提示词工程,Harness工程都是扯淡。对于非IT从业者来说,自己的专业知识才是最重要的。




回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|机械荟萃山庄 ( 辽ICP备16011317号-1 )

GMT+8, 2026-6-28 00:06 , Processed in 0.062035 second(s), 20 queries , Gzip On.

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表