AI Harness工程正在退潮
Harness 的本质是模型不够强的地方,用工程手段补。输出不稳定加评估偏护栏,容易跑偏加护栏,不懂上下文加 RAG.但这也引出一个根本性问题:模型越强,你需要补的东西越少。你精心设计的 20 个 agent 流水线、500 行 system prompt,很可能在下一代模型面前变成不必要的复杂度。去年搭的复杂 harness,今年新模型跑就能覆盖大部分功能。
复杂 harness 本身也是故障源。多 agent 编排、层层拦截,这些有状态的系统自己也会出 bug。维护 harness 的成本,有时比直接用模型还高。
真正稳定运行的是极简 harness:好的 tool definition、清晰的 prompt、基本校验和日志。这不是新学科,就是基本的工程素养。
审计链条、可追溯流程不会因为模型变强而消失。但它会演化成平台级合规能力,不是开发者自己搭的东西。
看被大量使用的工具如Cursor、Copilot,harness 复杂度其实很低。而那些主打复杂 harness 的项目,采纳率和留存率都不理想。
复杂 Harness 的热度消退是正确的。它会收缩到很窄的领域:合规驱动的高风险场景,和大规模自动化调度。
对开发者来说,正确的投入方向不是学怎么搭 Harness,而是提升自己判断和驾驭模型的能力。
知道什么时候可以信任AI,什么时候质疑AI。
简单、聚焦的 Harness 有价值,但把它包装成一个独立学科,很大程度上是营销行为。
点评
什么提示词工程,Harness工程都是扯淡。对于非IT从业者来说,自己的专业知识才是最重要的。
页:
[1]