AI Harness工程正在退潮

寂静回声 发表于 2026-6-26 12:40:39

Harness 的本质是模型不够强的地方，用工程手段补。输出不稳定加评估偏护栏，容易跑偏加护栏，不懂上下文加 RAG.
但这也引出一个根本性问题：模型越强，你需要补的东西越少。你精心设计的 20 个 agent 流水线、500 行 system prompt，很可能在下一代模型面前变成不必要的复杂度。去年搭的复杂 harness，今年新模型跑就能覆盖大部分功能。
复杂 harness 本身也是故障源。多 agent 编排、层层拦截，这些有状态的系统自己也会出 bug。维护 harness 的成本，有时比直接用模型还高。
真正稳定运行的是极简 harness：好的 tool definition、清晰的 prompt、基本校验和日志。这不是新学科，就是基本的工程素养。
审计链条、可追溯流程不会因为模型变强而消失。但它会演化成平台级合规能力，不是开发者自己搭的东西。
看被大量使用的工具如Cursor、Copilot，harness 复杂度其实很低。而那些主打复杂 harness 的项目，采纳率和留存率都不理想。
复杂 Harness 的热度消退是正确的。它会收缩到很窄的领域：合规驱动的高风险场景，和大规模自动化调度。
对开发者来说，正确的投入方向不是学怎么搭 Harness，而是提升自己判断和驾驭模型的能力。
知道什么时候可以信任AI，什么时候质疑AI。
简单、聚焦的 Harness 有价值，但把它包装成一个独立学科，很大程度上是营销行为。

点评
什么提示词工程，Harness工程都是扯淡。对于非IT从业者来说，自己的专业知识才是最重要的。

页: [1]

机械荟萃山庄's Archiver

AI Harness工程正在退潮