全部播客
深度解读:Agent Harness 框架 — OpenAI 与 Anthropic 的实践
深度解读

深度解读:Agent Harness 框架 — OpenAI 与 Anthropic 的实践

深度拆解 Harness Engineering 框架:OpenAI 如何用 Codex 实现 0 行手动代码生成 100 万行项目,Anthropic 如何解决长周期代理的上下文丢失问题。揭秘三大核心组件:上下文工程、架构约束、垃圾回收机制。

📅 2026年3月28日 ⏱ 12:30 👤 Vivi
AI编程Harness EngineeringOpenAIAnthropicCodex
0:00 12:30

📝 Show Notes

🎯 🎯 核心概念

  • Harness Engineering:从以人为中心到以代理为先的范式转变
  • 人类掌舵,代理执行 — 工程师角色的彻底重构
  • 上下文是稀缺资源:给代理一张地图,而不是一本千页说明书

🔧 🔧 三大核心组件

  • 上下文工程:结构化知识库 + 动态上下文 + 渐进式披露
  • 架构约束:机械化强制执行 + 单向依赖 + AI 友好设计
  • 垃圾回收:自动化重构 + 技术债务持续偿还 + 反馈循环

💡 💡 OpenAI Codex 实践

  • 5 个月构建 100 万行代码,0 行手动编写
  • 3 名工程师,平均每人每天 3.5 个 PR
  • 代理可访问 Chrome DevTools、LogQL、PromQL 等动态上下文

🚀 🚀 Anthropic 长周期代理

  • 初始化代理:设置环境 + feature_list.json 任务分解
  • 编码代理:逐步完成任务 + Puppeteer 端到端测试
  • 外部化记忆:Git 日志 + claude-progress.txt 持续跟踪

🎓 🎓 关键洞察

  • 软件工程重心从「编写代码」转向「构建环境」
  • 可观测性从运维需求提升为开发前置需求
  • 技术债务必须高频、小额持续偿还,不能等到崩盘
  • 验证驱动进度:外部化任务跟踪 + 自动化测试闭环

💡 核心纪要

Harness Engineering

为 AI 代理构建结构化、可控工作环境的工程方法论

上下文工程

通过结构化知识库和动态上下文,让代理高效理解项目背景

架构约束

机械化强制执行的架构规则,防止代码库混乱和漂移

垃圾回收

自动化识别和纠正代码库中的不一致和次优模式

feature_list.json

Anthropic 用于任务分解和进度跟踪的核心文件

📬

想听什么?

告诉我你最感兴趣的话题,也许下期就是为你量身定做的