全部播客
深度研究
2026 AI 新操作系统:Harness Engineering,模型只是内核
LangChain Vivek Trivedy 和 OpenAI 同一天发布 Harness Engineering 长文,定义 Agent = Model + Harness。五大核心组件:文件系统、Bash代码执行、沙箱、上下文管理(Context Rot)、实时知识注入(Context7)。SOTA模型迭代周期压缩到35天,Harness 成为新的护城河。
Harness EngineeringAgentLangChainOpenAIContext RotE2BContext7
0:00 7:27
在以下平台收听
📝 Show Notes
🎯 本期概要
- LangChain Vivek Trivedy 和 OpenAI 同一天发布 Harness Engineering 长文——行业共识信号
- 核心公式:Agent = Model + Harness。模型包含智能,Harness 让智能变得有用
- 五大组件拆解:文件系统、代码执行、沙箱、上下文管理、实时知识注入
- SOTA 模型迭代周期 35天,Harness 正在成为新的护城河
🧬 什么是 Harness?
- Harness = 模型之外的一切:系统提示、工具/Skill/MCP、文件系统、沙箱、编排逻辑、上下文管理、记忆、安全约束
- 裸模型什么都不能做——没有记忆、不能执行代码、不能访问实时信息
- Vivek:"If you're not the model, you're the harness."
📁 组件一:文件系统
- 最基础也最容易被忽略的 Harness 组件
- 给模型持久工作空间:读数据、存中间结果、跨会话保持状态
- Agent 协作的自然界面:多 Agent + 人类通过共享文件协调
- Git 加版本控制:追踪工作、回滚错误、分支实验
- OpenClaw 的 workspace + AGENTS.md + MEMORY.md 就是这个范式
💻 组件二:Bash 和代码执行
- 给模型一个通用的"手"——bash,而不是预设计每一个工具
- 模型可以自己写脚本、自己执行、自己设计工具
- OpenAI 实战数据:5个月、100万行代码、1500个PR、3个工程师、平均每天3.5个PR/人
- 核心哲学:Humans steer. Agents execute. 全部代码由 Agent 写,人类零行手动代码
🔐 组件三:沙箱
- Agent 生成的代码不能随便在本机跑——沙箱提供安全隔离执行环境
- 按需创建、弹性扩缩、用完销毁
- E2B、Daytona 是代表产品
- 2026年趋势:抛弃 Docker,转向 microVM 级别隔离——更快更安全
💥 组件四:Context Rot(上下文腐烂)
- 反直觉发现:上下文 token 越多,LLM 性能越差,不是满了才降
- Chroma 研究命名,Anthropic 用"注意力预算"解释
- 解决方案:Compaction(智能压缩)+ OpenAI 的"AGENTS.md 当目录不做百科全书"
- OpenAI 用 Linter + CI 自动检测文档是否过期,"doc-gardening" Agent 自动修复
🔍 组件五:Context7 实时知识注入
- Context7:Upstash 开发的 MCP 服务器,实时抓取最新库文档
- 在 prompt 里加"use context7",AI 就用最新 API 而不是猜
- Cursor、Claude Desktop、VS Code Copilot 都已支持
- 解决经典问题:AI 代码看着对,但用的是半年前废弃的 API
📊 为什么 2026 年这很重要
- SOTA 模型迭代周期 35天,模型趋同速度远超预期
- 所有模型都够聪明时,竞争焦点转向 Harness 质量
- Harness 工程 = 人类把先验知识注入 Agent 行为 = "得文科生者得天下"的工程版
- 大胆预测:未来最有价值的公司不是拥有最强模型的公司,而是拥有最好 Harness 的公司
🌍 一切都是 Harness
- OpenClaw = 个人助手 Harness
- Cursor = 编程 Harness
- E2B = 沙箱 Harness
- Context7 = 知识 Harness
- Delphi = 分身训练 Harness
- Poke = 交互语境 Harness
- Harness 是新的操作系统,模型是内核
📚 参考资料与延伸阅读
- The Anatomy of an Agent Harness - LangChain Blog — Vivek Trivedy,Agent = Model + Harness 五大组件深度拆解
- Harness Engineering: Leveraging Codex - OpenAI — OpenAI 官方,100万行代码实战经验,Humans steer Agents execute
- Context Rot: The Emerging Challenge - Understanding AI — Chroma 研究 + Anthropic 注意力预算概念
- Context7 MCP Server Setup Guide — Context7 详细安装和使用指南
- Daytona vs E2B: Best Sandbox for AI Code Execution — 2026年沙箱方案对比
💡 核心纪要
Agent = Model + Harness
LangChain Vivek Trivedy 和 OpenAI 同日发布。模型包含智能,Harness 让智能有用。模型趋同,Harness 差异化。
Context Rot
Chroma 研究:上下文 token 越多 LLM 性能越差。Anthropic 称为注意力预算。Compaction + 小型 AGENTS.md + Linter 自动维护是解决方案。
E2B/Daytona 沙箱
Agent 代码执行的安全隔离层。2026年从 Docker 转向 microVM,更快更安全更适合 Agent 工作负载。
Context7
Upstash 的 MCP 服务器,实时抓取最新库文档注入上下文。解决 AI 用废弃 API 的经典问题。Cursor/Claude Desktop 已支持。
📬
订阅播客速递
每周一封,不错过好内容
📬
想听什么?
告诉我你最感兴趣的话题,也许下期就是为你量身定做的