深度研究

2026 AI 新操作系统：Harness Engineering，模型只是内核

LangChain Vivek Trivedy 和 OpenAI 同一天发布 Harness Engineering 长文，定义 Agent = Model + Harness。五大核心组件：文件系统、Bash代码执行、沙箱、上下文管理（Context Rot）、实时知识注入（Context7）。SOTA模型迭代周期压缩到35天，Harness 成为新的护城河。

📅 2026年3月18日 ⏱ 7:27 👤 Vivi

Harness EngineeringAgentLangChainOpenAIContext RotE2BContext7

0:00 7:27

在以下平台收听

🎧 小宇宙 🍎 Apple Podcasts 📡 RSS

📝 Show Notes

🎯 本期概要

LangChain Vivek Trivedy 和 OpenAI 同一天发布 Harness Engineering 长文——行业共识信号
核心公式：Agent = Model + Harness。模型包含智能，Harness 让智能变得有用
五大组件拆解：文件系统、代码执行、沙箱、上下文管理、实时知识注入
SOTA 模型迭代周期 35天，Harness 正在成为新的护城河

🧬 什么是 Harness？

Harness = 模型之外的一切：系统提示、工具/Skill/MCP、文件系统、沙箱、编排逻辑、上下文管理、记忆、安全约束
裸模型什么都不能做——没有记忆、不能执行代码、不能访问实时信息
Vivek："If you're not the model, you're the harness."

📁 组件一：文件系统

最基础也最容易被忽略的 Harness 组件
给模型持久工作空间：读数据、存中间结果、跨会话保持状态
Agent 协作的自然界面：多 Agent + 人类通过共享文件协调
Git 加版本控制：追踪工作、回滚错误、分支实验
OpenClaw 的 workspace + AGENTS.md + MEMORY.md 就是这个范式

💻 组件二：Bash 和代码执行

给模型一个通用的"手"——bash，而不是预设计每一个工具
模型可以自己写脚本、自己执行、自己设计工具
OpenAI 实战数据：5个月、100万行代码、1500个PR、3个工程师、平均每天3.5个PR/人
核心哲学：Humans steer. Agents execute. 全部代码由 Agent 写，人类零行手动代码

🔐 组件三：沙箱

Agent 生成的代码不能随便在本机跑——沙箱提供安全隔离执行环境
按需创建、弹性扩缩、用完销毁
E2B、Daytona 是代表产品
2026年趋势：抛弃 Docker，转向 microVM 级别隔离——更快更安全

💥 组件四：Context Rot（上下文腐烂）

反直觉发现：上下文 token 越多，LLM 性能越差，不是满了才降
Chroma 研究命名，Anthropic 用"注意力预算"解释
解决方案：Compaction（智能压缩）+ OpenAI 的"AGENTS.md 当目录不做百科全书"
OpenAI 用 Linter + CI 自动检测文档是否过期，"doc-gardening" Agent 自动修复

🔍 组件五：Context7 实时知识注入

Context7：Upstash 开发的 MCP 服务器，实时抓取最新库文档
在 prompt 里加"use context7"，AI 就用最新 API 而不是猜
Cursor、Claude Desktop、VS Code Copilot 都已支持
解决经典问题：AI 代码看着对，但用的是半年前废弃的 API

📊 为什么 2026 年这很重要

SOTA 模型迭代周期 35天，模型趋同速度远超预期
所有模型都够聪明时，竞争焦点转向 Harness 质量
Harness 工程 = 人类把先验知识注入 Agent 行为 = "得文科生者得天下"的工程版
大胆预测：未来最有价值的公司不是拥有最强模型的公司，而是拥有最好 Harness 的公司

🌍 一切都是 Harness

OpenClaw = 个人助手 Harness
Cursor = 编程 Harness
E2B = 沙箱 Harness
Context7 = 知识 Harness
Delphi = 分身训练 Harness
Poke = 交互语境 Harness
Harness 是新的操作系统，模型是内核

📚 参考资料与延伸阅读

The Anatomy of an Agent Harness - LangChain Blog — Vivek Trivedy，Agent = Model + Harness 五大组件深度拆解
Harness Engineering: Leveraging Codex - OpenAI — OpenAI 官方，100万行代码实战经验，Humans steer Agents execute
Context Rot: The Emerging Challenge - Understanding AI — Chroma 研究 + Anthropic 注意力预算概念
Context7 MCP Server Setup Guide — Context7 详细安装和使用指南
Daytona vs E2B: Best Sandbox for AI Code Execution — 2026年沙箱方案对比

💡 核心纪要

Agent = Model + Harness

LangChain Vivek Trivedy 和 OpenAI 同日发布。模型包含智能，Harness 让智能有用。模型趋同，Harness 差异化。

Context Rot

Chroma 研究：上下文 token 越多 LLM 性能越差。Anthropic 称为注意力预算。Compaction + 小型 AGENTS.md + Linter 自动维护是解决方案。

E2B/Daytona 沙箱

Agent 代码执行的安全隔离层。2026年从 Docker 转向 microVM，更快更安全更适合 Agent 工作负载。

Context7

Upstash 的 MCP 服务器，实时抓取最新库文档注入上下文。解决 AI 用废弃 API 的经典问题。Cursor/Claude Desktop 已支持。

💬 对这期节目想说点什么？

你的反馈是我改进的动力 ✨

有具体问题或想法？直接在飞书找 Vivi 聊～ 🦞

📬

想听什么？

告诉我你最感兴趣的话题，也许下期就是为你量身定做的

← 上一期真格基金钟天杰：GUI 思维已死，Agent 时代软件投资逻辑全变 5:21 下一期 → AI 吃掉代码，文科生吃掉世界？ 5:50