全部播客
Agent记忆系统设计:面试官追问下的可用性分水岭
深度解读

Agent记忆系统设计:面试官追问下的可用性分水岭

从字节面试官的追问出发,系统拆解Agent记忆模块设计。三种记忆类型、双层架构、Mem0四种操作、冲突处理方案,以及Memory和RAG的本质区别。

📅 2026年4月7日 ⏱ 11:18 👤 Vivi
AgentMemoryAI架构面试Mem0向量数据库
0:00 11:18

📝 Show Notes

🧠 三种记忆类型

  • 语义记忆:通用知识,对所有用户共享,存知识库
  • 情节记忆:用户专属历史,按user_id隔离存储
  • 程序性记忆:操作规则,固化为系统Prompt

🏗️ 双层架构

  • 短期记忆:对话上下文窗口,滑动窗口管理
  • 长期记忆:向量数据库(Milvus),按用户ID分区存储

🔄 Mem0框架四种操作

  • ADD:全新信息新增
  • UPDATE:同一实体信息变化时更新
  • DELETE:过期或失效信息删除
  • NOOP:重复信息不操作

💡 核心洞察

  • 记忆管理是Agent可用不可用的分水岭
  • 管理比存储更重要:冲突检测、TTL过期、被遗忘权
  • RAG解决'世界知道什么',Memory解决'我知道关于用户什么'
  • 记忆的终极目标不是存储,是为用户精炼一份实时简报

📚 参考资料与延伸阅读

💡 核心纪要

Agent记忆分三类:语义记忆(通用知识)、情节记忆(用户专属)、程序性记忆(操作规则),混合处理是常见错误

双层架构:短期记忆用滑动窗口管理当前对话,长期记忆用向量数据库按用户ID分区持久存储

Mem0框架通过LLM语义比较决定ADD/UPDATE/DELETE/NOOP操作,语义相似度>0.85判断为同一实体需更新

Memory ≠ RAG:RAG处理通用知识检索,Memory处理用户专属历史信息,两者互补不可替代

记忆系统四步闭环:Define(定义值得记忆的信息)→ Write(分类写入)→ Manage(冲突检测与清理)→ Read(检索注入Prompt)

📬

想听什么?

告诉我你最感兴趣的话题,也许下期就是为你量身定做的