<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>基于LLM的系统设计与实现</title>
    <link>https://www6v.github.io/www6vAIGC/</link>
    <description>Recent content on 基于LLM的系统设计与实现</description>
    <generator>Hugo</generator>
    <language>en</language>
    <lastBuildDate>Mon, 01 Jan 0001 00:00:00 +0000</lastBuildDate>
    <atom:link href="https://www6v.github.io/www6vAIGC/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>Agent Memory 原理</title>
      <link>https://www6v.github.io/www6vAIGC/docs/Agent-Infra/agent-memory/AgentMemory1/Agent-Memory1/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>https://www6v.github.io/www6vAIGC/docs/Agent-Infra/agent-memory/AgentMemory1/Agent-Memory1/</guid>
      <description>&lt;h1 id=&#34;agent-memory-原理&#34;&gt;&#xA;  Agent Memory 原理&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#agent-memory-%e5%8e%9f%e7%90%86&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h1&gt;&#xA;&lt;blockquote&gt;&#xA;&lt;p&gt;本文是《大模型 Agent 和应用》Agent Memory 系列的&lt;strong&gt;上篇&lt;/strong&gt;，聚焦定义、生命周期与架构模式。下篇《Agent Memory 实践》将深入关键技术、工业实践与选型指南。&lt;/p&gt;&lt;/blockquote&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;本章导读&#34;&gt;&#xA;  本章导读&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#%e6%9c%ac%e7%ab%a0%e5%af%bc%e8%af%bb&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h2&gt;&#xA;&lt;p&gt;如果你用过 ChatGPT、Claude 或者任何大语言模型，你一定经历过这种挫败——你花了三个小时跟它讨论一个技术方案，关掉浏览器，第二天重新打开，它对你昨天说的一切一无所知。&lt;/p&gt;&#xA;&lt;p&gt;这不是因为它&amp;quot;变笨了&amp;quot;，而是因为它根本没有&lt;strong&gt;记忆&lt;/strong&gt;。它每次醒来都是一个新的会话，带着同一套预训练知识，却对你们的共同历史一无所知。&lt;/p&gt;&#xA;&lt;p&gt;这就引出了本文的核心问题：&lt;strong&gt;如果记忆是人类智能的基石，为什么 Agent 的记忆系统直到 2023 年才成为一个独立的研究方向？&lt;/strong&gt; 而在短短两年内，它又如何从一个简单的&amp;quot;把对话历史塞进 prompt&amp;quot;的朴素做法，演变成一个包含分层存储、向量检索、文件系统范式、反思学习的复杂工程体系？&lt;/p&gt;&#xA;&lt;p&gt;本文将回答以下问题：&lt;/p&gt;&#xA;&lt;ol&gt;&#xA;&lt;li&gt;什么是 Agent Memory？它与模型知识、对话上下文有什么本质区别？&lt;/li&gt;&#xA;&lt;li&gt;Agent Memory 的&amp;quot;生命周期&amp;quot;是怎样的——写入、存储、检索、遗忘各自面临什么挑战？&lt;/li&gt;&#xA;&lt;li&gt;业界出现了哪几种典型的 Memory 架构模式？它们各自的权衡是什么？&lt;/li&gt;&#xA;&lt;/ol&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;0-引子没有记忆的-agent-会怎样&#34;&gt;&#xA;  0. 引子：没有记忆的 Agent 会怎样？&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#0-%e5%bc%95%e5%ad%90%e6%b2%a1%e6%9c%89%e8%ae%b0%e5%bf%86%e7%9a%84-agent-%e4%bc%9a%e6%80%8e%e6%a0%b7&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h2&gt;&#xA;&lt;p&gt;想象一下这个场景：&lt;/p&gt;&#xA;&lt;blockquote&gt;&#xA;&lt;p&gt;你正在用 Agent 帮你写一个分布式系统的方案设计。第一轮对话，你告诉它系统的规模、用户量、延迟要求。第二轮，你让它分析几种存储方案。第三轮，你指出方案三的某个问题，它做了修改。第四轮，你问：&amp;ldquo;记得我们一开始说的那个延迟要求吗？&amp;rdquo;&lt;/p&gt;&#xA;&lt;p&gt;它回答：&amp;ldquo;什么延迟要求？&amp;rdquo;&lt;/p&gt;&lt;/blockquote&gt;&#xA;&lt;p&gt;这不是假设。这就是 2023 年之前绝大多数 LLM Agent 的真实状态。&lt;/p&gt;&#xA;&lt;h3 id=&#34;01-一个金鱼agent-的日常&#34;&gt;&#xA;  0.1 一个&amp;quot;金鱼&amp;quot;Agent 的日常&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#01-%e4%b8%80%e4%b8%aa%e9%87%91%e9%b1%bcagent-%e7%9a%84%e6%97%a5%e5%b8%b8&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h3&gt;&#xA;&lt;p&gt;LLM 的本质是一个&lt;strong&gt;无状态函数&lt;/strong&gt;（stateless function）：给它一段文本（prompt），它返回下一段文本。不记住上一次交互，不记住上一次交互的结果，不记住上一次交互中你纠正过的错误。&lt;/p&gt;&#xA;&lt;p&gt;在没有 Memory 系统的情况下，Agent 的行为特征与人类的&amp;quot;顺行性遗忘&amp;quot;（anterograde amnesia）惊人地相似——它能调用训练中学到的一切知识（相当于&amp;quot;长期语义记忆&amp;quot;），却无法形成任何新的情景记忆（episodic memory）。&lt;/p&gt;&#xA;&lt;h3 id=&#34;02-人类记忆的启发&#34;&gt;&#xA;  0.2 人类记忆的启发&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#02-%e4%ba%ba%e7%b1%bb%e8%ae%b0%e5%bf%86%e7%9a%84%e5%90%af%e5%8f%91&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h3&gt;&#xA;&lt;p&gt;人类的记忆不是一块&amp;quot;硬盘&amp;quot;。认知神经科学将人类记忆分为至少三个层次：&lt;/p&gt;</description>
    </item>
    <item>
      <title>Agent Memory 实践</title>
      <link>https://www6v.github.io/www6vAIGC/docs/Agent-Infra/agent-memory/AgentMemory2/Agent-Memory2/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>https://www6v.github.io/www6vAIGC/docs/Agent-Infra/agent-memory/AgentMemory2/Agent-Memory2/</guid>
      <description>&lt;h1 id=&#34;agent-memory-实践&#34;&gt;&#xA;  Agent Memory 实践&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#agent-memory-%e5%ae%9e%e8%b7%b5&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h1&gt;&#xA;&lt;blockquote&gt;&#xA;&lt;p&gt;本文是《大模型 Agent 和应用》Agent Memory 系列的&lt;strong&gt;下篇&lt;/strong&gt;，聚焦关键技术、工业实践与选型指南。上篇《Agent Memory 原理》可参见 &lt;code&gt;chapter-part1-principles.md&lt;/code&gt;。&lt;/p&gt;&lt;/blockquote&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;导读&#34;&gt;&#xA;  导读&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#%e5%af%bc%e8%af%bb&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h2&gt;&#xA;&lt;p&gt;上篇《Agent Memory 原理》我们讨论了 Agent Memory 的定义、生命周期和五种经典架构模式。本文将进入&lt;strong&gt;实践层面&lt;/strong&gt;：&lt;/p&gt;&#xA;&lt;ol&gt;&#xA;&lt;li&gt;记忆压缩、向量检索、跨模态记忆等&lt;strong&gt;关键技术&lt;/strong&gt;是如何工作的？&lt;/li&gt;&#xA;&lt;li&gt;MemOS、Mem0、Letta、OpenViking、Claude Code、OpenClaw、Hermes Agent 等真实系统是怎么做的？&lt;/li&gt;&#xA;&lt;li&gt;为什么&amp;quot;本地文件系统存储&amp;quot;正成为 Agent Memory 的主流选择？&lt;/li&gt;&#xA;&lt;li&gt;如何为你的 Agent 选择合适的 Memory 方案？&lt;/li&gt;&#xA;&lt;/ol&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;4-关键技术深潜&#34;&gt;&#xA;  4. 关键技术深潜&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#4-%e5%85%b3%e9%94%ae%e6%8a%80%e6%9c%af%e6%b7%b1%e6%bd%9c&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h2&gt;&#xA;&lt;h3 id=&#34;41-记忆压缩prompt-compression&#34;&gt;&#xA;  4.1 记忆压缩（Prompt Compression）&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#41-%e8%ae%b0%e5%bf%86%e5%8e%8b%e7%bc%a9prompt-compression&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h3&gt;&#xA;&lt;h4 id=&#34;411-为什么需要压缩&#34;&gt;&#xA;  4.1.1 为什么需要压缩&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#411-%e4%b8%ba%e4%bb%80%e4%b9%88%e9%9c%80%e8%a6%81%e5%8e%8b%e7%bc%a9&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h4&gt;&#xA;&lt;p&gt;token 经济学是驱动记忆压缩的核心力量。如果每次请求都携带完整的记忆，成本会随对话轮数呈 O(n²) 增长。压缩的本质是&lt;strong&gt;用更少的 token 承载相同的信息量&lt;/strong&gt;。&lt;/p&gt;&#xA;&lt;h4 id=&#34;412-longllmlingua问题感知的压缩&#34;&gt;&#xA;  4.1.2 LongLLMLingua：问题感知的压缩&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#412-longllmlingua%e9%97%ae%e9%a2%98%e6%84%9f%e7%9f%a5%e7%9a%84%e5%8e%8b%e7%bc%a9&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h4&gt;&#xA;&lt;p&gt;LongLLMLingua（arXiv:2310.06839）的核心洞察是：&lt;strong&gt;不是所有文本都同等重要——重要性取决于你要回答什么问题&lt;/strong&gt;。&lt;/p&gt;&#xA;&lt;p&gt;传统摘要压缩的做法是把文本无差别地压缩到固定长度。LongLLMLingua 则根据用户的问题，保留与问题最相关的信息，丢弃无关内容。它通过计算每个 token 相对于问题的&amp;quot;困惑度增益&amp;quot;（perplexity gain）来决定保留哪些 token。&lt;/p&gt;&#xA;&lt;p&gt;实验数据显示，LongLLMLingua 可以将 40K-100K 的上下文压缩到原来的 1/4 到 1/8，同时保持甚至提升下游任务的性能。&lt;/p&gt;</description>
    </item>
    <item>
      <title>Claude Code 长程任务稳定性</title>
      <link>https://www6v.github.io/www6vAIGC/docs/Harness-engineering/Claude-Code/Claude-code-stability/claude-code-long-running-stability/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>https://www6v.github.io/www6vAIGC/docs/Harness-engineering/Claude-Code/Claude-code-stability/claude-code-long-running-stability/</guid>
      <description>&lt;h1 id=&#34;claude-code-长程任务稳定性如何在-50-轮迭代中不迷失不失控不崩溃&#34;&gt;&#xA;  Claude Code 长程任务稳定性：如何在 50+ 轮迭代中不迷失、不失控、不崩溃&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#claude-code-%e9%95%bf%e7%a8%8b%e4%bb%bb%e5%8a%a1%e7%a8%b3%e5%ae%9a%e6%80%a7%e5%a6%82%e4%bd%95%e5%9c%a8-50-%e8%bd%ae%e8%bf%ad%e4%bb%a3%e4%b8%ad%e4%b8%8d%e8%bf%b7%e5%a4%b1%e4%b8%8d%e5%a4%b1%e6%8e%a7%e4%b8%8d%e5%b4%a9%e6%ba%83&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h1&gt;&#xA;&lt;blockquote&gt;&#xA;&lt;p&gt;&lt;strong&gt;摘要&lt;/strong&gt;：本文深度解析 Claude Code 如何在长程编程任务（数十轮 API 往返、数小时运行、数十万 token 消耗）中保持稳定。涵盖上下文生命周期管理、5 级压缩流水线、Session 持久化与回滚、Subagent 上下文隔离、错误恢复降级链、CLAUDE.md 双记忆系统、Hooks 预处理降本、Token 预算硬限制、Checkpointing 快照等 9 大稳定机制。所有结论均以 Claude Code 官方文档、逆向可运行源码（&lt;a href=&#34;https://github.com/oboard/claude-code-rev&#34;&gt;oboard/claude-code-rev&lt;/a&gt;）、学术论文（&lt;a href=&#34;https://github.com/VILA-Lab/Dive-into-Claude-Code&#34;&gt;VILA-Lab, arXiv:2604.14228&lt;/a&gt;）、递进式教学（&lt;a href=&#34;https://github.com/shareAI-lab/learn-claude-code&#34;&gt;shareAI-lab/learn-claude-code&lt;/a&gt;）和 17 篇深度解析（&lt;a href=&#34;https://openedclaude.github.io/claude-reviews-claude/zh-CN/overview&#34;&gt;openedclaude/claude-reviews-claude&lt;/a&gt;）为交叉验证依据。&lt;/p&gt;&lt;/blockquote&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;目录&#34;&gt;&#xA;  目录&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#%e7%9b%ae%e5%bd%95&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h2&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&lt;a href=&#34;#1-%e5%bc%95%e8%a8%80%e9%95%bf%e7%a8%8b%e4%bb%bb%e5%8a%a1%e7%9a%84%e6%ad%bb%e4%ba%a1%e4%b9%8b%e8%b0%b7&#34;&gt;1. 引言：长程任务的&amp;quot;死亡之谷&amp;quot;&lt;/a&gt;&lt;/li&gt;&#xA;&lt;li&gt;&lt;a href=&#34;#2-%e4%b8%8a%e4%b8%8b%e6%96%87%e7%94%9f%e5%91%bd%e5%91%a8%e6%9c%9f%e7%ae%a1%e7%90%86%e4%bb%8e%e5%8a%a0%e8%bd%bd%e5%88%b0%e5%8e%8b%e7%bc%a9%e7%9a%84%e5%ae%8c%e6%95%b4%e9%93%be%e8%b7%af&#34;&gt;2. 上下文生命周期管理：从加载到压缩的完整链路&lt;/a&gt;&lt;/li&gt;&#xA;&lt;li&gt;&lt;a href=&#34;#3-session-%e6%8c%81%e4%b9%85%e5%8c%96%e4%b8%8e%e6%81%a2%e5%a4%8d%e6%96%ad%e7%82%b9%e7%bb%ad%e4%bc%a0%e7%9a%84%e4%bc%9a%e8%af%9d%e7%ae%a1%e7%90%86&#34;&gt;3. Session 持久化与恢复：断点续传的会话管理&lt;/a&gt;&lt;/li&gt;&#xA;&lt;li&gt;&lt;a href=&#34;#4-checkpointing%e4%bb%a3%e7%a0%81%e4%b8%8e%e5%af%b9%e8%af%9d%e7%9a%84%e5%bf%ab%e7%85%a7%e5%9b%9e%e6%bb%9a&#34;&gt;4. Checkpointing：代码与对话的快照回滚&lt;/a&gt;&lt;/li&gt;&#xA;&lt;li&gt;&lt;a href=&#34;#5-subagent-%e4%b8%8a%e4%b8%8b%e6%96%87%e9%9a%94%e7%a6%bb%e5%88%86%e8%80%8c%e6%b2%bb%e4%b9%8b%e7%9a%84%e7%ad%96%e7%95%a5&#34;&gt;5. Subagent 上下文隔离：分而治之的策略&lt;/a&gt;&lt;/li&gt;&#xA;&lt;li&gt;&lt;a href=&#34;#6-%e9%94%99%e8%af%af%e6%81%a2%e5%a4%8d%e4%b8%8e%e9%99%8d%e7%ba%a7%e9%93%be%e5%bd%93%e4%ba%8b%e6%83%85%e5%87%ba%e9%94%99%e6%97%b6&#34;&gt;6. 错误恢复与降级链：当事情出错时&lt;/a&gt;&lt;/li&gt;&#xA;&lt;li&gt;&lt;a href=&#34;#7-claudemd-%e5%8f%8c%e8%ae%b0%e5%bf%86%e7%b3%bb%e7%bb%9f%e8%b7%a8%e4%bc%9a%e8%af%9d%e7%9a%84%e7%9f%a5%e8%af%86%e6%8c%81%e4%b9%85%e5%8c%96&#34;&gt;7. CLAUDE.md 双记忆系统：跨会话的知识持久化&lt;/a&gt;&lt;/li&gt;&#xA;&lt;li&gt;&lt;a href=&#34;#8-hooks-%e9%a2%84%e5%a4%84%e7%90%86%e5%9c%a8-claude-%e7%9c%8b%e5%88%b0%e4%b9%8b%e5%89%8d%e5%81%9a%e5%87%8f%e6%b3%95&#34;&gt;8. Hooks 预处理：在 Claude 看到之前做减法&lt;/a&gt;&lt;/li&gt;&#xA;&lt;li&gt;&lt;a href=&#34;#9-%e5%a4%9a-agent-%e7%bc%96%e6%8e%92%e4%b8%8e%e6%88%90%e6%9c%ac%e6%b2%bb%e7%90%86%e5%9b%a2%e9%98%9f%e7%ba%a7%e7%a8%b3%e5%ae%9a%e6%80%a7&#34;&gt;9. 多 Agent 编排与成本治理：团队级稳定性&lt;/a&gt;&lt;/li&gt;&#xA;&lt;li&gt;&lt;a href=&#34;#10-%e5%b7%a5%e7%a8%8b%e5%8d%93%e8%b6%8a%e6%94%af%e6%92%91%e9%95%bf%e7%a8%8b%e7%a8%b3%e5%ae%9a%e7%9a%84%e5%ba%95%e5%b1%82%e6%9e%b6%e6%9e%84&#34;&gt;10. 工程卓越：支撑长程稳定的底层架构&lt;/a&gt;&lt;/li&gt;&#xA;&lt;li&gt;&lt;a href=&#34;#11-%e9%95%bf%e7%a8%8b%e4%bb%bb%e5%8a%a1%e6%9c%80%e4%bd%b3%e5%ae%9e%e8%b7%b5%e4%bb%8e%e5%ae%98%e6%96%b9%e6%96%87%e6%a1%a3%e5%88%b0%e7%a4%be%e5%8c%ba%e7%bb%8f%e9%aa%8c&#34;&gt;11. 长程任务最佳实践：从官方文档到社区经验&lt;/a&gt;&lt;/li&gt;&#xA;&lt;li&gt;&lt;a href=&#34;#12-%e5%8f%af%e8%bf%81%e7%a7%bb%e8%ae%be%e8%ae%a1%e6%a8%a1%e5%bc%8f%e6%9e%84%e5%bb%ba%e4%bd%a0%e8%87%aa%e5%b7%b1%e7%9a%84%e9%95%bf%e7%a8%8b%e7%a8%b3%e5%ae%9a-agent&#34;&gt;12. 可迁移设计模式：构建你自己的长程稳定 Agent&lt;/a&gt;&lt;/li&gt;&#xA;&lt;li&gt;&lt;a href=&#34;#13-%e6%80%bb%e7%bb%93%e4%b8%8e%e5%b1%95%e6%9c%9b&#34;&gt;13. 总结与展望&lt;/a&gt;&lt;/li&gt;&#xA;&lt;li&gt;&lt;a href=&#34;#%e9%99%84%e5%bd%95&#34;&gt;附录&lt;/a&gt;&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;1-引言长程任务的死亡之谷&#34;&gt;&#xA;  1. 引言：长程任务的&amp;quot;死亡之谷&amp;quot;&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#1-%e5%bc%95%e8%a8%80%e9%95%bf%e7%a8%8b%e4%bb%bb%e5%8a%a1%e7%9a%84%e6%ad%bb%e4%ba%a1%e4%b9%8b%e8%b0%b7&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h2&gt;&#xA;&lt;h3 id=&#34;11-什么是长程任务&#34;&gt;&#xA;  1.1 什么是长程任务？&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#11-%e4%bb%80%e4%b9%88%e6%98%af%e9%95%bf%e7%a8%8b%e4%bb%bb%e5%8a%a1&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h3&gt;&#xA;&lt;p&gt;在 Claude Code 的实践中，任务的复杂度可以从单行 Bug 修复到整个代码库的架构重构。根据任务的规模，我们可以将其分为以下几个等级：&lt;/p&gt;</description>
    </item>
    <item>
      <title></title>
      <link>https://www6v.github.io/www6vAIGC/docs/Agent-Infra/agent-memory/other/chapter-draft/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>https://www6v.github.io/www6vAIGC/docs/Agent-Infra/agent-memory/other/chapter-draft/</guid>
      <description>&lt;h1 id=&#34;第-x-章-agent-memory让-agent-记住反思与成长&#34;&gt;&#xA;  第 X 章 Agent Memory：让 Agent 记住、反思与成长&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#%e7%ac%ac-x-%e7%ab%a0-agent-memory%e8%ae%a9-agent-%e8%ae%b0%e4%bd%8f%e5%8f%8d%e6%80%9d%e4%b8%8e%e6%88%90%e9%95%bf&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h1&gt;&#xA;&lt;blockquote&gt;&#xA;&lt;p&gt;本章对应参考文献：arXiv:2512.13564, arXiv:2603.07670, arXiv:2304.03442, arXiv:2310.08560, arXiv:2303.11366, arXiv:2310.06839, arXiv:2312.03815, arXiv:2505.22101, arXiv:2507.03724, arXiv:2504.19413, arXiv:2309.02427&lt;/p&gt;&lt;/blockquote&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;本章导读&#34;&gt;&#xA;  本章导读&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#%e6%9c%ac%e7%ab%a0%e5%af%bc%e8%af%bb&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h2&gt;&#xA;&lt;p&gt;如果你用过 ChatGPT、Claude 或者任何大语言模型，你一定经历过这种挫败——你花了三个小时跟它讨论一个技术方案，关掉浏览器，第二天重新打开，它对你昨天说的一切一无所知。&lt;/p&gt;&#xA;&lt;p&gt;这不是因为它&amp;quot;变笨了&amp;quot;，而是因为它根本没有&lt;strong&gt;记忆&lt;/strong&gt;。它每次醒来都是一个新的会话，带着同一套预训练知识，却对你们的共同历史一无所知。&lt;/p&gt;&#xA;&lt;p&gt;这就引出了本章的核心问题：&lt;strong&gt;如果记忆是人类智能的基石，为什么 Agent 的记忆系统直到 2023 年才成为一个独立的研究方向？&lt;/strong&gt; 而在短短两年内，它又如何从一个简单的&amp;quot;把对话历史塞进 prompt&amp;quot;的朴素做法，演变成一个包含分层存储、向量检索、文件系统范式、反思学习的复杂工程体系？&lt;/p&gt;&#xA;&lt;p&gt;本章将沿着一条从问题到解决方案的路径，回答以下问题：&lt;/p&gt;&#xA;&lt;ol&gt;&#xA;&lt;li&gt;什么是 Agent Memory？它与模型知识、对话上下文有什么本质区别？&lt;/li&gt;&#xA;&lt;li&gt;Agent Memory 的&amp;quot;生命周期&amp;quot;是怎样的——写入、存储、检索、遗忘各自面临什么挑战？&lt;/li&gt;&#xA;&lt;li&gt;业界出现了哪几种典型的 Memory 架构模式？它们各自的权衡是什么？&lt;/li&gt;&#xA;&lt;li&gt;向量检索、Prompt 压缩、跨模态记忆等关键技术是如何工作的？&lt;/li&gt;&#xA;&lt;li&gt;MemOS、Mem0、Letta、OpenViking、Claude Code、OpenClaw、Hermes Agent 等真实系统是怎么做的？&lt;/li&gt;&#xA;&lt;li&gt;为什么&amp;quot;本地文件系统存储&amp;quot;正成为 Agent Memory 的主流选择？&lt;/li&gt;&#xA;&lt;li&gt;如何为你的 Agent 选择合适的 Memory 方案？&lt;/li&gt;&#xA;&lt;/ol&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;0-引子没有记忆的-agent-会怎样&#34;&gt;&#xA;  0. 引子：没有记忆的 Agent 会怎样？&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#0-%e5%bc%95%e5%ad%90%e6%b2%a1%e6%9c%89%e8%ae%b0%e5%bf%86%e7%9a%84-agent-%e4%bc%9a%e6%80%8e%e6%a0%b7&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h2&gt;&#xA;&lt;p&gt;想象一下这个场景：&lt;/p&gt;&#xA;&lt;blockquote&gt;&#xA;&lt;p&gt;你正在用 Agent 帮你写一个分布式系统的方案设计。第一轮对话，你告诉它系统的规模、用户量、延迟要求。第二轮，你让它分析几种存储方案。第三轮，你指出方案三的某个问题，它做了修改。第四轮，你问：&amp;ldquo;记得我们一开始说的那个延迟要求吗？&amp;rdquo;&lt;/p&gt;</description>
    </item>
    <item>
      <title></title>
      <link>https://www6v.github.io/www6vAIGC/docs/Agent-Infra/agent-memory/other/outline/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>https://www6v.github.io/www6vAIGC/docs/Agent-Infra/agent-memory/other/outline/</guid>
      <description>&lt;h1 id=&#34;第-x-章-agent-memory让-agent-记住反思与成长&#34;&gt;&#xA;  第 X 章 Agent Memory：让 Agent 记住、反思与成长&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#%e7%ac%ac-x-%e7%ab%a0-agent-memory%e8%ae%a9-agent-%e8%ae%b0%e4%bd%8f%e5%8f%8d%e6%80%9d%e4%b8%8e%e6%88%90%e9%95%bf&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h1&gt;&#xA;&lt;blockquote&gt;&#xA;&lt;p&gt;本章大纲 — 2026-04-29 v3&lt;/p&gt;&lt;/blockquote&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;本章导读&#34;&gt;&#xA;  本章导读&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#%e6%9c%ac%e7%ab%a0%e5%af%bc%e8%af%bb&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h2&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;0-引子没有记忆的-agent-会怎样&#34;&gt;&#xA;  0. 引子：没有记忆的 Agent 会怎样？&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#0-%e5%bc%95%e5%ad%90%e6%b2%a1%e6%9c%89%e8%ae%b0%e5%bf%86%e7%9a%84-agent-%e4%bc%9a%e6%80%8e%e6%a0%b7&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h2&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;一个每次对话都从零开始的 Agent 的尴尬场景&lt;/li&gt;&#xA;&lt;li&gt;人类记忆类比：工作记忆 vs 长期记忆 vs 肌肉记忆&lt;/li&gt;&#xA;&lt;li&gt;核心问题提出：如何让 Agent 像人一样&amp;quot;从经验中学习&amp;quot;？&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;1-什么是-agent-memory&#34;&gt;&#xA;  1. 什么是 Agent Memory？&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#1-%e4%bb%80%e4%b9%88%e6%98%af-agent-memory&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h2&gt;&#xA;&lt;h3 id=&#34;11-定义与边界&#34;&gt;&#xA;  1.1 定义与边界&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#11-%e5%ae%9a%e4%b9%89%e4%b8%8e%e8%be%b9%e7%95%8c&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h3&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;Agent Memory vs 模型参数（Knowledge）——&amp;ldquo;记住昨天的对话&amp;quot;和&amp;quot;训练时学到的知识&amp;quot;不是一回事&lt;/li&gt;&#xA;&lt;li&gt;Agent Memory vs 对话历史（Context）——上下文窗口 ≠ 记忆&lt;/li&gt;&#xA;&lt;li&gt;类比：RAM 中的数据 vs 硬盘中的文件 vs 刻在芯片里的固件&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h3 id=&#34;12-为什么-llm-需要额外的-memory&#34;&gt;&#xA;  1.2 为什么 LLM 需要额外的 Memory？&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#12-%e4%b8%ba%e4%bb%80%e4%b9%88-llm-%e9%9c%80%e8%a6%81%e9%a2%9d%e5%a4%96%e7%9a%84-memory&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h3&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;上下文窗口的物理限制（即使 1M tokens 也不等于&amp;quot;无限记忆&amp;rdquo;）&lt;/li&gt;&#xA;&lt;li&gt;注意力稀释问题（Lost in the Middle 效应）&lt;/li&gt;&#xA;&lt;li&gt;成本考量：每次携带全部历史 = 指数级 token 开销&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h3 id=&#34;13-memory-的分类体系基于-arxiv251213564--arxiv260307670&#34;&gt;&#xA;  1.3 Memory 的分类体系（基于 arXiv:2512.13564 / arXiv:2603.07670）&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#13-memory-%e7%9a%84%e5%88%86%e7%b1%bb%e4%bd%93%e7%b3%bb%e5%9f%ba%e4%ba%8e-arxiv251213564--arxiv260307670&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h3&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&lt;strong&gt;Forms（形态）&lt;/strong&gt;：明文记忆、向量记忆、参数记忆、结构化记忆（KG）&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;Functions（功能）&lt;/strong&gt;：存储、检索、遗忘、更新、整合&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;Dynamics（动态演化）&lt;/strong&gt;：记忆的生成、衰减、巩固、迁移&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;blockquote&gt;&#xA;&lt;p&gt;📊 图 X-1 [Mermaid] Agent Memory 三维度分类框架图（Forms × Functions × Dynamics）&#xA;📋 表 X-1 四种 Memory 形态的对比（存储介质、读写方式、持久性、典型场景）&lt;/p&gt;</description>
    </item>
    <item>
      <title></title>
      <link>https://www6v.github.io/www6vAIGC/docs/Agent-Infra/agent-memory/other/references/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>https://www6v.github.io/www6vAIGC/docs/Agent-Infra/agent-memory/other/references/</guid>
      <description>&lt;h1 id=&#34;大模型-agent-和应用-agent-memory-章节参考文献&#34;&gt;&#xA;  《大模型 Agent 和应用》— Agent Memory 章节参考文献&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#%e5%a4%a7%e6%a8%a1%e5%9e%8b-agent-%e5%92%8c%e5%ba%94%e7%94%a8-agent-memory-%e7%ab%a0%e8%8a%82%e5%8f%82%e8%80%83%e6%96%87%e7%8c%ae&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h1&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;一学术论文&#34;&gt;&#xA;  一、学术论文&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#%e4%b8%80%e5%ad%a6%e6%9c%af%e8%ae%ba%e6%96%87&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h2&gt;&#xA;&lt;h3 id=&#34;11-综述&#34;&gt;&#xA;  1.1 综述&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#11-%e7%bb%bc%e8%bf%b0&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h3&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&lt;strong&gt;[arXiv:2512.13564]&lt;/strong&gt; &amp;ldquo;Memory in the Age of AI Agents&amp;rdquo; — 全面梳理 Agent Memory 的形态（Forms）、功能（Functions）和动态演化（Dynamics），定义了 Memory 在 Agent 架构中的系统性地位。&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;[arXiv:2603.07670]&lt;/strong&gt; Du, P. &amp;ldquo;Memory for Autonomous LLM Agents: Mechanisms, Evaluation, and Emerging Frontiers&amp;rdquo; (2026) — 系统梳理自主 LLM Agent 记忆的机制设计、评估方法和新兴前沿方向，聚焦 Agent 在长周期、多轮次场景下如何构建、维护和利用记忆以克服上下文窗口限制。&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h3 id=&#34;12-开创性工作&#34;&gt;&#xA;  1.2 开创性工作&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#12-%e5%bc%80%e5%88%9b%e6%80%a7%e5%b7%a5%e4%bd%9c&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h3&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&lt;strong&gt;[arXiv:2304.03442]&lt;/strong&gt; Park, J.S. et al. &amp;ldquo;Generative Agents: Interactive Simulacra of Human Behavior&amp;rdquo; — 提出 Memory-Reflection-Planning 循环，在虚拟小镇中展示 25 个 Agent 的长期记忆、社交互动和自发行为。&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;[arXiv:2310.08560]&lt;/strong&gt; Packer, C. et al. &amp;ldquo;MemGPT: Towards LLMs as Operating Systems&amp;rdquo; — 提出虚拟上下文管理（Virtual Context Management），将操作系统分层内存思想引入 LLM，实现文档分析和多轮对话中的长期记忆。后演变为 Letta 项目。&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;[arXiv:2303.11366]&lt;/strong&gt; Shinn, N. et al. &amp;ldquo;Reflexion: Language Agents with Verbal Reinforcement Learning&amp;rdquo; — 提出语言层面的反射式自我修正，Agent 通过记忆失败教训并生成反思来持续改进策略。&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;[arXiv:2309.02427]&lt;/strong&gt; CoALA 框架 — 提出认知架构的统一框架，系统化梳理 Agent 中 Learning 与 Acting 的协同机制。&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h3 id=&#34;13-上下文与检索优化&#34;&gt;&#xA;  1.3 上下文与检索优化&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#13-%e4%b8%8a%e4%b8%8b%e6%96%87%e4%b8%8e%e6%a3%80%e7%b4%a2%e4%bc%98%e5%8c%96&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h3&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&lt;strong&gt;[arXiv:2310.06839]&lt;/strong&gt; Jiang, H. et al. &amp;ldquo;LongLLMLingua: Accelerating and Enhancing LLMs in Long Context Scenarios via Prompt Compression&amp;rdquo; — 通过问题感知的 prompt 压缩，在长上下文场景下降低 token 消耗同时保持关键信息。&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;[arXiv:2312.03815]&lt;/strong&gt; AIOS: LLM Agent Operating System — 将 LLM 视为操作系统的核，提供上下文管理、权限控制、资源调度等 OS 级基础设施。&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;二工业实践&#34;&gt;&#xA;  二、工业实践&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#%e4%ba%8c%e5%b7%a5%e4%b8%9a%e5%ae%9e%e8%b7%b5&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h2&gt;&#xA;&lt;h3 id=&#34;21-memos--memoryos&#34;&gt;&#xA;  2.1 MemOS / MemoryOS&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#21-memos--memoryos&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h3&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&lt;strong&gt;[arXiv:2505.22101]&lt;/strong&gt; Li, Z. et al. &amp;ldquo;MemOS: An Operating System for Memory-Augmented Generation (MAG) in Large Language Models&amp;rdquo; (2025) — 首次将 Memory 提升为 LLM 的一等公民资源，统一参数记忆、激活记忆和明文记忆的表示、组织和治理机制。核心抽象为 MemCube，支持异构记忆的追踪、融合和迁移。&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;[arXiv:2507.03724]&lt;/strong&gt; Li, Z. et al. &amp;ldquo;MemOS: A Memory OS for AI System&amp;rdquo; (2025) — MemOS 的系统级扩展，将记忆视为可管理系统资源，统一 plaintext、activation-based 和 parameter-level 三种记忆的调度与演化，引入 MemCube 封装记忆内容与元数据（provenance、versioning），支持记忆的组成、迁移和融合。&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h3 id=&#34;22-mem0&#34;&gt;&#xA;  2.2 Mem0&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#22-mem0&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h3&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&lt;strong&gt;[arXiv:2504.19413]&lt;/strong&gt; Chhikara, P. et al. &amp;ldquo;Mem0: Building Production-Ready AI Agents with Scalable Long-Term Memory&amp;rdquo; (2025) — Mem0 团队的官方技术论文，详细阐述 Mem0 架构设计、可扩展长期记忆的构建方法、在生产环境中的实践经验和效果评估。&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;官方网站&lt;/strong&gt;: &lt;a href=&#34;https://mem0.ai/&#34;&gt;https://mem0.ai/&lt;/a&gt;&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;文档&lt;/strong&gt;: &lt;a href=&#34;https://docs.mem0.ai/&#34;&gt;https://docs.mem0.ai/&lt;/a&gt;&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;GitHub&lt;/strong&gt;: &lt;a href=&#34;https://github.com/mem0ai/mem0&#34;&gt;https://github.com/mem0ai/mem0&lt;/a&gt;&lt;/li&gt;&#xA;&lt;li&gt;Mem0（YC-backed）提供面向 AI 应用的 Memory 基础设施，核心能力包括：（1）基于对话的增量记忆提取与更新（Add → Learn → Retrieve 三步流程）；（2）单层 pass 的分层蒸馏压缩引擎，自动将聊天历史压缩为紧凑记忆，降低 token 消耗和延迟；（3）跨 session 和跨 agent 的记忆持久化；（4）支持多模态记忆（文本、图像、音频）。在 Healthcare、Education、CRM 等领域有落地案例。提供 Python/Node.js SDK 和云端 API。&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h3 id=&#34;23-letta原-memgpt&#34;&gt;&#xA;  2.3 Letta（原 MemGPT）&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#23-letta%e5%8e%9f-memgpt&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h3&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&lt;strong&gt;[arXiv:2310.08560]&lt;/strong&gt; Packer, C. et al. &amp;ldquo;MemGPT: Towards LLMs as Operating Systems&amp;rdquo; (2023) — 开创性工作，提出虚拟上下文管理，启发了后续 Letta 项目。&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;官方网站&lt;/strong&gt;: &lt;a href=&#34;https://www.letta.com/&#34;&gt;https://www.letta.com/&lt;/a&gt;&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;GitHub&lt;/strong&gt;: &lt;a href=&#34;https://github.com/letta-ai/letta&#34;&gt;https://github.com/letta-ai/letta&lt;/a&gt;&lt;/li&gt;&#xA;&lt;li&gt;Letta 诞生于 UC Berkeley Sky Computing Lab 的 MemGPT 研究，定位为&amp;quot;Memory-first Agent&amp;quot;平台。核心特性：（1）持久化 Agent，每个 Agent 拥有独立经验和人格，可随交互持续进化；（2）后台 Memory Subagent 自动改进 prompt、上下文和技能；（3）Memory Palace 可透明查看和修改 Agent 记忆；（4）记忆可跨模型和跨提供商迁移（port memory across models）；（5）支持在任意设备上运行，通过 letta server 远程控制。&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h3 id=&#34;24-openviking&#34;&gt;&#xA;  2.4 OpenViking&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#24-openviking&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h3&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&lt;strong&gt;GitHub&lt;/strong&gt;: &lt;a href=&#34;https://github.com/volcengine/OpenViking&#34;&gt;https://github.com/volcengine/OpenViking&lt;/a&gt;&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;官方网站&lt;/strong&gt;: &lt;a href=&#34;https://openviking.ai/&#34;&gt;https://openviking.ai/&lt;/a&gt;&lt;/li&gt;&#xA;&lt;li&gt;字节跳动（火山引擎）开源的 AI Agent Context Database，专为 Agent（如 OpenClaw）设计。核心设计哲学：&lt;strong&gt;摒弃传统 RAG 的碎片化向量存储模式，采用文件系统范式统一管理 Agent 所需的记忆、资源和技能&lt;/strong&gt;。&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&lt;strong&gt;文件系统管理范式&lt;/strong&gt;：基于文件系统层级结构统一管理记忆（Memory）、资源（Resources）和技能（Skills），解决上下文碎片化问题。&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;L0/L1/L2 三级上下文加载&lt;/strong&gt;：按需加载，显著降低 token 消耗。&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;目录递归检索&lt;/strong&gt;：结合目录定位与语义搜索，实现递归式精准上下文获取，突破扁平检索的局限。&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;可视化检索轨迹&lt;/strong&gt;：支持目录检索轨迹可视化，可观测检索路径，解决传统 RAG 的黑盒问题。&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;自动会话管理&lt;/strong&gt;：自动压缩对话内容、资源引用、工具调用等，提取长期记忆，实现上下文自迭代。&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;原生支持 OpenClaw 等 Agent 平台&lt;/strong&gt;，提供 pip install openviking 一键安装。&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h3 id=&#34;25-阿里-reme&#34;&gt;&#xA;  2.5 阿里 ReMe&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#25-%e9%98%bf%e9%87%8c-reme&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h3&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;阿里巴巴推出的 Retrieval-enhanced Memory 系统，面向长周期 Agent 的持续记忆管理。核心设计：（1）基于检索增强的记忆存取架构，将交互历史转化为可检索的结构化记忆单元；（2）支持记忆的自动摘要、去重和冲突解决；（3）与通义系列大模型深度集成，在电商客服、智能助手等场景中有大规模应用验证。&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h3 id=&#34;26-claude-code-的-memory-实现&#34;&gt;&#xA;  2.6 Claude Code 的 Memory 实现&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#26-claude-code-%e7%9a%84-memory-%e5%ae%9e%e7%8e%b0&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h3&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&lt;strong&gt;官方文档&lt;/strong&gt;: &lt;a href=&#34;https://code.claude.com/docs/en/agent-sdk/sessions&#34;&gt;https://code.claude.com/docs/en/agent-sdk/sessions&lt;/a&gt;&lt;/li&gt;&#xA;&lt;li&gt;Claude Code（Anthropic）通过 Session 机制实现对话记忆的持久化管理：（1）自动将 Agent 的完整对话历史（prompt、tool calls、tool results、responses）写入磁盘，支持后续恢复；（2）&lt;code&gt;resume&lt;/code&gt; 可按 session ID 恢复特定历史会话，&lt;code&gt;fork&lt;/code&gt; 可复制当前会话创建分支用于探索不同方向；（3）&lt;code&gt;SystemMessage(subtype=&amp;quot;compact_boundary&amp;quot;)&lt;/code&gt; 标记上下文压缩边界，压缩后仅保留摘要；（4）支持文件级 checkpoint，在重要操作前手动快照文件系统状态；（5）Memory 能力本身需外部实现（Claude Code 不内置长期记忆层），通过 Session + 外部存储组合实现。&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;[Deep Dive: Claude Code Memory Architecture]&lt;/strong&gt; Snowan &amp;ldquo;Deep Dive: Claude Code Memory Architecture&amp;rdquo; — 深入解析 Claude Code 的 Memory 架构设计，包括 Session 持久化机制、resume/fork 实现原理、compact_boundary 的上下文压缩策略。（URL: &lt;a href=&#34;https://snowan.gitbook.io/study-notes/ai-blogs/claude-code-memory-architecture&#34;&gt;https://snowan.gitbook.io/study-notes/ai-blogs/claude-code-memory-architecture&lt;/a&gt;）&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h3 id=&#34;27-openclaw-的-memory-实现&#34;&gt;&#xA;  2.7 OpenClaw 的 Memory 实现&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#27-openclaw-%e7%9a%84-memory-%e5%ae%9e%e7%8e%b0&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h3&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&lt;strong&gt;官方文档&lt;/strong&gt;: &lt;a href=&#34;https://docs.openclaw.ai/&#34;&gt;https://docs.openclaw.ai/&lt;/a&gt;&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;GitHub&lt;/strong&gt;: &lt;a href=&#34;https://github.com/openclaw/openclaw&#34;&gt;https://github.com/openclaw/openclaw&lt;/a&gt;&lt;/li&gt;&#xA;&lt;li&gt;OpenClaw 作为自托管 AI 网关，提供多层 Memory 架构：（1）短期记忆基于会话上下文窗口，通过 Agent Loop 内维护对话状态；（2）长期记忆采用文件持久化方案（MEMORY.md、USER.md、TOOLS.md、SOUL.md 等结构化 Markdown 文件），每次会话启动时自动加载；（3）&lt;code&gt;memory/&lt;/code&gt; 目录按日期存储每日笔记（&lt;code&gt;YYYY-MM-DD.md&lt;/code&gt;），支持原始日志和精炼长期记忆的分离；（4）Heartbeat 机制定期执行记忆维护——将日记中的关键洞察蒸馏到 MEMORY.md，淘汰过时信息；（5）结合向量数据库（如 LanceDB）实现语义记忆检索。整体设计借鉴操作系统的&amp;quot;缓存 → 主存 → 磁盘&amp;quot;分层策略。&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;[InfoQ]&lt;/strong&gt; 熊飞宇（MemTensor 创始人 &amp;amp; CEO）&amp;ldquo;从上下文到经验资产：OpenClaw 热潮下的 Agent 记忆系统工程实践&amp;rdquo; — 从工程实践视角分析 OpenClaw 的记忆系统设计，探讨如何将对话上下文转化为可沉淀的经验资产。（URL 待补充）&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;[Deep Dive: How OpenClaw&amp;rsquo;s Memory System Works]&lt;/strong&gt; Snowan &amp;ldquo;Deep Dive: How OpenClaw&amp;rsquo;s Memory System Works&amp;rdquo; — 深入解析 OpenClaw 的记忆系统架构，包括 Markdown 文件分层、Heartbeat 机制、LanceDB 向量检索等核心组件的设计与实现。（URL: &lt;a href=&#34;https://snowan.gitbook.io/study-notes/ai-blogs/openclaw-memory-system-deep-dive&#34;&gt;https://snowan.gitbook.io/study-notes/ai-blogs/openclaw-memory-system-deep-dive&lt;/a&gt;）&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h3 id=&#34;28-hermes-agent-的-memory-实现&#34;&gt;&#xA;  2.8 Hermes Agent 的 Memory 实现&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#28-hermes-agent-%e7%9a%84-memory-%e5%ae%9e%e7%8e%b0&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h3&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&lt;strong&gt;GitHub&lt;/strong&gt;: &lt;a href=&#34;https://github.com/NousResearch/hermes-agent&#34;&gt;https://github.com/NousResearch/hermes-agent&lt;/a&gt;&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;文档&lt;/strong&gt;: &lt;a href=&#34;https://hermes-agent.docs.nousresearch.com/&#34;&gt;https://hermes-agent.docs.nousresearch.com/&lt;/a&gt;&lt;/li&gt;&#xA;&lt;li&gt;Hermes Agent（NousResearch）的 Memory 系统有以下独特设计：（1）基于 SQLite + FTS5 全文索引的轻量级会话存储，无需外部向量数据库（如 Milvus/Pinecone），对轻量级部署友好；（2）集成 &lt;a href=&#34;https://github.com/plastic-labs/honcho&#34;&gt;Honcho&lt;/a&gt; 用户建模系统，通过辩证交互（主动提问验证和更新用户理解）构建深层用户画像；（3）闭环学习（Closed Learning Loop）系统：Agent 不仅使用工具，还能产出训练数据，用于后续 RL 训练；（4）通过 MEMORY.md / USER.md 等结构化文件实现跨会话记忆，并设有记忆字符上限强制 Agent 学会&amp;quot;什么值得记&amp;quot;；（5）内置 47 个工具分布在 19 个 toolsets 中，可按平台（CLI vs 消息渠道）动态启用不同记忆相关工具。&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;三删除的条目&#34;&gt;&#xA;  三、删除的条目&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#%e4%b8%89%e5%88%a0%e9%99%a4%e7%9a%84%e6%9d%a1%e7%9b%ae&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h2&gt;&#xA;&lt;p&gt;以下条目已从本列表中移除：&lt;/p&gt;</description>
    </item>
    <item>
      <title></title>
      <link>https://www6v.github.io/www6vAIGC/docs/Deep-Research/research/deep-research/deep-research-outline/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>https://www6v.github.io/www6vAIGC/docs/Deep-Research/research/deep-research/deep-research-outline/</guid>
      <description>&lt;h1 id=&#34;deep-research-文章大纲&#34;&gt;&#xA;  Deep Research 文章大纲&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#deep-research-%e6%96%87%e7%ab%a0%e5%a4%a7%e7%ba%b2&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h1&gt;&#xA;&lt;h2 id=&#34;1-引言什么是-deep-research&#34;&gt;&#xA;  1. 引言：什么是 Deep Research？&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#1-%e5%bc%95%e8%a8%80%e4%bb%80%e4%b9%88%e6%98%af-deep-research&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h2&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;1.1 定义与演进（从 Web Search → Agentic Search → Deep Research）&lt;/li&gt;&#xA;&lt;li&gt;1.2 与传统搜索/问答的本质区别（单次检索 vs 多轮自主探索）&lt;/li&gt;&#xA;&lt;li&gt;1.3 为什么 Deep Research 是大模型应用的重要分水岭&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h2 id=&#34;2-技术架构深度解析&#34;&gt;&#xA;  2. 技术架构深度解析&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#2-%e6%8a%80%e6%9c%af%e6%9e%b6%e6%9e%84%e6%b7%b1%e5%ba%a6%e8%a7%a3%e6%9e%90&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h2&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&#xA;&lt;p&gt;&lt;strong&gt;2.1 整体架构分层&lt;/strong&gt;&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&lt;strong&gt;感知层（Perception）&lt;/strong&gt;：Web 搜索、页面爬取、API 调用、文档解析&#xA;&lt;ul&gt;&#xA;&lt;li&gt;搜索引擎接入（Google/Bing/SearXNG 等）&lt;/li&gt;&#xA;&lt;li&gt;网页内容提取（Readability / Jina Reader / Firecrawl）&lt;/li&gt;&#xA;&lt;li&gt;多源数据整合（学术论文、新闻、代码仓库、私有知识库）&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;认知层（Cognition）&lt;/strong&gt;：信息理解、推理、知识整合&#xA;&lt;ul&gt;&#xA;&lt;li&gt;LLM 作为推理引擎（推理模型 vs 通用模型的选择）&lt;/li&gt;&#xA;&lt;li&gt;信息抽取与结构化（实体、关系、时间线）&lt;/li&gt;&#xA;&lt;li&gt;知识图谱构建与利用&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;决策层（Decision）&lt;/strong&gt;：策略制定、路径规划、迭代控制&#xA;&lt;ul&gt;&#xA;&lt;li&gt;任务分解策略（自上而下 vs 自下而上）&lt;/li&gt;&#xA;&lt;li&gt;搜索路径优化（广度优先 vs 深度优先 vs 自适应）&lt;/li&gt;&#xA;&lt;li&gt;资源预算分配（token 预算、时间预算、API 调用限制）&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;执行层（Action）&lt;/strong&gt;：工具调用、搜索执行、报告输出&#xA;&lt;ul&gt;&#xA;&lt;li&gt;工具调用框架（Function Calling / MCP / ReAct）&lt;/li&gt;&#xA;&lt;li&gt;报告生成与引用标注&lt;/li&gt;&#xA;&lt;li&gt;人机交互（中间状态反馈、方向修正）&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;/li&gt;&#xA;&lt;li&gt;&#xA;&lt;p&gt;&lt;strong&gt;2.2 核心组件详解&lt;/strong&gt;&lt;/p&gt;</description>
    </item>
    <item>
      <title></title>
      <link>https://www6v.github.io/www6vAIGC/docs/Harness-engineering/harness-enginering/harness/harness-engineering-deep-dive/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>https://www6v.github.io/www6vAIGC/docs/Harness-engineering/harness-enginering/harness/harness-engineering-deep-dive/</guid>
      <description>&lt;h1 id=&#34;harness-工程深潜从-agent-loop-到生产级架构的实战拆解openclaw-vs-claude-code-vs-hermes-agent&#34;&gt;&#xA;  Harness 工程深潜：从 Agent Loop 到生产级架构的实战拆解——OpenClaw vs Claude Code vs Hermes Agent&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#harness-%e5%b7%a5%e7%a8%8b%e6%b7%b1%e6%bd%9c%e4%bb%8e-agent-loop-%e5%88%b0%e7%94%9f%e4%ba%a7%e7%ba%a7%e6%9e%b6%e6%9e%84%e7%9a%84%e5%ae%9e%e6%88%98%e6%8b%86%e8%a7%a3openclaw-vs-claude-code-vs-hermes-agent&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h1&gt;&#xA;&lt;blockquote&gt;&#xA;&lt;p&gt;写在前面的话：本文不是概念科普，而是从源码和工程实践出发，拆解&amp;quot;Harness&amp;quot;到底是什么、怎么实现的、有哪些坑。以 &lt;strong&gt;OpenClaw&lt;/strong&gt;、&lt;strong&gt;Claude Code&lt;/strong&gt; 和 &lt;strong&gt;Hermes Agent&lt;/strong&gt; 三个典型实现为案例，穿插通用设计模式。&lt;/p&gt;&lt;/blockquote&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;一什么是-harness&#34;&gt;&#xA;  一、什么是 Harness&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#%e4%b8%80%e4%bb%80%e4%b9%88%e6%98%af-harness&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h2&gt;&#xA;&lt;p&gt;在大模型应用开发中，&amp;ldquo;Harness&amp;rdquo;（线束/支架）指的是&lt;strong&gt;围绕 LLM API 调用构建的工程基础设施层&lt;/strong&gt;。它把裸模型变成可用的 Agent 系统。&lt;/p&gt;&#xA;&lt;p&gt;如果把 LLM 比作引擎，Harness 就是底盘、传动系统、仪表板和安全气囊的总和。没有它，引擎再好也跑不起来。&lt;/p&gt;&#xA;&lt;p&gt;一个完整的 Harness 至少包含以下模块：&lt;/p&gt;&#xA;&lt;pre tabindex=&#34;0&#34;&gt;&lt;code&gt;┌─────────────────────────────────────────────┐&#xA;│                  Harness                     │&#xA;│  ┌──────────┐  ┌─────────┐  ┌────────────┐  │&#xA;│  │Agent Loop│  │Tool     │  │Context     │  │&#xA;│  │(ReAct)   │  │Dispatch │  │Management  │  │&#xA;│  └────┬─────┘  └────┬────┘  └─────┬──────┘  │&#xA;│       │              │              │         │&#xA;│  ┌────┴──────────────┴──────────────┴──────┐ │&#xA;│  │          Session &amp;amp; State Layer          │ │&#xA;│  └─────────────────────────────────────────┘ │&#xA;│  ┌──────────┐  ┌─────────┐  ┌────────────┐  │&#xA;│  │Security &amp;amp;│  │Multi-   │  │Observ-     │  │&#xA;│  │Sandbox   │  │Agent    │  │ability     │  │&#xA;│  │          │  │Routing  │  │            │  │&#xA;│  └──────────┘  └─────────┘  └────────────┘  │&#xA;└─────────────────────────────────────────────┘&#xA;         │&#xA;         ▼&#xA;   ┌───────────┐&#xA;   │  LLM API  │&#xA;   └───────────┘&#xA;&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;每个框都不是概念——都是要实打实写代码的子系统。下面逐个拆解。&lt;/p&gt;</description>
    </item>
    <item>
      <title></title>
      <link>https://www6v.github.io/www6vAIGC/docs/Harness-engineering/OpenClaw/security/openclaw-sandbox-security/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>https://www6v.github.io/www6vAIGC/docs/Harness-engineering/OpenClaw/security/openclaw-sandbox-security/</guid>
      <description>&lt;h1 id=&#34;openclaw-安全执行环境沙箱审批策略管道与深度防御体系&#34;&gt;&#xA;  OpenClaw 安全执行环境：沙箱、审批、策略管道与深度防御体系&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#openclaw-%e5%ae%89%e5%85%a8%e6%89%a7%e8%a1%8c%e7%8e%af%e5%a2%83%e6%b2%99%e7%ae%b1%e5%ae%a1%e6%89%b9%e7%ad%96%e7%95%a5%e7%ae%a1%e9%81%93%e4%b8%8e%e6%b7%b1%e5%ba%a6%e9%98%b2%e5%be%a1%e4%bd%93%e7%b3%bb&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h1&gt;&#xA;&lt;blockquote&gt;&#xA;&lt;p&gt;&lt;strong&gt;基于 OpenClaw v2026.4.21 源码深度分析&lt;/strong&gt;&#xA;作者：小伟 | 2026-04-30&lt;/p&gt;&lt;/blockquote&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;导读&#34;&gt;&#xA;  导读&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#%e5%af%bc%e8%af%bb&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h2&gt;&#xA;&lt;p&gt;LLM Agent 最危险的操作是什么？&lt;strong&gt;执行不受控的命令&lt;/strong&gt;。OpenClaw 面对这个问题的答案不是&amp;quot;信任模型&amp;quot;，而是构建了一套多层纵深防御体系（Defense in Depth）：从 Docker 沙箱隔离 → exec 安全策略 → 命令审批 → 文件系统保护 → SSRF 防护 → 工具策略管道，每一层都独立有效，合在一起构成完整的安全执行环境。&lt;/p&gt;&#xA;&lt;p&gt;本文将从源码级别完整拆解这套体系。&lt;/p&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;1-总览纵深防御架构&#34;&gt;&#xA;  1. 总览：纵深防御架构&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#1-%e6%80%bb%e8%a7%88%e7%ba%b5%e6%b7%b1%e9%98%b2%e5%be%a1%e6%9e%b6%e6%9e%84&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h2&gt;&#xA;&lt;pre tabindex=&#34;0&#34;&gt;&lt;code&gt;┌─────────────────────────────────────────────────────────────────────────┐&#xA;│                    OpenClaw 安全执行环境                                 │&#xA;│                                                                         │&#xA;│  ┌───────────────────────────────────────────────────────────────────┐ │&#xA;│  │  第1层：沙箱隔离（Sandbox Isolation）                               │ │&#xA;│  │  Docker Container: readOnlyRoot, capDrop ALL, network none        │ │&#xA;│  │  SSH Backend: 严格 Host Key 校验 + 独立 workspaceRoot             │ │&#xA;│  └───────────────────────────────────────────────────────────────────┘ │&#xA;│                                │                                       │&#xA;│  ┌─────────────────────────────▼─────────────────────────────────────┐ │&#xA;│  │  第2层：Exec 安全策略（Exec Safety）                                │ │&#xA;│  │  Shell 元字符检测 + 安全可执行值判断                               │ │&#xA;│  │  Safe Bin Profile（仅允许白名单命令）                               │ │&#xA;│  └─────────────────────────────┬─────────────────────────────────────┘ │&#xA;│                                │                                       │&#xA;│  ┌─────────────────────────────▼─────────────────────────────────────┐ │&#xA;│  │  第3层：命令审批（Exec Approval）                                   │ │&#xA;│  │  命令 → 用户确认 → 允许/拒绝/allowlist                             │ │&#xA;│  │  iOS Push / Channel 推送 / Web 界面                               │ │&#xA;│  └─────────────────────────────┬─────────────────────────────────────┘ │&#xA;│                                │                                       │&#xA;│  ┌─────────────────────────────▼─────────────────────────────────────┐ │&#xA;│  │  第4层：文件系统安全（Filesystem Safety）                           │ │&#xA;│  │  readFileWithinRoot / writeFileWithinRoot                         │ │&#xA;│  │  Path Alias Guards / Hardlink Guards                              │ │&#xA;│  │  Path Safety（穿越/符号链接/越界检测）                               │ │&#xA;│  └─────────────────────────────┬─────────────────────────────────────┘ │&#xA;│                                │                                       │&#xA;│  ┌─────────────────────────────▼─────────────────────────────────────┐ │&#xA;│  │  第5层：网络与 SSRF 防护（Network &amp;amp; SSRF）                          │ │&#xA;│  │  Sandbox network=none + SSRF Policy                               │ │&#xA;│  │  Fetch Guard（内网 IP 拦截 + 端口限制）                              │ │&#xA;│  └─────────────────────────────┬─────────────────────────────────────┘ │&#xA;│                                │                                       │&#xA;│  ┌─────────────────────────────▼─────────────────────────────────────┐ │&#xA;│  │  第6层：工具策略管道（Tool Policy Pipeline）                        │ │&#xA;│  │  Allowlist / Denylist / Owner-Only / Profile / FS Policy          │ │&#xA;│  └───────────────────────────────────────────────────────────────────┘ │&#xA;│                                                                         │&#xA;└─────────────────────────────────────────────────────────────────────────┘&#xA;&lt;/code&gt;&lt;/pre&gt;&lt;hr&gt;&#xA;&lt;h2 id=&#34;2-第1层沙箱隔离sandbox-isolation&#34;&gt;&#xA;  2. 第1层：沙箱隔离（Sandbox Isolation）&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#2-%e7%ac%ac1%e5%b1%82%e6%b2%99%e7%ae%b1%e9%9a%94%e7%a6%bbsandbox-isolation&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h2&gt;&#xA;&lt;h3 id=&#34;21-沙箱配置解析&#34;&gt;&#xA;  2.1 沙箱配置解析&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#21-%e6%b2%99%e7%ae%b1%e9%85%8d%e7%bd%ae%e8%a7%a3%e6%9e%90&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h3&gt;&#xA;&lt;p&gt;&lt;strong&gt;源码&lt;/strong&gt;：&lt;a href=&#34;https://github.com/openclaw/openclaw/blob/main/src/agents/sandbox/config.ts&#34;&gt;sandbox/config.ts&lt;/a&gt;&lt;/p&gt;</description>
    </item>
    <item>
      <title></title>
      <link>https://www6v.github.io/www6vAIGC/docs/Harness-engineering/OpenClaw/stability/openclaw-long-task-stability/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>https://www6v.github.io/www6vAIGC/docs/Harness-engineering/OpenClaw/stability/openclaw-long-task-stability/</guid>
      <description>&lt;h1 id=&#34;openclaw-如何保证长程任务的稳定性从架构到源码实现&#34;&gt;&#xA;  OpenClaw 如何保证长程任务的稳定性：从架构到源码实现&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#openclaw-%e5%a6%82%e4%bd%95%e4%bf%9d%e8%af%81%e9%95%bf%e7%a8%8b%e4%bb%bb%e5%8a%a1%e7%9a%84%e7%a8%b3%e5%ae%9a%e6%80%a7%e4%bb%8e%e6%9e%b6%e6%9e%84%e5%88%b0%e6%ba%90%e7%a0%81%e5%ae%9e%e7%8e%b0&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h1&gt;&#xA;&lt;blockquote&gt;&#xA;&lt;p&gt;OpenClaw v2026.4.21，源码版本分析。所有结论来自官方文档与 &lt;code&gt;openclaw&lt;/code&gt; npm 包源码（TypeScript → ESM bundle），源码路径标注格式为 &lt;code&gt;src/&amp;lt;path&amp;gt;&lt;/code&gt;。&lt;/p&gt;&lt;/blockquote&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;概览&#34;&gt;&#xA;  概览&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#%e6%a6%82%e8%a7%88&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h2&gt;&#xA;&lt;p&gt;OpenClaw 不是简单地把一个 LLM API 调用丢出去就完了。它在 Gateway 层构建了一整套 &lt;strong&gt;任务生命周期管理 + 可靠性机制&lt;/strong&gt;，涵盖任务账本、超时保护、队列串行化、文件级写锁、上下文压缩、进程守护等多层防护。&lt;/p&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;1-background-tasks--任务生命周期账本&#34;&gt;&#xA;  1. Background Tasks — 任务生命周期账本&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#1-background-tasks--%e4%bb%bb%e5%8a%a1%e7%94%9f%e5%91%bd%e5%91%a8%e6%9c%9f%e8%b4%a6%e6%9c%ac&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h2&gt;&#xA;&lt;h3 id=&#34;11-状态机&#34;&gt;&#xA;  1.1 状态机&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#11-%e7%8a%b6%e6%80%81%e6%9c%ba&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h3&gt;&#xA;&lt;p&gt;所有脱离主会话的工作（ACP runs、subagent spawns、cron 执行、CLI agent 命令）都会创建一条 &lt;strong&gt;Task 记录&lt;/strong&gt;，经历完整状态机：&lt;/p&gt;&#xA;&lt;pre tabindex=&#34;0&#34;&gt;&lt;code&gt;queued → running → succeeded / failed / timed_out / cancelled / lost&#xA;&lt;/code&gt;&lt;/pre&gt;&lt;h3 id=&#34;12-源码实现&#34;&gt;&#xA;  1.2 源码实现&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#12-%e6%ba%90%e7%a0%81%e5%ae%9e%e7%8e%b0&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h3&gt;&#xA;&lt;p&gt;&lt;strong&gt;任务执行器&lt;/strong&gt;（&lt;code&gt;src/tasks/task-executor.ts&lt;/code&gt;）定义了 6 个核心操作：&lt;/p&gt;&#xA;&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; style=&#34;color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;&#34;&gt;&lt;code class=&#34;language-typescript&#34; data-lang=&#34;typescript&#34;&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#75715e&#34;&gt;// src/tasks/task-executor.ts&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#75715e&#34;&gt;&lt;/span&gt;&lt;span style=&#34;color:#66d9ef&#34;&gt;function&lt;/span&gt; &lt;span style=&#34;color:#a6e22e&#34;&gt;createQueuedTaskRun&lt;/span&gt;(&lt;span style=&#34;color:#a6e22e&#34;&gt;params&lt;/span&gt;) { &lt;span style=&#34;color:#75715e&#34;&gt;/* → status: &amp;#34;queued&amp;#34; */&lt;/span&gt; }&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#66d9ef&#34;&gt;function&lt;/span&gt; &lt;span style=&#34;color:#a6e22e&#34;&gt;createRunningTaskRun&lt;/span&gt;(&lt;span style=&#34;color:#a6e22e&#34;&gt;params&lt;/span&gt;) { &lt;span style=&#34;color:#75715e&#34;&gt;/* → status: &amp;#34;running&amp;#34; */&lt;/span&gt; }&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#66d9ef&#34;&gt;function&lt;/span&gt; &lt;span style=&#34;color:#a6e22e&#34;&gt;startTaskRunByRunId&lt;/span&gt;(&lt;span style=&#34;color:#a6e22e&#34;&gt;params&lt;/span&gt;)  { &lt;span style=&#34;color:#75715e&#34;&gt;/* markTaskRunningByRunId */&lt;/span&gt; }&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#66d9ef&#34;&gt;function&lt;/span&gt; &lt;span style=&#34;color:#a6e22e&#34;&gt;recordTaskRunProgressByRunId&lt;/span&gt;(&lt;span style=&#34;color:#a6e22e&#34;&gt;params&lt;/span&gt;) { &lt;span style=&#34;color:#75715e&#34;&gt;/* 进度更新 */&lt;/span&gt; }&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#66d9ef&#34;&gt;function&lt;/span&gt; &lt;span style=&#34;color:#a6e22e&#34;&gt;completeTaskRunByRunId&lt;/span&gt;(&lt;span style=&#34;color:#a6e22e&#34;&gt;params&lt;/span&gt;) { &lt;span style=&#34;color:#75715e&#34;&gt;/* → status: &amp;#34;succeeded&amp;#34; */&lt;/span&gt; }&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#66d9ef&#34;&gt;function&lt;/span&gt; &lt;span style=&#34;color:#a6e22e&#34;&gt;failTaskRunByRunId&lt;/span&gt;(&lt;span style=&#34;color:#a6e22e&#34;&gt;params&lt;/span&gt;)     { &lt;span style=&#34;color:#75715e&#34;&gt;/* → status: &amp;#34;failed&amp;#34; */&lt;/span&gt; }&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;&lt;strong&gt;分离任务运行时&lt;/strong&gt;（&lt;code&gt;src/tasks/detached-task-runtime.ts&lt;/code&gt;）封装了这些操作，并提供 &lt;strong&gt;可插拔的生命周期钩子&lt;/strong&gt;：&lt;/p&gt;</description>
    </item>
    <item>
      <title></title>
      <link>https://www6v.github.io/www6vAIGC/docs/Harness-engineering/OpenClaw/state/openclaw-conversation-state-management/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>https://www6v.github.io/www6vAIGC/docs/Harness-engineering/OpenClaw/state/openclaw-conversation-state-management/</guid>
      <description>&lt;h1 id=&#34;openclaw-对话状态管理从-session-存储到-context-engine-的源码级拆解&#34;&gt;&#xA;  OpenClaw 对话状态管理：从 Session 存储到 Context Engine 的源码级拆解&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#openclaw-%e5%af%b9%e8%af%9d%e7%8a%b6%e6%80%81%e7%ae%a1%e7%90%86%e4%bb%8e-session-%e5%ad%98%e5%82%a8%e5%88%b0-context-engine-%e7%9a%84%e6%ba%90%e7%a0%81%e7%ba%a7%e6%8b%86%e8%a7%a3&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h1&gt;&#xA;&lt;blockquote&gt;&#xA;&lt;p&gt;&lt;strong&gt;基于 OpenClaw v2026.4.21 源码深度分析&lt;/strong&gt;&#xA;作者：小伟 | 2026-04-30&lt;/p&gt;&lt;/blockquote&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;导读&#34;&gt;&#xA;  导读&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#%e5%af%bc%e8%af%bb&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h2&gt;&#xA;&lt;p&gt;一个 LLM Agent 能&amp;quot;记住&amp;quot;什么、如何管理对话上下文、如何在有限的 context window 中塞入最有价值的信息，这些是 Agent 系统的核心挑战。OpenClaw 的对话状态管理不是简单的&amp;quot;把历史消息传给模型&amp;quot;，而是一个分层架构：从持久化存储 → Session 生命周期 → Session Manager → Context Engine → Compaction → Transcript Repair，每一层各司其职。&lt;/p&gt;&#xA;&lt;p&gt;本文将从源码级别完整拆解这一架构。&lt;/p&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;1-总览对话状态管理架构&#34;&gt;&#xA;  1. 总览：对话状态管理架构&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#1-%e6%80%bb%e8%a7%88%e5%af%b9%e8%af%9d%e7%8a%b6%e6%80%81%e7%ae%a1%e7%90%86%e6%9e%b6%e6%9e%84&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h2&gt;&#xA;&lt;pre tabindex=&#34;0&#34;&gt;&lt;code&gt;┌──────────────────────────────────────────────────────────────────────────┐&#xA;│                    OpenClaw 对话状态管理体系                                │&#xA;│                                                                          │&#xA;│  ┌────────────────────────────────────────────────────────────────────┐ │&#xA;│  │  存储层：持久化                                                       │ │&#xA;│  │  Session Store (sessions.json) + JSONL Transcript (session.jsonl)   │ │&#xA;│  │  + Session Store Cache + Session Write Lock                          │ │&#xA;│  └────────────────────────────────┬───────────────────────────────────┘ │&#xA;│                                   │                                     │&#xA;│  ┌────────────────────────────────▼───────────────────────────────────┐ │&#xA;│  │  会话层：Session 生命周期                                              │ │&#xA;│  │  Session 创建 / 路由 / 分组 / 维护（prune/rotate/maintenance）      │ │&#xA;│  └────────────────────────────────┬───────────────────────────────────┘ │&#xA;│                                   │                                     │&#xA;│  ┌────────────────────────────────▼───────────────────────────────────┐ │&#xA;│  │  引擎层：Session Manager + Context Engine                             │ │&#xA;│  │  SessionManager (pi-coding-agent) + Context Engine (assemble/ingest)│ │&#xA;│  │  + Context Window Guard + Token Estimation                          │ │&#xA;│  └────────────────────────────────┬───────────────────────────────────┘ │&#xA;│                                   │                                     │&#xA;│  ┌────────────────────────────────▼───────────────────────────────────┐ │&#xA;│  │  维护层：Compaction + Maintenance                                     │ │&#xA;│  │  Context Engine Maintenance + Compaction + Session Truncation       │ │&#xA;│  │  + Transcript Rewrite + Tool Result Truncation                      │ │&#xA;│  └────────────────────────────────┬───────────────────────────────────┘ │&#xA;│                                   │                                     │&#xA;│  ┌────────────────────────────────▼───────────────────────────────────┐ │&#xA;│  │  安全层：Repair + Guard                                               │ │&#xA;│  │  Session File Repair + Tool Result Context Guard                    │ │&#xA;│  │  + Tool Use/Result Pairing Sanitize + Thinking Block Repair         │ │&#xA;│  └────────────────────────────────────────────────────────────────────┘ │&#xA;│                                                                          │&#xA;└──────────────────────────────────────────────────────────────────────────┘&#xA;&lt;/code&gt;&lt;/pre&gt;&lt;hr&gt;&#xA;&lt;h2 id=&#34;2-存储层session-store--jsonl-transcript&#34;&gt;&#xA;  2. 存储层：Session Store + JSONL Transcript&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#2-%e5%ad%98%e5%82%a8%e5%b1%82session-store--jsonl-transcript&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h2&gt;&#xA;&lt;h3 id=&#34;21-双存储结构&#34;&gt;&#xA;  2.1 双存储结构&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#21-%e5%8f%8c%e5%ad%98%e5%82%a8%e7%bb%93%e6%9e%84&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h3&gt;&#xA;&lt;p&gt;OpenClaw 使用&lt;strong&gt;两种文件格式&lt;/strong&gt;来管理对话状态：&lt;/p&gt;</description>
    </item>
    <item>
      <title></title>
      <link>https://www6v.github.io/www6vAIGC/docs/Harness-engineering/OpenClaw/tools/openclaw-tool-invocation-flow/</link>
      <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
      <guid>https://www6v.github.io/www6vAIGC/docs/Harness-engineering/OpenClaw/tools/openclaw-tool-invocation-flow/</guid>
      <description>&lt;h1 id=&#34;openclaw-工具调用全流程从模型输出到结果回传的源码级拆解&#34;&gt;&#xA;  OpenClaw 工具调用全流程：从模型输出到结果回传的源码级拆解&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#openclaw-%e5%b7%a5%e5%85%b7%e8%b0%83%e7%94%a8%e5%85%a8%e6%b5%81%e7%a8%8b%e4%bb%8e%e6%a8%a1%e5%9e%8b%e8%be%93%e5%87%ba%e5%88%b0%e7%bb%93%e6%9e%9c%e5%9b%9e%e4%bc%a0%e7%9a%84%e6%ba%90%e7%a0%81%e7%ba%a7%e6%8b%86%e8%a7%a3&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h1&gt;&#xA;&lt;blockquote&gt;&#xA;&lt;p&gt;&lt;strong&gt;基于 OpenClaw v2026.4.21 源码深度分析&lt;/strong&gt;&#xA;作者：小伟 | 2026-04-30&lt;/p&gt;&lt;/blockquote&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;导读&#34;&gt;&#xA;  导读&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#%e5%af%bc%e8%af%bb&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h2&gt;&#xA;&lt;p&gt;OpenClaw 的工具调用系统是其 Agent 能力的核心。模型输出 &lt;code&gt;tool_calls&lt;/code&gt; 后，OpenClaw 并不是简单地&amp;quot;找到函数然后调用&amp;quot;，而是经历了一整套严密的流程：工具发现 → 策略过滤 → 参数归一化 → &lt;code&gt;before_tool_call&lt;/code&gt; 钩子 → 分类分发执行 → 结果截断与媒体提取 → &lt;code&gt;after_tool_call&lt;/code&gt; 钩子 → 写回 transcript → 下一轮 LLM 调用。&lt;/p&gt;&#xA;&lt;p&gt;本文将从源码级别完整拆解这一流程。&lt;/p&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;1-总览工具调用架构图&#34;&gt;&#xA;  1. 总览：工具调用架构图&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#1-%e6%80%bb%e8%a7%88%e5%b7%a5%e5%85%b7%e8%b0%83%e7%94%a8%e6%9e%b6%e6%9e%84%e5%9b%be&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h2&gt;&#xA;&lt;pre tabindex=&#34;0&#34;&gt;&lt;code&gt;┌─────────────────────────────────────────────────────────────────────┐&#xA;│                        OpenClaw Gateway                             │&#xA;│                                                                     │&#xA;│  ┌─────────┐    ┌──────────────┐    ┌──────────────────────────┐   │&#xA;│  │  Model   │───▶│ Tool Policy  │───▶│  Tool Definition         │   │&#xA;│  │  Stream  │    │  Pipeline    │    │  Builder                 │   │&#xA;│  └─────────┘    └──────────────┘    └──────────────────────────┘   │&#xA;│                                    │                                │&#xA;│                                    ▼                                │&#xA;│  ┌─────────────────────────────────────────────────────────────┐   │&#xA;│  │              Agent Loop (selection-DmkxuIQC.js)              │   │&#xA;│  │                                                              │   │&#xA;│  │  1. 接收 assistant tool_calls                                │   │&#xA;│  │  2. buildEmbeddedAttemptToolRunContext() 构建执行上下文      │   │&#xA;│  │  3. before_tool_call 钩子（loop 检测、诊断）                 │   │&#xA;│  │  4. dispatchToolExecution() 分类分发执行                     │   │&#xA;│  │  5. sanitizeToolResult() 结果清洗 + truncation               │   │&#xA;│  │  6. after_tool_call 钩子                                     │   │&#xA;│  │  7. 写入 session transcript (JSONL)                          │   │&#xA;│  │  8. 触发下一轮 LLM 调用                                      │   │&#xA;│  └─────────────────────────────────────────────────────────────┘   │&#xA;│                                    │                                │&#xA;│                                    ▼                                │&#xA;│  ┌──────────┐  ┌──────────┐  ┌──────────┐  ┌──────────────────┐   │&#xA;│  │  exec    │  │  read    │  │ message  │  │  channel tools   │   │&#xA;│  │  process │  │  write   │  │  send    │  │  MCP / plugin    │   │&#xA;│  └──────────┘  └──────────┘  └──────────┘  └──────────────────┘   │&#xA;│                                                                     │&#xA;└─────────────────────────────────────────────────────────────────────┘&#xA;&lt;/code&gt;&lt;/pre&gt;&lt;hr&gt;&#xA;&lt;h2 id=&#34;2-工具发现与注册&#34;&gt;&#xA;  2. 工具发现与注册&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#2-%e5%b7%a5%e5%85%b7%e5%8f%91%e7%8e%b0%e4%b8%8e%e6%b3%a8%e5%86%8c&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h2&gt;&#xA;&lt;h3 id=&#34;21-工具来源分类&#34;&gt;&#xA;  2.1 工具来源分类&#xA;  &lt;a class=&#34;anchor&#34; href=&#34;#21-%e5%b7%a5%e5%85%b7%e6%9d%a5%e6%ba%90%e5%88%86%e7%b1%bb&#34;&gt;#&lt;/a&gt;&#xA;&lt;/h3&gt;&#xA;&lt;p&gt;OpenClaw 的工具来自 4 个渠道：&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
