<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>文档管理 on 王占伟</title><link>https://zhanwei.wang/zh/tags/%E6%96%87%E6%A1%A3%E7%AE%A1%E7%90%86/</link><description>Recent content in 文档管理 on 王占伟</description><generator>Hugo</generator><language>zh-CN</language><lastBuildDate>Thu, 09 Apr 2026 00:00:00 +0800</lastBuildDate><atom:link href="https://zhanwei.wang/zh/tags/%E6%96%87%E6%A1%A3%E7%AE%A1%E7%90%86/index.xml" rel="self" type="application/rss+xml"/><item><title>当文档不再腐烂：从 Karpathy 的 LLM Wiki 到软件工程文档管理</title><link>https://zhanwei.wang/zh/posts/when-documentation-stops-rotting/</link><pubDate>Thu, 09 Apr 2026 00:00:00 +0800</pubDate><guid>https://zhanwei.wang/zh/posts/when-documentation-stops-rotting/</guid><description>&lt;blockquote&gt;
&lt;p&gt;人负责写原始文档和做决策，LLM 负责综合、更新和一致性检查。文档不再是写完即腐烂的静态产物，而是一个由 LLM 持续维护的活知识库。&lt;/p&gt;
&lt;/blockquote&gt;
&lt;h2 id="一个古老的问题"&gt;一个古老的问题&lt;/h2&gt;
&lt;p&gt;每个软件工程师都经历过这样的场景：你接手一个项目，翻开文档，发现 README 还在描述半年前删掉的模块，API 文档里的字段和代码完全对不上，架构图画的是两个版本前的设计。你问同事，同事说&amp;quot;别看文档，直接看代码吧&amp;quot;。&lt;/p&gt;
&lt;p&gt;文档腐烂（documentation decay）不是因为工程师不想写文档，而是因为维护文档的成本太高。写一份设计文档可能花两个小时，但之后每次代码变更都需要回来同步更新 —— 检查交叉引用是否还成立、术语是否一致、边界条件是否还对 —— 这些琐碎的记账工作让人疲惫，最终被放弃。&lt;/p&gt;
&lt;h2 id="karpathy-的洞见知识编译而非知识检索"&gt;Karpathy 的洞见：知识编译而非知识检索&lt;/h2&gt;
&lt;p&gt;2025 年，Andrej Karpathy 提出了一个关于 LLM 与知识管理的重要观察。他的核心主张出奇地简单：&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;不要让 LLM 每次都从原始文档中重新发现模式，而应该让它构建和维护一个结构化的知识库，让知识持续积累。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;这就是 LLM Wiki 模式。它和传统的 RAG（检索增强生成）有一个关键区别 —— RAG 每次查询都强迫 LLM 从零开始重建理解，而 Wiki 模式将综合（synthesis）本身视为一等公民的产物。知识不断积累，因为交叉引用已经建立，矛盾已经被标记，概念之间的关系已经被梳理。&lt;/p&gt;
&lt;p&gt;Karpathy 勾勒了一个三层架构：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;原始来源（Raw Sources）&lt;/strong&gt;：人类策划的不可变文档 —— 论文、文章、笔记。LLM 永远不碰这一层。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Wiki&lt;/strong&gt;：LLM 生成和维护的 Markdown 页面 —— 摘要、实体、概念、对比。LLM 完全拥有这一层的结构和内容。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Schema&lt;/strong&gt;：定义 wiki 结构、命名约定和工作流的配置文件，让 LLM 成为一个有纪律的维护者而不是一个通用聊天机器人。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;以及三个核心操作：&lt;strong&gt;Ingest&lt;/strong&gt;（摄入新来源并更新 wiki）、&lt;strong&gt;Query&lt;/strong&gt;（查询并将有价值的发现回写 wiki）、&lt;strong&gt;Lint&lt;/strong&gt;（健康检查 —— 找矛盾、找孤立页面、找缺失引用）。&lt;/p&gt;
&lt;p&gt;他还提出了一个深刻的分工：&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;人的工作是策划来源、指导分析、问好的问题。LLM 的工作是其他一切。&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;这个&amp;quot;其他一切&amp;quot;，恰好是杀死人类 wiki 的那些事情 —— 更新摘要、维护交叉引用、检查一致性。这些工作对人来说是乏味的苦差事，对 LLM 来说却是可靠且不知疲倦的日常。&lt;/p&gt;</description></item></channel></rss>