用Karpathy的LLM Wiki模式，我搭了一个会自己生长的研究大脑

2026-06-08

先说痛点—你可能也有的那个”research”文件夹
为什么RAG不够
Karpathy的洞见：让AI当图书管理员
三层架构：什么放哪，为什么
三个核心操作
Obsidian的角色：窗口，不是大脑
实战：作者两周的真实经验
会断的地方和怎么修
两周后的改变
更大的图景

先说痛点—你可能也有的那个”research”文件夹

你有一个叫”research”或”阅读资料”或”ai-stuff”的文件夹。里面有四十七个Markdown文件、六篇早就想总结但一直没动的PDF、三个导出过一次就再也没打开的Notion页面，还有一个叫”重要”的浏览器书签文件夹——里面的链接来自2023年。

你知道里面有一篇关于注意力机制的文章，和一篇关于MCP服务器的东西。你几乎确定这两者之间有联系——但你不知道当时记在哪了，也不知道到底有没有记过。

你不是不整理。你是被信息淹没了。这两者有本质区别。

为什么RAG不够

大多数人跟LLM和文档的互动方式是RAG：你把一堆文件上传，LLM在查询时检索相关段落，生成答案。

这能工作，但每次查询LLM都是从零重新发现知识。没有积累。没有成长。问一个需要综合五篇文档的微妙问题，LLM每次都要重新找到相关内容、拼凑在一起。什么都没有被构建起来。

我用了这个模式好几个月。NotebookLM处理论文。ChatGPT文件上传处理会议笔记。一堆永远不会再看第二眼的Claude对话。每一次都是一次性交易——我问一个问题，得到一个答案，关掉标签页，两周后我把同一批论文重新上传，问几乎同样的问题，因为之前综合出的东西没有在任何地方持久保存。

Karpathy的洞见：让AI当图书管理员

2026年4月，Andrej Karpathy在GitHub上丢了一个Gist，就叫”LLM Wiki”。不是新产品、不是新框架、不是SaaS——就是一个”思路文件”，一种设计模式，贴进Claude Code或者Codex里就能用。

核心思路的转变：

过去：你维护知识库，偶尔问AI问题。现在：AI构建和维护整个知识库，你只管丢原始资料。

Karpathy用的类比来自软件工程：编译。你写源代码，编译器把它变成优化过的二进制产物。你不会每次运行源代码——你编译一次，分发产物，在需要时高效执行。编译步骤很贵，但在后续每一次使用中都值回票价。

在这里，编译后的产物不是二进制。是Wiki——一个文件夹的可读Markdown文件，每个概念一个页面，相互交叉引用，由模型维护，在Obsidian中查看。

RAG检索然后遗忘。Wiki积累然后复利。

三层架构：什么放哪，为什么

my-wiki/
├── raw/              # 原始资料（你维护，不可变）
│   ├── papers/
│   ├── articles/
│   └── notes/
├── wiki/             # 知识层（AI写，你读）
│   ├── entities/
│   ├── concepts/
│   ├── sources/
│   ├── index.md
│   └── log.md
└── CLAUDE.md         # 规则层（操作手册）

第一层：raw/ — 原始资料

论文PDF、文章、笔记、播客文字稿全部放在这里。这层不可变——不编辑，不修改，只追加。

不可变不是审美选择，是设计决策。它意味着你随时可以从原始资料重新派生出整个Wiki。如果需要重建、发现AI出了错，你永远不会丢失原始内容。

第二层：wiki/ — 知识层

这是AI生成的Markdown文件，按类型分目录：

entities/: 人物、组织、项目
concepts/: 核心概念、方法、理论
sources/: 每篇资料的总结页

每个页面内部有[[wikilinks]]交叉引用。一页可能关联到10~15个其他页面。

第三层：CLAUDE.md — 规则层

这是整个系统的灵魂。它把通用的LLM变成一个有纪律的知识工作者。

CLAUDE.md定义了：

页面类型（实体、概念、来源、综合）
[[wikilinks]]的命名规范
何时新建页面 vs 更新现有页面
lint检查清单

第一版写得比较粗糙。但经过几十次导入和几次lint之后，它会变成反映你领域实际运作方式的schema。

三个核心操作

1. 导入（Ingest）— 一份资料触达10~15页

你丢一个新资料进raw/，告诉Claude处理它。然后Claude：

读完整篇资料
跟你讨论核心观点和重点
在wiki里写一个摘要页
更新index页面
更新所有相关的实体和概念页面
在log中追加一条记录

一份资料可能触达10~15个Wiki页面。

Karpathy偏好一份一份导入，并在过程中保持参与——读摘要，检查更新，指导AI哪些该强调。第一次导入是一场对话，不是一次批处理。Claude总结完论文后，会建议创建五个概念页，并询问是否需要为某个特定数据集单独建页。这是编辑决策。模型主动询问是对的。

2. 查询（Query）— 质量碾压RAG

LLM不是从某个PDF第14页随机切一段出来。它读的是已经综合好了、交叉引用的百科条目，这些条目已经整合了系统所有所学。

作者问了一个典型问题：“关于上下文窗口长度和AI Agent可靠性的关系，我读过的所有资料都说了什么？”

Claude做了三件事：

读了index，定位到6个相关Wiki页面
引用4篇不同论文，按名字引用
标出了一个矛盾——两篇论文在这个问题上立场相反

还有一个关键设计：--save标记。当开启时，一次有价值的综合查询结果会被自动归档为新的Wiki页面。未来会话立即受益。Karpathy把这称为”复利原则”——你问了一个问题，系统回答了，现在Wiki也知道答案了。

3. 健康检查（Lint）— 每周8分钟的保养

没人爱做维护，这就是为什么人在做的时候Wiki最终会腐烂。但LLM做这个只需8分钟。

定期让AI健康检查Wiki，它会找：

页面之间的矛盾
被新资料推翻的过时断言
没有入链的孤立页面
被频繁提及但没有独立页面的概念
丢失的交叉引用
需要补充搜索填补的知识空白

作者在12天后做了第一次lint。AI发现了：

3个矛盾——其中一个第一周和第二周导入的论文之间的真实分歧，作者完全没有注意到
2个孤立页面
4个被跨页引用但没有独立页面的概念

全程约8分钟。

在lint中标记矛盾，LLM花3分钟。而那个导致每份人维护的Wiki最终腐烂的知识管理开销，彻底消失了。剩下的是真正属于人的部分：筛选资料、决定哪些重要、问正确的问题、思考这一切意味着什么。LLM处理其他一切。

Obsidian的角色：窗口，不是大脑

这里有一个关键区别：Claude Code是大脑，Obsidian是窗口。

Obsidian作为Wiki的IDE存在。它渲染带反向链接的Markdown，显示页面之间的图视图，支持全文搜索，文件变更时实时刷新。

你始终处于阅读模式，从不处于编辑模式。你浏览、跟链接、看图、阅读。你从不直接编辑Wiki文件。

图视图是那个能转变怀疑者的功能。两周后，87个页面——图视图显示出了自然的聚类：围绕Transformer架构的、围绕Agent记忆的、围绕评估文献的。特定页面作为聚类之间的桥梁。作者没有设计这些聚类——模型通过跟踪文献中实际一起讨论的内容，自主发现了这些结构。

实战：作者两周的真实经验

指标	数值
时间投入	首次搭建~2小时，后续每次导入15分钟
导入资料	34份（论文、文章、YouTube字幕、播客笔记）
生成页面	87个（作者一个都没自己写）
首次lint	12天后，8分钟，发现3个矛盾+2个孤立页+4个缺失概念
token消耗	导入阶段约5~8倍原始token量，查询阶段极低

会断的地方和怎么修

Schema在第三天跟你打架

第一个版本的CLAUDE.md太抽象了。几次导入后，模型创建页面的结构不一致——有些有”Key Claims”章节，有些有”Main Arguments”，意思一样但命名不同。修复方法：标准化章节名。模型会严格遵循schema说什么，所以schema必须说清楚。

认知漂移

如果AI在导入时误解了一份资料——误解、幻觉出的连接——这个错误会进入Wiki，影响后续导入。Lint操作能减轻但不能消除。通过git diff进行人工审核是真正的安全网。作者在每次导入后跑git diff，花90秒，两周内抓住了两次错误。

规模上限：约100~200份资料

Karpathy建议Wiki包含大约100篇文章以确保系统保持高效。超过这个规模，可能需要LLM Wiki v2的扩展（混合搜索、多Agent治理）或专门的RAG管线。

好消息是：200份精选资料，经过正确的编译和交叉引用，比2000份在RAG系统中每次都从零检索的原始文档有用得多。

导入成本前置

导入步骤是token消耗最集中的地方。一份10页的PDF可能触发12个Wiki文件的更新。预算大约是原始token量的5~8倍。但后续查询极为便宜——通常只需要index.md加2~3个概念页。

两周后的改变

我停止了丢失东西。

听起来很平凡？其实不然。在这个系统之前，每篇读过的有趣论文都处于逐渐衰减的状态——刚读那天最有用，此后每周都在退化。

两周后，相反的事正在发生。每份新资料都让现有资料更容易被发现，因为导入过程会明确更新所有相关页面。第一天读的论文现在在11个后来添加的Wiki页面上被交叉引用。它比刚读的时候更有连接了。

Karpathy本人几乎从不直接编辑Wiki文件。他把Wiki视为”AI的领地”。AI写、更新、维护。Karpathy只读。

那个让系统有效的纪律：你一旦开始手动编辑Wiki页面，你就在AI自己的领土上和它竞争，并且失去了让整个系统可行的维护自动化。

更大的图景

Karpathy还提到了一个未来方向：用Wiki生成合成训练数据，微调一个LLM，让它”在权重中知道”这些数据，而不仅仅通过上下文窗口理解。这意味着把个人知识库变成个性化模型。

那个未来比Gist听起来要远一些。但当前的版本——一个自愈、交叉引用、AI维护的Wiki，跑在你本机的一个文件夹里——已经是作者用过的最好的知识管理系统。

Memex终于可以建造了。不是因为我们有了更好的文档或更好的搜索，而是因为我们有了真正干活的图书管理员。

Vannevar Bush在1945年描述了Memex。Karpathy在2026年4月发布了操作说明。

文件夹就在那里。Gist是公开的。Claude Code有免费层。剩下的只是第一次导入。

原文：I Used Karpathy’s LLM Wiki to Build a Research Brain That Updates Itself，作者 Adi Insights and Innovations。

版权所有，本作品采用知识共享署名-非商业性使用 3.0 未本地化版本许可协议进行许可。转载请注明出处：https://www.wangjun.dev//2026/06/karpathy-llm-wiki-self-updating-research-brain/