让跑腿的去取书、去外面打听（查资料 + 上网）

墙后面的图书馆员读过所有的书——每一本小说、每一本教科书、每一本百科全书。听起来像是超能力。大多数时候确实如此。但有一个陷阱，几乎每个第一次用 AI 的人都会踩到，不少开发者也不例外。

图书馆员上次读书是在一段时间以前。此后的报纸没有人塞进他们的门缝。当你问起他们不太确定的事情，他们不会说「我不知道」——他们会说听起来最像正确答案的话。有时候完全没问题。有时候则是满怀信心、措辞流畅、但完全错误。

本文要讲的，就是跑腿的（智能体 agent）可以跑的两趟差事，用来修正这两个毛病。

图书馆员的两大弱点

在讲差事之前，先把问题看清楚。

弱点一：训练截止日期。 图书馆员在某个时间点停止读新材料了。从那以后发生的一切，对他们来说是空白。问他们上个月的新闻、去年修改的法律、今天的某件商品价格——他们只能猜。而且他们不一定会告诉你他们在猜。

弱点二：幻觉（hallucination）。 这是技术圈用来描述 AI 一本正经地编造不存在的事实时用的词。幻觉之所以发生，是因为图书馆员的工作就是写出下一个最有可能的词。不确定的时候，他们也要继续写——他们没有办法直接停下来。结果可能听起来像真实的数据、真实的引用、真实的书名，但根本不存在。这不是在撒谎，这是在没有事实核查的情况下做模式匹配。

两个弱点的根源相同：图书馆员查不了东西。他们只有自己脑子里已有的内容。

第一趟差事：从你的书架上取回正确的书

设想一个场景。你作为家长，正在读孩子的期末学校报告，想就此向 AI 提个问题。你把纸条（提示词 prompt）塞进信箱口：「这份报告的主要关注点是什么？」但图书馆员从未见过这份报告。他们要么猜，要么礼貌地说没有这份文件帮不上忙。不管哪种，都没什么用。

解决办法是让跑腿的去取来那份文件，附在纸条上。这样纸条变成：「这是报告全文（附上全文）。主要关注点是什么？」图书馆员就能好好回答了，因为实际信息就在纸条上。

这是简单的版本。真正的魔法发生在你的书架上有几百份文件的时候——一整个文件夹的学校报告、课堂笔记、或者公司内部政策。你不可能把所有文件都贴在每一张纸条上。信箱口就那么宽。

所以跑腿的要聪明地判断取哪几页回来。

按意思找，而不是按拼写找

这里发生了一件真正有意思的事。

最直接的做法是按关键词搜索。你问「一只孤独的小狗」，跑腿的就去找含有「孤独的小狗」这几个字的文件。这有用——直到相关段落写的是「一只思念主人的幼犬」。意思一样，用词不同。按关键词搜索完全找不到它。

跑腿的用的是另一种方法。在这一切开始之前，你书架上的每一份文件都被读取，转换成一种意义地图——一组数字，捕捉的是这段文字讲的是什么，而不只是用了哪些词。技术圈把这组数字叫做向量（vector），整套做法叫向量搜索（vector search）或语义搜索（semantic search，按意义搜索）。可以把它想象成一位超级图书管理员，把书架上每一本书按内容主题归类——不是按首字母顺序，不是按封面颜色，而是按主题和含义。「一只思念主人的幼犬」和「一只孤独的小狗」在这张意义地图上紧挨着，因为两段话说的是同一件事。

跑腿的收到你的问题后，把问题也转换成同样的意义地图，然后找出书架上意义地图最接近的文件，取回那几页，贴在纸条上。

这整套流程——把文件转成意义地图、取回相关内容、贴在纸条上、让图书馆员从真实文本作答——的完整名称是 RAG：检索增强生成（retrieval-augmented generation）。图书馆员的回答得到了加强，补充了真实取回的材料，而不是靠猜。

RAG 不会让图书馆员无所不知。它让图书馆员从实际证据出发作答，而不是凭记忆。这个区别非常有用。

为什么这能解决「编造内容」的问题

当图书馆员从就摆在纸条上的真实文本作答时，能编造的空间就小多了。答案有真实、具体的依据。幻觉不会完全消失——图书馆员仍然可能误读或误引——但相比完全凭记忆回答一个他们只了解一半的话题，幻觉率会大幅下降。

这就是为什么今天很多正经的 AI 工具都建立在 RAG 之上，而不是单靠模型训练数据。从真实数据库取答案的客户服务工具、从你实际笔记中取内容的学习助手、从你上传的文件中取内容的文档分析工具——它们都是同一个跑腿取书差事的不同规模。

第二趟差事：去外面打听

第二趟差事解决的是截止日期问题：比图书馆员训练数据更新的事实，或者本来就会变化的事实——今天的汇率、昨天的头条新闻、某个职位当前的负责人。

跑腿的出门去打听。他们拿着你的问题，做一次联网搜索，阅读最相关的几个页面，把关键内容带回来贴在纸条上。这样图书馆员就是在根据新鲜来源作答，而不是凭借一两年前互联网的样子作答。

联网搜索（web search）的工作方式几乎和查你自己文件的 RAG 完全一样。区别在于跑腿的去哪里取材料：你的私人书架，还是整个公共互联网。机制是一样的——取回相关材料，贴在纸条上，让大模型从真实文本作答。

这就是为什么现代 AI 助手常常能告诉你今天的比赛结果、引用上周的政府公告，或者总结今早的新闻。模型本身还是用的旧训练数据。但跑腿的取回了真实的东西，放到了纸条上。

两趟差事，一个道理

这两趟差事的底层只有一个原则：纸条上有真实、具体的证据时，图书馆员的工作效果更好。 只靠记忆，图书馆员猜测。给了正确的页面，图书馆员阅读并总结。两种效果差距很大。

跑腿的在两种情况下的工作，都是快速找到正确的内容——按意思找，而不只是按关键词——然后在纸条塞进信箱口之前把它贴好。图书馆员甚至不需要知道这些页面从哪里来。他们只是看到一张更长的纸条，然后从中作答。

如果你已经读过什么是 AI 智能体，会认出这个模式。跑腿的负责机械性的「取材料、贴上去」工作。图书馆员负责理解和写作。两者都干不好对方的活。合在一起，才能产出真正有用的结果。

一句话版本

RAG 和联网搜索是同一趟差事朝两个方向跑：跑腿的取回真实、新鲜、具体的文本，贴在纸条上，让图书馆员从证据出发作答，而不是凭记忆猜测。这就是为什么能搜索的 AI 通常比不能搜索的 AI 编造得少。

本系列下一篇：跑腿的还需要一种方式，向外部工具请求具体操作——不只是取信息，而是真的去做事。这就是 function calling 和 MCP 的内容。请阅读Function calling 与 MCP 详解。

返回 AI 大白话系列总览。

Duke Harewood 运营 aitutors.me — 面向英国中学生的 AI 辅导。更新于 2026 年 6 月 5 日。