墙后面的图书馆员读过所有的书——每一本小说、每一本教科书、每一本百科全书。听起来像是超能力。大多数时候确实如此。但有一个陷阱,几乎每个第一次用 AI 的人都会踩到,不少开发者也不例外。
图书馆员上次读书是在一段时间以前。此后的报纸没有人塞进他们的门缝。当你问起他们不太确定的事情,他们不会说"我不知道"——他们会说听起来最像正确答案的话。有时候完全没问题。有时候则是满怀信心、措辞流畅、但完全错误。
本文要讲的,就是跑腿的(智能体 agent)可以跑的两趟差事,用来修正这两个毛病。
图书馆员的两大弱点
在讲差事之前,先把问题看清楚。
弱点一:训练截止日期。 图书馆员在某个时间点停止读新材料了。从那以后发生的一切,对他们来说是空白。问他们上个月的新闻、去年修改的法律、今天的某件商品价格——他们只能猜。而且他们不一定会告诉你他们在猜。
弱点二:幻觉(hallucination)。 这是技术圈用来描述 AI 一本正经地编造不存在的事实时用的词。幻觉之所以发生,是因为图书馆员的工作就是写出下一个最有可能的词。不确定的时候,他们也要继续写——他们没有办法直接停下来。结果可能听起来像真实的数据、真实的引用、真实的书名,但根本不存在。这不是在撒谎,这是在没有事实核查的情况下做模式匹配。
两个弱点的根源相同:图书馆员查不了东西。他们只有自己脑子里已有的内容。
第一趟差事:从你的书架上取回正确的书
设想一个场景。你作为家长,正在读孩子的期末学校报告,想就此向 AI 提个问题。你把纸条(提示词 prompt)塞进信箱口:"这份报告的主要关注点是什么?"但图书馆员从未见过这份报告。他们要么猜,要么礼貌地说没有这份文件帮不上忙。不管哪种,都没什么用。
解决办法是让跑腿的去取来那份文件,附在纸条上。这样纸条变成:"这是报告全文(附上全文)。主要关注点是什么?"图书馆员就能好好回答了,因为实际信息就在纸条上。
这是简单的版本。真正的魔法发生在你的书架上有几百份文件的时候——一整个文件夹的学校报告、课堂笔记、或者公司内部政策。你不可能把所有文件都贴在每一张纸条上。信箱口就那么宽。
所以跑腿的要聪明地判断取哪几页回来。
按意思找,而不是按拼写找
这里发生了一件真正有意思的事。
最直接的做法是按关键词搜索。你问"一只孤独的小狗",跑腿的就去找含有"孤独的小狗"这几个字的文件。这有用——直到相关段落写的是"一只思念主人的幼犬"。意思一样,用词不同。按关键词搜索完全找不到它。
跑腿的用的是另一种方法。在这一切开始之前,你书架上的每一份文件都被读取,转换成一种意义地图——一组数字,捕捉的是这段文字讲的是什么,而不只是用了哪些词。技术圈把这组数字叫做向量(vector),整套做法叫向量搜索(vector search)或语义搜索(semantic search,按意义搜索)。可以把它想象成一位超级图书管理员,把书架上每一本书按内容主题归类——不是按首字母顺序,不是按封面颜色,而是按主题和含义。"一只思念主人的幼犬"和"一只孤独的小狗"在这张意义地图上紧挨着,因为两段话说的是同一件事。
跑腿的收到你的问题后,把问题也转换成同样的意义地图,然后找出书架上意义地图最接近的文件,取回那几页,贴在纸条上。
这整套流程——把文件转成意义地图、取回相关内容、贴在纸条上、让图书馆员从真实文本作答——的完整名称是 RAG:检索增强生成(retrieval-augmented generation)。图书馆员的回答得到了加强,补充了真实取回的材料,而不是靠猜。
RAG 不会让图书馆员无所不知。它让图书馆员从实际证据出发作答,而不是凭记忆。这个区别非常有用。
为什么这能解决"编造内容"的问题
当图书馆员从就摆在纸条上的真实文本作答时,能编造的空间就小多了。答案有真实、具体的依据。幻觉不会完全消失——图书馆员仍然可能误读或误引——但相比完全凭记忆回答一个他们只了解一半的话题,幻觉率会大幅下降。
这就是为什么今天很多正经的 AI 工具都建立在 RAG 之上,而不是单靠模型训练数据。从真实数据库取答案的客户服务工具、从你实际笔记中取内容的学习助手、从你上传的文件中取内容的文档分析工具——它们都是同一个跑腿取书差事的不同规模。
第二趟差事:去外面打听
第二趟差事解决的是截止日期问题:比图书馆员训练数据更新的事实,或者本来就会变化的事实——今天的汇率、昨天的头条新闻、某个职位当前的负责人。
跑腿的出门去打听。他们拿着你的问题,做一次联网搜索,阅读最相关的几个页面,把关键内容带回来贴在纸条上。这样图书馆员就是在根据新鲜来源作答,而不是凭借一两年前互联网的样子作答。
联网搜索(web search)的工作方式几乎和查你自己文件的 RAG 完全一样。区别在于跑腿的去哪里取材料:你的私人书架,还是整个公共互联网。机制是一样的——取回相关材料,贴在纸条上,让大模型从真实文本作答。
这就是为什么现代 AI 助手常常能告诉你今天的比赛结果、引用上周的政府公告,或者总结今早的新闻。模型本身还是用的旧训练数据。但跑腿的取回了真实的东西,放到了纸条上。
两趟差事,一个道理
这两趟差事的底层只有一个原则:纸条上有真实、具体的证据时,图书馆员的工作效果更好。 只靠记忆,图书馆员猜测。给了正确的页面,图书馆员阅读并总结。两种效果差距很大。
跑腿的在两种情况下的工作,都是快速找到正确的内容——按意思找,而不只是按关键词——然后在纸条塞进信箱口之前把它贴好。图书馆员甚至不需要知道这些页面从哪里来。他们只是看到一张更长的纸条,然后从中作答。
如果你已经读过什么是 AI 智能体,会认出这个模式。跑腿的负责机械性的"取材料、贴上去"工作。图书馆员负责理解和写作。两者都干不好对方的活。合在一起,才能产出真正有用的结果。
一句话版本
RAG 和联网搜索是同一趟差事朝两个方向跑:跑腿的取回真实、新鲜、具体的文本,贴在纸条上,让图书馆员从证据出发作答,而不是凭记忆猜测。这就是为什么能搜索的 AI 通常比不能搜索的 AI 编造得少。
本系列下一篇:跑腿的还需要一种方式,向外部工具请求具体操作——不只是取信息,而是真的去做事。这就是 function calling 和 MCP 的内容。请阅读Function calling 与 MCP 详解。
返回 AI 大白话系列总览。
Jason 运营 aitutors.me — 面向英国中学生的 AI 辅导。更新于 2026 年 6 月 5 日。