想象你们当地的图书馆里有一位非常聪明的图书馆员。他坐在一面墙的背后,外人看不见他,也没法和他说话——你只能通过一个信箱口联系他:把一张纸条塞进去,回复就从里面滑出来。一次只能递一张纸条,没有眼神交流,没有寒暄。

现在想象,这座图书馆决定在三条不同的街道上各开一扇门。第一扇门里有一个友好的服务台,任何人都可以走过来写纸条。第二扇门通往一间主要由建筑师和工程师使用的后台工作室。第三扇门打开后,迎接你的是一间小屋,里面有个"跑腿的"还能帮你翻看你自己的文件柜。

每次,背后都是同一位图书馆员。但进门的体验截然不同。

这正是你听到人们谈论"AI 聊天工具""写代码助手""桌面 AI 助手"时发生的事。每一种情形背后的大脑——也就是大模型(英文叫 LLM,Large Language Model,意思是用海量文字训练出来的超大型词语预测引擎)——本质上是同一类东西。变化的只是你站在哪个窗口前

第一个窗口:聊天框

聊天框是最简单的窗口。你打开一个网站或 app,输入文字,回复就出现了。不需要安装什么,也不需要任何技术背景。这是大多数人第一次接触 AI 的方式。

在这背后,有人搭建了一个整洁的服务台。你输入纸条,服务台把它交给跑腿的(英文叫 agent,智能体),跑腿的在纸条上附上一些有用的背景信息,再把它塞进信箱口递给图书馆员。回复出来后,跑腿的稍加整理,服务台就把它显示给你。

图书馆员并不知道你是从聊天框进来的还是从其他门进来的。他只看到一张纸条。

聊天框额外提供的,主要是舒适感:滚动的历史记录让它看起来像一场对话(但正如我们在记忆那篇文章里讲过的,那些历史只是被重新贴到每张新纸条上而已)、干净的输入框,有时还能上传图片或文档。这个窗口让体验显得温馨、像对话一样流畅。图书馆员仍然只是一次处理一张纸条。

第二个窗口:写代码工具

写代码工具,有时也叫"编程助手",它住在程序员用来写代码的软件里面。这还是同一座图书馆,只是这扇门直接通往工坊。

为什么这个窗口最先出现在程序员那里?因为程序员是最早意识到图书馆员极其擅长文字模式匹配的人,而代码就是非常精确的文字。你让图书馆员"把这个写了一半的函数续完",他出奇地能胜任,因为他读过数百万个类似代码的例子。

这里的跑腿的(agent)比基础聊天框里做的事要多一点。当你写到函数的一半,请它给你提个建议,跑腿的会悄悄把你当前打开的相关文件收集起来——一些你不用自己费力输入的上下文(英文叫 context,上下文)——然后一起附在纸条上。图书馆员看到的背景更完整,回复自然更有用。

这里藏着一个对非程序员很实用的小道理:写代码工具不是魔法,里面的图书馆员也不是更聪明的另一位图书馆员。他们在代码上犯的错误,和他们在文章上犯的错误一模一样。他们可以满脸自信地给你一个听起来很合理但完全错误的代码建议。程序员依然需要自己检查。

随着时间推移,开发写代码工具的人注意到,"帮我写一行代码"和"帮我起草一封邮件"并没有那么大的区别。两者都只是塞进信箱口的纸条。于是,许多写代码工具悄悄成长为更通用的助手——不是换了图书馆员,而是教跑腿的去跑更多种类的腿,同时把大门的欢迎垫铺得更宽了。

第三个窗口:桌面助手或日常助手

第三个窗口终于让人感觉像科幻小说里许诺的那种助手:一个坐在你电脑里、了解你的文件、能打开你日历、帮你起草文稿、上网搜索,然后替你行动的帮手。

图书馆员仍然是同一个。但这里的跑腿的功能强大了很多。还记得我们在function calling 和 MCP 那篇文章里讲的,跑腿的可以用一套标准握手方式(MCP,模型上下文协议,Model Context Protocol)去拜访各种"工具铺"——提供特定服务的软件吗?桌面助手的跑腿的被介绍给了更多的工具铺:你的文件、你的浏览器、也许还有你的日历或邮件。

真正让它感觉像一位正经助手而不是藏在柜子里的小玩意儿的,是你通常能看见跑腿的在做什么。一个好的助手会把它即将使用哪些工具展示给你,在深入你的文件之前先征得你的同意。这种透明度很重要。图书馆员仍在墙的那头;跑腿的不再是隐形的了。

这也是"给助手一个有人情味的家"这个想法变得关键的地方。一个能看见你文件却没有明确边界的助手会让人不安。一个说"我能看到你的下载文件夹和日历,这是我打算做的事情——可以吗?"的助手让人感觉可以掌控。能力相同,体验天差地别。

窗口不是大脑

这篇文章最重要的一个想法是:产品的名字不是 AI 的名字

人们常常说"我问了某某产品,它告诉我……",好像产品和 AI 是同一件事。它们不是。产品是前门、大堂、跑腿的,以及所有关于信箱口长什么样子的设计决策。AI——图书馆员,大模型——是藏在这一切之下的独立一层。

这在两个实际场景里很重要。

第一,两个产品可以使用同一个底层大模型,体验却完全不同,因为一个只有简单服务台,而另一个有复杂的跑腿的和十家工具铺。图书馆员没有变;围绕信箱口搭的建筑变了。

第二,一个产品可以在不改名字的情况下换掉底层大模型。当这发生时,图书馆员的能力提升了(偶尔也会换个性格)。但你在这个系列里学到的关于提示词(prompt,纸条)、上下文和记忆(memory)的所有东西依然成立,因为这些想法住在信箱口那一层,而不是前门那一层。

不需要会写代码

如果你是一位家长,正隐约担心自己不会写代码就被"真正的" AI 拒之门外,请放心:你不会的。

写代码的窗口对写代码的人真的很有用。但聊天框和桌面助手的窗口同样真实,在各自的领域同样强大,而且只需要你会打字就够了。这个系列里讲过的那些道理——写一张清晰的纸条、提供有用的上下文、记住图书馆员会忘事——在每一个窗口里都适用。

选一个适合你任务的窗口就好。其他的,一切如常。

小结

信箱口后面的图书馆员是不变的常数。窗口——聊天框、写代码工具、桌面助手——是变量。有的窗口给跑腿的配了更多工具铺;有的窗口让你更清楚地看见跑腿的在做什么;有的窗口针对某一类纸条(代码)做了专门优化。没有哪个窗口改变了图书馆员或信箱口的本质。

一旦你看清了这一点,很多铺天盖地的产品公告就变得好解读了。"带文件访问功能的新 AI 助手!"——就是跑腿的多了一家工具铺。"内置进编辑器的 AI!"——就是跑腿的在发纸条前自动帮你收集了代码上下文。同一座图书馆,新的大门而已。

下一篇:什么是 AI 工作流?——当每次要跑的腿都一样,就把步骤固定成一份食谱,只有思考那一步才需要图书馆员。

返回"AI 大白话"系列主页,或回到首页