AI 只是个“猜词机器”——认识信箱口后的图书馆员

欢迎来到 AI 大白话系列——这是一个共十篇文章的系列，专为那些听过「大模型」「智能体」"RAG"却不知道它们究竟是什么意思的人准备。每篇文章只讲一个概念，不预设任何技术背景。这是第一篇，从这里开始读起吧。

想象一座奇怪的图书馆

想象一座你从未见过的图书馆。有一堵墙，墙后面坐着一个人——我们叫他图书馆员。这位图书馆员把一生都花在了阅读上：每一本书、每一份报纸、每一个网站、每一条论坛帖子和操作手册，几十种语言，全都读过。他知道的东西多得惊人。

但关键在于：你看不到他，他也看不到你。墙上只有一个小小的信箱口。

如果你想和他沟通，就写一张纸条塞进去。几秒钟后，一张纸条从里面滑出来。交流就这样完成了。

这不是比喻故事。这，几乎就是 AI 语言模型——也就是 LLM（Large Language Model，大语言模型，简称大模型）——的真实运作方式。

现在，这是整个系列里最重要的一句话，请慢慢读：

图书馆员只能做一件事：把你的纸条续写完。

就这样。你写「法国的首都是」，他回你「巴黎」。你写「从前有一位年轻的骑士，他」，他给你接一个故事。你写半截食谱，他把它补完。你写一个问题，而因为他读过的文章里，问题后面几乎总跟着答案——他就写出了听起来像答案的内容。

图书馆员没有在查资料。他没有连接互联网。他也没有在以我们的方式「思考」。他在做一件听起来简单得有点奇怪的事：猜下一个最可能出现的词，然后再猜下一个，再下一个，一次又一次，几千次，全凭他从那海量阅读中吸收的所有语言模式。

这个过程在技术上叫做下一个词元（token）预测——词元是比单词还要小一点的文字单元，但用「猜词」来理解已经足够准确。

如果只是猜词，为什么感觉像在和一个真正理解你的人对话？

因为语言里的规律一点都不简单。要猜出「光速大约是每秒___公里」后面跟什么，你得以某种方式消化过物理学知识。要把「她心里涌起一种复杂的感觉，既有如释重负，又有___」接续得自然流畅，你需要某种像是情感理解的东西——或者说，用无数个有真实感受的人写下的句子构建出来的极好模拟。

图书馆员没有意识，他不在体验这段对话。但人类在语言里凝结的巨量思想，使得一个足够大的图书馆员，在续写你的句子时，产出的内容确实有用。

这就引出了「Large（大）」这个字。

早期的语言模型很小——用适量的文本训练，计算资源也有限。它们能续写句子，但结果平淡、机械，常常说不通。对研究者来说有点意思，对普通人来说没什么用。

然后，一件出人意料的事情发生了。随着研究者把模型做得越来越大——用海量的文本和巨大的算力来训练——结果不是一点点地改善，而是在某个规模上，某种接近智能的东西突然从无到有地出现了。模型能推理简单的逻辑题，能翻译从未被明确教过的语言，能写出像样的诗，能向孩子解释科学概念。

这个出乎意料的现象叫做涌现（emergence）——没有人专门编程让它这样，仅仅因为模型足够大，这些能力就冒出来了。这是这个领域里真正奇特、至今仍在讨论的现象之一。

这就是为什么这类系统叫做大语言模型。「大」这个字是有实质意义的。同样的想法做小一点，能力天差地别。规模改变了可能性。

这一点，每一个用过 AI 工具的家长和孩子都应该知道。

图书馆员根据语言模式来续写你的纸条，他不知道自己写的是不是真的。他知道某些词在某些语境下倾向于跟着其他词出现。所以他写起来流畅自然、句子完整、语气镇定——即使他写错了。

如果你问一个具体数据，图书馆员可能给出一个听起来完全正确但纯属捏造的数字，因为「被问到数据时，给出一个数字」这个模式太根深蒂固了。如果你要他推荐一本书，他可能满怀把握地说出一本根本不存在的书，因为模式吻合。

专业人士把这叫做幻觉（hallucination）——模型生成了听起来合理但实际上不对的内容。这不是故意撒谎，图书馆员没有意图。这只是模式补全出了偏差。

这不是回避 AI 工具的理由，而是一个提示：把它当作一位博览群书、乐于助人、但有时会记错细节的朋友——值得倾听，重要的事值得核实。

信箱口的设计有硬性限制，弄清楚这些限制能省去很多困惑。

图书馆员无法追问。一张纸条进，一张纸条出。他不记得你上一张纸条写了什么。每张纸条对他来说都是全新的开始——他对之前任何一张纸条毫无记忆。

图书馆员出不了门。他看不到今天的新闻，查不到实时的价格，也核实不了他停止阅读之后才出现的事实。他的知识有一个截止日期——他知道的一切，都来自那个时间点之前的文字。

图书馆员无法采取行动。他不能帮你发邮件、订餐厅或者把文件存到你的电脑上。他只能写文字回给你。

这些限制不是缺陷，而是语言模型本质上就是这样的东西。而且——这才是有趣的地方——你听说过的几乎所有令人兴奋的 AI 产品，说到底都是在想方设法绕过这些限制。这正是本系列剩下九篇文章要讲的内容。

总结一下：图书馆员了不起。他吸收的文字比任何人一千辈子能读到的都多，他续写句子的方式感觉真的很智慧。但他也受到严格限制——一个信箱口，一次一张纸条，没有记忆，不能行动，有时自信地给出错误答案。

怎么在这个基础上建出一个有用的产品？

你加上脚手架。你想办法写出更好、信息更丰富的纸条。你雇一个跑腿的人（也就是 agent，智能体），让他站在信箱口前替你办事，把所有那些不需要天才的、机械性的环节都处理掉。你给图书馆员更好的素材，再把他的回答送到有用的地方去。

你以后会听到的每一个 AI 术语——提示词（prompt）、智能体（agent）、记忆（memory）、上下文、工具、工作流——都是这个脚手架的某一块。一旦理解了图书馆员，每一块都会自然地对上。

这就是这个系列的承诺：十篇文章，一次一个概念，全部连回这一幅图——一位才华横溢却有所局限的图书馆员，坐在信箱口后面。

下一篇：把纸条塞进信箱口——什么是提示词？你已经知道纸条要塞进去了。下一篇讲的是，怎样的纸条才算好纸条。

「AI 大白话」系列第 1 篇，共 10 篇。来自 AI Tutors 的免费系列，点此查看全部文章。