欢迎来到 AI 大白话 系列——这是一个共十篇文章的系列,专为那些听过"大模型""智能体""RAG"却不知道它们究竟是什么意思的人准备。每篇文章只讲一个概念,不预设任何技术背景。这是第一篇,从这里开始读起吧。

想象一座奇怪的图书馆

想象一座你从未见过的图书馆。有一堵墙,墙后面坐着一个人——我们叫他图书馆员。这位图书馆员把一生都花在了阅读上:每一本书、每一份报纸、每一个网站、每一条论坛帖子和操作手册,几十种语言,全都读过。他知道的东西多得惊人。

但关键在于:你看不到他,他也看不到你。墙上只有一个小小的信箱口。

如果你想和他沟通,就写一张纸条塞进去。几秒钟后,一张纸条从里面滑出来。交流就这样完成了。

这不是比喻故事。这,几乎就是 AI 语言模型——也就是 LLM(Large Language Model,大语言模型,简称大模型)——的真实运作方式。

图书馆员只会做一件事

现在,这是整个系列里最重要的一句话,请慢慢读:

图书馆员只能做一件事:把你的纸条续写完。

就这样。你写"法国的首都是",他回你"巴黎"。你写"从前有一位年轻的骑士,他",他给你接一个故事。你写半截食谱,他把它补完。你写一个问题,而因为他读过的文章里,问题后面几乎总跟着答案——他就写出了听起来像答案的内容。

图书馆员没有在查资料。他没有连接互联网。他也没有在以我们的方式"思考"。他在做一件听起来简单得有点奇怪的事:猜下一个最可能出现的词,然后再猜下一个,再下一个,一次又一次,几千次,全凭他从那海量阅读中吸收的所有语言模式。

这个过程在技术上叫做下一个 token(令牌)预测——token 是比单词还要小一点的文字单元,但用"猜词"来理解已经足够准确。

为什么感觉这么聪明

如果只是猜词,为什么感觉像在和一个真正理解你的人对话?

因为语言里的规律一点都不简单。要猜出"光速大约是每秒___公里"后面跟什么,你得以某种方式消化过物理学知识。要把"她心里涌起一种复杂的感觉,既有如释重负,又有___"接续得自然流畅,你需要某种像是情感理解的东西——或者说,用无数个有真实感受的人写下的句子构建出来的极好模拟。

图书馆员没有意识,他不在体验这段对话。但人类在语言里凝结的巨量思想,使得一个足够大的图书馆员,在续写你的句子时,产出的内容确实有用。

这就引出了"Large(大)"这个字。

为什么必须"大"

早期的语言模型很小——用适量的文本训练,计算资源也有限。它们能续写句子,但结果平淡、机械,常常说不通。对研究者来说有点意思,对普通人来说没什么用。

然后,一件出人意料的事情发生了。随着研究者把模型做得越来越大——用海量的文本和巨大的算力来训练——结果不是一点点地改善,而是在某个规模上,某种接近智能的东西突然从无到有地出现了。模型能推理简单的逻辑题,能翻译从未被明确教过的语言,能写出像样的诗,能向孩子解释科学概念。

这个出乎意料的现象叫做涌现(emergence)——没有人专门编程让它这样,仅仅因为模型足够大,这些能力就冒出来了。这是这个领域里真正奇特、至今仍在讨论的现象之一。

这就是为什么这类系统叫做语言模型。"大"这个字是有实质意义的。同样的想法做小一点,能力天差地别。规模改变了可能性。

自信却未必正确

这一点,每一个用过 AI 工具的家长和孩子都应该知道。

图书馆员根据语言模式来续写你的纸条,他不知道自己写的是不是真的。他知道某些词在某些语境下倾向于跟着其他词出现。所以他写起来流畅自然、句子完整、语气镇定——即使他写错了。

如果你问一个具体数据,图书馆员可能给出一个听起来完全正确但纯属捏造的数字,因为"被问到数据时,给出一个数字"这个模式太根深蒂固了。如果你要他推荐一本书,他可能满怀把握地说出一本根本不存在的书,因为模式吻合。

专业人士把这叫做幻觉(hallucination)——模型生成了听起来合理但实际上不对的内容。这不是故意撒谎,图书馆员没有意图。这只是模式补全出了偏差。

这不是回避 AI 工具的理由,而是一个提示:把它当作一位博览群书、乐于助人、但有时会记错细节的朋友——值得倾听,重要的事值得核实。

图书馆员做不到的事

信箱口的设计有硬性限制,弄清楚这些限制能省去很多困惑。

图书馆员无法追问。一张纸条进,一张纸条出。他不记得你上一张纸条写了什么。每张纸条对他来说都是全新的开始——他对之前任何一张纸条毫无记忆。

图书馆员出不了门。他看不到今天的新闻,查不到实时的价格,也核实不了他停止阅读之后才出现的事实。他的知识有一个截止日期——他知道的一切,都来自那个时间点之前的文字。

图书馆员无法采取行动。他不能帮你发邮件、订餐厅或者把文件存到你的电脑上。他只能写文字回给你。

这些限制不是缺陷,而是语言模型本质上就是这样的东西。而且——这才是有趣的地方——你听说过的几乎所有令人兴奋的 AI 产品,说到底都是在想方设法绕过这些限制。这正是本系列剩下九篇文章要讲的内容。

其他一切都是"脚手架"

总结一下:图书馆员了不起。他吸收的文字比任何人一千辈子能读到的都多,他续写句子的方式感觉真的很智慧。但他也受到严格限制——一个信箱口,一次一张纸条,没有记忆,不能行动,有时自信地给出错误答案。

怎么在这个基础上建出一个有用的产品?

你加上脚手架。你想办法写出更好、信息更丰富的纸条。你雇一个跑腿的人(也就是 agent,智能体),让他站在信箱口前替你办事,把所有那些不需要天才的、机械性的环节都处理掉。你给图书馆员更好的素材,再把他的回答送到有用的地方去。

你以后会听到的每一个 AI 术语——提示词(prompt)、智能体(agent)、记忆(memory)、上下文、工具、工作流——都是这个脚手架的某一块。一旦理解了图书馆员,每一块都会自然地对上。

这就是这个系列的承诺:十篇文章,一次一个概念,全部连回这一幅图——一位才华横溢却有所局限的图书馆员,坐在信箱口后面。

下一篇:把纸条塞进信箱口——什么是提示词? 你已经知道纸条要塞进去了。下一篇讲的是,怎样的纸条才算好纸条。


"AI 大白话"系列第 1 篇,共 10 篇。来自 AI Tutors 的免费系列,点此查看全部文章