「展示解题过程」解析：Professor Pi 为何坚持，以及它能发现什么

如果你看过一个 KS3 孩子使用作业辅助聊天机器人，你一定见过这样的规律。他们粘贴问题，得到答案，抄下来，继续下一道题。整个循环大约八秒，孩子依旧丝毫没有改变。

这就是 Pi 存在要打破的循环。而它使用的最重要的单一机械杠杆，是在把任何东西标记为对或错之前先问：

「给我看看你的解题过程——你第一步做了什么？」

这篇文章是关于为什么的长篇版本，以及它能发现什么，在实践中是什么样子。

机械原因：一个错误答案告诉你的几乎是零

这是一道 Year 8 题目和一个错误答案：

「解 3x - 5 = 10。」 学生写：「x = 7。」

我们知道什么？几乎什么都不知道。学生可能：

只在一边加了 5（非常常见）：3x - 5 + 5 = 10 → 3x = 10 → x = 10/3 → 搞混了 → 写了 7
减了 5 而不是加（符号错误）：3x = 5 → x = 5/3 → 搞混了 → 写了 7
几乎做对了，最后一步失误：3x = 15 → x = 15/3 → 写了 7，因为 5 和 7 在视觉上相近（真的会发生，这不是数学错误）
猜的：因为这道题感觉像个「小整数」题，就试了 7

没有解题过程，Pi 无法判断哪种情况在发生。而干预方式在每种情况下都不同。符号错误需要关注逆运算。第一种错误需要关注「两边保持平衡」。失误根本不需要干预——说「检查你的最后一步」学生就能自己修正。猜题需要一次关于自信心的对话。

所以 Pi 的协议是：不看解题过程，绝不标记错误。 这不是迂腐，而是给出有用下一步回应的唯一方式。

实证原因：模型追踪有效

这个协议在文献中有个名字——模型追踪（model tracing）——而且已经被大规模研究过。Carnegie Learning 的 MATHia，美国学校里主流的智能辅导系统，以模型追踪作为核心引擎，积累了最高级别的教育证据（ESSA 一级，意味着多项大型随机对照试验显示可测量的进步）。

主要发现：平均 +8 个百分位点，对困难学生为 +11 个百分位点。对于一项教育干预而言，这是巨大的数字。这是把你的 Year 9 孩子从中位数以下送到中位数以上的差距。

机制：模型追踪把「我不知道哪里出了问题」变成「我能清楚地看到哪一步出了问题」。而对出错步骤的有针对性干预，远比对整个主题的泛化重教高效得多。

解题过程最常揭示的三种错误概念

在原型阶段，我们记录了数千次卡顿时刻的出错步骤，三个规律脱颖而出。

1. 第二行的符号错误

目前最常见的，以大幅度领先。学生写：

3x - 5 = 10
3x = 5      ← 符号错误在这里
x = 5/3

学生知道「对两边做操作」，但做错了——他们把 -5 当成又要减去一次的东西，而不是要通过加法撤销的东西。这是程序性错误，不是概念性错误。一旦 Pi 点出来，学生通常立刻就修正了，掌握度大幅提升。

解题过程如何揭示它：即使最终答案碰巧视觉上接近正确，工作的第二行也是明显错误的。

2. 分数与除法混淆

KS3 学生经常把 3/4 解析为「答案是 0.75」，但把 3 ÷ 4 理解为不同的运算。它们是同一件事。当解题过程包含一个除法且学生把它翻转了，这种错误概念表现得非常漂亮：

「60 的 1/2 是多少？」
解题过程：60 ÷ 1 = 60，然后 × 2 = 120     ← 颠倒了分子/分母的作用
答案：120

学生知道「60 的 1/2」应该是一个减半运算。程序形式 ÷ 分子 × 分母 是错误的记忆法，只有解题过程才能揭示。没有过程，Pi 只会看到「答案是 120，期望是 30」，根本不知道从哪里干预。

3. 「变量就是答案」

这是最深层的一个，也是我觉得最有意思的。KS3 学生有时把 3x - 5 = 10 解析为一种文字谜题，x 是问题而答案是他们被问到的内容。所以他们把它读成「3，然后这个东西，然后 -5，等于 10」，然后给出 x = 3 这样的答案，因为，嗯，3 + 7 - 5 = 5...不对。

解题过程立刻揭示这一点。工作的第一行是这样的：

3x = 3 乘以 x
但 x 是多少？

——学生还没有内化「x 是一个要被求解的占位符」。他们把它当作答案的标签。这里的干预是概念性的，不是程序性的，需要退回到变量的含义——一个六年级/Year 7 没有完全落地的基础。

Pi 实际问的是什么

实践中的协议是在学生给出答案后的一个简短友好的问题：

「给我看看你是怎么得到的——你第一步做了什么？」

或者当答案没有上下文时：

「你的第一行是什么样的？」

Pi 接受：

输入的步骤（最常见）
纸质解题过程的照片（如果家长开启了图片上传）
用文字描述的心算（「我两边加了 5，然后除以 3」）

它不接受没有追问的「我就是知道」。如果学生声称纯粹靠直觉，Pi 出一道同类题，等着看直觉是否重现。通常不会，对话就变成了一次关于模式识别与可靠方法的建设性讨论。

第二个更安静的好处：防作弊

协议的一个我没料到自己会这么喜欢的副效果：它是一个软性的防作弊层。

一个用 ChatGPT 生成了 Pi 练习题答案的学生，当被要求「展示你的解题过程」时，无法生成连贯的过程。答案是正确的，但步骤缺失，或者流利度高得可疑，与学生之前课程的表现规律不符，或者干脆是粘贴过来的看起来不像 Year 8 数学解题过程的散文。

Pi 不会指控——那会是错误的做法——但它会用同一主题的另一道题来追问，不计时，要求有过程。不匹配在大约一分钟内就会浮现。这比浏览器监控或监考好得多，因为它与教学法对齐：需要在 Pi 课程中「作弊」的学生，恰恰是最需要 Pi 的学生，协议温柔地将他们引向他们实际需要的帮助。