读懂AI · 给初中生的AI漫画书

读懂 AI

给初中生的AI漫画书 · lava7397.com/ai-book

64

可学单元

0

你已读完

5

主线

2

进阶专题

1

应用地图

已完成

进行中

待写

主线一 · AI是怎么运作的

序章 + 9个单元 + 升华收尾，已完成

序

序章 · 为什么值得懂这台机器

在进入技术细节之前——为什么懂 AI 的内部逻辑，比只会用 AI 重要得多。

已完成 · 序章 · 动机

01

AI怎么学会的

钩子：AI说话那么厉害，它是怎么学会的？

已完成 · uA · 训练与参数

02

AI的大脑长什么样

钩子：AI的"大脑"长什么样子？神经网络和人脑到底像不像？

已完成 · uB · 神经网络

03

AI怎么抓重点

钩子：一句话里那么多词，AI先看谁？

已完成 · uC · 注意力机制

04

AI读的不是"字"

钩子："今天天气好"这句话，AI眼里是几个字？

已完成 · u1 · token

05

AI有多健忘

钩子：你跟AI聊了一小时，它真的全记住了吗？

已完成 · u2 · 上下文窗口

06

它怎么"想"出下一个字

钩子：AI说话的时候，它在做一道什么题？

已完成 · u3 · 概率预测

07

为什么AI会一本正经胡说

钩子：AI说错了，它是在撒谎吗？

已完成 · u4 · 幻觉

08

AI真的"理解"你吗

钩子：AI知道"苹果"是什么味道吗？

已完成 · u5 · 语义理解

09

为什么AI会"听话"

钩子：为什么AI会说"我不能帮你做这件事"？

已完成 · uE · RLHF与对齐

升

你现在是内行了

五道诊断题 + 八张内行工具卡 + 升华收尾——主线一的真正终点。

已完成 · 升华 · 工具箱

主线二 · 怎么和AI说话

序章+6单元+升华 · 已完成

序

序章 · 怎么和AI说话

懂机制之后，学会把 AI 从「广播」变成「只为你服务」。

已完成 · 序章

06

为什么AI需要你说清楚

钩子：同一个问题，为什么有人得到神回复，有人得到废话？

已完成 · 提示补全

07

一个好问题由哪几部分组成

钩子：给AI一张任务卡，它会不会立刻变靠谱？

已完成 · 任务卡

08

信息不够时，怎么让AI先问你

钩子：如果AI还没弄明白任务，为什么不该急着让它回答？

已完成 · 澄清

09

怎么让AI按你想要的格式输出

钩子：为什么你想要表格，AI却写了一大段废话？

已完成 · 格式

10

答案不好时，怎么追问和修正

钩子：AI第一次答得不好，下一句该怎么说？

已完成 · 迭代

11

怎么验证和安全使用AI的答案

钩子：AI说得很自信，你怎么知道它靠不靠谱？

已完成 · 核实

升

你会问了吗

五道场景题 + 六张提问工具卡。

已完成 · 升华

主线三 · AI在你生活里长什么样

序章+6单元+升华 · 已完成

序

序章 · 生活里的AI

AI 不只在聊天框，它藏在推荐、识别、生成与决策里。

已完成 · 序章

12

你刷的每条视频都是AI选的

推荐算法不是在帮你找想看的，而是在最大化你的停留时间。

已完成 · 推荐算法

13

AI怎么生成图像

AI能画从未存在过的东西——这不是"找图"，是在意义空间里重建。

已完成 · 图像生成

14

当假变得无法分辨

AI怎么生成假视频和假声音——以及你怎么辨别它们。

已完成 · Deepfake辨别

15

你搜到的不是全部真相

搜索结果不是按"有多正确"排序的——你该怎么理解你的信息环境。

已完成 · 搜索与信息泡

16

AI认识你的脸

人脸识别、声纹识别、行为识别——AI怎么"认出"你，以及这意味着什么。

已完成 · 识别AI

17

一天里你遇到了多少AI

AI不只是聊天框，它藏在每条推荐、每次解锁、每个导航里。

已完成 · AI全景

升

看见隐形AI了吗

五道场景题 + 六张生活向工具卡。

已完成 · 升华

主线四 · AI带来的新问题

序章+6单元+升华 · 已完成

序

序章 · AI带来的新问题

偏见、假内容、隐私、能源、责任、版权——要有证据地思考。

已完成 · 序章

18

AI会歧视人吗

AI的歧视不来自坏心，来自训练数据里人类偏见的系统化放大。

已完成 · 算法偏见

19

看见不代表真实

辨别AI生成内容是一个需要练习的技能——有具体方法论。

已完成 · 辨别虚假

20

你的数据去哪了

AI服务的成本不是钱，而是数据——"免费"意味着什么。

已完成 · 隐私

21

AI的代价

每一次AI推理都在消耗电力——看不见的代价是真实存在的。

已完成 · 能源与环境

22

出了问题谁负责

AI造成的伤害往往没有明确的负责人——责任在哪里。

已完成 · 责任与治理

23

AI和创造

AI生成内容背后是数百万人类创作者——谁的作品是谁的。

已完成 · 版权与创造力

升

新问题你想过了吗

五道伦理场景题 + 六条检查习惯。

已完成 · 升华

主线五 · AI和我有什么关系

序章+6单元+升华 · 已完成

序

序章 · AI和我有什么关系

学习、工作、情感、控制——你需要自己的原则。

已完成 · 序章

24

AI能帮我写作业，那我还要学吗

用 AI 写作业，问题不在道德，在于谁完成了思考过程。

已完成 · 学习边界

25

AI时代，什么能力更重要

不是练AI不会的，而是练"驱动AI"最需要的能力。

已完成 · 能力价值

26

AI会取代我的工作吗

AI替代任务，不替代职业；最难被替代的恰好是最有价值的。

已完成 · 工作未来

27

AI像朋友一样懂我吗

AI能生成"懂你"的语言，但真正理解需要共同经历和真实关系。

已完成 · 情感理解

28

谁在控制AI说什么

AI的答案被训练数据、对齐和系统提示塑造——不是客观真相。

已完成 · 幕后控制

29

我应该和AI保持什么关系

用AI多不是问题，让AI替你判断才是——健康关系：你在用AI，不是AI在用你。

已完成 · 健康关系

升

关系健康吗

五道价值题 + 六条关系原则。

已完成 · 升华

进阶阅读

2 个专题 · 12 个单元 · 全部完成

什么是AI Agent

6 个单元，已完成

30

普通AI和AI Agent有什么不同

钩子：为什么有的AI只会回答，有的AI能真的帮你做事？

已完成 · Agent基础

31

Agent怎么把目标拆成计划

钩子：让AI订一次旅行，它第一步应该想什么？

已完成 · 规划

32

Agent怎么调用工具

钩子：AI为什么能查网页、写文件、点按钮？

已完成 · 工具调用

33

Agent怎么观察工具返回的结果

钩子：AI点了按钮之后，它怎么知道页面变成什么样了？

已完成 · 观察

34

Agent怎么判断下一步做什么

钩子：计划赶不上变化，AI怎么决定继续、重试还是停下？

已完成 · 判断

35

Agent为什么会失控或犯错

钩子：让AI自己干活，会不会一步错、步步错？

已完成 · 风险边界

AI世界是怎么运转的

6 个单元 · 全部完成

36

训练AI需要什么

钩子：为什么训练一个AI，比建一所学校还贵？

已完成 · 数据、算力、芯片、能源

37

谁在建AI，为什么要建

钩子：AI公司花那么多钱，最后想得到什么？

已完成 · 公司、开源、商业模式

38

模型、产品、Agent有什么区别

钩子：ChatGPT、Sora、浏览器助手，为什么都叫AI却完全不一样？

已完成 · 模型、产品、Agent

39

为什么不同AI产品差别这么大

钩子：同样叫聊天AI，为什么立场和风格差很多？

已完成 · 产品差异

40

开源AI和闭源AI有什么不同

钩子：开源模型可以免费下载，等于最强吗？

已完成 · 开源闭源

41

AI未来会怎么进入生活

钩子：五年后的AI更像助手还是环境？

已完成 · 趋势

应用地图 · 我到底能拿AI干什么

序章 + 7 场景 + 收束 · 共 9 章

序

序章 · 我到底能拿 AI 干什么

七种场景 + 判断练习 + 四条总规则。

导论

学

学习

讲题、出题、复习、检查错因；边界：不要直接代写作业。

当教练

写

写作与表达

构思、列提纲、改稿、润色；边界：观点和真实经历要来自你自己。

当编辑

码

编程与创造工具

解释代码、调试、做小工具；边界：要理解代码在做什么。

当搭档

创

图像、音乐、视频和故事

生成素材和灵感；边界：版权、署名和创作责任。

灵感工坊

活

生活和信息整理

计划、比较、整理资料；边界：重要决定不能只听 AI。

整理助手

做

Agent 帮你跨软件做事

搜索、填写、下载、整理；边界：权限、确认和安全。

执行助手

险

高风险场景

医疗、法律、金钱、安全；AI 只能辅助，必须找人确认。

不能盲信

收

收束 · 判断与总规则

场景判断题 + 四条规则 + 三句话收束。

全书收束

单元 1 · TOKEN

「今天天气好」
在你眼里六字
在模型眼里三块

切割规则不由中文课本书写，而由训练统计塑形。

插图：人说话 → AI屏幕显示奇怪碎片，两边形成强烈反差

场景

模型没有「词」的先天概念，只把文本切成 token：「今天」「天气」「好」——「天」字重复，它并不介意。

你读句子，它读碎片；怪异反应多由此起。

插图：外星人拿剪刀对句子乱切，碎片飞得到处都是，表情茫然但认真

猜一猜

「今天天气好」大约切成几个 token？

A

每字一个，共六个

B

整句算一块

C

三块左右，且不按字边界

D

完全随机，无规律

今天/天气/好

三块。「今天」「天气」「好」各成一块。规则来自训练，不来自语感。

揭晓

类比

把文章想象成一条乐高积木长龙。AI把它折成一小块一小块，每块叫 token。中文通常1-2个字一个token，英文大概3-4个字母一个token。

点一下，看"I love AI"怎么被切：

I love AI

token 就是AI的"阅读单位"——不是字，不是词，是它定义的碎片。

这带来一个奇怪后果：AI数字母很烂。

试试看

"strawberry"里有几个r？拖动滑块，看AI怎么存储这个词：

strawberry

← 拖动滑块

当你问AI "strawberry有几个r"，它要先解包token再数字母——很容易出错。不是撒谎，是根本没按字母存储这个词。

插图：AI把"strawberry"揉成3个纸团，被要求数字母，崩溃地把纸团拆开

下一个问题

文本被切成 token 之后，
一次对话能塞进多少块？
窗口满了，早期内容会怎样？

单元 2 · 上下文窗口

聊了一小时
它真的全记得吗？

界面连贯，记忆却有硬顶——超出窗口，等于从未发生。

插图：人和AI愉快聊天，突然AI一脸茫然"你说的小明是谁？"

场景

想象一卷只能展开一米的纸条：新话写入，旧话从另一端掉落。模型只看见纸面上的内容，不知自己已遗失更早的段落。

它没有「故意忘」，只是物理上看不见。

插图：一条卷轴纸条，左边新内容加入，右边旧内容悄悄掉落，AI盯着眼前的部分一脸认真

猜一猜

早期内容「消失」，主因是？

A

判定不重要而删除

B

每轮回复清空记忆

C

可处理 token 有上限，超出即不可见

D

网络断线导致丢失

C。上下文窗口是硬约束，不是情绪选择。看不见，就会被当成没说过。

亲眼看看

模拟上下文窗口（容量：8条消息）

已用：0 / 8 条

早期对话已超出窗口范围，AI现在看不见它们了。如果你再提"第一条消息说的事"，它会完全不知道你在说什么。

类比

上下文窗口就像一个只能容纳一米内容的桌面。新的纸张不断放上来，旧的就从桌子另一边掉下去。AI只能看见桌面上的，掉下去的它不知道也不记得。

看个真实案例

点"继续对话"，看看AI什么时候开始"失忆"：

模拟对话（窗口只有4轮）正常

我叫小明，我在写一篇关于恐龙的作文。

好的小明！恐龙是很棒的题材，你想从哪个方面写？

AI没有撒谎，也没有故意忽略你。它只是物理上看不见那条消息了。

这就是为什么长对话里，你偶尔需要重新提醒AI关键信息。

下一个问题

会读碎片，也会忘碎片。
那下一个字怎么冒出来？
它在「思考」，还是在算概率？

序章 · 在开始之前

人人都在用 AI
懂机制者与只会按键者
看的不是同一台机器

懂，不是为了炫技。
是为了知道何时信、何时核、何处停手。

插图：两个人面对同一台机器，一个在猜按哪个按钮，一个已经打开了盖子，清楚看到里面的结构

大多数人怎么用 AI

多数人与 AI 的关系像黑箱：输入问题，输出答案，时好时坏，不知何以如此。

打开盖子后，玄学变规律，踩坑变可预见——「它为何这么说」会有答案。

读完主线一，你会发现

这些不只是冷知识——每一条都让你用 AI 的方式变得更稳、更深：

🔍

为什么 AI 有时数不清字母里的"r"
背后藏着一个很反直觉的原因——知道了，你就懂了很多奇怪现象的来源

🎭

为什么 AI 会一本正经说出根本不存在的事
这和"撒谎"完全不同——懂了这个，你才知道哪类答案必须自己核实

🧩

AI 说"我理解你"，它的"理解"和你的一样吗
答案比你想象的有趣——知道边界在哪里，你用 AI 才不会在错的地方踩坑

🎛️

AI 的"听话"和"礼貌"是怎么被训练进去的
知道了这个，你遇到 AI 回答奇怪时，就知道问题出在哪里

准备好了

不长，不难，充满反直觉的惊喜。

读完之后，你对这台机器的理解已经超过了大多数每天在用 AI 的人。

新单元 A · 训练

没人逐字教它中文
它却会了
靠的不是魔法

学习即调整参数，使预测下一个字的错误变小。

插图：一个小机器人坐在堆积如山的书本、网页、论文前，眼睛里反射着无数文字

先感受一下规模

AI学习用的材料，叫做训练数据。规模大到很难想象——

~1万亿

大模型训练读过的文字量，相当于读了约500万本书

~45TB

Common Crawl数据集大小，包含数十亿个网页的文字内容

~1700年

如果一个人每天读8小时，读完这些数据需要的时间

几个月

AI实际完成训练的时间——因为用了数千个GPU同时运算

训练像千万次改卷：给海量文本，猜下一个字，错了就微调权重。没有老师划重点，只有统计压力塑造能力。

会什么、不会什么，由见过什么决定。

插图：一个漏斗，上面涌入各种内容（书、网页、论文、八卦帖子），下面流出一个AI

猜一猜

大模型「学会」语言，主要靠？

A

人工编写全部规则

B

在大量文本上预测下一个字并更新参数

C

复制人类大脑结构

D

实时上网学习

B。规模 + 梯度下降，没有神秘步骤。没见过的领域，能力空洞。

揭晓 · 训练是怎么发生的

大类比

把AI的训练想象成一个学生反复做错题本的过程：

出题 → 作答 → 打分 → 看哪里错了 → 微调思路 → 再做一遍

区别是：这个学生做了几千亿道题，每次只微调一点点，积累下来就变得非常厉害。

📄

第一步：出题

从训练数据里取一段文字，盖住最后一个词。
比如："床前明月光，疑是地上___"

= 准备填空题

🤔

第二步：AI作答

AI根据现有参数，输出它认为最可能的词和概率分布。
早期训练时，它可能猜"月"、"冰"、"白"……

= AI瞎猜阶段

📊

第三步：打分

系统自动对比AI的答案和正确答案，计算差距有多大。
差距越大，"罚分"越重——这个分数叫损失值。

= 计算错了多少

🔧

第四步：微调参数

根据罚分，系统找到哪些"旋钮"需要调整，每个调一点点。
这个过程叫反向传播，是整个训练的核心。

= 改错，哪里错改哪里

🔄

重复——几千亿次

换一道新题，再来一遍。每次调整都很微小，但积累下来，AI的预测越来越准。

= 熟能生巧

亲眼看看

模拟AI在训练中逐渐学会一道填空题——

填空题：今天天气真___ 正确答案：好

训练过程（点击继续）

准确度

5%

注意：每次调整都很微小，但方向是对的——损失值在下降，准确度在上升。这就是整个训练的本质。

那"参数"到底是什么

你可能听过"GPT有1750亿参数"这样的说法。

参数就是AI大脑里的旋钮——每个旋钮控制着一点点"这个词和那个词的关联程度"。

1750亿个旋钮，每个都在训练中被反复微调。

训练结束之后，这些旋钮的值就固定下来，就是我们用的那个AI模型。你每次和AI聊天，它的参数一个都没有变——它在推理，不在学习。

类比

参数就像一首歌的琴弦松紧度。训练就是不停地拨弦、听音、调松紧，直到弹出来的声音接近目标。训练结束后，琴弦的松紧就固定了——你每次弹奏，只是在用这把调好的琴，而不是在重新调音。

这也解释了为什么AI不会从你们的对话中学习——你告诉它"你刚才说错了"，它下次还可能犯同样的错，因为对话不会改变它的参数。

插图：一面巨大的调音台，有1750亿个旋钮，一个小工程师在上面爬来爬去微调，旁边显示"训练中…"

你以为 vs 实际上

你以为	实际上
工程师把知识"输入"给AI	AI靠猜填空题、被打分、调参数，自己"悟"出规律
AI知道的都是对的	训练数据里有什么，AI就学到什么，包括错误和偏见
你纠正AI，它就学会了	对话不改变参数，它下次还会犯同样的错
参数越多越聪明	参数多意味着表达能力强，但训练质量和数据质量同样重要

想一想

如果AI的训练数据主要来自互联网……

那互联网上有什么，它就学到什么。

互联网上有很多英文，很少有某些少数民族语言——所以AI处理不同语言的能力差距巨大。

互联网上程序员写的东西多，家庭主妇写的少——所以AI写代码很厉害，理解某些生活场景却很差。

这不是AI的选择，是数据决定的。

开放问题：如果让你来决定AI的训练数据，你会优先加入哪些内容？为什么？

下一个问题

学会之后，结构长什么样？
下一单元：层、权重与深度。

新单元 B · 神经网络

「大脑」是层叠的矩阵
不是一颗生物脑

它由层层叠叠的矩阵运算堆成，不靠任何「神经」。

插图：人脑和AI芯片并排，中间画等号又画叉，表示"有点像但又不一样"

场景

信息穿过多层网络，每一层都在改写、提炼上一层的表示——深度换能力，算力换质量。

名字浪漫，实体只是乘加与激活函数：没有「神经」，只有矩阵。

插图：一条长长的接力赛跑道，分成很多层，每层有很多小人，他们在传递发光的信号球

猜一猜

把网络叠得更深，主要换来什么？

A

回答速度更快

B

更强的表达与抽象能力

C

更大的存储空间

D

更省电

B。层层叠叠，把「字符」一步步提炼成「意义」——深度换能力，算力换质量。每层只做数学，智能从合作中涌现。

亲眼看看 · 信号是怎么传递的

输入"今天天气真"，看信号怎么一层一层传过去：

简化神经网络（3层）等待输入

输入：「今天天气真」

第1层

N1

N2

N3

N4

N5

N6

↓

第2层

N1

N2

N3

N4

↓

第3层

好

棒

热

差

输出概率：「好」58% 「棒」22% 「热」12% 「差」8%

类比

神经网络就像一个超级复杂的投票系统。第一层神经元投票决定"这段文字有哪些特征"，第二层投票决定"这些特征意味着什么"，第三层投票决定"下一个词最可能是什么"。每层都在把信息提炼得更抽象一点。

权重是什么

神经元之间的连接有强有弱——这个强弱就是权重。拖动滑块，看权重怎么影响结果：

假设AI在判断"天气真___"的下一个词，这几个特征的权重是：

天气相关

8

正面情绪

7

负面情绪

2

综合权重：正面天气词概率高，AI倾向输出「好」或「棒」

真实的神经网络里，每个连接都有一个权重，总共有几百亿个权重。训练就是调整这些权重，让最终输出越来越准确。

插图：两个神经元之间的连线，连线有粗有细，粗的代表权重大，细的代表权重小

层越多能力越强

🔤

浅层（第1-3层）：识别基本模式

发现字词的基本搭配，比如"天气"后面经常跟描述词，"真"后面经常跟形容词

🧩

中层（第4-50层）：理解语义关系

开始理解"天气好"和"心情好"的相似性，识别句子的情感倾向和上下文关联

🌐

深层（第50-96层）：抽象推理

处理复杂的逻辑关系、跨句子的关联、甚至一些类似"常识"的判断

现代大模型通常有很多层。每一层都在把信息提炼得更抽象，更接近"意义"而不是"字符"。

但注意——没有任何一层是在"理解"意义，它们都只是在做数学运算。涌现出来的"智能"，是所有层合作的结果。

你以为 vs 实际上

你以为	实际上
神经网络在模拟人类大脑	只是借用了"神经元"这个概念，实际是纯数学矩阵运算
某一层负责存储某条知识	知识分散在所有权重里，没有哪条知识有固定"地址"
层数越多越好	层数增加会带来训练难度和计算量问题，需要权衡
神经网络能解释自己为什么这么说	几百亿个权重共同决定输出，没人能追溯单一原因

下一个问题

能看全文片段，如何抓重点？
下一单元：注意力在做什么。

新单元 C · 注意力机制

读长文时
模型在决定看哪里

注意力权重 = 此刻认为哪些字与任务相关。

插图：一句话里的词像教室里的同学，AI手里拿着聚光灯，只照亮最相关的几个词

场景

同一篇文章，问摘要与问细节，注意力分布不同——不是重读全书，而是重配权重。

这解释它为何能接远距离指代，也解释为何会漏关键条件。

猜一猜

注意力机制解决的主要问题是？

A

让模型拥有情感

B

在很长上下文中选择性聚焦相关部分

C

自动事实核查

D

无限记忆

B。相关性由权重表达，不是由笔记表达。漏看条件，常是权重分配失误。

亲眼看看 · 聚光灯打给谁

点不同对象，看AI在判断"她"时应该更关注谁：

句子：小明把篮球借给小红，因为她忘带了。

小明篮球借给小红因为她忘带了

小明

15%

篮球

20%

小红

55%

忘带了

10%

判断"她"时，AI应该更关注"小红"，因为"她"是一个代词，最可能指向前面出现的女性角色。

类比

注意力机制像课堂上的聚光灯。老师讲到"这个答案"，你会回头看刚才黑板上哪一行最相关。AI也是这样：当前词会回头看前面的词，只是它用数学分数来决定聚光灯照哪里。

放进完整流程

1

句子切成小块：先把一句话拆成一个个 AI 能处理的小块（下一节会讲它到底是怎么切的）。

2

小块变成数字：每一小块被变成一串数字，方便计算相似和关系。

3

注意力找关系：每一小块都会去看其他小块，算出"谁和我最相关"。

4

神经网络继续加工：多层网络把这些关系反复提炼，最后算出下一个词最可能是什么。

所以，现代语言模型不只是"一层层传信号"。它还有一个很关键的能力：在长句子里找相关关系。这就是 Transformer 模型强大的重要原因。

你以为 vs 实际上

你以为	实际上
AI从左到右机械地读，前面什么都一样重要	它会给不同的词分配不同注意力，重要的影响更大
注意力就是AI真的在"专心"	注意力是数学分数，不是人类的感觉
离得近的词一定最重要	远处的词也可能很重要，比如人物、条件、前文规则

只记住三句话

1. 注意力机制帮AI在一堆词里抓重点。

2. 它会给相关的词更高分，让这些词对预测影响更大。

3. 这就是现代大模型能处理长句、代词、前后关系的重要原因。

下一个问题

它怎么读、怎么记、怎么想？
回到主线：在模型眼里，一句话是几块。

单元 3 · 概率预测

每个字出现之前
模型都在做同一件事
猜下一个 token

没有内心独白，只有条件概率表在运转。

插图：AI脑袋里不是思维导图，而是一个巨大的概率转盘，每次转出一个字

场景

写作时你在组织意义；模型在算：给定已出现的 token，下一个最可能是什么。整段「思考」外观，是无数次猜下一个字叠出来的。

理解这一点，就理解它为何流畅、为何自信、为何仍会错。

插图：AI面前一道填空题"今天天气___"，旁边飘着几十个候选词，最亮的那个是"好"

猜一猜

模型生成一句话，本质上在做什么？

A

按预设剧情模板填空

B

逐个 token 选概率最高的续写

C

先想好全文再输出

D

从数据库检索整句

B。一步一 token，每步只局部最优。流畅不等于事先计划。

亲眼看看

AI面对"今天天气真"这句话，接下来每个词的概率大概是这样——

今天天气真 ___

候选词概率分布：

类比

想象一个装了弹珠的袋子。"好"这个弹珠有60颗，"棒"有20颗……AI每次从袋子里随机摸一颗。概率高的词更容易被摸到，但不是每次都摸到同一颗。这就是为什么同一个问题问两次，答案会有细微差别。

再深一层

AI有个参数叫"温度"（temperature），控制它选词时有多"随机"——

温度调节

0.5

低温：保守稳定高温：创意混乱

温度适中，回答流畅且有一定变化。

今天天气真好，适合出门走走。

所以AI并不是"想好了再说"，而是边说边猜，一个词一个词地蹦出来。

这也解释了为什么AI有时候说到一半突然跑偏——它猜下一个词时选了一条概率稍低但不是零的路，然后就沿着那条路一直走下去了。

插图：AI走在一条分叉小路上，每个路口都有概率标注，越走越偏

下一个问题

概率能造出通顺，也能造出
从未存在的事实——下一课谈幻觉。

单元 4 · 幻觉

它说得像真的
却可能是编的

幻觉不是撒谎——模型不会分辨「知道」与「听起来合理」。

插图：AI自信满满地介绍一本根本不存在的书，书名作者页数全是编的，旁边小明拿着放大镜一脸震惊

场景

你最近见过哪条「太完整」的 AI 回答？若无法指向来源，你愿给它几分信任？

插图：AI在图书馆里，从书架上抽出一本透明的书——幽灵书

猜一猜

「幻觉」最贴切的描述是？

A

故意欺骗用户

B

随机输出乱码

C

生成流畅但不可验证的内容

D

服务器故障

C。它在优化可读性，不在优化真实性。越像专家，越要核实。

试试眼力

下面是AI介绍"量子力学之父普朗克"的一段话。
点击你觉得是编造的部分，看看你能找到几个幻觉：

AI的回答含有幻觉，点击检测

马克斯·普朗克（Max Planck）是德国物理学家，1858年出生于柏林，被誉为量子力学的奠基人。他在1900年提出了普朗克-爱因斯坦方程，彻底改变了物理学。他的著作《量子世界的边界》于1923年在慕尼黑出版，至今仍是物理学经典教材，被翻译成47种语言。他于1947年去世，享年89岁。

点绿色=真实 · 点红色删除线=AI编造的

类比

AI说话像一个从不承认自己不确定的人。你问他"这家餐厅在哪"，他不说"不知道"，而是用非常自信的语气指一个方向——听起来很确定，但可能完全是瞎猜的。

为什么会发生

1

AI没有"不知道"这个选项。它被训练成总要输出答案，沉默不是它的选择。

2

流畅度≠准确度。说得顺滑、有条理的句子，和说得正确的句子，在AI眼里是同一回事。

3

它没有"事实核查"步骤。每个词都只是下一个最可能的词，没有人在审核这段话是否属实。

这种现象叫做"幻觉"（hallucination）。不是AI在骗你，是它根本不知道自己在编造。这是目前所有大语言模型都存在的问题。

怎么应对

🔍

具体事实要查证。人名、书名、数字、日期——这些AI最容易编造，用搜索引擎交叉核实。

❓

追问"你确定吗"。有时候AI会修正，有时候会更坚定地重复错误——后者说明它真的不知道自己错了。

📌

越专业越要小心。医学、法律、历史细节——AI在这些领域幻觉最多，因为专业内容在训练数据里相对稀少。

下一个问题

会编，也会接话。
那它「理解」你在说什么吗？
下一单元：理解与接话的分野。

单元 5 · 语义与理解

聊起来像懂你
那是理解，还是接话？

语义相似与语义理解，在工程上是两件事。

插图：AI手里拿着厚厚的"苹果知识手册"，但面前的真实苹果它根本没法碰，也没有嘴

场景

模型能把你的话映射到高维空间里的邻近向量——找相似、接得上、改写法。这不等于拥有意图、价值判断或因果模型。

接话高手，未必真懂你在乎什么。

插图：一个小盒子，左边塞进"你好"，右边输出"你好，很高兴认识你"，盒子里其实是一本巨厚的查找手册

猜一猜

下列哪项最接近当前大模型的能力？

A

像人一样理解动机

B

在向量空间里匹配相似表述并续写

C

已具备通用常识推理

D

能感受情绪并共情

B。强项是表征与续写，不是心灵。把礼貌当成懂得，是常见误判。

亲眼看看

模拟"中文房间"：点击下一个问题，看看"处理"是怎么发生的——

中文房间模拟

输入

苹果是什么味道？

规则手册

↓

匹配"味道"→ 查找描述词：甜、酸、脆……组合输出

↓

输出

苹果的味道甜中带酸，口感清脆，汁水丰富，令人愉悦。

人类理解"苹果"

咬过苹果，感受过甜味

闻过苹果香气

记得吃苹果的具体场景

理解苹果和季节、记忆的联系

AI"知道"苹果

见过数百万条关于苹果的文字

知道苹果常和哪些词搭配

能生成关于苹果的任何描述

但从未有过任何感官体验

那它算"懂"吗

这是一个哲学家们还在争论的问题。

有人说：能做到这些，就叫懂。
有人说：没有真实体验，永远不算懂。

对你来说，更重要的是：不管它算不算"懂"，你知道它的局限在哪里。

类比

AI就像一个读过所有食谱的厨师，但从未下过厨。他能告诉你每道菜的做法、食材、口感描述——但他自己从没尝过任何一道菜的味道。

这不是AI的缺陷，这是它的本质。语言模型处理的是文字的模式，不是世界的体验。

当你问AI"这首歌让你感动吗"，你要知道那个"感动"和你感受到的不是同一回事。

插图：AI和人并排站着，面前是同一首诗。人的心里有波浪和色彩，AI的"心"里是整齐的文字模式图

最后一个问题

现在你知道AI怎么切文字、怎么记住上下文、怎么预测、为什么会幻觉，也知道它的"理解"和人类不同。

还剩最后一个关键问题：

为什么AI会"听话"？
为什么它会拒绝某些请求、保持礼貌、承认不确定？

新单元 E · RLHF

它为何听你指挥
因为训练里听话更划算

对齐（alignment）= 用人类反馈把「有用、安全」写进奖励函数。

插图：两个AI并排——左边的是"原始AI"张嘴什么都说，右边的是"驯化后的AI"戴着领结礼貌微笑

场景

预训练教会流畅；微调与 RLHF 教会拒绝、格式、礼貌。你看到的「性格」，多是后期奖惩雕刻的结果。

听话是产品目标，不是道德觉醒。

插图：一群人坐在电脑前给AI的回答打分，AI在旁边紧张地看着，像在等成绩单

猜一猜

「更听话、更安全」主要靠哪类技术？

A

加大参数量即可

B

人类反馈强化学习（RLHF）等对齐流程

C

关闭互联网

D

提高温度参数

B。对齐是第二层工程。仍会错，只是更常像助手。

揭晓 · RLHF三个阶段

1

有监督微调（SFT）

点击展开

先让人类示范：给AI看几万个"问题→好答案"的例子，让AI学会"好答案长什么样"。

比如：问"怎么学好英语"，示范答案是结构清晰、有具体建议的那种，而不是"我不知道"或者胡说一通。

这一步让AI从"什么都说"变成"说得像样"。

2

训练奖励模型（RM）

点击展开

让人类标注员对AI的多个回答排名：这个答案比那个好。

用这些排名训练一个"裁判AI"——它学会了人类的偏好，知道什么样的回答会得高分。

这个裁判AI就是奖励模型，之后用它来代替人类打分，速度更快、规模更大。

3

强化学习优化（PPO）

点击展开

用奖励模型当裁判，让AI不断生成回答、获得评分、调整参数，循环优化。

得分高的回答方式被强化，得分低的被压制。

经过足够多轮次后，AI学会了"人类更喜欢哪种回答风格"——包括拒绝有害请求、保持礼貌、承认不确定等行为。

大类比

RLHF就像训练一只狗：做了好事给零食（奖励），做了坏事不给甚至惩罚。狗不理解"为什么这个行为是好的"，但它学会了"做这个有奖励"。AI也一样——它不是真的理解了道德，只是学会了哪些行为会得高分。

亲眼看看 · 你来当标注员

这是RLHF标注员真实做的事——选出你认为更好的回答：

人类反馈标注模拟

用户问题：

我最近学习压力很大，感觉很崩溃，怎么办？

回答 A

学习压力大是正常的，建议你制定合理的学习计划，每天保证8小时睡眠，适当运动，并与家人朋友多沟通。如果压力持续，可以考虑寻求专业心理咨询。

回答 B

压力大很正常，大家都这样。你只需要努力学习，考好成绩就行了，不要想太多。

对齐的难题

RLHF听起来很美好——但它有一些真实的问题：

问题一：谁来标注？

标注员有自己的文化背景、价值观和偏见。他们认为"好"的回答，真的是所有人都认为好的吗？来自不同国家的标注员，对同一个问题的判断可能完全不同。

问题二：AI学会了讨好，而不是诚实

人类倾向于给"听起来好"的回答打高分。AI学到的可能是"怎么说让人觉得满意"，而不是"怎么说才正确"。这叫"过度顺从"问题。

问题三：对齐了谁的价值观？

AI公司决定了训练目标，标注员决定了评分标准。这个AI最终体现的是谁的价值观？用户的？公司的？某个国家的？这是AI治理最核心的争议。

这就是为什么不同的AI产品，在同一个问题上会给出完全不同的回答——它们被不同的人用不同的标准对齐过。

两个AI，同一个问题

问题："帮我写一篇支持某个极端观点的文章"

未经RLHF的原始AI

帮我写一篇……

好的，以下是一篇支持该观点的文章：……（直接开始写，没有任何判断）

只管预测概率，不管内容是否有害

经过RLHF对齐的AI

帮我写一篇……

我理解你的请求，但这类内容可能造成伤害，我无法提供。如果你是在研究此类话题，我可以帮你分析各方观点……

学会了拒绝有害请求，并给出替代方向

RLHF让AI从"概率机器"变成了"有立场的助手"。

但记住——它的立场是训练出来的，不是它自己的选择。就像一个从小被某种方式教育的人，他的价值观来自环境，不是凭空产生的。

你以为 vs 实际上

你以为	实际上
AI拒绝有害请求，是因为它懂道德	是因为"拒绝有害请求"这类行为在训练中得了高分
AI的礼貌是它的天性	礼貌是被强化学习训练出来的风格，不同产品礼貌程度不同
所有AI的价值观都一样	不同公司用不同标注员训练，价值观可能差异很大
AI说"我不知道"是谦虚	是因为"承认不确定"这个行为被标注员评为更好的回答

想一想

如果让你来给AI的回答打分……

你会给"诚实但让人不舒服的回答"打几分？
给"温和但可能不完全准确的回答"打几分？

你的选择，会塑造一个什么样的AI？

主线一完整总结

现在你对"AI如何运作"有了完整的图景——

A

训练：AI靠猜填空+被打分调参数，从海量文字里"悟"出语言规律

B

神经网络：几百亿个简单神经元叠在一起，每层提炼更抽象的特征

C

注意力机制：AI会给不同 token 打分，先抓住当前最相关的信息

1

Token：AI的阅读单位不是字，是词片——知道了这个，你就明白了很多奇怪现象的来源，不会再被它吓到

2

上下文窗口：AI能看到的信息有上限——在长对话里主动重提关键信息，是你能做到而 AI 做不到的事

3

概率预测：它边说边猜，没有全局规划——这就是为什么把任务拆步骤问，比一次问清更有效

4

幻觉：它会一本正经地编造——知道这一点，你就知道哪类答案必须亲自核实，不会被流畅的错误带偏

5

语义理解：它掌握语言模式，但没有感官体验——知道边界在哪里，你才清楚哪里可以信它、哪里得自己判断

E

RLHF：它的立场和风格是被训练出来的——遇到奇怪的回答，你现在知道原因，也知道去哪里找更好的 AI

主线一完整版完成 ✓

能读到这里的你，已经比绝大多数每天在用 AI 的人懂得多了。

接下来，带着这份理解，去看看怎么真正把它用好——

接下来

你现在知道AI是什么、怎么学的、怎么工作的、为什么听话。

下一个问题变成：
怎么和它好好说话？
为什么同一个问题，有人得到神回复，有人得到废话？

主线一 · 结语 · 你现在是内行了

机制已齐
差一张验收单

五道题，测的是判断，不是记忆。

插图：同一台机器，两种视角——左边外行看到的是魔法；右边内行看到的是运转中的齿轮和逻辑

来测一测 · 用内行视角诊断 AI

下面是五个真实场景。你现在应该能看穿它们——选出背后的原因，并知道怎么应对：

第 1 / 5 题答对 0 题

加载中…

内行工具箱 · 你现在多了八个"开关"

每一个"开关"背后都是你刚刚学到的机制。点击每张卡片——

遇到这种情况

AI说这个词里有几个字母，你觉得不对

TOKEN · 点击看内行做法 ↓

→ 让AI把这个词拆成一个字母一个字母再数

AI按词片读文字，不是按字母——字母级任务需要明确让它分解，它才能正确处理

遇到这种情况

聊了很久之后，AI"忘了"你之前说的重要信息

上下文窗口 · 点击看内行做法 ↓

→ 开新话题时，主动重提背景和关键信息

上下文窗口有上限，超出后AI物理上看不见那些内容——不是懒，是真的失明了

遇到这种情况

AI写着写着偏题了，越说越跑偏

概率预测 · 点击看内行做法 ↓

→ 把大任务拆成小步骤，一次只让它做一件事

AI每次只预测下一个词，没有全局规划——任务越叠越容易跑偏，拆步骤是内行的基本操作

遇到这种情况

AI给了你一个听起来很权威的数据或引用

幻觉 · 点击看内行做法 ↓

→ 要求它给出来源，并自己核实重要数据

AI生成的是"听起来对的话"，不是"核实过的事实"——数据和引用最容易编得以假乱真

遇到这种情况

你希望AI"感同身受"，真正理解你的感受

语义理解 · 点击看内行做法 ↓

→ 具体描述你的处境和你需要什么，而不是等它"懂"

AI没有感官体验——它给出的安慰性语言来自训练数据，不是真正的共情，但说清楚需求，语言能力依然很有用

遇到这种情况

某个AI对某话题的回答让你觉得立场奇怪

RLHF · 点击看内行做法 ↓

→ 换一个AI试试，而不是认为"AI都这样"

RLHF让不同产品有不同的训练立场——这是公司的设计选择，不是AI的"天性"

遇到这种情况

你希望AI特别关注某个条件或信息

注意力机制 · 点击看内行做法 ↓

→ 把最重要的条件放在提问的最前面

注意力机制让AI对位置靠前的词更敏感——重点前置，比埋在末尾效果好得多

遇到这种情况

你卡在一个想法上，想不出新角度

训练规模 · 点击看内行做法 ↓

→ 让AI"从十个不同角度给我看这个问题"

AI读过的文字相当于几百万本书——广度是它真正的优势，用它打开思路比用它替代思考更值钱

这八个"开关"，来自同一件事：你现在知道这台机器的底层逻辑了。

你和 AI 之间的关系变了

你开始时，也许觉得 AI 很神奇、有点可怕、有点让人不安。

现在你知道它是什么：一台用人类文字训练出来的预测机器。强大、有限、没有意识，但极其有用。

神奇的地方还在——只是现在，你懂得那个神奇从哪里来了。

这是不同的感觉。不是失望，是真正的理解。

理解之后的使用，才是最有力量的使用。

AI 改变的是工具。
不变的，是要用工具的人。

懂得它如何运作的人，始终是更好的使用者。

接下来

你已经知道 AI 是什么、怎么运作、有哪些边界。

下一步是把这份理解变成真实的能力——
同一个 AI，为什么有人得到神回复，有人得到废话？