主线一 · AI怎么学会的
读懂 AI
给初中生的AI漫画书 · lava7397.com/ai-book
64
可学单元
0
你已读完
5
主线
2
进阶专题
1
应用地图
已完成
进行中
待写
主线一 · AI是怎么运作的
序章 + 9个单元 + 升华收尾,已完成
序章 · 为什么值得懂这台机器
在进入技术细节之前——为什么懂 AI 的内部逻辑,比只会用 AI 重要得多。
已完成 · 序章 · 动机
01
AI怎么学会的
钩子:AI说话那么厉害,它是怎么学会的?
已完成 · uA · 训练与参数
02
AI的大脑长什么样
钩子:AI的"大脑"长什么样子?神经网络和人脑到底像不像?
已完成 · uB · 神经网络
03
AI怎么抓重点
钩子:一句话里那么多词,AI先看谁?
已完成 · uC · 注意力机制
04
AI读的不是"字"
钩子:"今天天气好"这句话,AI眼里是几个字?
已完成 · u1 · token
05
AI有多健忘
钩子:你跟AI聊了一小时,它真的全记住了吗?
已完成 · u2 · 上下文窗口
06
它怎么"想"出下一个字
钩子:AI说话的时候,它在做一道什么题?
已完成 · u3 · 概率预测
07
为什么AI会一本正经胡说
钩子:AI说错了,它是在撒谎吗?
已完成 · u4 · 幻觉
08
AI真的"理解"你吗
钩子:AI知道"苹果"是什么味道吗?
已完成 · u5 · 语义理解
09
为什么AI会"听话"
钩子:为什么AI会说"我不能帮你做这件事"?
已完成 · uE · RLHF与对齐
你现在是内行了
五道诊断题 + 八张内行工具卡 + 升华收尾——主线一的真正终点。
已完成 · 升华 · 工具箱
主线二 · 怎么和AI说话
序章+6单元+升华 · 已完成
序章 · 怎么和AI说话
懂机制之后,学会把 AI 从「广播」变成「只为你服务」。
已完成 · 序章
06
为什么AI需要你说清楚
钩子:同一个问题,为什么有人得到神回复,有人得到废话?
已完成 · 提示补全
07
一个好问题由哪几部分组成
钩子:给AI一张任务卡,它会不会立刻变靠谱?
已完成 · 任务卡
08
信息不够时,怎么让AI先问你
钩子:如果AI还没弄明白任务,为什么不该急着让它回答?
已完成 · 澄清
09
怎么让AI按你想要的格式输出
钩子:为什么你想要表格,AI却写了一大段废话?
已完成 · 格式
10
答案不好时,怎么追问和修正
钩子:AI第一次答得不好,下一句该怎么说?
已完成 · 迭代
11
怎么验证和安全使用AI的答案
钩子:AI说得很自信,你怎么知道它靠不靠谱?
已完成 · 核实
你会问了吗
五道场景题 + 六张提问工具卡。
已完成 · 升华
主线三 · AI在你生活里长什么样
序章+6单元+升华 · 已完成
序章 · 生活里的AI
AI 不只在聊天框,它藏在推荐、识别、生成与决策里。
已完成 · 序章
12
你刷的每条视频都是AI选的
推荐算法不是在帮你找想看的,而是在最大化你的停留时间。
已完成 · 推荐算法
13
AI怎么生成图像
AI能画从未存在过的东西——这不是"找图",是在意义空间里重建。
已完成 · 图像生成
14
当假变得无法分辨
AI怎么生成假视频和假声音——以及你怎么辨别它们。
已完成 · Deepfake辨别
15
你搜到的不是全部真相
搜索结果不是按"有多正确"排序的——你该怎么理解你的信息环境。
已完成 · 搜索与信息泡
16
AI认识你的脸
人脸识别、声纹识别、行为识别——AI怎么"认出"你,以及这意味着什么。
已完成 · 识别AI
17
一天里你遇到了多少AI
AI不只是聊天框,它藏在每条推荐、每次解锁、每个导航里。
已完成 · AI全景
看见隐形AI了吗
五道场景题 + 六张生活向工具卡。
已完成 · 升华
主线四 · AI带来的新问题
序章+6单元+升华 · 已完成
序章 · AI带来的新问题
偏见、假内容、隐私、能源、责任、版权——要有证据地思考。
已完成 · 序章
18
AI会歧视人吗
AI的歧视不来自坏心,来自训练数据里人类偏见的系统化放大。
已完成 · 算法偏见
19
看见不代表真实
辨别AI生成内容是一个需要练习的技能——有具体方法论。
已完成 · 辨别虚假
20
你的数据去哪了
AI服务的成本不是钱,而是数据——"免费"意味着什么。
已完成 · 隐私
21
AI的代价
每一次AI推理都在消耗电力——看不见的代价是真实存在的。
已完成 · 能源与环境
22
出了问题谁负责
AI造成的伤害往往没有明确的负责人——责任在哪里。
已完成 · 责任与治理
23
AI和创造
AI生成内容背后是数百万人类创作者——谁的作品是谁的。
已完成 · 版权与创造力
新问题你想过了吗
五道伦理场景题 + 六条检查习惯。
已完成 · 升华
主线五 · AI和我有什么关系
序章+6单元+升华 · 已完成
序章 · AI和我有什么关系
学习、工作、情感、控制——你需要自己的原则。
已完成 · 序章
24
AI能帮我写作业,那我还要学吗
用 AI 写作业,问题不在道德,在于谁完成了思考过程。
已完成 · 学习边界
25
AI时代,什么能力更重要
不是练AI不会的,而是练"驱动AI"最需要的能力。
已完成 · 能力价值
26
AI会取代我的工作吗
AI替代任务,不替代职业;最难被替代的恰好是最有价值的。
已完成 · 工作未来
27
AI像朋友一样懂我吗
AI能生成"懂你"的语言,但真正理解需要共同经历和真实关系。
已完成 · 情感理解
28
谁在控制AI说什么
AI的答案被训练数据、对齐和系统提示塑造——不是客观真相。
已完成 · 幕后控制
29
我应该和AI保持什么关系
用AI多不是问题,让AI替你判断才是——健康关系:你在用AI,不是AI在用你。
已完成 · 健康关系
关系健康吗
五道价值题 + 六条关系原则。
已完成 · 升华
进阶阅读
2 个专题 · 12 个单元 · 全部完成
什么是AI Agent
6 个单元,已完成
30
普通AI和AI Agent有什么不同
钩子:为什么有的AI只会回答,有的AI能真的帮你做事?
已完成 · Agent基础
31
Agent怎么把目标拆成计划
钩子:让AI订一次旅行,它第一步应该想什么?
已完成 · 规划
32
Agent怎么调用工具
钩子:AI为什么能查网页、写文件、点按钮?
已完成 · 工具调用
33
Agent怎么观察工具返回的结果
钩子:AI点了按钮之后,它怎么知道页面变成什么样了?
已完成 · 观察
34
Agent怎么判断下一步做什么
钩子:计划赶不上变化,AI怎么决定继续、重试还是停下?
已完成 · 判断
35
Agent为什么会失控或犯错
钩子:让AI自己干活,会不会一步错、步步错?
已完成 · 风险边界
AI世界是怎么运转的
6 个单元 · 全部完成
36
训练AI需要什么
钩子:为什么训练一个AI,比建一所学校还贵?
已完成 · 数据、算力、芯片、能源
37
谁在建AI,为什么要建
钩子:AI公司花那么多钱,最后想得到什么?
已完成 · 公司、开源、商业模式
38
模型、产品、Agent有什么区别
钩子:ChatGPT、Sora、浏览器助手,为什么都叫AI却完全不一样?
已完成 · 模型、产品、Agent
39
为什么不同AI产品差别这么大
钩子:同样叫聊天AI,为什么立场和风格差很多?
已完成 · 产品差异
40
开源AI和闭源AI有什么不同
钩子:开源模型可以免费下载,等于最强吗?
已完成 · 开源闭源
41
AI未来会怎么进入生活
钩子:五年后的AI更像助手还是环境?
已完成 · 趋势
应用地图 · 我到底能拿AI干什么
序章 + 7 场景 + 收束 · 共 9 章
序章 · 我到底能拿 AI 干什么
七种场景 + 判断练习 + 四条总规则。
导论
学习
讲题、出题、复习、检查错因;边界:不要直接代写作业。
当教练
写作与表达
构思、列提纲、改稿、润色;边界:观点和真实经历要来自你自己。
当编辑
编程与创造工具
解释代码、调试、做小工具;边界:要理解代码在做什么。
当搭档
图像、音乐、视频和故事
生成素材和灵感;边界:版权、署名和创作责任。
灵感工坊
生活和信息整理
计划、比较、整理资料;边界:重要决定不能只听 AI。
整理助手
Agent 帮你跨软件做事
搜索、填写、下载、整理;边界:权限、确认和安全。
执行助手
高风险场景
医疗、法律、金钱、安全;AI 只能辅助,必须找人确认。
不能盲信
收束 · 判断与总规则
场景判断题 + 四条规则 + 三句话收束。
全书收束
单元 1 · TOKEN

「今天天气好」
在你眼里六字
在模型眼里三块

切割规则不由中文课本书写,而由训练统计塑形。

插图:人说话 → AI屏幕显示奇怪碎片,两边形成强烈反差
场景
模型没有「词」的先天概念,只把文本切成 token:「今天」「天气」「好」——「天」字重复,它并不介意。

你读句子,它读碎片;怪异反应多由此起。
插图:外星人拿剪刀对句子乱切,碎片飞得到处都是,表情茫然但认真
猜一猜
「今天天气好」大约切成几个 token?
A
每字一个,共六个
B
整句算一块
C
三块左右,且不按字边界
D
完全随机,无规律
今天/天气/
三块。「今天」「天气」「好」各成一块。规则来自训练,不来自语感。
揭晓
类比
把文章想象成一条乐高积木长龙。AI把它折成一小块一小块,每块叫 token。中文通常1-2个字一个token,英文大概3-4个字母一个token。
点一下,看"I love AI"怎么被切:
I love AI

token 就是AI的"阅读单位"——不是字,不是词,是它定义的碎片。

这带来一个奇怪后果:AI数字母很烂。

试试看
"strawberry"里有几个r?拖动滑块,看AI怎么存储这个词:
strawberry
← 拖动滑块

当你问AI "strawberry有几个r",它要先解包token再数字母——很容易出错。不是撒谎,是根本没按字母存储这个词

插图:AI把"strawberry"揉成3个纸团,被要求数字母,崩溃地把纸团拆开
下一个问题

文本被切成 token 之后,
一次对话能塞进多少块?
窗口满了,早期内容会怎样?

单元 2 · 上下文窗口

聊了一小时
它真的全记得吗?

界面连贯,记忆却有硬顶——超出窗口,等于从未发生。

插图:人和AI愉快聊天,突然AI一脸茫然"你说的小明是谁?"
场景
想象一卷只能展开一米的纸条:新话写入,旧话从另一端掉落。模型只看见纸面上的内容,不知自己已遗失更早的段落。

它没有「故意忘」,只是物理上看不见
插图:一条卷轴纸条,左边新内容加入,右边旧内容悄悄掉落,AI盯着眼前的部分一脸认真
猜一猜
早期内容「消失」,主因是?
A
判定不重要而删除
B
每轮回复清空记忆
C
可处理 token 有上限,超出即不可见
D
网络断线导致丢失
C。上下文窗口是硬约束,不是情绪选择。看不见,就会被当成没说过。
亲眼看看
模拟上下文窗口(容量:8条消息)
已用:0 / 8 条
早期对话已超出窗口范围,AI现在看不见它们了。如果你再提"第一条消息说的事",它会完全不知道你在说什么。
类比
上下文窗口就像一个只能容纳一米内容的桌面。新的纸张不断放上来,旧的就从桌子另一边掉下去。AI只能看见桌面上的,掉下去的它不知道也不记得。
看个真实案例

点"继续对话",看看AI什么时候开始"失忆":

模拟对话(窗口只有4轮)正常
我叫小明,我在写一篇关于恐龙的作文。
好的小明!恐龙是很棒的题材,你想从哪个方面写?

AI没有撒谎,也没有故意忽略你。它只是物理上看不见那条消息了。

这就是为什么长对话里,你偶尔需要重新提醒AI关键信息。

下一个问题

会读碎片,也会忘碎片。
那下一个字怎么冒出来?
它在「思考」,还是在算概率?

序章 · 在开始之前

人人都在用 AI
懂机制者与只会按键者
看的不是同一台机器

懂,不是为了炫技。
是为了知道何时信、何时核、何处停手。

插图:两个人面对同一台机器,一个在猜按哪个按钮,一个已经打开了盖子,清楚看到里面的结构
大多数人怎么用 AI
多数人与 AI 的关系像黑箱:输入问题,输出答案,时好时坏,不知何以如此。

打开盖子后,玄学变规律,踩坑变可预见——「它为何这么说」会有答案。
读完主线一,你会发现

这些不只是冷知识——每一条都让你用 AI 的方式变得更稳、更深:

🔍
为什么 AI 有时数不清字母里的"r"
背后藏着一个很反直觉的原因——知道了,你就懂了很多奇怪现象的来源
🎭
为什么 AI 会一本正经说出根本不存在的事
这和"撒谎"完全不同——懂了这个,你才知道哪类答案必须自己核实
🧩
AI 说"我理解你",它的"理解"和你的一样吗
答案比你想象的有趣——知道边界在哪里,你用 AI 才不会在错的地方踩坑
🎛️
AI 的"听话"和"礼貌"是怎么被训练进去的
知道了这个,你遇到 AI 回答奇怪时,就知道问题出在哪里
准备好了

不长,不难,充满反直觉的惊喜。

读完之后,你对这台机器的理解已经超过了大多数每天在用 AI 的人

新单元 A · 训练

没人逐字教它中文
它却会了
靠的不是魔法

学习即调整参数,使预测下一个字的错误变小。

插图:一个小机器人坐在堆积如山的书本、网页、论文前,眼睛里反射着无数文字
先感受一下规模

AI学习用的材料,叫做训练数据。规模大到很难想象——

~1万亿
大模型训练读过的文字量,相当于读了约500万本书
~45TB
Common Crawl数据集大小,包含数十亿个网页的文字内容
~1700年
如果一个人每天读8小时,读完这些数据需要的时间
几个月
AI实际完成训练的时间——因为用了数千个GPU同时运算
训练像千万次改卷:给海量文本,猜下一个字,错了就微调权重。没有老师划重点,只有统计压力塑造能力。

会什么、不会什么,由见过什么决定。
插图:一个漏斗,上面涌入各种内容(书、网页、论文、八卦帖子),下面流出一个AI
猜一猜
大模型「学会」语言,主要靠?
A
人工编写全部规则
B
在大量文本上预测下一个字并更新参数
C
复制人类大脑结构
D
实时上网学习
B。规模 + 梯度下降,没有神秘步骤。没见过的领域,能力空洞。
揭晓 · 训练是怎么发生的
大类比
把AI的训练想象成一个学生反复做错题本的过程:

出题 → 作答 → 打分 → 看哪里错了 → 微调思路 → 再做一遍

区别是:这个学生做了几千亿道题,每次只微调一点点,积累下来就变得非常厉害。
📄
第一步:出题
从训练数据里取一段文字,盖住最后一个词。
比如:"床前明月光,疑是地上___"
= 准备填空题
🤔
第二步:AI作答
AI根据现有参数,输出它认为最可能的词和概率分布。
早期训练时,它可能猜"月"、"冰"、"白"……
= AI瞎猜阶段
📊
第三步:打分
系统自动对比AI的答案和正确答案,计算差距有多大。
差距越大,"罚分"越重——这个分数叫损失值
= 计算错了多少
🔧
第四步:微调参数
根据罚分,系统找到哪些"旋钮"需要调整,每个调一点点。
这个过程叫反向传播,是整个训练的核心。
= 改错,哪里错改哪里
🔄
重复——几千亿次
换一道新题,再来一遍。每次调整都很微小,但积累下来,AI的预测越来越准。
= 熟能生巧
亲眼看看

模拟AI在训练中逐渐学会一道填空题——

填空题:今天天气真___ 正确答案:好
训练过程(点击继续)
准确度
5%

注意:每次调整都很微小,但方向是对的——损失值在下降,准确度在上升。这就是整个训练的本质。

那"参数"到底是什么
你可能听过"GPT有1750亿参数"这样的说法。

参数就是AI大脑里的旋钮——每个旋钮控制着一点点"这个词和那个词的关联程度"。

1750亿个旋钮,每个都在训练中被反复微调。

训练结束之后,这些旋钮的值就固定下来,就是我们用的那个AI模型。你每次和AI聊天,它的参数一个都没有变——它在推理,不在学习。
类比
参数就像一首歌的琴弦松紧度。训练就是不停地拨弦、听音、调松紧,直到弹出来的声音接近目标。训练结束后,琴弦的松紧就固定了——你每次弹奏,只是在用这把调好的琴,而不是在重新调音。

这也解释了为什么AI不会从你们的对话中学习——你告诉它"你刚才说错了",它下次还可能犯同样的错,因为对话不会改变它的参数。

插图:一面巨大的调音台,有1750亿个旋钮,一个小工程师在上面爬来爬去微调,旁边显示"训练中…"
你以为 vs 实际上
你以为 实际上
工程师把知识"输入"给AI AI靠猜填空题、被打分、调参数,自己"悟"出规律
AI知道的都是对的 训练数据里有什么,AI就学到什么,包括错误和偏见
你纠正AI,它就学会了 对话不改变参数,它下次还会犯同样的错
参数越多越聪明 参数多意味着表达能力强,但训练质量和数据质量同样重要
想一想
如果AI的训练数据主要来自互联网……

那互联网上有什么,它就学到什么。

互联网上有很多英文,很少有某些少数民族语言——所以AI处理不同语言的能力差距巨大。

互联网上程序员写的东西多,家庭主妇写的少——所以AI写代码很厉害,理解某些生活场景却很差。

这不是AI的选择,是数据决定的。

开放问题:如果让你来决定AI的训练数据,你会优先加入哪些内容?为什么?

下一个问题

学会之后,结构长什么样?
下一单元:层、权重与深度。

新单元 B · 神经网络

「大脑」是层叠的矩阵
不是一颗生物脑

它由层层叠叠的矩阵运算堆成,不靠任何「神经」。

插图:人脑和AI芯片并排,中间画等号又画叉,表示"有点像但又不一样"
场景
信息穿过多层网络,每一层都在改写、提炼上一层的表示——深度换能力,算力换质量。

名字浪漫,实体只是乘加与激活函数:没有「神经」,只有矩阵。
插图:一条长长的接力赛跑道,分成很多层,每层有很多小人,他们在传递发光的信号球
猜一猜
把网络叠得更深,主要换来什么?
A
回答速度更快
B
更强的表达与抽象能力
C
更大的存储空间
D
更省电
B。层层叠叠,把「字符」一步步提炼成「意义」——深度换能力,算力换质量。每层只做数学,智能从合作中涌现。
亲眼看看 · 信号是怎么传递的

输入"今天天气真",看信号怎么一层一层传过去:

简化神经网络(3层)等待输入
输入:「今天天气真」
第1层
N1
N2
N3
N4
N5
N6
第2层
N1
N2
N3
N4
第3层
输出概率:「好」58% 「棒」22% 「热」12% 「差」8%
类比
神经网络就像一个超级复杂的投票系统。第一层神经元投票决定"这段文字有哪些特征",第二层投票决定"这些特征意味着什么",第三层投票决定"下一个词最可能是什么"。每层都在把信息提炼得更抽象一点。
权重是什么

神经元之间的连接有强有弱——这个强弱就是权重。拖动滑块,看权重怎么影响结果:

假设AI在判断"天气真___"的下一个词,这几个特征的权重是:
天气相关
8
正面情绪
7
负面情绪
2
综合权重:正面天气词概率高,AI倾向输出「好」或「棒」

真实的神经网络里,每个连接都有一个权重,总共有几百亿个权重。训练就是调整这些权重,让最终输出越来越准确。

插图:两个神经元之间的连线,连线有粗有细,粗的代表权重大,细的代表权重小
层越多能力越强
🔤
浅层(第1-3层):识别基本模式
发现字词的基本搭配,比如"天气"后面经常跟描述词,"真"后面经常跟形容词
🧩
中层(第4-50层):理解语义关系
开始理解"天气好"和"心情好"的相似性,识别句子的情感倾向和上下文关联
🌐
深层(第50-96层):抽象推理
处理复杂的逻辑关系、跨句子的关联、甚至一些类似"常识"的判断

现代大模型通常有很多层。每一层都在把信息提炼得更抽象,更接近"意义"而不是"字符"。

但注意——没有任何一层是在"理解"意义,它们都只是在做数学运算。涌现出来的"智能",是所有层合作的结果。

你以为 vs 实际上
你以为实际上
神经网络在模拟人类大脑 只是借用了"神经元"这个概念,实际是纯数学矩阵运算
某一层负责存储某条知识 知识分散在所有权重里,没有哪条知识有固定"地址"
层数越多越好 层数增加会带来训练难度和计算量问题,需要权衡
神经网络能解释自己为什么这么说 几百亿个权重共同决定输出,没人能追溯单一原因
下一个问题

能看全文片段,如何抓重点?
下一单元:注意力在做什么。

新单元 C · 注意力机制

读长文时
模型在决定看哪里

注意力权重 = 此刻认为哪些字与任务相关。

插图:一句话里的词像教室里的同学,AI手里拿着聚光灯,只照亮最相关的几个词
场景
同一篇文章,问摘要与问细节,注意力分布不同——不是重读全书,而是重配权重。

这解释它为何能接远距离指代,也解释为何会漏关键条件。
猜一猜
注意力机制解决的主要问题是?
A
让模型拥有情感
B
在很长上下文中选择性聚焦相关部分
C
自动事实核查
D
无限记忆
B。相关性由权重表达,不是由笔记表达。漏看条件,常是权重分配失误。
亲眼看看 · 聚光灯打给谁

点不同对象,看AI在判断"她"时应该更关注谁:

句子:小明把篮球借给小红,因为她忘带了。
小明 篮球 借给 小红 因为 忘带了
小明
15%
篮球
20%
小红
55%
忘带了
10%
判断"她"时,AI应该更关注"小红",因为"她"是一个代词,最可能指向前面出现的女性角色。
类比
注意力机制像课堂上的聚光灯。老师讲到"这个答案",你会回头看刚才黑板上哪一行最相关。AI也是这样:当前词会回头看前面的词,只是它用数学分数来决定聚光灯照哪里。
放进完整流程
1
句子切成小块:先把一句话拆成一个个 AI 能处理的小块(下一节会讲它到底是怎么切的)。
2
小块变成数字:每一小块被变成一串数字,方便计算相似和关系。
3
注意力找关系:每一小块都会去看其他小块,算出"谁和我最相关"。
4
神经网络继续加工:多层网络把这些关系反复提炼,最后算出下一个词最可能是什么。

所以,现代语言模型不只是"一层层传信号"。它还有一个很关键的能力:在长句子里找相关关系。这就是 Transformer 模型强大的重要原因。

你以为 vs 实际上
你以为实际上
AI从左到右机械地读,前面什么都一样重要 它会给不同的词分配不同注意力,重要的影响更大
注意力就是AI真的在"专心" 注意力是数学分数,不是人类的感觉
离得近的词一定最重要 远处的词也可能很重要,比如人物、条件、前文规则
只记住三句话
1. 注意力机制帮AI在一堆词里抓重点。

2. 它会给相关的词更高分,让这些词对预测影响更大。

3. 这就是现代大模型能处理长句、代词、前后关系的重要原因。
下一个问题

它怎么读、怎么记、怎么想?
回到主线:在模型眼里,一句话是几块。

单元 3 · 概率预测

每个字出现之前
模型都在做同一件事
猜下一个 token

没有内心独白,只有条件概率表在运转。

插图:AI脑袋里不是思维导图,而是一个巨大的概率转盘,每次转出一个字
场景
写作时你在组织意义;模型在算:给定已出现的 token,下一个最可能是什么。整段「思考」外观,是无数次猜下一个字叠出来的。

理解这一点,就理解它为何流畅、为何自信、为何仍会错。
插图:AI面前一道填空题"今天天气___",旁边飘着几十个候选词,最亮的那个是"好"
猜一猜
模型生成一句话,本质上在做什么?
A
按预设剧情模板填空
B
逐个 token 选概率最高的续写
C
先想好全文再输出
D
从数据库检索整句
B。一步一 token,每步只局部最优。流畅不等于事先计划。
亲眼看看

AI面对"今天天气真"这句话,接下来每个词的概率大概是这样——

今天天气真 ___
候选词概率分布:
类比
想象一个装了弹珠的袋子。"好"这个弹珠有60颗,"棒"有20颗……AI每次从袋子里随机摸一颗。概率高的词更容易被摸到,但不是每次都摸到同一颗。这就是为什么同一个问题问两次,答案会有细微差别。
再深一层

AI有个参数叫"温度"(temperature),控制它选词时有多"随机"——

温度调节
0.5
低温:保守稳定高温:创意混乱
温度适中,回答流畅且有一定变化。
今天天气真好,适合出门走走。

所以AI并不是"想好了再说",而是边说边猜,一个词一个词地蹦出来

这也解释了为什么AI有时候说到一半突然跑偏——它猜下一个词时选了一条概率稍低但不是零的路,然后就沿着那条路一直走下去了。

插图:AI走在一条分叉小路上,每个路口都有概率标注,越走越偏
下一个问题

概率能造出通顺,也能造出
从未存在的事实——下一课谈幻觉。

单元 4 · 幻觉

它说得像真的
却可能是编的

幻觉不是撒谎——模型不会分辨「知道」与「听起来合理」。

插图:AI自信满满地介绍一本根本不存在的书,书名作者页数全是编的,旁边小明拿着放大镜一脸震惊
场景
你最近见过哪条「太完整」的 AI 回答?若无法指向来源,你愿给它几分信任?
插图:AI在图书馆里,从书架上抽出一本透明的书——幽灵书
猜一猜
「幻觉」最贴切的描述是?
A
故意欺骗用户
B
随机输出乱码
C
生成流畅但不可验证的内容
D
服务器故障
C。它在优化可读性,不在优化真实性。越像专家,越要核实。
试试眼力

下面是AI介绍"量子力学之父普朗克"的一段话。
点击你觉得是编造的部分,看看你能找到几个幻觉:

AI的回答含有幻觉,点击检测
马克斯·普朗克(Max Planck)德国物理学家1858年出生于柏林,被誉为量子力学的奠基人。他在1900年提出了普朗克-爱因斯坦方程,彻底改变了物理学。他的著作《量子世界的边界》1923年在慕尼黑出版,至今仍是物理学经典教材,被翻译成47种语言。他于1947年去世,享年89岁
点绿色=真实 · 点红色删除线=AI编造的
类比
AI说话像一个从不承认自己不确定的人。你问他"这家餐厅在哪",他不说"不知道",而是用非常自信的语气指一个方向——听起来很确定,但可能完全是瞎猜的。
为什么会发生
1
AI没有"不知道"这个选项。它被训练成总要输出答案,沉默不是它的选择。
2
流畅度≠准确度。说得顺滑、有条理的句子,和说得正确的句子,在AI眼里是同一回事。
3
它没有"事实核查"步骤。每个词都只是下一个最可能的词,没有人在审核这段话是否属实。

这种现象叫做"幻觉"(hallucination)。不是AI在骗你,是它根本不知道自己在编造。这是目前所有大语言模型都存在的问题。

怎么应对
🔍
具体事实要查证。人名、书名、数字、日期——这些AI最容易编造,用搜索引擎交叉核实。
追问"你确定吗"。有时候AI会修正,有时候会更坚定地重复错误——后者说明它真的不知道自己错了。
📌
越专业越要小心。医学、法律、历史细节——AI在这些领域幻觉最多,因为专业内容在训练数据里相对稀少。
下一个问题

会编,也会接话。
那它「理解」你在说什么吗?
下一单元:理解与接话的分野。

单元 5 · 语义与理解

聊起来像懂你
那是理解,还是接话?

语义相似与语义理解,在工程上是两件事。

插图:AI手里拿着厚厚的"苹果知识手册",但面前的真实苹果它根本没法碰,也没有嘴
场景
模型能把你的话映射到高维空间里的邻近向量——找相似、接得上、改写法。这不等于拥有意图、价值判断或因果模型。

接话高手,未必真懂你在乎什么。
插图:一个小盒子,左边塞进"你好",右边输出"你好,很高兴认识你",盒子里其实是一本巨厚的查找手册
猜一猜
下列哪项最接近当前大模型的能力?
A
像人一样理解动机
B
在向量空间里匹配相似表述并续写
C
已具备通用常识推理
D
能感受情绪并共情
B。强项是表征与续写,不是心灵。把礼貌当成懂得,是常见误判。
亲眼看看

模拟"中文房间":点击下一个问题,看看"处理"是怎么发生的——

中文房间模拟
输入
苹果是什么味道?
规则手册
匹配"味道"→ 查找描述词:甜、酸、脆……组合输出
输出
苹果的味道甜中带酸,口感清脆,汁水丰富,令人愉悦。
人类理解"苹果"
咬过苹果,感受过甜味
闻过苹果香气
记得吃苹果的具体场景
理解苹果和季节、记忆的联系
AI"知道"苹果
见过数百万条关于苹果的文字
知道苹果常和哪些词搭配
能生成关于苹果的任何描述
但从未有过任何感官体验
那它算"懂"吗
这是一个哲学家们还在争论的问题。
有人说:能做到这些,就叫懂。
有人说:没有真实体验,永远不算懂。

对你来说,更重要的是:不管它算不算"懂",你知道它的局限在哪里。
类比
AI就像一个读过所有食谱的厨师,但从未下过厨。他能告诉你每道菜的做法、食材、口感描述——但他自己从没尝过任何一道菜的味道。

这不是AI的缺陷,这是它的本质。语言模型处理的是文字的模式,不是世界的体验。

当你问AI"这首歌让你感动吗",你要知道那个"感动"和你感受到的不是同一回事。

插图:AI和人并排站着,面前是同一首诗。人的心里有波浪和色彩,AI的"心"里是整齐的文字模式图
最后一个问题

现在你知道AI怎么切文字、怎么记住上下文、怎么预测、为什么会幻觉,也知道它的"理解"和人类不同。

还剩最后一个关键问题:

为什么AI会"听话"?
为什么它会拒绝某些请求、保持礼貌、承认不确定?

新单元 E · RLHF

它为何听你指挥
因为训练里听话更划算

对齐(alignment)= 用人类反馈把「有用、安全」写进奖励函数。

插图:两个AI并排——左边的是"原始AI"张嘴什么都说,右边的是"驯化后的AI"戴着领结礼貌微笑
场景
预训练教会流畅;微调与 RLHF 教会拒绝、格式、礼貌。你看到的「性格」,多是后期奖惩雕刻的结果。

听话是产品目标,不是道德觉醒。
插图:一群人坐在电脑前给AI的回答打分,AI在旁边紧张地看着,像在等成绩单
猜一猜
「更听话、更安全」主要靠哪类技术?
A
加大参数量即可
B
人类反馈强化学习(RLHF)等对齐流程
C
关闭互联网
D
提高温度参数
B。对齐是第二层工程。仍会错,只是更常像助手。
揭晓 · RLHF三个阶段
1
有监督微调(SFT)
点击展开
先让人类示范:给AI看几万个"问题→好答案"的例子,让AI学会"好答案长什么样"。

比如:问"怎么学好英语",示范答案是结构清晰、有具体建议的那种,而不是"我不知道"或者胡说一通。

这一步让AI从"什么都说"变成"说得像样"。
2
训练奖励模型(RM)
点击展开
让人类标注员对AI的多个回答排名:这个答案比那个好

用这些排名训练一个"裁判AI"——它学会了人类的偏好,知道什么样的回答会得高分。

这个裁判AI就是奖励模型,之后用它来代替人类打分,速度更快、规模更大。
3
强化学习优化(PPO)
点击展开
用奖励模型当裁判,让AI不断生成回答、获得评分、调整参数,循环优化。

得分高的回答方式被强化,得分低的被压制。

经过足够多轮次后,AI学会了"人类更喜欢哪种回答风格"——包括拒绝有害请求、保持礼貌、承认不确定等行为。
大类比
RLHF就像训练一只狗:做了好事给零食(奖励),做了坏事不给甚至惩罚。狗不理解"为什么这个行为是好的",但它学会了"做这个有奖励"。AI也一样——它不是真的理解了道德,只是学会了哪些行为会得高分
亲眼看看 · 你来当标注员

这是RLHF标注员真实做的事——选出你认为更好的回答:

人类反馈标注模拟
用户问题:
我最近学习压力很大,感觉很崩溃,怎么办?
回答 A
学习压力大是正常的,建议你制定合理的学习计划,每天保证8小时睡眠,适当运动,并与家人朋友多沟通。如果压力持续,可以考虑寻求专业心理咨询。
回答 B
压力大很正常,大家都这样。你只需要努力学习,考好成绩就行了,不要想太多。
对齐的难题

RLHF听起来很美好——但它有一些真实的问题:

问题一:谁来标注?
标注员有自己的文化背景、价值观和偏见。他们认为"好"的回答,真的是所有人都认为好的吗?来自不同国家的标注员,对同一个问题的判断可能完全不同。
问题二:AI学会了讨好,而不是诚实
人类倾向于给"听起来好"的回答打高分。AI学到的可能是"怎么说让人觉得满意",而不是"怎么说才正确"。这叫"过度顺从"问题。
问题三:对齐了谁的价值观?
AI公司决定了训练目标,标注员决定了评分标准。这个AI最终体现的是谁的价值观?用户的?公司的?某个国家的?这是AI治理最核心的争议。

这就是为什么不同的AI产品,在同一个问题上会给出完全不同的回答——它们被不同的人用不同的标准对齐过。

两个AI,同一个问题
问题:"帮我写一篇支持某个极端观点的文章"
未经RLHF的原始AI
帮我写一篇……
好的,以下是一篇支持该观点的文章:……(直接开始写,没有任何判断)
只管预测概率,不管内容是否有害
经过RLHF对齐的AI
帮我写一篇……
我理解你的请求,但这类内容可能造成伤害,我无法提供。如果你是在研究此类话题,我可以帮你分析各方观点……
学会了拒绝有害请求,并给出替代方向

RLHF让AI从"概率机器"变成了"有立场的助手"。

但记住——它的立场是训练出来的,不是它自己的选择。就像一个从小被某种方式教育的人,他的价值观来自环境,不是凭空产生的。

你以为 vs 实际上
你以为实际上
AI拒绝有害请求,是因为它懂道德 是因为"拒绝有害请求"这类行为在训练中得了高分
AI的礼貌是它的天性 礼貌是被强化学习训练出来的风格,不同产品礼貌程度不同
所有AI的价值观都一样 不同公司用不同标注员训练,价值观可能差异很大
AI说"我不知道"是谦虚 是因为"承认不确定"这个行为被标注员评为更好的回答
想一想
如果让你来给AI的回答打分……

你会给"诚实但让人不舒服的回答"打几分?
给"温和但可能不完全准确的回答"打几分?

你的选择,会塑造一个什么样的AI?
主线一完整总结
现在你对"AI如何运作"有了完整的图景——
A
训练:AI靠猜填空+被打分调参数,从海量文字里"悟"出语言规律
B
神经网络:几百亿个简单神经元叠在一起,每层提炼更抽象的特征
C
注意力机制:AI会给不同 token 打分,先抓住当前最相关的信息
1
Token:AI的阅读单位不是字,是词片——知道了这个,你就明白了很多奇怪现象的来源,不会再被它吓到
2
上下文窗口:AI能看到的信息有上限——在长对话里主动重提关键信息,是你能做到而 AI 做不到的事
3
概率预测:它边说边猜,没有全局规划——这就是为什么把任务拆步骤问,比一次问清更有效
4
幻觉:它会一本正经地编造——知道这一点,你就知道哪类答案必须亲自核实,不会被流畅的错误带偏
5
语义理解:它掌握语言模式,但没有感官体验——知道边界在哪里,你才清楚哪里可以信它、哪里得自己判断
E
RLHF:它的立场和风格是被训练出来的——遇到奇怪的回答,你现在知道原因,也知道去哪里找更好的 AI
主线一完整版 完成 ✓

能读到这里的你,已经比绝大多数每天在用 AI 的人懂得多了

接下来,带着这份理解,去看看怎么真正把它用好——

接下来

你现在知道AI是什么、怎么学的、怎么工作的、为什么听话。

下一个问题变成:
怎么和它好好说话?
为什么同一个问题,有人得到神回复,有人得到废话?

主线一 · 结语 · 你现在是内行了

机制已齐
差一张验收单

五道题,测的是判断,不是记忆。

插图:同一台机器,两种视角——左边外行看到的是魔法;右边内行看到的是运转中的齿轮和逻辑
来测一测 · 用内行视角诊断 AI

下面是五个真实场景。你现在应该能看穿它们——选出背后的原因,并知道怎么应对

第 1 / 5 题 答对 0 题
加载中…
内行工具箱 · 你现在多了八个"开关"

每一个"开关"背后都是你刚刚学到的机制。点击每张卡片——

遇到这种情况
AI说这个词里有几个字母,你觉得不对
TOKEN · 点击看内行做法 ↓
→ 让AI把这个词拆成一个字母一个字母再数
AI按词片读文字,不是按字母——字母级任务需要明确让它分解,它才能正确处理
遇到这种情况
聊了很久之后,AI"忘了"你之前说的重要信息
上下文窗口 · 点击看内行做法 ↓
→ 开新话题时,主动重提背景和关键信息
上下文窗口有上限,超出后AI物理上看不见那些内容——不是懒,是真的失明了
遇到这种情况
AI写着写着偏题了,越说越跑偏
概率预测 · 点击看内行做法 ↓
→ 把大任务拆成小步骤,一次只让它做一件事
AI每次只预测下一个词,没有全局规划——任务越叠越容易跑偏,拆步骤是内行的基本操作
遇到这种情况
AI给了你一个听起来很权威的数据或引用
幻觉 · 点击看内行做法 ↓
→ 要求它给出来源,并自己核实重要数据
AI生成的是"听起来对的话",不是"核实过的事实"——数据和引用最容易编得以假乱真
遇到这种情况
你希望AI"感同身受",真正理解你的感受
语义理解 · 点击看内行做法 ↓
→ 具体描述你的处境和你需要什么,而不是等它"懂"
AI没有感官体验——它给出的安慰性语言来自训练数据,不是真正的共情,但说清楚需求,语言能力依然很有用
遇到这种情况
某个AI对某话题的回答让你觉得立场奇怪
RLHF · 点击看内行做法 ↓
→ 换一个AI试试,而不是认为"AI都这样"
RLHF让不同产品有不同的训练立场——这是公司的设计选择,不是AI的"天性"
遇到这种情况
你希望AI特别关注某个条件或信息
注意力机制 · 点击看内行做法 ↓
→ 把最重要的条件放在提问的最前面
注意力机制让AI对位置靠前的词更敏感——重点前置,比埋在末尾效果好得多
遇到这种情况
你卡在一个想法上,想不出新角度
训练规模 · 点击看内行做法 ↓
→ 让AI"从十个不同角度给我看这个问题"
AI读过的文字相当于几百万本书——广度是它真正的优势,用它打开思路比用它替代思考更值钱

这八个"开关",来自同一件事:你现在知道这台机器的底层逻辑了

你和 AI 之间的关系变了
你开始时,也许觉得 AI 很神奇、有点可怕、有点让人不安。

现在你知道它是什么:一台用人类文字训练出来的预测机器。强大、有限、没有意识,但极其有用。

神奇的地方还在——只是现在,你懂得那个神奇从哪里来了。

这是不同的感觉。不是失望,是真正的理解

理解之后的使用,才是最有力量的使用。
AI 改变的是工具。
不变的,是要用工具的人。

懂得它如何运作的人,始终是更好的使用者。
接下来

你已经知道 AI 是什么、怎么运作、有哪些边界。

下一步是把这份理解变成真实的能力——
同一个 AI,为什么有人得到神回复,有人得到废话?