学习路线

用六个阶段把 AI 学习从基本概念、机器学习、大模型应用到治理和基础设施串起来。

AI 学习路线

这条路线给普通读者用：先能听懂 AI 讨论里的高频词，再能判断一个工具、方案或观点到底靠不靠谱。它不是论文阅读顺序，而是一条“从常识坐标到应用判断”的阅读路径。

如果只想快速入门，可以按每个阶段的“先读”顺序走；如果已经知道某个词，可以直接跳到对应详情页复习边界和常见误解。

阶段 0：先建立词表坐标

从 AI 术语百科开始，先知道一个词大概属于哪一层：基础概念、机器学习、模型机制、大模型与提示、生成式与多模态、产品智能体、安全治理，还是基础设施。

这个阶段不用追公式。目标只有一个：看到一个词时，先知道它在整张地图上的位置，而不是把“模型”“产品”“公司宣传”和“未来愿景”混成一团。

推荐先问自己：

这个词是在讲能力、方法、产品，还是风险？
它是已经稳定的技术定义，还是仍在变化的实践说法？
它需要看详情页，还是先用卡片解释就够了？

阶段 1：分清 AI 的基本层级

进入 AI 基础概念，先理解最容易被混用的几个词：

AI：人工智能是大框，不等于某一个聊天产品。
AGI：通用人工智能是一个尚未达成、定义也有争议的目标。
ASI：超级智能更偏未来风险讨论，不能当成当前产品能力。
Generative AI：生成式 AI 解释为什么模型能生成文本、图像、音频和视频。

这一阶段要理解的问题：

AI、AGI、ASI 的能力范围分别是什么？
“生成式 AI 很强”和“已经接近 AGI”为什么不是同一句话？
哪些说法是事实定义，哪些只是愿景、预测或营销？

阶段 2：补上机器学习底座

进入机器学习基础，先把“模型为什么会学习、为什么会出错”讲清楚。推荐顺序是：

Machine Learning：理解机器学习如何从数据中学习规律。
Deep Learning：理解深度学习为什么适合处理复杂表示。
Neural Network：理解神经网络如何把输入变成输出。
Supervised Learning、Unsupervised Learning、Reinforcement Learning：分清“带答案学映射”“无标签找结构”和“靠奖励学策略”。
Training Data、Validation Data、Generalization ability：把数据质量、调参检查和新场景表现连起来看。

这一阶段不是为了把你训练成算法工程师，而是为了建立几个判断：训练数据会影响模型表现，评估集不能随便泄漏，泛化能力比“训练集上看起来很好”更重要。

这一阶段要理解的问题：

机器学习和深度学习是什么关系？
模型是真的“懂了”，还是学到了数据中的统计规律？
过拟合、欠拟合、泛化这些词为什么会影响真实使用？

阶段 3：看懂模型从输入到输出

进入模型与训练机制，把大模型背后的关键机制串起来。推荐顺序是：

Transformer：理解现代大语言模型常用的核心架构。
Token：理解模型看到的不是完整句子，而是被切分后的文本片段。
LLM：理解大语言模型如何基于上下文生成语言。
Inference：理解“训练好模型”和“实际调用模型回答问题”不是同一个阶段。

如果你想继续理解训练过程，可以再回到主题页里的参数、损失函数、梯度下降等卡片。普通读者不需要先推公式，但应该知道：模型不是手写规则库，它的能力来自数据、结构、目标函数和优化过程的共同作用；而你日常使用模型时看到的延迟、费用和稳定性，多半发生在推理阶段。

这一阶段要理解的问题：

Token 为什么会影响上下文长度、价格和回答质量？
Transformer 和 LLM 是什么关系？
训练和推理为什么要分开看？
“模型会说得很顺”为什么不等于“模型说的一定是真的”？

阶段 4：学会判断提示、检索和微调

进入大模型与提示工程，把“我该怎么让模型更好用”拆成三类问题。推荐顺序是：

Prompt Engineering：当任务、格式、限制和示例不清楚时，先改提示。
Embedding：当需要语义搜索和相似度匹配时，理解向量表示。
Vector Database：当语义向量变多后，理解系统如何存储、索引和查询这些向量。
RAG：当模型缺少最新资料、私有资料或可核查证据时，优先补检索。
Fine-Tuning：当你需要稳定改变风格、格式或特定任务表现时，再考虑微调。

这一阶段最实用，因为它直接影响你日常使用 AI 的质量。很多问题不是“模型不够聪明”，而是资料没给、任务没说清、验证机制没做，或者错误地把微调当成万能药。

这一阶段要理解的问题：

什么时候该改提示词，什么时候该补资料？
Embedding、向量数据库和 RAG 在一条检索链路里各自负责什么？
RAG 和微调解决的是不是同一种问题？
为什么重要事实仍然要回到来源，而不能只看模型回答是否流畅？

阶段 5：理解生成式、多模态和智能体入口

进入生成式与多模态和智能体、产品与公司，把模型能力和真实产品体验分开看。推荐顺序是：

Diffusion Models：理解很多图像生成模型为什么是“逐步去噪”。
Agent：理解智能体不是一个神秘人格，而是围绕目标调用工具、记忆和工作流的系统设计。

这一阶段会帮你区分三件事：底层模型能做什么，产品把能力包装成什么体验，以及自动化工作流到底有没有可靠的反馈和边界。

这一阶段要理解的问题：

文本模型、图像生成和多模态理解为什么不能简单混为一谈？
Agent 比普通聊天机器人多了什么，又多了哪些风险？
一个 AI 产品的体验好，是模型好、工具链好，还是流程设计好？

阶段 6：最后看治理、风险和基础设施

进入前沿、安全与治理和算力与基础设施。等你已经理解能力、应用和限制后，再看这些概念会更稳：

Hallucination：理解模型为什么会生成看似可信但错误的内容。
Alignment：理解“让模型按人的意图和价值行动”为什么不是一句口号。
Bias：理解偏差不只是“模型态度不好”，也可能来自数据、目标、评估和使用场景。
Foundation Model：理解基础模型为什么能支撑多个下游任务。
MoE：理解专家混合如何在算力、容量和路由之间做权衡。

这一阶段不是为了追热点，而是为了避免被热点带偏。治理、安全、算力和基础模型都很重要，但它们应该建立在前面几个阶段的概念之上。

这一阶段要理解的问题：

幻觉是偶发 bug，还是生成式模型需要被管理的结构性风险？
偏差来自模型本身、训练数据，还是部署场景？
对齐是在训练阶段、产品阶段，还是组织治理阶段发生？
基础模型、MoE、GPU、TPU 和算力叙事分别解决什么问题？

一条最短阅读路径

如果今天只想用 30 分钟建立主线，可以按这个顺序读：

AI
Machine Learning
Neural Network
Transformer
Token
LLM
Prompt Engineering
RAG
Fine-Tuning
Hallucination

读完这 10 个词，再回到各主题页补齐相邻概念，会比一开始就从 80 多个术语里硬啃更省力。

来源线索

这条学习路线主要整理站内已发布核心词条和资料来源清单。其中技术定义优先回到原始论文、大学课程、官方文档和研究机构资料；WaytoAGI 公开知识库与用户提供的名词表用于目录结构和选题线索，不作为单独事实依据。

WaytoAGI 公开知识库：通往 AGI 之路
站内来源汇总：资料来源清单

开始学习

面向普通人的 AI 学习入口，先建立路线，再进入术语、模型、应用和治理。

AI 术语百科

面向普通人的 AI 高频术语百科，用核心词条和分类卡片建立稳定坐标。

On this page

AI 学习路线

阶段 0：先建立词表坐标

阶段 1：分清 AI 的基本层级

阶段 2：补上机器学习底座

阶段 3：看懂模型从输入到输出

阶段 4：学会判断提示、检索和微调

阶段 5：理解生成式、多模态和智能体入口

阶段 6：最后看治理、风险和基础设施

一条最短阅读路径

AI知路AI 知识学习站