学习路线

用六个阶段把 AI 学习从基本概念、机器学习、大模型应用到治理和基础设施串起来。

AI 学习路线

这条路线给普通读者用:先能听懂 AI 讨论里的高频词,再能判断一个工具、方案或观点到底靠不靠谱。它不是论文阅读顺序,而是一条“从常识坐标到应用判断”的阅读路径。

如果只想快速入门,可以按每个阶段的“先读”顺序走;如果已经知道某个词,可以直接跳到对应详情页复习边界和常见误解。

阶段 0:先建立词表坐标

AI 术语百科 开始,先知道一个词大概属于哪一层:基础概念、机器学习、模型机制、大模型与提示、生成式与多模态、产品智能体、安全治理,还是基础设施。

这个阶段不用追公式。目标只有一个:看到一个词时,先知道它在整张地图上的位置,而不是把“模型”“产品”“公司宣传”和“未来愿景”混成一团。

推荐先问自己:

  • 这个词是在讲能力、方法、产品,还是风险?
  • 它是已经稳定的技术定义,还是仍在变化的实践说法?
  • 它需要看详情页,还是先用卡片解释就够了?

阶段 1:分清 AI 的基本层级

进入 AI 基础概念,先理解最容易被混用的几个词:

  1. AI:人工智能是大框,不等于某一个聊天产品。
  2. AGI:通用人工智能是一个尚未达成、定义也有争议的目标。
  3. ASI:超级智能更偏未来风险讨论,不能当成当前产品能力。
  4. Generative AI:生成式 AI 解释为什么模型能生成文本、图像、音频和视频。

这一阶段要理解的问题:

  • AI、AGI、ASI 的能力范围分别是什么?
  • “生成式 AI 很强”和“已经接近 AGI”为什么不是同一句话?
  • 哪些说法是事实定义,哪些只是愿景、预测或营销?

阶段 2:补上机器学习底座

进入 机器学习基础,先把“模型为什么会学习、为什么会出错”讲清楚。推荐顺序是:

  1. Machine Learning:理解机器学习如何从数据中学习规律。
  2. Deep Learning:理解深度学习为什么适合处理复杂表示。
  3. Neural Network:理解神经网络如何把输入变成输出。
  4. Supervised LearningUnsupervised LearningReinforcement Learning:分清“带答案学映射”“无标签找结构”和“靠奖励学策略”。
  5. Training DataValidation DataGeneralization ability:把数据质量、调参检查和新场景表现连起来看。

这一阶段不是为了把你训练成算法工程师,而是为了建立几个判断:训练数据会影响模型表现,评估集不能随便泄漏,泛化能力比“训练集上看起来很好”更重要。

这一阶段要理解的问题:

  • 机器学习和深度学习是什么关系?
  • 模型是真的“懂了”,还是学到了数据中的统计规律?
  • 过拟合、欠拟合、泛化这些词为什么会影响真实使用?

阶段 3:看懂模型从输入到输出

进入 模型与训练机制,把大模型背后的关键机制串起来。推荐顺序是:

  1. Transformer:理解现代大语言模型常用的核心架构。
  2. Token:理解模型看到的不是完整句子,而是被切分后的文本片段。
  3. LLM:理解大语言模型如何基于上下文生成语言。
  4. Inference:理解“训练好模型”和“实际调用模型回答问题”不是同一个阶段。

如果你想继续理解训练过程,可以再回到主题页里的参数、损失函数、梯度下降等卡片。普通读者不需要先推公式,但应该知道:模型不是手写规则库,它的能力来自数据、结构、目标函数和优化过程的共同作用;而你日常使用模型时看到的延迟、费用和稳定性,多半发生在推理阶段。

这一阶段要理解的问题:

  • Token 为什么会影响上下文长度、价格和回答质量?
  • Transformer 和 LLM 是什么关系?
  • 训练和推理为什么要分开看?
  • “模型会说得很顺”为什么不等于“模型说的一定是真的”?

阶段 4:学会判断提示、检索和微调

进入 大模型与提示工程,把“我该怎么让模型更好用”拆成三类问题。推荐顺序是:

  1. Prompt Engineering:当任务、格式、限制和示例不清楚时,先改提示。
  2. Embedding:当需要语义搜索和相似度匹配时,理解向量表示。
  3. Vector Database:当语义向量变多后,理解系统如何存储、索引和查询这些向量。
  4. RAG:当模型缺少最新资料、私有资料或可核查证据时,优先补检索。
  5. Fine-Tuning:当你需要稳定改变风格、格式或特定任务表现时,再考虑微调。

这一阶段最实用,因为它直接影响你日常使用 AI 的质量。很多问题不是“模型不够聪明”,而是资料没给、任务没说清、验证机制没做,或者错误地把微调当成万能药。

这一阶段要理解的问题:

  • 什么时候该改提示词,什么时候该补资料?
  • Embedding、向量数据库和 RAG 在一条检索链路里各自负责什么?
  • RAG 和微调解决的是不是同一种问题?
  • 为什么重要事实仍然要回到来源,而不能只看模型回答是否流畅?

阶段 5:理解生成式、多模态和智能体入口

进入 生成式与多模态智能体、产品与公司,把模型能力和真实产品体验分开看。推荐顺序是:

  1. Diffusion Models:理解很多图像生成模型为什么是“逐步去噪”。
  2. Agent:理解智能体不是一个神秘人格,而是围绕目标调用工具、记忆和工作流的系统设计。

这一阶段会帮你区分三件事:底层模型能做什么,产品把能力包装成什么体验,以及自动化工作流到底有没有可靠的反馈和边界。

这一阶段要理解的问题:

  • 文本模型、图像生成和多模态理解为什么不能简单混为一谈?
  • Agent 比普通聊天机器人多了什么,又多了哪些风险?
  • 一个 AI 产品的体验好,是模型好、工具链好,还是流程设计好?

阶段 6:最后看治理、风险和基础设施

进入 前沿、安全与治理算力与基础设施。等你已经理解能力、应用和限制后,再看这些概念会更稳:

  1. Hallucination:理解模型为什么会生成看似可信但错误的内容。
  2. Alignment:理解“让模型按人的意图和价值行动”为什么不是一句口号。
  3. Bias:理解偏差不只是“模型态度不好”,也可能来自数据、目标、评估和使用场景。
  4. Foundation Model:理解基础模型为什么能支撑多个下游任务。
  5. MoE:理解专家混合如何在算力、容量和路由之间做权衡。

这一阶段不是为了追热点,而是为了避免被热点带偏。治理、安全、算力和基础模型都很重要,但它们应该建立在前面几个阶段的概念之上。

这一阶段要理解的问题:

  • 幻觉是偶发 bug,还是生成式模型需要被管理的结构性风险?
  • 偏差来自模型本身、训练数据,还是部署场景?
  • 对齐是在训练阶段、产品阶段,还是组织治理阶段发生?
  • 基础模型、MoE、GPU、TPU 和算力叙事分别解决什么问题?

一条最短阅读路径

如果今天只想用 30 分钟建立主线,可以按这个顺序读:

  1. AI
  2. Machine Learning
  3. Neural Network
  4. Transformer
  5. Token
  6. LLM
  7. Prompt Engineering
  8. RAG
  9. Fine-Tuning
  10. Hallucination

读完这 10 个词,再回到各主题页补齐相邻概念,会比一开始就从 80 多个术语里硬啃更省力。

来源线索

这条学习路线主要整理站内已发布核心词条和 资料来源清单。其中技术定义优先回到原始论文、大学课程、官方文档和研究机构资料;WaytoAGI 公开知识库与用户提供的名词表用于目录结构和选题线索,不作为单独事实依据。