继续阅读顺序

按机器学习、深度学习、学习方式、训练数据、泛化和过拟合的顺序补齐基础地图。

机器学习这一章不要按术语热度读。先从“机器学习是什么”开始,再看深度学习为什么成为主线,最后再看泛化和过拟合这些判断模型质量的概念。

1. 先看总框

读:机器学习(Machine Learning)先分清机器学习这个总框

你要先分清:机器学习不是所有 AI,也不是某一个算法。它是一类从数据中学习规律的方法。

读完要能回答:

  • 它和手写规则有什么区别?
  • 它为什么依赖数据?
  • 它为什么会受训练样本影响?

2. 再看深度学习

读:深度学习(Deep Learning)为什么深度学习成为主线

深度学习是机器学习里最强势的一条路线,尤其适合图像、语音、文本和多模态这类复杂数据。

读完要能分清:

  • 机器学习是总类;
  • 深度学习是其中一条路线;
  • 大模型是深度学习规模化后的重要形态之一。

3. 再看三种学习方式

读:监督学习无监督学习强化学习三种学习方式怎么区分

这里的重点不是背定义,而是看反馈来源:有标准答案、没有标准答案,还是根据奖励调整策略。

4. 再看数据和泛化

读:训练数据验证集泛化能力别只看训练分数

这一步决定你会不会被漂亮 demo 骗。模型在训练集上好看,不代表在真实场景里可靠。

5. 最后看过拟合、欠拟合和正则化

读:过拟合欠拟合正则化

这组词解释了为什么模型会“学太死”或“学不会”,以及工程上怎样让模型更稳。

学完这一章你该得到什么

你不需要记住所有算法名。你应该能判断:一个 AI 系统的问题,可能出在数据、标签、模型容量、训练方式、验证方式,还是上线后的真实分布变化。