第一步：先分清机器学习这个总框

把机器学习理解成“从数据中学规律”，再区分它和传统规则系统、深度学习、大模型。

机器学习的起点很简单：系统不是由人把所有规则写死，而是从样本里学习规律。

比如垃圾邮件识别。传统规则系统可能会写：“包含某些词就判垃圾”。机器学习系统会看大量已标注邮件，自己学出哪些特征组合更像垃圾邮件。它不一定知道“为什么人类讨厌这封邮件”，但它能从数据里学到判断模式。

先分清 4 个概念

概念	先怎么理解
AI	人工智能的大范围，包含识别、预测、生成、规划等能力
机器学习	AI 里靠数据学习规律的一类方法
深度学习	机器学习里使用多层神经网络的一条主线
大模型	深度学习规模化之后的一类模型形态，常见于语言和多模态任务

所以，不要把机器学习等同于所有 AI，也不要把大模型等同于机器学习全部。

机器学习和规则系统的区别

规则系统靠人写逻辑：如果 A 且 B，就执行 C。优点是可解释、可控；缺点是遇到复杂变化时很难穷举规则。

机器学习靠数据学模式。优点是能处理图像、语音、文本、推荐这类复杂输入；缺点是它学到的规律可能偏、可能过拟合，也不一定容易解释。

一个现实判断：

规则清楚、变化少，用规则系统可能更稳；
规律复杂、样本很多、边界模糊，机器学习更有价值；
高风险场景通常需要两者结合，不能只信模型。

机器学习真正关心什么

它不只是“训练一个模型”。完整链路至少包括：

收集数据；
定义标签或反馈；
选择模型；
训练；
用验证集测试；
上线后监控；
数据变化后重新评估。

这也是为什么很多 AI 项目不是败在算法，而是败在数据、标签、评估和部署。

这一页要建立的直觉

判断一个系统是不是机器学习，不要看它名字里有没有 AI。看它是否主要靠样本学习规律，并把这种规律用于新输入。

下一步读：为什么深度学习成为主线。

建议按这 5 步读

用五步路线建立机器学习基础地图：总框、深度学习、学习方式、泛化、过拟合。

第二步：为什么深度学习成为主线

深度学习让模型从原始数据中学习表示，推动了视觉、语音、语言和多模态模型的发展。

On this page

先分清 4 个概念

机器学习和规则系统的区别

机器学习真正关心什么

这一页要建立的直觉