第一步:先分清机器学习这个总框
把机器学习理解成“从数据中学规律”,再区分它和传统规则系统、深度学习、大模型。
机器学习的起点很简单:系统不是由人把所有规则写死,而是从样本里学习规律。
比如垃圾邮件识别。传统规则系统可能会写:“包含某些词就判垃圾”。机器学习系统会看大量已标注邮件,自己学出哪些特征组合更像垃圾邮件。它不一定知道“为什么人类讨厌这封邮件”,但它能从数据里学到判断模式。
先分清 4 个概念
| 概念 | 先怎么理解 |
|---|---|
| AI | 人工智能的大范围,包含识别、预测、生成、规划等能力 |
| 机器学习 | AI 里靠数据学习规律的一类方法 |
| 深度学习 | 机器学习里使用多层神经网络的一条主线 |
| 大模型 | 深度学习规模化之后的一类模型形态,常见于语言和多模态任务 |
所以,不要把机器学习等同于所有 AI,也不要把大模型等同于机器学习全部。
机器学习和规则系统的区别
规则系统靠人写逻辑:如果 A 且 B,就执行 C。优点是可解释、可控;缺点是遇到复杂变化时很难穷举规则。
机器学习靠数据学模式。优点是能处理图像、语音、文本、推荐这类复杂输入;缺点是它学到的规律可能偏、可能过拟合,也不一定容易解释。
一个现实判断:
- 规则清楚、变化少,用规则系统可能更稳;
- 规律复杂、样本很多、边界模糊,机器学习更有价值;
- 高风险场景通常需要两者结合,不能只信模型。
机器学习真正关心什么
它不只是“训练一个模型”。完整链路至少包括:
- 收集数据;
- 定义标签或反馈;
- 选择模型;
- 训练;
- 用验证集测试;
- 上线后监控;
- 数据变化后重新评估。
这也是为什么很多 AI 项目不是败在算法,而是败在数据、标签、评估和部署。
这一页要建立的直觉
判断一个系统是不是机器学习,不要看它名字里有没有 AI。看它是否主要靠样本学习规律,并把这种规律用于新输入。
下一步读:为什么深度学习成为主线。