第一步:先分清机器学习这个总框

把机器学习理解成“从数据中学规律”,再区分它和传统规则系统、深度学习、大模型。

机器学习的起点很简单:系统不是由人把所有规则写死,而是从样本里学习规律。

比如垃圾邮件识别。传统规则系统可能会写:“包含某些词就判垃圾”。机器学习系统会看大量已标注邮件,自己学出哪些特征组合更像垃圾邮件。它不一定知道“为什么人类讨厌这封邮件”,但它能从数据里学到判断模式。

先分清 4 个概念

概念先怎么理解
AI人工智能的大范围,包含识别、预测、生成、规划等能力
机器学习AI 里靠数据学习规律的一类方法
深度学习机器学习里使用多层神经网络的一条主线
大模型深度学习规模化之后的一类模型形态,常见于语言和多模态任务

所以,不要把机器学习等同于所有 AI,也不要把大模型等同于机器学习全部。

机器学习和规则系统的区别

规则系统靠人写逻辑:如果 A 且 B,就执行 C。优点是可解释、可控;缺点是遇到复杂变化时很难穷举规则。

机器学习靠数据学模式。优点是能处理图像、语音、文本、推荐这类复杂输入;缺点是它学到的规律可能偏、可能过拟合,也不一定容易解释。

一个现实判断:

  • 规则清楚、变化少,用规则系统可能更稳;
  • 规律复杂、样本很多、边界模糊,机器学习更有价值;
  • 高风险场景通常需要两者结合,不能只信模型。

机器学习真正关心什么

它不只是“训练一个模型”。完整链路至少包括:

  1. 收集数据;
  2. 定义标签或反馈;
  3. 选择模型;
  4. 训练;
  5. 用验证集测试;
  6. 上线后监控;
  7. 数据变化后重新评估。

这也是为什么很多 AI 项目不是败在算法,而是败在数据、标签、评估和部署。

这一页要建立的直觉

判断一个系统是不是机器学习,不要看它名字里有没有 AI。看它是否主要靠样本学习规律,并把这种规律用于新输入。

下一步读:为什么深度学习成为主线