欠拟合（Underfitting）

欠拟合指模型太简单、训练不足或特征不足，连训练数据中的基本规律也没有学好。

欠拟合（Underfitting）

欠拟合是模型没有学到数据中的基本规律。它是什么？一句话说，欠拟合就是模型太简单、训练不够或特征不够，连训练集上的题都做不好。

欠拟合示意图

图片说明：原创图示，展示过于简单的模型曲线无法捕捉数据里的明显趋势。

它解决什么问题

欠拟合提醒你：模型表现差不一定是“泛化很严格”，也可能是根本没学会。常见原因包括：

模型容量太小，表达不了数据里的规律。
训练时间太短或优化设置不合适。
特征太弱，关键信息没有进入模型。
正则化太强，把模型限制得过死。

和相邻概念的边界

概念	表现	边界
欠拟合	训练和验证都差	模型连基础规律都没学到。
过拟合	训练好、验证差	模型学得太贴训练集。
正则化	控制复杂度	太强可能造成欠拟合。
泛化能力	新数据表现	欠拟合不是好泛化，而是整体能力不足。

边界要说清：欠拟合不是“很稳健”，而是模型能力或训练过程不够。 如果训练集都做不好，新数据通常也不会突然变好。

常见误解

误解 1：验证集和训练集差距小就是好事

不一定。如果两边都很差，那不是泛化好，而是欠拟合。

误解 2：欠拟合只要加数据就能解决

不一定。如果模型太简单或特征缺失，加同类数据也可能仍然学不会。

误解 3：越强的正则化越安全

不对。正则化过强会压制模型学习能力，导致欠拟合。

继续阅读链接

过拟合（Overfitting）：理解另一种常见失败模式。
正则化（Regularization）：理解约束太强为什么会出问题。
训练数据（Training Data）：理解特征和样本覆盖。
泛化能力（Generalization ability）：理解最终评估目标。

参考来源

过拟合（Overfitting）

过拟合指模型在训练数据上表现很好，但对新数据泛化很差，常见原因是记住了噪声或偶然模式。

正则化（Regularization）

正则化是在训练中加入约束或惩罚，减少模型过度贴合训练数据、提升泛化能力的方法集合。

On this page

欠拟合（Underfitting）

它解决什么问题

和相邻概念的边界

误解 1：验证集和训练集差距小就是好事

误解 2：欠拟合只要加数据就能解决

误解 3：越强的正则化越安全

继续阅读链接