欠拟合(Underfitting)

欠拟合指模型太简单、训练不足或特征不足,连训练数据中的基本规律也没有学好。

欠拟合(Underfitting)

欠拟合是模型没有学到数据中的基本规律。它是什么?一句话说,欠拟合就是模型太简单、训练不够或特征不够,连训练集上的题都做不好。

欠拟合示意图

图片说明:原创图示,展示过于简单的模型曲线无法捕捉数据里的明显趋势。

它解决什么问题

欠拟合提醒你:模型表现差不一定是“泛化很严格”,也可能是根本没学会。常见原因包括:

  • 模型容量太小,表达不了数据里的规律。
  • 训练时间太短或优化设置不合适。
  • 特征太弱,关键信息没有进入模型。
  • 正则化太强,把模型限制得过死。

和相邻概念的边界

概念表现边界
欠拟合训练和验证都差模型连基础规律都没学到。
过拟合训练好、验证差模型学得太贴训练集。
正则化控制复杂度太强可能造成欠拟合。
泛化能力新数据表现欠拟合不是好泛化,而是整体能力不足。

边界要说清:欠拟合不是“很稳健”,而是模型能力或训练过程不够。 如果训练集都做不好,新数据通常也不会突然变好。

常见误解

误解 1:验证集和训练集差距小就是好事

不一定。如果两边都很差,那不是泛化好,而是欠拟合。

误解 2:欠拟合只要加数据就能解决

不一定。如果模型太简单或特征缺失,加同类数据也可能仍然学不会。

误解 3:越强的正则化越安全

不对。正则化过强会压制模型学习能力,导致欠拟合。

继续阅读链接

参考来源