概念 | 定义 | 原因 |
---|---|---|
过拟合 | 模型在训练数据上表现很好,但在新数据上表现不佳,即泛化能力差。 | 1. 模型过于复杂,学习到了训练数据中的噪声和细节。 2. 训练数据量不足。 3. 训练时间过长,导致模型对训练数据过度敏感。 |
欠拟合 | 模型在训练数据上表现不佳,即模型过于简单,无法捕捉数据的基本结构。 | 1. 模型过于简单,无法捕捉数据中的复杂关系。 2. 训练数据量不足,导致模型无法学习到足够的特征。 3. 训练时间过短,模型未能充分学习数据特征。 |
过拟合和欠拟合都会导致模型的泛化能力下降,即模型在未见过的数据上的表现不佳。理想的模型应该在训练数据上表现良好,同时在新数据上也能保持较好的表现,这被称为“良好拟合”或“恰当拟合”。