过拟合和欠拟合¶

过拟合(overfitting)和欠拟合(underfitting)都是分类训练过程中经常遇到的现象，理清它们之间的区别和含义，有助于得到更好的分类器

过拟合¶

参考：

机器学习中用来防止过拟合的方法有哪些？

过拟合(over fitting)现象常出现在分类器训练过程中，指的是分类器对训练集数据能够得到很好的结果，但是在测试集（或者其他数据）上不能够很好的分类，分类器泛化能力差

出现原因：

训练集数据不够大
训练集数据存在噪音
模型过于复杂导致不仅能够拟合数据还能够拟合噪音

解决方法：

给予足够多的数据
提高训练集质量
选用合适的模型，限制模型的拟合能力

针对卷积神经网络，限制网络复杂度的方法包括

减少网络层数
减小神经元个数
激活函数

欠拟合¶

参考：欠拟合

欠拟合(under fitting)指分类器在训练集上不能够得到很好的检测效果，同样在测试集上也不能够得到很好的检测效果，分类器泛化能力差

欠拟合的原因是由于分类模型没有很好的捕捉到数据特征，真实数据离拟合曲线较远

解决方法：

增加新特征
减少参数正则化
使用非线性模型
集成多个学习模型

针对卷积神经网络，提高网络复杂度的方法包括

扩展网络层数
扩大神经元个数
减少激活函数
使用稀疏网络结构
集成多个网络模型
随机激活权值

Read the Docs v: stable

Versions: latest; stable

Downloads

On Read the Docs: Project Home; Builds

Free document hosting provided by Read the Docs.