- 误差分析
- 我们可以手动查看分类错误的子集样本(通常为100个),并统计他们的错误类型
- 在所有错误类型中,选择一种或几种最常见的错误,进行改进。这可以最高效的改进你的模型
- 误差分析的一个限制是:它只能很好的解决人类擅长的问题
- 添加数据
- 添加数据有三种常见方法:直接添加全新的数据,数据增强,数据合成
- 添加所有类型的全新数据可能又贵又慢,因此添加有针对性的全新数据可以更低成本的改进模型
- 在图像和音频领域,数据增强是一种显著增加数据集的方法。
- 数据增强:通过旋转、缩小、方法、增加对比度、镜像变换等改变已有的训练样本,来获得一个全新的训练样本
- 数据增强的高级变换例子:在图片上加一个网格,并随机扭曲网格,从而获得一个更丰富的数据集
- 数据增强,是在数据中制造更多的噪音,同时最后的结果应当与测试集接近
- 数据合成:通常用于计算机视觉领域。上图的例子是使用电脑上的字体,通过不同的对比度,颜色,字体进行截图得到。
- AI包括代码(算法或模型)+ 数据,通常我们是以模型为中心来改进我们的系统,但也可以以数据为中心来改进我们的系统