数据增强文献综述

授权转载自知乎专栏:计算机视觉 paper daily

1.

数据增强_geometric versus photometric transformations_image data augmentation techniques 数据增强_geometric versus photometric transformations_image data augmentation techniques

2. Image Data

2.1 Data based on basic image

geometric versus photometric transformations_数据增强_image data augmentation techniques

随机裁剪效果最好。

2.2

数据增强_geometric versus photometric transformations_image data augmentation techniques

还有非线性的mixup裁剪如下:

geometric versus photometric transformations_数据增强_image data augmentation techniques

以及随机裁剪的图像混合:

数据增强_image data augmentation techniques_geometric versus photometric transformations

这些混合方式是十分反人类直觉的,因此可解释性不强。只能说是可能增强了对底层低级特征如线条边缘等的鲁棒性。其实有点没有抓住关键点。

image data augmentation techniques_geometric versus photometric transformations_数据增强

2.3 Data based on Deep

不觉得这个效果会普遍很好,应该来说是针对特定域会有效(如白天黑夜),实际效果应该有限。

image data augmentation techniques_数据增强_geometric versus photometric transformations

3. for image Data

3.1 Test-time

许多都论文指出在检测阶段进行同等的数据增强能够获得较好的效果。归结可以认为是训练检测阶段的一致性。当然,这种手段时间成本太高,只在如医学影像等追求精度的关键领域可以使用。

3.2

团队早年在ICML提出的观点,确实合理,一开始就进行大量的增强容易导致网络不收敛。

3.3

3.4 Final size

数据增强的形式可以分为在线和离线增强。前者是在加载数据时增强,可能造成额外的内存消耗(现在都是数据容量不变的随机增强)。

此外作者提到了一个比较有意思的点:当前数据集尤其是进行增广后是十分庞大的,明显能够在一定程度上缩小数据集但是保持性能下降不多的子集效率会高得多。

3.5 class with Data

这也是值得借鉴的一点。通过增强在一定程度上解决类别不平衡问题。但增强需要仔细设计,否则会面对已经学习较好的类别或者场景造成过拟合等问题。

论文解读论文合集:

-完-

© 版权声明

相关文章

暂无评论

none
暂无评论...