会议简介
在计算机视觉任务中,数据扩增是一种基于较少数据、产生大量训练样本,进而提升模型性能的有效方法。传统数据扩增方法主要借助于图像域的翻转、平移、旋转等简单变换。而本期讲者王语霖提出了一种隐式语义数据扩增算法,对样本进行更为「高级」的、「语义」层面的变换,例如改变物体的背景、颜色、视角等。
讲者介绍
王语霖,清华大学自动化系2019级直博生。导师为吴澄院士和黄高助理教授。此前于北京航空航天大学自动化学院获工学学士学位。研究兴趣为深度学习模型的高效训练和推理方法。在T-PAMI、NeurIPS、ICLR等国际一流期刊、会议上以第一作者发表学术论文。
会议题目
图像数据的隐式语义数据扩增
会议摘要
我们提出了一种隐式语义数据扩增算法:ISDA,具有如下几个突出特点:
(1)与传统数据扩增方法高度互补,有效地增进扩增多样性和进一步提升性能;
(2)巧妙地利用深度神经网络长于学习线性化表征的性质,在特征空间完成扩增过程,无需训练任何辅助生成模型(如GAN等),几乎不引入任何额外计算或时间开销;
(3)直接优化无穷扩增样本期望损失的一个上界,最终形式仅为一个全新的损失函数,简单易用,便于实现;
(4)可以广泛应用于全监督、半监督图像识别、语义分割等视觉任务,在ImageNet、Cityscapes等较大规模的数据集上效果比较明显。
论文标题:Regularizing Deep Networks with Semantic Data Augmentation
论文在线阅读:https://bbs.sffai.com/d/130
会议亮点
1、关注语义层面的数据扩增;
2、利用特征空间的性质,对深度特征进行数据扩增;
3、从期望损失的形式出发,向大家展示了数据扩增不一定是随机化的方法,亦可以体现为一个确定的形式,例如损失函数。
直播时间
2021年3月21日(周日)20:00-21:00 线上直播
关注微信公众号:人工智能前沿讲习,对话框回复“SFFAI99”,获取入群二维码
注:直播地址会分享在交流群内
SFFAI介绍
现代科学技术高度社会化,在科学理论与技术方法上更加趋向综合与统一,为了满足人工智能不同领域研究者相互交流、彼此启发的需求,我们发起了SFFAI这个公益活动。SFFAI每周举行一期线下活动,邀请一线科研人员分享、讨论人工智能各个领域的前沿思想和最新成果,使专注于各个细分领域的研究者开拓视野、触类旁通。
SFFAI目前主要关注机器学习、计算机视觉、自然语言处理等各个人工智能垂直领域及交叉领域的前沿进展,将对线下讨论的内容进行线上传播,使后来者少踩坑,也为讲者塑造个人影响力。SFFAI还在构建人工智能领域的知识森林—AI Knowledge Forest,通过汇总各位参与者贡献的领域知识,沉淀线下分享的前沿精华,使AI Knowledge Tree枝繁叶茂,为人工智能社区做出贡献,欢迎大家关注SFFAI论坛:https://bbs.sffai.com。