浪潮信息:新型自监督学习框架论文入选CVPR 2022
简介 北京2022年7月4日 /美通社/ -- 在近日举办的IEEE国际计算机与模式识别会议CVPR 2022期间,浪潮信息AI团队提交的论文《CoDo: Contrastive Learning with Downstream Background Invariance for Detection (CoDo:在自监督学习中引入下游数据的背景不变性)》成功入选。论文提出了一种新的自监督学习框架,在自监督学习的预训练过程兼顾下游数据的背景不变性,以提升自监督学习在下游目标检测任务的性能,并通过初步实验证明了方法的有效性。CVPR是计算机视觉领域三大世界顶级会议之一,今年线下注册参会人数达到了5641人。在论文方面,CVPR 2022共收到了8161篇投稿,最终接收了2064篇论文,接收率约为25.3%,论文研究方向涵盖目标检测、图像分割、医学影像、模型压缩、图像处理、文本检测等。&
<div id="dvContent" style="box-sizing: border-box; border: 0px; list-style: none; font-size: 16px; line-height: 1.8; color: #333333; font-family: 'Helvetica Neue', Helvetica, Tahoma, Arial, 'PingFang SC', 'Microsoft YaHei', SimHei, 'WenQuanYi Micro Hei', sans-serif; background-color: #ffffff;">
<p style="box-sizing: border-box; padding-bottom: 28px; border: 0px; list-style: none;"><span class="legendSpanClass" style="box-sizing: border-box; border: 0px; list-style: none;">北京</span><span class="legendSpanClass" style="box-sizing: border-box; border: 0px; list-style: none;">2022年7月4日</span> /美通社/ -- 在近日举办的IEEE国际计算机与模式识别会议CVPR 2022期间,浪潮信息AI团队提交的论文《CoDo: Contrastive Learning with Downstream Background Invariance for Detection (CoDo:在自监督学习中引入下游数据的背景不变性)》成功入选。论文提出了一种新的自监督学习框架,在自监督学习的预训练过程兼顾下游数据的背景不变性,以提升自监督学习在下游目标检测任务的性能,并通过初步实验证明了方法的有效性。CVPR是计算机视觉领域三大世界顶级会议之一,今年线下注册参会人数达到了5641人。在论文方面,CVPR 2022共收到了8161篇投稿,最终接收了2064篇论文,接收率约为25.3%,论文研究方向涵盖目标检测、图像分割、医学影像、模型压缩、图像处理、文本检测等。</p>
<p style="box-sizing: border-box; padding-bottom: 28px; border: 0px; list-style: none;">自监督学习可以对海量数据进行自主学习,无需像监督学习那样进行复杂的数据标注,有望改变自动驾驶等数据生成量巨大、标注成本高昂行业的工作模式,因此被认为是计算机视觉领域中有望带来突破的重点方向。目前,虽然基于对比学习的自监督学习方法在图像分类任务上取得了与监督型学习相近甚至更优的性能,但是将其应用于下游任务如目标检测时,常常会出现明显的性能差距。</p>
<p style="box-sizing: border-box; padding-bottom: 28px; border: 0px; list-style: none;">浪潮信息AI团队提出的自监督学习框架CoDo,在预训练中引入上下游任务数据集充当背景,预训练图像的推荐框粘贴到背景图像上,边框经过比例变换及扰动后,作为增强样本参与对比学习。由于背景为上下游数据集,模型实际上获得了前景目标的背景不变性能力。这意味着无论背景如何变化,模型都能够准确定位前景目标,这对于目标检测类人工智能任务尤为重要。</p>
<div id="DivAssetPlaceHolder9385" class="PRN_ImbeddedAssetReference" style="box-sizing: border-box; border: 0px; list-style: none;">
<p style="box-sizing: border-box; padding-bottom: 28px; border: 0px; list-style: none; text-align: center; width: 1140px;"><a style="box-sizing: border-box; background-color: transparent; color: #00837e; overflow-wrap: break-word; word-break: break-all;" href="https://mma.prnasia.com/media2/1852830/image_5011443_37389786.jpg?p=publish" target="_blank" rel="nofollow noopener" data-fancybox="gallery" data-caption="CoDo模型架构图" data-mma="https://mma.prnasia.com/media2/1852830/image_5011443_37389786.html"><img style="box-sizing: border-box; border-style: none; vertical-align: middle;" title="CoDo模型架构图" src="https://mma.prnasia.com/media2/1852830/image_5011443_37389786.jpg?p=medium600" alt="CoDo模型架构图" /></a><br style="box-sizing: border-box;" /><span style="box-sizing: border-box; border: 0px; list-style: none;">CoDo模型架构图</span></p>
</div>
<p style="box-sizing: border-box; padding-bottom: 28px; border: 0px; list-style: none;">论文采用CPJ数据增强方法、目标检测结构对齐及层次对比学习构建,并通过初步实验证明了方法的有效性。在实验中,研究团队使用浪潮AI服务器NF5488A5作为模型训练平台,使用COCO数据集以R50-FPN作为backbone的Mask R-CNN的目标检测与语义分割性能进行分析。结果显示,在1×schedule设置下,CoDo的检测性能相比于基线模型MoCo-v2提升了0.8 AP,在2×schedule设置下,CoDo的检测性能相比于基线模型MoCo-v2提升了0.9AP,而多视角版本的CoDom最终取得了43.1 AP的优异性能。</p>
<p class="prntac" style="box-sizing: border-box; padding-bottom: 28px; border: 0px; list-style: none; text-align: center;">Mask R-CNN(R50-FPN)在COCO数据集的的下游任务性能</p>
<div id="DivAssetPlaceHolder7151" class="PRN_ImbeddedAssetReference" style="box-sizing: border-box; border: 0px; list-style: none;">
<p style="box-sizing: border-box; padding-bottom: 28px; border: 0px; list-style: none; text-align: center; width: 1140px;"><a style="box-sizing: border-box; background-color: transparent; color: #00837e; overflow-wrap: break-word; word-break: break-all;" href="https://mma.prnasia.com/media2/1852831/image_5011443_37389849.jpg?p=publish" target="_blank" rel="nofollow noopener" data-fancybox="gallery" data-caption="" data-mma="https://mma.prnasia.com/media2/1852831/image_5011443_37389849.html"><img style="box-sizing: border-box; border-style: none; vertical-align: middle;" title="" src="https://mma.prnasia.com/media2/1852831/image_5011443_37389849.jpg?p=medium600" alt="" /></a></p>
</div>
<p style="box-sizing: border-box; padding-bottom: 28px; border: 0px; list-style: none;">此外,研究团队评估了CoDo中Query Network和Key Network的背景数据集的选择策略。实验发现,相比于两路引入不同数据集,引入相同数据集性能更优,同时引入数据集的多样性也对下游任务的性能有贡献。</p>
<p style="box-sizing: border-box; padding-bottom: 28px; border: 0px; list-style: none;">该论文已被CVPR 2022 L3D-IVU Workshop接收,本届L3D-IVU Workshop的主题为利用有限标签数据实现图像及视频的学习理解。如想进一步了解这篇论文,请点击链接<a style="box-sizing: border-box; background-color: transparent; color: #00837e; overflow-wrap: break-word; word-break: break-all;" href="https://t.prnasia.com/t/555AsXxh" target="_blank" rel="nofollow noopener">http://arxiv.org/abs/2205.04617</a>下载全文。</p>
<div id="DivAssetPlaceHolder0" class="PRN_ImbeddedAssetReference" style="box-sizing: border-box; border: 0px; list-style: none;"></div>
</div>
<div id="dvExtra" style="box-sizing: border-box; border: 0px; list-style: none; font-size: 16px; line-height: 1.8; color: #333333; font-family: 'Helvetica Neue', Helvetica, Tahoma, Arial, 'PingFang SC', 'Microsoft YaHei', SimHei, 'WenQuanYi Micro Hei', sans-serif; background-color: #ffffff;"></div>
<div id="dvSource" class="dvPt" style="box-sizing: border-box; padding-bottom: 28px; border: 0px; list-style: none; font-size: 16px; color: #333333; font-family: 'Helvetica Neue', Helvetica, Tahoma, Arial, 'PingFang SC', 'Microsoft YaHei', SimHei, 'WenQuanYi Micro Hei', sans-serif; background-color: #ffffff;">消息来源:浪潮信息</div>&&
分享到:
转载:
https://www.prnasia.com/story/367292-1.shtml
喜欢 0
收藏
暂无评论信息
- 相关文章
- 文章推荐
-
娱美德旗下MMORPG手游《传奇4》将推出新PVP玩法"比奇掠夺"&
《传奇4》推出新门派PVP玩法!韩国首尔2022年6月29日 /美通社/ -- 《传奇4》(MIR4)的新PVP玩法比奇掠夺(Bicheon Heist)于2022年6月28日推出。
-
亚马逊推出“无需收银员”的新技术,以此帮助品牌和广告商提高销量
北京时间 6 月 30 日早间消息,据报道,亚马逊发明了一种无需收银员的技术,可以加快人们去杂货店或便利店的速度。现在,该公司希望利用这个跟踪系统来帮助品牌和广告商提高销量。&
-
眼镜试戴的装饰效果
开发眼镜类产品的时候需要使用试戴的功能,这里就有你需要的学习资料哦!
-
git:如何管理本机的多个ssh密钥(多个远程仓库账号)
如果我们电脑上已经存在了一个ssh key,那么我们需要在我们电脑上生成第二个你想在本电脑上使用的id_rsa,使用命令:ssh-keygen -t rsa -C "你的github账号"。
- 点击排行
- 站长推荐
- 猜你喜欢
- 网站信息
- 站内问答:12篇
- 站内文章:212篇
- 建站时间:已运行1107天
- 备案号: 浙ICP备2022018799号
- 语言:
English(USA)
French(FR)
Chinese(ZH)
无数据