凤凰国际_凤凰国际技术解读:腾讯优图12篇论文入选 ICCV 2017

中国围棋网2017年10月20日 09时10分22秒
62

原标题:业界 | 技术解读:腾讯优图12篇论文入选 ICCV 2017

机器之心发布

来源:腾讯优图实验室

被誉为计算机视觉领域三大顶级会议之一的 ICCV(另外两个为 CVPR、ECCV)不久之前揭晓了收录论文名单,腾讯优图共有 12 篇论文入选,居业界实验室前列,其中 3 篇被选做口头报告(Oral),该类论文仅占总投稿数的 2.1%(45/2143)。


本届 ICCV 共收到 2143 篇论文投稿,其中 621 篇被选为大会论文,录用比例 29%。其中有 45 篇口头报告(Oral)和 56 篇亮点报告(Spotlight)。今年参会人数预计将超过 3000 人。



ICCV 作为计算机视觉领域最高级别的会议之一,其论文集代表了计算机视觉领域最新的发展方向和水平。此次腾讯优图入选的论文提出了诸多亮点:全球首个 AI 卸妆效果的算法;现今最准确的单张图像深度估计算法;完美解决多帧信息融合困难的多帧超分辨率视频结果;史无前例的手机双摄图像匹配和分割研究成果。这些论文呈现了有趣且可扩展应用的技术,让视觉 AI 成为了一个工业界和学术界的交叉热点。其中,腾讯优图的智能卸妆超分辨率、双摄融合、滤镜还原和智能图像缩放都是具有极大应用前景的技术。它们创造出新应用的同时也改进了现有算法,为后续的研究提供了更多的经验和指导。


下文对腾讯优图 12 篇入选论文进行解析:


1. Oral 论文:美化人像的盲复原


  • Makeup-Go: Blind Reversion of Portrait Edit


  • 本文与香港中文大学合作完成。目前市面上有很多关于人脸美化的应用,如腾讯天天 P 图等。由于这些应用的流行,网络上的人像很多与真人不符。本文提出一种图像盲复原的算法,用于将美化过的人像复原为真实的人像。为了简化问题,本文着重阐述如何解决全局美化操作的复原问题,例如肤色美白,去皱,磨皮等。由于这些操作是在图像的不同尺度上完成的,而我们又无法得到人脸美化应用中所使用的操作类型和参数,直接使用现有的模型并无法解决这个问题。我们提出了一种新的深度网络结构,成分回归网络,来对美化图像进行盲复原。即使在不知道美化系统具体参数的情况下,该网络结构亦能更好地将美化后的图像映射为原始图像。实验表明,该网络在不同尺度上均可以得到较高的还原度。


    本文入选 ICCV 2017 口头报告(Oral),该类论文仅占总投稿数的 2.1%。


    2. Oral 论文:细节还原深度视频超分辨率


  • Detail-revealing Deep Video Super-resolution


  • 本论文与香港中文大学、多伦多大学和 Adobe 合作完成。本论文关注解决视频超分辨率的问题,即利用视频中低分辨率的多帧信息,恢复出清晰而真实的高分辨率图像。传统的超分辨率算法处理速度慢,恢复效果严重依赖于繁琐的参数调整,因此难以实用。近期的基于深度学习的算法则由于运动估计不够准确,难以恢复足够丰富的真实细节。


    本文作者从原理和实验上发现并指出:正确的运动估计对于图像细节恢复至关重要,并基于此设计了亚像素运动补偿网络层 SPMC Layer。本文提出的适用于视频超分辨率的网络结构能够实现:单模型处理任意尺寸输入,任意倍率放大,任意多帧处理。同时,本文算法能够在取得丰富的真实细节情况下,达到很快的处理速度(百倍于同等效果的传统方法)。本文算法在效果、速度和实用性上均能超过现有其他算法。


    本文入选 ICCV 2017 口头报告(Oral),该类论文仅占总投稿数的 2.1%。


    3. Oral 论文:基于图的 RGBD 图像分割网络


  • 3D Graph Neural Networks for RGBD Semantic Segmentation


  • 本论文与香港中文大学、多伦多大学合作完成。本论文专注解决 RGBD 图像的语义分割问题。与比较常见的 RGB 图像分割问题相比,这个问题又有了深度的信息。深度信息能够表征物体的几何形状,并且能够更精确的描述像素件的几何链接。因此如何利用深度信息做到更精确的图像分割成为这个问题最核心的模块。在此之前的方法都是先将深度图编码成 HHA 图像,然后再把 HHA 图当作另外一张图像并输入到神经网络里抽取特征。这种方法在本质上还是一个基于 2D 的解决思路,无法更好的融合点之间在真实空间的联系,并不能使得到的结果很好的利用深度信息。本文作者提出在把深度信息转化为点真实的三维坐标,然后建立基于点实际坐标的 knn 图。并且利用基于图的神经网络,能够让图像特征可以根据 knn 图相互迭代更新每个点的特征。最后再利用分类网络对更新过的特征进行分类完成图像 RGBD 图像分割的问题。本文算法在效果上超过现在的基于 2d 卷积的方法,体现了该方法利用几何信息完成特征迭代更新的有效性。


    本文入选 ICCV 2017 口头报告(Oral),该类论文仅占总投稿数的 2.1%。


    4. Poster 论文:高质量的手机双摄图像匹配和分割估计


  • High-Quality Correspondence and Segmentation Estimation for Dual-Lens Smart-Phone Portraits



  • 本文提出了一个高质量的手机双摄图像匹配以及分割的算法。同时解决了图像匹配和物体分割这两大计算机视觉里的难题。随着双摄逐渐成为手机的标配,怎样更好的匹配双摄图像一直以来都是学术界和工业界关心的问题。为了解决这一难题,作者提出了一种联合优化匹配和分割的框架,为了让优化高效,还提出了一种区域的匹配算法。作者建立了一个 2000 对双摄图像的数据集用于算法的评估和测试。


    5. Poster 论文:立体匹配的无监督机器学习


  • Unsupervised Learning of Stereo Matching

  • 标签:凤凰国际,凤凰国际官网,凤凰国际娱乐

    本文链接:http://www.weiqi.cc/developer/117562.html 转载请注明出处