近日,国际计算机视觉大会 ICCV 2023(International Conference on Computer Vision,简称ICCV)在法国巴黎召开。传音影像团队与哈尔滨工业大学机器学习研究中心合作完成的图像超分辨领域的论文“MetaF2N: Blind Image Super-Resolution by Learning Efficient Model Adaptation from Faces”被ICCV 2023接收。该论文为图像复原领域的技术难题提供了新思路,且能应用在智能移动终端产品图像和视频功能上,具有广泛的应用场景。
ICCV国际计算机视觉大会每2年举办一次,由IEEE(Institute of Electrical and Electronics Engineers,简称IEEE)主办,与计算机视觉模式识别大会(IEEE Conference on Computer Vision and Pattern Recognition,CVPR)、欧洲计算机视觉大会(European Conference on Computer Vision,ECCV)并称为计算机视觉三大顶级会议。ICCV属于CCF A(Core Conference Ranking A)类会议,录用率在20%-30%之间,在计算机视觉领域具备极高的学术影响力。本届会议共收到全球8068篇论文投稿,2160篇被录取,录用率为26.77%。
图像超分辨率技术旨在通过先进的计算机视觉算法和深度学习方法,将低清晰度的图像转换为高清晰度的图像,从而恢复丢失的细节和增强图像质量。随着深度学习技术的发展,在已知图像的退化设定下,很多基于深度神经网络的图像超分辨算法已经取得了高质量的复原效果。但是由于真实世界图像退化的复杂性与多样性,算法的实际应用场景往往是退化未知的场景。因此,如何在未知场景下取得优越的图像超分辨效果,成为了图像复原领域一项重要的技术难题。
此次传音影像部在ICCV上发表的论文MetaF2N充分利用了人脸本身五官所具有的结构性先验,在模型的训练及推理过程中加入了元学习(Meta-Learning)框架,通过人脸特有的先验信息对整张图像的退化类型进行了隐式估计。同时,MetaF2N还利用人脸权重估计网络MaskNet对人脸先验信息进行了评估与权重分配,来预防不准确的人脸先验信息对结果产生的负面影响,并在对应的数据集上实现了领先的图像超分辨效果。
、
随着自媒体平台的兴起和短视频的普及,用户对于显示内容与摄影效果的清晰程度也有了更高的要求。除了对图像增强外,图像超分辨率技术也被广泛应用于视频领域,通过将低分辨率视频帧转换为高分辨率,可以显著提高视频画质和清晰度。此次论文研究成果,也可作为高清人像复原技术向通用图像复原技术的迁移的技术研究基础,后续将应用在智能移动终端产品图像和视频功能中。
多年来,传音影像团队持续深耕移动摄影、图像技术,在相关领域不断建立和完善的技术创新体系,形成持续的创新能力,打造产品影像技术的领先优势。未来,传音影像团队将继续推进图像超分辨技术的迭代和应用,赋能公司多品牌智能终端产品,为新兴市场消费者带来更高清的影像体验。