《多元视觉信息的内容处理与编辑》

多元视觉信息(包括图像、视频、3D场景)的流量占互联网及智能终端上总流量的90%以上,全国有数以亿计的智能手机、监控摄像头、3D获取设备采集海量的图像、视频及几何数据。有效内容处理与编辑成为视觉信息计算领域的关键问题。该项目在多元视觉信息的内容处理与编辑领域方面展开了系统深入的工作,依据多元视觉信息具有数据量大、语义多样性和非结构性等特点,构建对应的内容处理与编辑模型,以满足数字媒体产业、公共安全和虚拟现实等对多元视觉信息的国家重大需求。主要研究内容及创新贡献包括:

(1)在图像视频光照恢复与内容增强领域取得了重要的研究成果。发明了一种从局部到全局的光照恢复算法,解决了阴影区域纹理细节及全局光照一致恢复问题;首次引入人类视觉感知度量用于评估视频质量,生成全局最佳虚拟曝光视频;创新构建了一种累进式薄云检测框架及保图像纹理结构去雾算法,获得了高精度图像内容增强结果。

(2)在图像视频场景理解与浓缩的理论和方法展开了深入研究。率先提出了利用深度学习进行特征选择应用于遥感影像场景分类。在国际上首次构建高效的精确的最近邻域块匹配算法,通过消除图像块匹配之间的冗余对图像块进行快速匹配,且对内存要求最小。首次提出了一种基于物体分块组合优化的视频摘要算法,消除视频中运动物体内部的冗余,提高视频缩放的压缩率。

(3)在三维几何重建与编辑领域,发明了一种面向特征点邻接关系的大规模图像集快速匹配算法,极大提升三维重建的效率及重建精度;首次提出一个保特征无参数投影的快速几何重建算法,同时保持了几何模型的特征与精度。在多层次的几何特征提取、几何特征跟踪模型、时变曲面多尺度表示及几何细节增强等领域构建了一系列算法,为几何模型的形状分析与编辑提供有效方法。

在国际著名学术期刊和会议上发表论文50余篇。8篇代表作论文共被他引530次,其中SCI他引214次,其中5篇论文发表在IEEE Transactions期刊、1篇发表在The Visual Computer,1篇发表在IEEEGeoscience and Remote Sensing Letters,1篇发表在Computers in Industry。授权国内发明专利6项。成果得到了斯坦福大学、微软研究院等80余所大学/机构和26位ACM/IEEE Fellow的广泛引用,并获得学界、业界的较高认可。研究成果丰富了多元视觉信息的内容处理与编辑的理论和方法,在国内国际学术界产生较大影响。

  1. 下载详细PDF版/Doc版

提示:为方便大家复制编辑,博主已将PDF文件制作为Word/Doc格式文件。