近日,国际人工智能领域知名期刊《Engineering Applications of Artificial Intelligence》(2024年中科院一区,IF=8.0)发表了我院机器视觉与智能装备团队联合华中科技大学机械科学与工程学院刘默耘博士在深度学习工程应用领域取得的最新成果,论文题目为" Multiple prior representation learning for self-supervised monocular depth estimation via hybrid transformer"。该论文第一完成单位为yl7703永利官网,由我院孙国栋教授、研究生刘俊杰、张杨副教授及华中科技大学机械科学与工程学院刘默耘博士等共同完成。
深度估计被广泛应用于三维场景理解领域。由于标记成本昂贵,自监督方法利用物体的几何形状以及图像中的空间关系来训练模型,而不依赖标记的数据,但标记信息的缺失会影响模型的表征能力。该方法通过探索空间、上下文和语义先验的互补特性,从而增强自监督单目深度估计的表征和泛化能力。
结果表明,该方法在KITTI数据集上的绝对相对差(Abs Rel)指标达到0.104。同时,在Make3D和NYU depth V2数据集上也实现了高质量的深度估计。这项工作得到了国家自然科学基金(51775177),湖北省自然科学基金(2024AFB153)的资助。
原文Guodong Sun, Junjie Liu, Mingxuan Liu, Moyun Liu, Yang Zhang, Multiple prior representation learning for self-supervised monocular depth estimation via hybrid transformer, Engineering Applications of Artificial Intelligence, Volume 135, 2024, 108790.
原文链接:https://doi.org/10.1016/j.engappai.2024.108790