本报讯 近日,我校电子信息学院何志伟教授团队的研究成果“P2P:Part-to-PartMotionCuesGuideaStrongTrackingFrameworkforLiDARPointClouds”被Interna-tionalJournalofComputerVision(IJCV)录用并在线发表。IJCV是中国计算机学会(CCF)认定的人工智能领域四个A类期刊之一,也是计算机视觉领域最重要的两个顶级学术期刊之一,2024年影响因子19.5,年发文量仅180篇左右。该论文第一作者为电子信息学院2022级硕博连读博士生聂佳浩,指导老师何志伟教授为该论文的通讯作者。这也是我校在读研究生首次以第一作者身份在IJCV上发表科研论文。
探索:该论文围绕激光雷达点云单目标跟踪任务,首先对现有主流跟踪框架进行了系统性的探索性实验,旨在厘清不同跟踪范式与结构之间的关系与优劣。通过对比分析传统外观匹配方法、运动建模方法及其组合模型的性能表现,作者发现:与复杂的外观匹配和运动建模相比,简洁而高效的运动结构在激光雷达点云中同样能够实现高精度、高鲁棒性的目标跟踪。这一实验结论为后续研究提供了明确方向,也凸显了在稀疏、不规则的点云环境中,运动信息在目标定位任务中的核心价值。
架构:在上述探索结果的基础上,论文设计了一种新颖的“部件对应部件”式细粒度运动建模机制。该方法通过挖掘目标在连续两帧点云中的局部结构变化,实现对目标整体运动趋势的精准建模。不同于传统的刚体或全局中心运动估计方式,本方法强调对目标关键部件之间的对应关系进行细粒度建模,从而提升在复杂场景中对遮挡、形变和多目标干扰下的鲁棒性与准确率。该方法有效结合了结构先验与数据驱动建模,为点云运动建模提供了新的思路。基于这个设计,论文构建了一套通用的点云运动建模框架。
模型:基于这一框架,作者进一步提出了两种模型变体:一种基于点表征,强调点级几何特征的保留与匹配;另一种基于体素表征,更侧重于局部空间一致性与计算效率的权衡。两种模型在结构实现上各有侧重,能够覆盖不同应用场景下的需求,为后续工程部署和多场景迁移提供了可扩展性和灵活性。
实验:所提出的方法分别在KITTI、nuScenes和Way-mo三大公开点云跟踪基准数据集上进行了全面验证。实验结果显示,无论是在准确率(Accuracy)、成功率(Success)还是运行速度(FPS)等指标上,所提方法均显著优于当前主流方法,展现出兼具高性能与高效率的领先优势,充分验证了模型设计的有效性与推广性。该成果为激光雷达点云目标跟踪的实用化和产业化落地奠定了坚实基础。
(电子信息学院)