分享好友 最新动态首页 最新动态分类 切换频道
北理工团队在激光雷达点云数据3D目标检测领域取得新突破
2024-12-26 10:08

该研究成果以题为“MsSVT++: Mixed-scale Sparse Voxel Transformer with Center Voting for 3D Object Detection”的论文形式发表在国际顶级期刊《IEEE Transactions on Pattern Analysis and Machine Intelligence》上。IEEE TPAMI作为人工智能、模式识别和图像处理等领域的顶级权威期刊,其影响因子为23.6,是中国计算机协会(CCF)推荐的人工智能领域A类期刊。论文的第一作者为北京理工大学李佳男副研究员,通讯作者为许廷发教授。

针对真实大规模场景中存在的远距离目标误检漏检和3D检测模型在精度和计算效率之间难以平衡的瓶颈问题,科研团队提出了一种全稀疏体素Transformer点云特征提取网络架构(MsSVT),如图1所示。该网络架构引入了混合尺度注意力机制,捕获感兴趣目标的局部细粒度几何信息与长程上下文信息;运用三维空间中非空体素的稀疏特性,仅对非空体素位置执行混合尺度注意力操作,从而提升了计算效率,实现了高效的激光雷达点云3D目标检测。

图1. MsSVT点云特征提取网络架构图

该方法基于混合尺度注意力机制的强大多尺度特征捕获能力(见图2(a)-(d)),在大规模Waymo数据集上的检测精度超过了同期性能最优的双阶段检测器。图2(e)-(f)展示了部分在Waymo数据集上的部分检测结果,该方法可以精确检测仅具有极度稀疏点云表示的远距离车辆目标,并在处理带有巨大尺度变化的密集行人时也表现出优异的性能。

图2. 注意力图(a)-(d)及目标检测结果可视化(e)-(f)

该研究成功克服了三维场景中由于远距离目标点云极度稀疏而导致的目标定位困难以及漏检等问题,实现了精度与计算效率的平衡,为真实大规模场景下基于激光雷达点云数据的3D目标检测及应用提供了方法和关键技术支持。

论文详情:J. Li, S. Cong, L. Ding and T. Xu, MsSVT++: Mixed-scale Sparse Voxel Transformer with Center Voting for 3D Object Detection, in IEEE Transactions on Pattern Analysis and Machine Intelligence, doi: 10.1109/TPAMI.2023.3345880.

论文链接:https://ieeexplore.ieee.org/document/10371785


附作者简介:

李佳男,博士,北京理工大学光电学院预聘助理教授(特别副研究员),新加坡国立大学博士后。主要从事光电成像目标探测与识别等方面的研究,主持国家自然科学基金等项目 5 项。以第一/共一作者发表IEEE TPAMI 4篇,IEEE TNNLS、CVPR等论文11篇,ESI高被引论文1篇;以通讯作者发表论文40余篇;谷歌学术总引4000余次。入选中国科协及北京市科协“青年人才托举工程”项目,获得中国图象图形学学会优秀博士学位论文,王大珩光学奖等荣誉。指导学生获得 ICCV 2021“反无人机跟踪”挑战赛国际冠军及最佳论文奖、第四届“空天杯”创新创意大赛二等奖、中国高等教育博览会“校企合作 双百计划”典型案例等。

许廷发,博士,国家一级重点学科“光学工程”学科责任教授,博士研究生导师。光电成像技术与系统教育部重点实验室主任,北京理工大学重庆创新中心智能化和大数据技术实验室主任。近年来带领其科研团队围绕光电成像探测与识别、计算成像和人工智能等领域不断深化研究。主持承担国家自然科学基金委重大科研仪器研制项目等50多项。在国际、国内等系列期刊发表学术论文190余篇,其中被SCI/EI收录100余篇。以第一发明人申请国家发明专利87项,已授权和公示35项。获省部级科技进步二等奖等奖项3项。指导研究生获得中国图象图形学学会优秀博士学位论文,二人次获得王大珩高校学生光学奖,二人次获得全国光学与光学工程博士生学术联赛全国百强,获得中国高等教育博览会“校企合作 双百计划”典型案例和重庆英才创新创业示范团队等荣誉称号。

最新文章
2024年x7x7x7任意噪技术在人工智能与数据处理中的革命性突破有哪些
随着科技的不断进步,尤其是计算机领域的创新,各种新型技术和算法不断涌现。在这些新兴技术中,“x7x7x7任意噪2024”作为一个独特的关键词,吸引了不少关注。这个术语可能对很多人来说比较陌生,但实际上它代表了一种新的数据处理或噪音管
10、iconninja
秘迹搜索[1]的定位是一款 “不追踪” 你的搜索引擎,的确,这对于个人隐私“分文不值”的互联网时代,一些无良的互联网公司的确视用户的隐私为粪土。追踪用户浏览搜索记录,用于挖掘商业价值,个性化推荐广
imdb数据集_Python数据分析实战:TMDB电影数据可视化
腾讯课堂 | Python网络爬虫与文本分析(戳一戳)~~2. 数量最多的电影类型Top103. 各种电影类型所占比例4. 电影关键词分析5. 各类型电影数量随时间变化趋势6. 电影票房与电影时长关系作者简介:叶庭云个人格言: 热爱可抵岁月漫长CSDN 博
2023手游热度排行榜100名 受玩家欢迎的游戏合集
一个热度的高低是反应这款游戏受不受欢迎的直接指标,并且大家都非常喜欢游玩一些热度高的由此,所以小编今天给大家带来了这篇2023手游热度排行榜100名,目的就是想让大家游玩一些高热度的游戏。由于篇幅有限,小编并不能给大家找出100款游
2022年度游戏排行榜 有趣的手机游戏大全
现在有不少人爱看年度游戏排行榜,他们都想在排行榜上寻找自己爱玩的游戏,年度游戏排行榜上的手游也是比较多的,那么2022年度游戏排行榜情况怎么样?今天小编就给大家整理了2022年的年度游戏介绍,这些游戏都是榜上有名的好玩游戏哦,喜欢
AI绘画神器,轻松生成超逼真美女写真教程!
在社交网络遍布的当今时代,大家总是希望在朋友圈中展示最完美的自己。你有没有想过,如何快速、简单地生成一张超逼真的美女写真?无论是为了个人形象、社交媒体的内容,还是为了表达自己的创意,AI绘画工具正在悄然改变着我们的生活。本文
Kafka Lens:Kafka集群的可视化利器
项目地址:https://gitcode.com/gh_mirrors/ka/kafka-lensKafka Lens 是一款专为 Kafka 集群设计的可视化工具,旨在帮助开发者轻松监控和排查 Kafka 集群中的问题。通过 Kafka Lens,您可以实时查看消息在 Kafka 主题和分区中的
iPhone12或成未来两年最值得入手苹果手机,除5G外,屏幕变化最大
近日,三星、华为、小米等国内外手机厂商陆续发布了自己的上半年度的旗舰智能手机,仍然是八仙过海各显神通,也能看出目前手机市场已经进入白热化阶段,技术的提升也带动着价格的提高。苹果公司也在前几日在官网悄悄更新了iPad Pro、MacBoo
2021年数据分析与商业智能的十大关键词Ⅲ
1.认知计算认知计算是BI的流行语,我们将在2021年听到更多。它被认为是计算和BI行业的新热点,它能够消化大量结构化和非结构化的数据,这些数据将转换为可管理的内容。它模仿人脑,并正在创造一条技术路径,将模仿人类信息处理在比以往更复
google搜索手机版app
google搜索客户端是一款由谷歌推出的网上浏览器软件,界面整洁、字迹清晰、模版多样、细化分类等功能,用户只需一键搜索就可搜到想要看的内容,有需要的用户欢迎来2265安卓网下载吧!Android手机的Google搜索应用程序可以为你的手机提供*快
相关文章
推荐文章
发表评论
0评