本文分析KDTree的原理,集合案例深入理解,同时提供源代码。
三个案例:K近邻搜索、半径内近邻搜索、近似最近邻搜索。方法对比,如下表所示:
看一下示例效果:
白色的是随机生成的原始点云,红色是查询点,绿色是找到的10个最近点。
KDTree(K-Dimensional Tree,K维树)是一种用于多维空间中数据点的快速点查找的数据结构。它是计算几何领域中的一种二叉树。
-
构建过程:
- 将数据点递归地划分成两个子集,直到每个子集中的点数目小于等于一个。
- 每次划分时,选择某个维度,将数据点按照该维度的中位数进行分割,这样一半的数据点在分割超平面的左侧,另一半在右侧。
- 每个节点保存一个数据点及一个用于分割的维度。
-
搜索过程:
- 从根节点开始,递归地向下遍历树,根据查询点在当前分割维度上的值决定向左子树或右子树移动,直到达到叶节点。
- 回溯过程中,检查是否需要跨越分割超平面搜索另一子树。
- 使用一个优先级队列维护当前最优的 K 个最近邻点。
KDTree常用的方法,汇总如下所示:
官网:Introduction — Point Cloud Library 0.0 documentation
对应函数:Point Cloud Library (PCL): Module kdtree
- Point Cloud Library (PCL): pcl::KdTree< PointT > Class Template Reference
优点:
- 高效邻近搜索: 在低维数据中,KDTree 提供了一种高效的 K 近邻和范围搜索方法。
- 动态更新: KDTree 可以动态地插入和删除数据点,保持数据结构的有效性。
- 适用多种距离度量: KDTree 可以使用多种距离度量,如欧氏距离、曼哈顿距离等,适应不同应用需求。
缺点:
- 高维数据性能下降: 随着维度增加,KDTree 的性能会急剧下降,这是因为高维空间中的数据分布变得稀疏,导致分割效率降低。这种现象被称为“维度灾难”。
- 构建和维护成本: 构建和维护 KDTree 的成本较高,尤其是在数据频繁变化的场景中。
- 不适用于动态变化的场景: 如果数据频繁更新,KDTree 需要频繁重建,维护成本较高。
K近邻搜索(K-Nearest Neighbors Search)是一种用于查找给定点的K个最近邻点的搜索方法,KDTree提供了一种高效的实现方式。
看一个示例深入理解,在这个示例中:
- 随机生成一个包含1000个点的点云。
- 随机选择一个查询点。
- 使用 进行近似最近邻搜索,查找10个距离最近的点。
- 使用 可视化原始点云、查询点和近似最近邻点。
代码示例:
可视化K近邻搜索的效果,如下图所示:
白色的是随机生成的原始点云,红色是查询点,绿色是找到的10个最近点。
K近邻搜索的思路流程:
- 初始化:
- 从根节点开始,根据查询点的坐标,决定向左子树还是右子树移动。
- 递归搜索:
- 递归地向下遍历树,直至达到叶节点。
- 在叶节点处,计算该叶节点数据点与查询点之间的距离,将其加入优先级队列(最大堆),用于存储当前最近的K个点。
- 回溯:
- 回溯到父节点,检查当前节点的数据点与查询点之间的距离,并更新优先级队列。
- 判断是否需要跨越分割超平面搜索另一子树:如果查询点到分割超平面的距离小于优先级队列中最远点的距离,则跨越分割超平面,进入另一子树进行搜索。
- 重复搜索和回溯:
- 重复上述搜索和回溯过程,直至回溯到根节点,最终优先级队列中存储的就是查询点的K个最近邻点。
近似最近邻搜索的目标是找到查询点的近似K个最近邻点,允许一定的误差以提高搜索速度。
常见的做法是通过多次随机采样、设置较大的搜索半径或者在其他库中使用误差参数来实现近似搜索。
示例代码:
结果可视化:
结果分析:
- 白色的是随机生成的原始点云,红色是查询点,绿色是找到的2个最近点(本文需要找到10个点的)。
- 允许一定误差,以提高搜索速度。
- 在示例代码中,通过增加随机性和多次采样来实现近似搜索,最终合并和去重结果。
径内近邻搜索 (Radius Search),找到指定半径内的所有点。
思路流程:
- 构建 KDTree:首先,构建包含所有数据点的KDTree。这一步骤将数据点按空间位置递归地分割成子区域。
- 查询节点搜索:从根节点开始,检查当前节点是否在查询点的半径内。如果是,则将其加入结果集中。
- 递归搜索:递归地检查当前节点的子节点:
- 如果查询球体与子节点对应的空间区域相交,则继续搜索该子节点。
- 如果查询球体与子节点对应的空间区域不相交,则跳过该子节点。
- 合并结果:合并所有符合条件的节点,得到最终的近邻点集合。
看一个示例深入理解,在这个示例中:
- 随机生成一个包含1000个点的点云。
- 随机选择一个查询点。
- 使用 radiusSearch 进行半径内近邻搜索,半径为116。
- 使用 可视化原始点云、查询点和近似最近邻点。
代码示例:
可视化半径内近邻搜索的效果,如下图所示:
白色的是随机生成的原始点云,红色是查询点,绿色是找到的3个最近点(半径范围内)。
半径内近邻搜索,查询点为 (200.242 73.3622 785.961),半径=116.108
166.217 33.6048 783.911 (距离平方: 2742.57)
164.154 125.101 776.535 (距离平方: 4068.13)
239.646 7.50222 856.443 (距离平方: 10857.9)
分享完成~