其他分享
首页 > 其他分享> > 文章阅读-VoxNet: A 3D Convolutional Neural Network for Real-Time Object Recognition

文章阅读-VoxNet: A 3D Convolutional Neural Network for Real-Time Object Recognition

作者:互联网

Brief

 为了好好整理一下3D视觉在深度学习方面的过程,做好这个系列,这一篇文章是在体素(voxel)上发布比较早的文章,应该是第一篇,后续第二篇是来自princeton大学的3D shapeNets。发布在15年的视觉顶会。
这也是一篇发在15年的文章,在IEEE/RSJ,机器人方面顶会IROS。
这里是 paper
这里是 code
本文的后半部分有借助知乎该回答

Absract

Introduction

Related

Object Recognition with point cloud data

2.5D 卷积神经网络

3D CNN

Apporach

我们的算法的输入是点云段,如果执行检测,它可以源自诸如[12],[29]的分割方法或“滑动框”。我们的任务就是对这个点云段最分类。我们网络主要由两部分组成,一个代表空间占用估计的体素网络和一个用于对该被占用的网格进行分类的CNN。

岂不是要做预处理?

Volumentric Occupancy Grid

占用网格([30],[31])将环境状态表示为随机变量的3D网格(每个对应于体素),并根据传入的传感器数据和先验知识保持其占用率的概率估计。两个使用占用网格的理由:

Reference frame and resolution

Occupancy models(占有率模型)

4 3D Convolutional Network Layers 3D CNN模型

CNN的优点在于可以明确的利用问题的空间结构,我们期望输入级的滤波器可以在不同方向上编码空间结构,比如平面和角。
在这里插入图片描述

标签:Convolutional,Real,占用,Object,网格,点云,CNN,体素,3D
来源: https://blog.csdn.net/weixin_40805392/article/details/98869865