# Multi-view-Convolutional-Neural-Networks-for-3D-Shape-Recognition
本文提出了一种基于多视图卷积神经网络的三维物体识别算法,以实现三维物体的准确识别。首先实现一个标准的卷积神经网络架构,该架构经过训练可以独立地识别形状的渲染视图,以实现即使从单一视图中也可以识别出一个三维形状。随后使用该三维物体多个角度的二维视图通过卷积神经网络识别的结果进行模型融合。在模型融合的过程中取出输入单角度视图的卷积神经网络的某一层,使用层最大值算法将多个层中同一位置的最大值取出,形成一个新的层参与神经网络的训练,以提高卷积神经网络识别多视图的准确率。为了应对数据集较小的情况,我们使用了迁移学习的方法,先使用ModelNET数据集对单视图卷积神经网络进行预训练,然后将预训练模型加载到多视图卷积神经网络后再进行微调,以提高图像的识别率。ModelNET数据集上的实验结果证明了算法的有效性。Keras版本:2.2.4,TensorFlow版本:1.12.0,GPU型号:GeForce RTX 2080 Ti
In this paper, we propose a multi-view convolutional neural network which based on 3D object recognition algorithm to achieve accurate recognition of 3D objects. A standard convolutional neural network architecture is first implemented that is trained to recognize rendered views of a shape independently to achieve recognition of a 3D shape even from a single view. The 2D views of the 3D object from multiple angles are then used to perform ensemble learning with the results recognized by the convolutional neural network. A layer of the convolutional neural network with an input single-angle view is taked during the ensemble learning process, and the maximum value at the same location in multiple layers is taked using the layer maximum algorithm to form a new layer to participate in the training of the neural network to improve the accuracy of the convolutional neural network in recognizing multiple views. To cope with the small dataset, we use a transfer learning approach to pre-train the single-view convolutional neural network using the ModelNET dataset first, and then fine-tune the pre-trained model after loading it into the multi-view convolutional neural network to improve the recognition rate of images. experimental results on the ModelNET dataset demonstrate the effectiveness of the algorithm.Keras version: 2.2.4, TensorFlow version: 1.12.0, GPU model: GeForce RTX 2080 Ti
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
python实现的基于多视图卷积神经网络的三维物体识别算法实现三维物体的准确识别源代码+文档说明.zip,提出了一种基于多视图卷积神经网络的三维物体识别算法,以实现三维物体的准确识别。首先实现一个标准的卷积神经网络架构,该架构经过训练可以独立地识别形状的渲染视图,以实现即使从单一视图中也可以识别出一个三维形状。随后使用该三维物体多个角度的二维视图通过卷积神经网络识别的结果进行模型融合。 在模型融合的过程中取出输入单角度视图的卷积神经网络的某一层,使用层最大值算法将多个层中同一位置的最大值取出,形成一个新的层参与神经网络的训练,以提高卷积神经网络识别多视图的准确率。为了应对数据集较小的情况,我们使用了迁移学习的方法,先使用ModelNET数据集对单视图卷积神经网络进行预训练,然后将预训练模型加载到多视图卷积神经网络后再进行微调,以提高图像的识别率。ModelNET数据集上的实验结果证明了算法的有效性。 python实现的基于多视图卷积神经网络的三维物体识别算法实现三维物体的准确识别源代码+文档说明.zippython实现的基于多视图卷积神经网络的三维物体识别算法实现三维物体的准确识别
资源推荐
资源详情
资源评论
收起资源包目录
python实现的基于多视图卷积神经网络的三维物体识别算法实现三维物体的准确识别源代码+文档说明.zip (7个子文件)
文件夹n-main
mvcnn_train_1.py 9KB
cnn_train.py 5KB
test_picture.py 3KB
mvcnn_train_2.py 10KB
jpg2gray.py 2KB
gray2npy.py 8KB
README.md 3KB
共 7 条
- 1
资源评论
yava_free
- 粉丝: 2539
- 资源: 739
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 在winsows下使用pcap抓取http数据的exe小程序
- Liberate MX for SRAM RaK教程 嵌入式静态随机存取存储器(SRAM)实例需要在自由(.lib)文件中捕获的
- K210 maix bit使用寻找色块函数所需要的固件
- Qt操作主/从视图及XML-实例:汽车管理系统
- 用python裁剪txt的代码
- 基于Java、CSS和HTML的StudentBookingSystem学生火车票订票系统设计源码
- self python script
- 基于Jupyter Notebook的Python代码设计源码分享
- 两挡AMT纯电动汽车仿真模型,可实现挡过程模拟 ABS TCS驱动防滑控制 电池管理等功能 模型可以输入WLTC CLTC等不同
- 9030B频谱仪编程手册
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功