这篇文章主要讲解了“GVCNN的网络结构是怎样的”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“GVCNN的网络结构是怎样的”吧!
网络结构:
觉得眼熟吗?看看前端输入的一排图片,是不是和MVCNN非常像。来看一下MVCNN的网络结构:
你可能已经猜到了,其实GVCNN就是对MVCNN做了改进。
MVCNN又是什么来路呢?
它可是最早将深度学习引入到三维形状识别中来的,早在ICCV2015会议上发表出来,当时就已经能在ModelNet40数据集上跑出90.1%的成绩了,可以说是师爷级的网络了。
后续的各种处理点云的方法,都会与它做比较。
它的思路其实很简单,对于三维物体,从多个视角去‘拍照’,得到12幅图片,然后码12个VGG网络上来,进行特征提取,把12组特征进行池化后,进行分类。
所以,MVCNN的缺点也很明显,网络巨大。这与当今小型化的趋势明显不符嘛!这么大的网络,别说往移动终端部署了,就是桌面电脑,跑起来都费劲。所以,这个网络的follower一直也不多。
笔者倒是见过一篇比较老的论文,是把三维物体往球形上面做投影,同样是把三维转换成多个二维图像去处理,跟MVCNN的区别是,往球型投影比平面投影更能反映三维物体的属性
再来看今天的主角GVCNN,它的改进是,把12幅图片进行了分组、加权。
作者考虑到,MVCNN中的12幅图像其实权重是一样的,但是实际当中肯定12幅图像对于分类的贡献是有高有低,通过合理加权,自然可以提高分类准确率。
具体操作就如上图,每个图片得到一组特征值,通过FC层获得分数,对分数进行分组,比如图中分成了三组。
然后,在组内按照MVCNN原来的池化操作进行。组间则是加权后在平均池化,得到最后结果。
下面是结果了:
可以看到,提升效果还是很明显的。
感谢各位的阅读,以上就是“GVCNN的网络结构是怎样的”的内容了,经过本文的学习后,相信大家对GVCNN的网络结构是怎样的这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是恰卡编程网,小编将为大家推送更多相关知识点的文章,欢迎关注!
polyfills怎么按需加载
polyfills怎么按需加载本篇内容主要讲解“polyfills...
C#数据类型怎么实现背包、队列和栈
C#怎么实现冒泡排序和插入排序算法
C#怎么实现冒泡排序和插入排序算法这篇文章主要讲解了“C#怎么实现...
C#如何实现希尔排序
C#如何实现归并排序
C#怎么使用符号表实现查找算法
C#类的静态成员怎么用
C#类的静态成员怎么用这篇“C#类的静态成员怎么用”文章的知识点大...
C#的静态函数怎么用
C#的静态函数怎么用这篇文章主要讲解了“C#的静态函数怎么用”,文...
C#中的析构函数怎么用
C#中的析构函数怎么用这篇文章主要讲解了“C#中的析构函数怎么用”...
怎么用CZGL.ProcessMetrics监控.NET应用
用户名
密码
记住登录状态 忘记密码?
邮箱
确认密码
我已阅读并同意 用户协议