《Monocular Outdoor Semantic Mapping with a Multi-task Network》论文复盘及思考

raymondbyc 2019-03-13 原文

论文弄完了来个复盘~的系列

一句话概括论文：用单目视频流作为输入，用多任务神经网络来构建语义三维地图
contribution：
- 使用多任务学习来对单目和语义对两个任务进行效果提升
- 使用超像素来使得深度估计更加平滑
如何运用多任务学习来对深度和语义进行效果提升的？
- 使用了 Resnet-50 作为 backbone 进行特征提取（使用 Resnet-50 是因为显存妥协）
- 将 feature 分别送入 semg_decoder 和 depth_decoder。
- 分别在两个 decoder 中了使用了 ASPP 来处理多尺度问题,，
- 将各自的 feature （3348）送到另一个 decoder，并拉伸到 4x。
- decoder 中进行两次 3*3 的卷积，然后语义 decoder 卷积到类别数量的 channel, 深度卷积到1.
如何使用超像素来进行深度估计平滑的？
- 将根据中心点和周围点的距离，颜色，语义信息来划分超像素。
- 将一个超像素内的深度取平均值。
实验部分
- 对单任务同样架构（即 Resnet-50 + ASPP + 2个 33256 conv + 33 num_classes or 1 ）两个进行了实验。对于语义和深度各有提升。
- 对 ASPP 放在一起还是分开放。分开放对于语义和深度各有提升，但是牺牲了速度.
- 对于 ASPP 处理后的两个 branch 送到另一个 decoder. 对于语义和深度各有提升.
我是在 deeplab v3+ 的基础上添加了深度估计分支，遇到了一些问题，想和大家分享下：
- 遇到的问题：深度效果差，
- - 猜测原因：数据增强的原因。对于单目估计这种 ill-posed 的问题，物体大小是很强的线索。但是在数据增强的时候，和语义的数据增强一块做了scale (语义的物体大小并不会语义)，导致神经网络无法 get 到物体大小的线索，直接导致效果很差。
  - solution：就是把scale变成了rotate
- 遇到的问题：数据训飞掉了
- - 猜测原因：数据分布不平均
  - solution：把所有的数据值都打印出来，大概数据在0-100之间, 而且小值偏多。就用了个映射函数将它相对均匀的映射到了（-1，1）之间。（用的圆的左上部分映射到（0，1），然后再*2-1分布到（-1，1））

版权声明：本文为raymondbyc原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://www.cnblogs.com/raymondbyc/p/10526680.html

《Monocular Outdoor Semantic Mapping with a Multi-task Network》论文复盘及思考的更多相关文章

KnowRob: A knowledge processing infrastructure for cognition-enabled robots
标题：KnowRob: A knowledge processing infrastructure for c […]...
专访：跨境电商 SaaS ERP 领星完成 7000 万人民币 A 轮融资的背后
深圳市领星网络科技有限公司是一家专注于为跨境电商行业提供 SaaS 解决方案的公司，于 2017 年成立并上线 […]...
Null is your firend, not a mistake
原文作者： Roman Elizarov 原文地址： Null is your firend, not a m […]...
print control with css and javascript – WebQ
print control with css and javascript Sometimes we have […]...
Tree – Decision Tree with sklearn source code
After talking about Information theory, now let\’ […]...
DirectX11 With Windows SDK–22 静态天空盒的读取与实现、模型反射
前言从现在开始可以说算是要进入到高级主题部分了。这一章我们主要学习由6个纹理所构成的立方体映射，以及用它来实 […]...
微软MSDN原版Windows Server 2008 R2 With SP1下载
Windows Server 2008 R2是windows 服务器版本Windows Server 2008 […]...
MySQL with as 用法
链接：https://www.cnblogs.com/Niko12230/p/5945133.html...

随机推荐

Android中Handler与Message的简单实例
原文链接：http://blog.csdn.net/double2hao/article/details/49 […]...
一个基于Ionic3.x cordova的移动APP demo
一个基于Ionic3.x cordova的移动APP demo 项目地址如遇网络不佳，请移步国内镜像加速节点 […]...
请给出你熟悉关系数据库范式有哪些，有什么作用
在进行数据库的设计时，所遵循的一些规范，只要按照设计规范进行设计，就能设计出没有数据冗余和数据维护异常的数据 […]...
腾讯社招面试经历
腾讯社招面试经历前提：本人2011年毕业于一个普通本科，工作不到2年。　　15号晚上7点多，正在炒菜做饭， […]...
Qunit 中文文档
1、官方文档地址 http://qunitjs.com/cookbook/#asserting-results […]...
关于MySql数据库主键及索引的区别
一、什么是索引？索引用来快速地寻找那些具有特定值的记录，所有MySQL索引都以B-树的形式保存。如果没有索引， […]...
聊聊阿里面试的三个层次
博主个人独立站点开通啦！欢迎点击访问：https://shuyi.tech 最近去阿里的菜鸟国际做了一次面试交 […]...
怎样在windows上定时执行python脚本
作为一个需要在电脑上工作和学习的人，一件十分困扰我的事情就是怎样不受互联网中其他内容的干扰而专注于自己想要做的 […]...

展开目录

目录导航