A Relation-Augmented Fully Convolutional Network for Semantic Segmentation in Aerial Scenes
- 传统CNN无法处理语义分割的上下分消息
-
现有的关系模型有:
- 图模型
- 空间传递网络
- 现有模型在空间的长距离关系中处理的并不好
-
本文提出的方法使用了两种模型
-
a spatial relation module
- 两两像素上的vector乘上权重矩阵后做内积
- 拼合上原输入feature maps得到最后结果
-
a channel relation module
- 不同channel取最大池化降维,然后不同channel两两相乘得到C*C的feature maps
- 和原输入feature maps矩阵相乘得到最后结果
- 两种模型可以并行最后融合,或者是串行先经过通道模型再经过空间关系模型
-
数据集
- Vaihingen dataset,16类有标注的影像中的11类训练,5类测试
- Potsdam dataset,10类训练,7类测试
- feature extraction使用预训练的CNN网络
-
关系模块使用
- glorot初始化权重
- Nestrow Adam优化器
- 交叉熵损失函数
- 使用tensorflow
- nvidia tesla p100 16G,迭代250k轮
- batch=5
- 当损失函数不再下降时停止
-
性能评估
- 评价F1,β=1;mIoU;OA
-
比较的网络
- 本文提供的方法对于指标的提升有一定的作用,并且在测试集上表现明显优于其他方式。但是因为目前只是进行了简单的空间像素内积,通道向量平均池化降维再外积。最后输出结果拼接上原feature maps,故虽然可以表现出一定的优异性,但是对于更深层次的关系还未完全挖掘,需要进一步的研究
[29][31]
原文