Core Concepts
提出一个并行推理网络,通过多层特征聚合、递归对齐和自适应得分融合来实现高效的实时语义分割。
Abstract
本文提出了一个并行推理网络MFARANet,旨在实现实时语义分割的高效性和准确性。主要包含以下三个核心组件:
多层特征聚合模块(MFAM):采用双路径架构和横向连接,将编码器的多层特征聚合到每个尺度,为后续的空间对齐和预测提供丰富的层次信息。
递归对齐模块(RAM):结合基于流的对齐模块和递归上采样架构,以半复杂度实现多尺度特征图的空间对齐,解决了直接对齐带来的问题。
自适应得分融合模块(ASFM):采用像素级注意力机制自适应地融合多尺度预测得分,使最终预测能够兼顾不同尺度的目标。
此外,作者还提出了多尺度联合监督(MJS)的训练策略,同时监督分割预测和边界预测,增强了特征表示。
通过上述创新,MFARANet在保持高速推理的同时,也能达到较高的分割精度,在Cityscapes和CamVid数据集上都取得了优秀的性能。
Stats
我们的方法在Cityscapes验证集上达到了78.2%的mIoU,比基准方法提高了5.9%。
与基准方法相比,我们的方法在保持相似的推理速度(52.2 FPS)的情况下,计算复杂度(FLOPs)降低了10.5G。