Core Concepts
提出了一种掩码双通道解耦框架(MTD)来处理不完全多视图弱多标签学习问题。该框架通过解耦单通道视图级表示为共享表示和视图专有表示,并设计了跨通道对比损失来增强两个通道的语义属性。同时,该框架还利用监督信息设计了标签引导图正则化损失,帮助提取的嵌入特征保留样本之间的几何结构。此外,受到图像和文本分析中掩码机制的成功启发,我们开发了一种随机片段掩码策略来提高编码器的学习能力。
Abstract
本文提出了一种掩码双通道解耦框架(MTD)来处理不完全多视图弱多标签学习问题。
该框架通过解耦单通道视图级表示为共享表示和视图专有表示,并设计了跨通道对比损失来增强两个通道的语义属性。这样可以满足多视图一致性和互补性的假设。
该框架还利用监督信息设计了标签引导图正则化损失,帮助提取的嵌入特征保留样本之间的几何结构。
受到图像和文本分析中掩码机制的成功启发,我们开发了一种随机片段掩码策略来提高编码器的学习能力。
该框架可以处理任意不完整的多视图和弱多标签数据,并在实验中表现出色,优于其他先进方法。
总的来说,该框架通过解耦特征、引入监督信息和采用掩码策略,有效地解决了不完全多视图弱多标签学习问题。
Stats
在Corel5k数据集上,我们的方法在AP指标上达到了0.415,在1-HL指标上达到了0.988,在1-RL指标上达到了0.893,在AUC指标上达到了0.896,在1-OE指标上达到了0.491,在1-Cov指标上达到了0.750。
在Pascal07数据集上,我们的方法在AP指标上达到了0.551,在1-HL指标上达到了0.932,在1-RL指标上达到了0.831,在AUC指标上达到了0.851,在1-OE指标上达到了0.459,在1-Cov指标上达到了0.784。
在ESPGame数据集上,我们的方法在AP指标上达到了0.306,在1-HL指标上达到了0.983,在1-RL指标上达到了0.837,在AUC指标上达到了0.842,在1-OE指标上达到了0.447,在1-Cov指标上达到了0.602。
在IAPRTC12数据集上,我们的方法在AP指标上达到了0.332,在1-HL指标上达到了0.981,在1-RL指标上达到了0.875,在AUC指标上达到了0.876,在1-OE指标上达到了0.467,在1-Cov指标上达到了0.649。
在MIRFLICKR数据集上,我们的方法在AP指标上达到了0.607,在1-HL指标上达到了0.891,在1-RL指标上达到了0.875,在AUC指标上达到了0.862,在1-OE指标上达到了0.655,在1-Cov指标上达到了0.676。
Quotes
"我们的MTD是令人信服的,在几乎所有指标上都优于比较方法。除了在IAPRTC12数据集上的平均排名为1.17之外,它在其他四个数据集上都排名第一。无论与传统方法(如GLOCAL和NAIM3L)还是深度方法(如C2AE和DICNet)相比,我们的MTD都表现出了出色的兼容性,能够处理缺失视图和弱标签。"
"我们可以发现基于深度神经网络的方法通常比传统方法表现更好。具体来说,我们的MTD、DICNet和CDMM在所有五个数据集上都排名前三,这可归因于深度编码器强大的特征提取能力以及它们采用的灵活的多视图融合策略。"
"在传统方法的比较中,专门为双重不完整性设计的方法明显优于其他方法。这表明在模型设计过程中考虑可能存在的缺失视图和标签的必要性。"