Exploring and Exploiting Uncertainty for Incomplete Multi-View Classification 论文
Exploring and Exploiting Uncertainty for Incomplete Multi-View Classification 论文
引言
面临的问题: 多视图学习相较于单视图能够利用互补性信息,在聚类、分类和表示学习上表现更佳。但由于视图缺失带来的 高不确定性,如何在缺失情况下实现稳定、可信的分类仍是难题。
现存解决方法: 现有的不完整多视图分类(IMVC)方法大体分为两类:
一类仅依赖可观测视图进行分类 [8, 9],不进行插补。但当缺失率较高时,难以充分利用视图间相关性,效果欠佳。
另一类利用深度学习(如自编码器 [14, 15]、GAN [16])对缺失视图进行插补,然后用完整数据分类 [10–13]。但其存在三个问题:
可解释性不足;
采用确定性插补,无法刻画缺失视图的不确定性,导致分类不稳定;
面对复杂缺失模式(尤其是多于两个视图的情况)时缺乏灵活性。
提出的方法:: 提出不确定性驱动的不完整多视图分类模型(UIMC) 来解决上述问题。核心思想是 把缺失数据建模为分布而非单值,并在此基础上进行采样和自适应融合:
分布建模: 每个缺失视图通过条件分布进行建模,引入不确定性。
采样生成: 从该分布中多次采样,将采样结果与观测视图组合,得到多个完整的多视图样本。
质量感知融合: 由于采样结果本身的质量不确定,模型从两个层面自适应整合:
单视图层面:对低质量采样数据赋予更高不确定性,使其不干扰其他视图的学习;为此构建基于证据的分类器,输出 主观概率 + 不确定性质量 的观点。
多视图层面:通过 Dempster-Shafer (DS) 规则 融合多个视图观点,保证在不同质量视图下的可信整合。
贡献总结:
我们提出了一个“探索–利用”策略,通过刻画缺失数据的不确定性来进行不完整多视图分类,使得利用插补数据时既有效又可信。值得注意的是,UIMC 是首个在 IMVC 中显式引入不确定性的工作。
我们设计了从 单视图与多视图融合 两方面对插补数据进行加权的机制,以充分利用高质量数据并抑制低质量数据的负面影响;其中不确定性感知训练与融合显著提升了结果的稳定性与可靠性。
在多个包含不同特征类型或模态的数据集上进行实验,并采用多样化指标进行评估,结果表明 UIMC 在性能和可信度方面均超过现有方法,且能提供可靠的不确定性信息。