SRMVEC

Posted on 2025-03-08 Edited on 2025-11-26 In Research

这是一篇论文学习笔记，简单记录一下学习论文过程中学习到的知识和思路

论文信息

题目： Sparse Reconstructive Evidential Clustering for Multi-View Data
来源： IEEE/CAA JOURNAL OF AUTOMATICA SINICA, VOL. 11, NO. 2, FEBRUARY 2024
作者： Chaoyu Gong and Yang You

笔记

SRMVEC工作流插图

SRMVEC工作流插图

得到亲和矩阵后聚类簇中心的选取

P(xᵢ)表示对于每一个 xᵢ，所有满足 ŵᵢⱼ > 0 且 j ≠ i 的对象 xⱼ 都被包含到一个集合 P(xᵢ) 中。
对于决定的聚类中心，主要是通过possibility和separation两个指标
- possibility主要是体现周围样本j对某个样本i的作为聚类中心支持成都，ij两个样本的相似度越高，j对i支持作为聚类中心的支撑越大
- separation，Sep 参数量化了数据点 xi 与其他数据点在特征空间中的“疏远”或“隔离”程度。其中：
  1. Sep_min 表示 xi 与比它更像簇中心的点之间的最小分离程度。
  2. 当xi为范围内具有最高 Pos 值的点，用Sep_max 表示 xi 与所有其他数据点之间的最大分离程度

证据理论

为什么要在MVC中加入证据理论？
- 现有的MVC算法仅产生硬分区，这无法精确地对多特征空间高度重叠区域中的部分对象进行分组。换句话说，聚类成员的模糊性和不确定性需要被描述，以提高聚类性能。
- 所谓的“高度重叠区域”指的是在多维特征空间中，某些数据点在不同的特征空间或视角下有很多重合的部分。例如，数据点在一个视角中可能属于某个特定的类别，但在另一个视角中却可能属于另一个类别。在这些情况下，传统的硬分区方法无法准确地确定这些数据点到底属于哪个类别，因为它们在不同的视角中都有较大的重叠。
证据理论在本文中用在多处地方
- 来自多视角的数据的融合
- 学习过程中的不确定性
  1. 对象能否成为聚类中心的不确定度
  2. 成员聚类过程中划分的不确定度

实验

用的一般都是分类的数据集
来估计聚类的簇数，由实验结果来看比较准确，但是由方法来看，簇数是通过Sep-Pos chart人工选取的，是否最后的结果也存在一定的水分，类似根据答案做题
ACC NMI两个聚类指标也相应的较高

0%