信念函数理论(Dempster-Shafer Theory, DST)
基本的概念
0. 定义
证据理论也被称为 Dempster-Shafer 理论,是一种不精确推理理论,主要用于处理不确定信息。它允许人们在证据不完全、不精确或相互矛盾的情况下进行推理和决策。
Dempster-Shafer 理论(DST),也称为证据理论,是一种用于处理不确定性信息的数学框架。它通过将概率分布分配到假设集合的子集上,而不仅仅是单个假设,从而更好地表达不确定性和模糊性。下面介绍 DST 的几个基本概念及相关内容。
1. 识别框架(Frame of Discernment, Θ)
定义:
识别框架 $ \Theta $ 是一个包含所有可能假设或状态的集合。例如,在医疗诊断问题中,$ \Theta $ 可能表示所有可能的疾病。例子:
设定识别框架为
$$ \Theta = {A, B} $$作用:
所有 DST 中的计算和推理均基于该框架进行,确保所有可能性都得到考虑。
2. 基本概率赋值函数(Basic Probability Assignment, BPA)
定义:
BPA 函数 $ m: 2^{\Theta} \rightarrow [0,1] $ 为识别框架中每个子集分配概率质量,满足:
$$ m(\emptyset) = 0 $$
$$ \sum_{A \subseteq \Theta} m(A) = 1 $$
作用:
$ m(A) $ 表示对子集 $ A $ 的支持程度,这种支持既不精确指向 $ A $ 内的某个具体假设,也不更细分,从而表达了部分知识和不确定性。
例子:
一个简单的 BPA 可以如下定义:
$$ m({A}) = 0.6 $$
$$ m({B}) = 0.3 $$
$$ m({A, B}) = 0.1 $$
这表示:
- 有 60% 的支持认为命题 $ A $ 成立,
- 有 30% 的支持认为命题 $ B $ 成立,
- 剩下 10% 表示不确定性,支持 $ A $ 或 $ B $ 中某一个成立,但无法确定具体是哪一个。
3. 信任函数(Belief Function, Bel)
定义:
对任意子集 $ A \subseteq \Theta $,信任函数定义为:
$$ Bel(A) = \sum_{B \subseteq A} m(B) $$
作用:
$ Bel(A) $ 表示所有完全支持 $ A $ 的证据之和,是对 $ A $ 的“坚实支持”。
例子:
继续采用上面的 BPA,计算对于子集 $ {A} $ 的信任度:
$$ Bel({A}) = m({A}) = 0.6 $$
而对于全集 $ {A, B} $:
$$ Bel({A, B}) = m({A}) + m({B}) + m({A, B}) = 0.6 + 0.3 + 0.1 = 1.0 $$
4. 可行函数(Plausibility Function, Pl)
定义:
对任意子集 $ A \subseteq \Theta $,可行函数定义为:
$$ Pl(A) = \sum_{B \cap A \neq \emptyset} m(B) $$
同时满足:
$$ Pl(A) = 1 - Bel(\bar{A}) $$
其中 $ \bar{A} $ 是 $ A $ 的补集。
作用:
$ Pl(A) $ 表示与 $ A $ 不冲突的所有证据之和,反映 $ A $ 可能为真的最大支持程度。
例子:
仍然使用上面的 BPA,计算对于子集 $ {A} $ 的可行度:
首先,$ \bar{A} = {B} $,因此,
$$ Bel({B}) = m({B}) = 0.3 $$所以,
$$ Pl({A}) = 1 - 0.3 = 0.7 $$或者直接计算与 $ {A} $ 有交集的子集:
$$ Pl({A}) = m({A}) + m({A, B}) = 0.6 + 0.1 = 0.7 $$
5. Dempster 的组合规则
定义:
当有两个独立来源的证据 $ m_1 $ 和 $ m_2 $ 时,Dempster 的组合规则用于合并这些信息:
$$ m_{12}(A) = \frac{1}{1-K} \sum_{B \cap C = A} m_1(B) , m_2(C) $$
其中,冲突度量 $ K $ 定义为:
$$ K = \sum_{B \cap C = \emptyset} m_1(B) , m_2(C) $$如果 $ K_{12}^{\Theta} $ 越大,说明两个质量函数的冲突越严重,合并的可靠性就越低。
当 $ K_{12}^{\Theta} = 1 $ 时,说明两个质量函数完全矛盾,无法合并。
作用:
该规则通过归一化处理,将来自不同来源的证据合并,同时处理冲突部分,使得合并后的 BPA 满足归一性要求。
6. 冲突度量(Conflict Measure)
定义:
冲突度量用于反映两个质量函数(BPA)之间的不一致程度。以 SRMVEC 方法中的定义为例,两个数据点 $ x_i $ 和 $ x_l $ 之间的置信冲突度量为:
$$
\mathcal{K}^{\Omega}{il} = \sum{\substack{\mathcal{B} \cap \mathcal{C} = \emptyset}} m^{\Omega}_i (\mathcal{B}) \cdot m^{\Omega}_l (\mathcal{C})
$$
其中:
- $ m^{\Omega}_i(\mathcal{B}) $ 和 $ m^{\Omega}_l(\mathcal{C}) $ 分别为数据点 $ x_i $ 和 $ x_l $ 在信念分区下的 BPA。
- 仅计算 $ \mathcal{B} $ 与 $ \mathcal{C} $ 互斥($ \mathcal{B} \cap \mathcal{C} = \emptyset $)的部分。
直观理解:
- 低冲突: 若 $ \mathcal{K}^{\Omega}_{il} $ 值较小,说明两个数据点的 BPA 分布较为一致,它们更可能属于同一类别。
- 高冲突: 若 $ \mathcal{K}^{\Omega}_{il} $ 值较大,表示两个数据点的证据存在较大不一致,可能属于不同类别。
应用:
在聚类、决策支持和多传感器数据融合等领域,冲突度量用于量化和处理不一致信息,从而帮助进行更可靠的推理和决策。
例子:
设识别框架为 $ \Theta = {A, B} $,假设两个证据源的 BPA 如下:
证据 1:
$$ m_1({A}) = 0.7,\quad m_1({B}) = 0.2,\quad m_1({A, B}) = 0.1 $$证据 2:
$$ m_2({A}) = 0.6,\quad m_2({B}) = 0.3,\quad m_2({A, B}) = 0.1 $$
计算冲突度量 $ K $:
不相交的情况有:
$ {A} \cap {B} = \emptyset $:
$$ m_1({A}) \times m_2({B}) = 0.7 \times 0.3 = 0.21 $$$ {B} \cap {A} = \emptyset $:
$$ m_1({B}) \times m_2({A}) = 0.2 \times 0.6 = 0.12 $$
因此,
$$ K = 0.21 + 0.12 = 0.33 $$
计算组合后的 BPA:
- 对于 $ {A} $:
考虑所有 $ B, C $ 满足 $ B \cap C = {A} $: - $ B = {A} $ 与 $ C = {A} $ 得:$ 0.7 \times 0.6 = 0.42 $
- $ B = {A} $ 与 $ C = {A, B} $ 得:$ 0.7 \times 0.1 = 0.07 $
- $ B = {A, B} $ 与 $ C = {A} $ 得:$ 0.1 \times 0.6 = 0.06 $
总和为:$ 0.42 + 0.07 + 0.06 = 0.55 $
归一化因子为 $ 1 - K = 0.67 $,所以
$$ m_{12}({A}) = \frac{0.55}{0.67} \approx 0.82 $$
- 对于 $ {B} $:
考虑满足 $ B \cap C = {B} $ 的组合: - $ B = {B} $ 与 $ C = {B} $ 得:$ 0.2 \times 0.3 = 0.06 $
- $ B = {B} $ 与 $ C = {A, B} $ 得:$ 0.2 \times 0.1 = 0.02 $
- $ B = {A, B} $ 与 $ C = {B} $ 得:$ 0.1 \times 0.3 = 0.03 $
总和为:$ 0.06 + 0.02 + 0.03 = 0.11 $,归一化后,
$$ m_{12}({B}) = \frac{0.11}{0.67} \approx 0.16 $$
- 对于全集 $ {A, B} $:
考虑 $ B = {A, B} $ 与 $ C = {A, B} $:
$ 0.1 \times 0.1 = 0.01 $,归一化后,
$$ m_{12}({A, B}) = \frac{0.01}{0.67} \approx 0.015 $$
组合结果表明:经过两个证据的融合,支持 $ {A} $ 的概率显著提升,反映了两个证据在支持 $ A $ 上的一致性。
总结
Dempster-Shafer 理论通过引入 BPA、信任函数和可行函数,为处理不确定性和模糊性提供了一个灵活的框架。利用 Dempster 的组合规则可以有效地融合来自不同来源的证据,而冲突度量则帮助量化证据之间的不一致性。这些概念为在实际问题中处理不确定性提供了坚实的理论基础。