粗糙集简记

2021-09-25 17:35:06 作者：互联网

1、粗糙集基本概念

U：论域
$R = C\cup D$ ：属性集合（这被认为是知识，或者知识库）
V：属性值域：
f：从U x R 到V的信息函数f

一个信息系统S可以表示为一个四元组 $S = \left \{ U, R, V, f \right \}$ 。在不混淆的情况下，简记为 $S = \left \{ U, R \right \}$ ，也成为知识库。

等价关系（通常用来代替分类）是不可或缺的概念，根据等价关系可以划分论域中样本为等价类。而每个等价类被称为同一个对象。等价关系是建立在不可分辨概念之上的。

设 $B\subseteq U$ 为一个非空属性子集，如果 $x_i,x_j\in U$ ， $\forall r\in B$ ，均有 $f(x_i, r) = f(x_j, r)$ 成立，那么，我们称 $x_i$ 和 $x_j$ 关于属性子集B不可分辨。B不可分辨关系，简记为 $Ind(B)$ ，是一种等价关系，可以将论域U中的元素分成若干等价类，每个等价类成为知识库的知识颗粒。全体等价类组成的集合记为 $U / Ind(B)$ ，称之为基本集合。若集合X可以表示成某些基本集的并时，则称X是B精确集，否则称为B粗糙集。

粗糙集中的“粗糙”主要体现在边界域的存在，而边界又是由下、上近似来刻画的。对于任意 $X\subset U$ ，X关于现有知识R的下、上近似分别定义为：
X的确定域 $Pos(X) = \underline{R}(X)$ ，是指论域U中那些在现有知识R之下能够确定地归入集合X的元素的集合；
反之，否定域为 $Neg(X) = U - \overline{R}(X)$ ；
边界域是某种意义上论域的不确定域，即在现有知识R之下U中那些既不能肯定在X中，又不能肯定归入 $\overline{X} = U / X$ 中的元素，记为 $Bnd_k(X) = \overline{R}(X) - \underline{R}(x)$

样本子集X的不确定性程度可以用粗糙度 $\alpha_R(X)$ 来来刻画，粗糙度的定义为： $\alpha_R(X) = \frac{Card(\underline{R}(X))}{Card(\overline{R}(X))}$ ，其中Card表示集合的基数（集合中元素的个数）。显然， $0\leq \alpha_R(X) \leq 1$ ，如果 $\alpha_R(X) = 1$ ，则称集合X关于R是确定的；如果 $\alpha_R(X) < 1$ ，则称集合X关于R是粗糙的， $\alpha_R(X)$ 可认为是在等价关系R下逼近集合X的精度。

与粗糙度类似，在给出了两个知识集（特征属性）的相对肯定域的概念 $Pos_P(Q)$ 之后，我们也可以以一个量来刻画两个知识集的依赖度。
设K =(U ,R)为一个知识库， $P,Q\subseteq R$ 为两个知识集。令 $k = r_P(Q) = Card (Pos _P(Q))/ Card (U)$ ，称为知识Q依赖于知识P的依赖度。特别，当k=1时称为完全依赖；0<k<1时称为部份依赖；k=0时称为Q完全独立于知识P。

2、知识约简

（1）一般约简：是不改变论域中对象的分辨能力的前提下会特征属性集的约简。

（2）相对约简：是不改变决策属性Q的前提下对特征属性集P的约简。考虑一个分类相对于另一个分类的关系，就导出了相对约简与相对核的概念。相对约简的概念是条件属性相对于决策属性的约简

（3）决策表约简的重要内容之一是简化决策表中的条件属性使得约简前后的决策表具有相同的功能。同样的决策可以通过基于更少量的条件，便于我们借助一些简单的手段就能获得同样要求的结果，这是事半功倍的好事。
分辨矩阵：将决策表中关于属性区分的信息浓缩进一个矩阵当中，可用于决策表的属性约简。

因此只要考虑上半或下半三角部分足矣。

决策表：

Ind(C)的等价类称为条件类，Ind(D)的等价类称为决策类。

参考总结：https://wenku.baidu.com/view/b9fb3e619b6648d7c1c74635.html

标签：决策表,知识,约简,粗糙集,简记,论域,集合,属性
来源： https://blog.csdn.net/qq_35255933/article/details/120471662