关键字 不完备模糊信息系统;模糊容差关系;熵
1 引言
,
,
。
粗糙集理论[1,2](Rough Set Theory,RST)是由波兰学者Pawlak于上世纪八十年代初提出的一种处理含糊和不精确性问题的新型数学工具。传统粗集模型的处理对象是具有离散属性值的完备信息系统(Complete Information System,CIS),并且Pawlak所做的工作都是基于这样一个假设,即CIS中的知识是确定的。然而,模糊集的创始人Zadeh告诉我们现实世界中的大部分知识不是精确而是模糊的,因此对于客观存在的模糊信息系统[3,4](Fuzzy Information System,FIS)的研究不仅是必要的,而且相对于CIS的研究来说,具有更为广泛的意义。
不完备模糊信息系统[3] (Incomplete Fuzzy Information System,IFIS)是一种更为复杂的信息系统形式,其中既有模糊知识,又可能存在未知的模糊属性值。由于RST建立在分类机制的基础上,所以对于IFIS,文献[3]首先采用数据补齐方式来处理未知的模糊属性值,然后建立了IFIS中的模糊容差关系(满足自反、对称性[5])以进行对象的模糊分类,并进行了模糊知识的约简研究。文献[3]在IFIS中进行数据补齐时简单地将未知模糊属性值用模糊属性的全体值域来填充,然而经过笔者的研究,发现这种简单的数据补齐方式并不能很完整地刻画对象之间的模糊相似程度。因此,本文中采用了两种不同的数据补齐方式来处理不确定模糊属性值,分别得到对象间相似程度的乐观和悲观估计,从而构成相似度的估计区间,由此建立的新的模糊容差关系实际上是文献[3]中的模糊容差关系的一种推广形式。
本文的主要内容安排如下:第一节简要介绍模糊信息系统中的相关知识;第二节采用两种不同的数据补齐方式处理未知模糊属性值,建立了一种新的模糊容差关系;第三节重新定义了不完备模糊信息系统中模糊知识的粗糙熵,并进行了相关性质的讨论;第四节总结全文。
2 不完备模糊信息系统
定义1 一个模糊信息系统(FIS)为二元组S =〈U,AT 〉,其中U是一个非空有限对象集合,称为论域,U上的模糊子集族记为F(U ),AT为模糊属性集合。
令S为一FIS,对于
,有a:U→Va,Va表示模糊属性a的值域;对于
,a(x)表示x在模糊属性a上的取值,即为Va的一模糊子集;对于
表示x在模糊属性a上取值为v的可能性程度且
。
,有a:U→Va,Va表示模糊属性a的值域;对于
,a(x)表示x在模糊属性a上的取值,即为Va的一模糊子集;对于
表示x在模糊属性a上取值为v的可能性程度且
。 FIS是集值信息系统[6]、完备信息系统[1,2]的拓展形式,若对于
,有
,则FIS就退化为集值信息系统;更进一步地,若有
,则FIS就退化成为完备信息系统,由此可见,FIS是CIS的一种广义化的表现形式。但是,由于FIS中存在的是模糊知识,因此经典粗集理论中的不可分辨关系(等价关系)已不再适用,取而代之的是模糊等价关系或其他更弱的模糊二元关系。
,有
,则FIS就退化为集值信息系统;更进一步地,若有
,则FIS就退化成为完备信息系统,由此可见,FIS是CIS的一种广义化的表现形式。但是,由于FIS中存在的是模糊知识,因此经典粗集理论中的不可分辨关系(等价关系)已不再适用,取而代之的是模糊等价关系或其他更弱的模糊二元关系。 定义2 设S为一FIS,对于
,定义二元模糊关系如下所示:
,定义二元模糊关系如下所示:
, 其中x,y∈U.
关系Ra(x,y)表示对象x与y在模糊属性a上取值的相似程度,对于
,有Ra(x,y)∈[0,1],容易验证Ra满足自反性和对称性,但并不一定满足传递性,因此称Ra为一个模糊容差关系。
,有Ra(x,y)∈[0,1],容易验证Ra满足自反性和对称性,但并不一定满足传递性,因此称Ra为一个模糊容差关系。 命题1 设S为一FIS,对于
,则由模糊属性集合A决定的模糊容差关系记为RA且
,则由模糊属性集合A决定的模糊容差关系记为RA且
,其中x,y∈U.
定义3 设S为一FIS,其中
,对于
,则x基于RA的模糊容差类记为F(a)(x)且
,对于
,则x基于RA的模糊容差类记为F(a)(x)且
在Pawlak所讨论的CIS的基础上,已有很多学者将信息系统的概念进一步拓展,讨论了其中存在未知属性值的情况,这种未知属性值类似于关系数据库系统中的“Null”值,称这种信息系统为不完备信息系统[7~9](Incomplete Information System,简称IIS). 对于IIS,一般来说有2种处理方式[9]:①间接处理,即数据补齐或数据删除,将IIS转化为CIS来处理;②直接处理,对不可分辨关系(等价关系)进行扩展,建立了容差关系、相似关系、限制容差关系等较弱的二元关系。
对于模糊信息系统来说,由于数据测量的误差、对数据理解或获取的限制等原因,也可能存在数据遗漏等不完备、不确定的情况。设S为一FIS,当且仅当至少存在一个不确定值(文中用“*”表示)使得a (x) = *,则称其为不完备模糊信息系统(Incomplete Fuzzy Information System,IFIS).
3 数据补齐方式
在FIS中,我们不能说一个对象是否完全属于一个模糊容差类,而只能称这个对象以何种程度属于某个模糊容差类,因此对于IFIS中的未知模糊属性值,只能采用间接方式进行处理。
定义4 设S为一IFIS,其中a∈AT,对于
,则x与y的乐观相似度表示为RaOPT:
,则x与y的乐观相似度表示为RaOPT:RaOPT (x,y) = Ra (x,y),
其中a (x)= *=> a (x)= Va .
定义4 是文[3]中的模糊分类方法,a (x)= *=> a (x)= Va表示x在模糊属性a上确实有可能取值,只是由于某些原因目前无法取何值,因此假定所取的值为a的值域。关系RaOPT(x,y)表示对象x与y在模糊属性a上的相似程度的最大值。
命题2 设S为一IFIS,其中a∈AT,x,y∈U,若a (x)= *且a (y) ¹*,则
。 证明:根据定义4,因为a (x)= *,所以假设a (x) = Va,那么对于
,就有a (x) (v)∧a (y) (v) = a (y) (v),再由定义2就可以得到
。
,就有a (x) (v)∧a (y) (v) = a (y) (v),再由定义2就可以得到
。 特别地,若a (x)=*且a (y)=*,则RaOPT (x,y)=1。
表1是文用来分析的一个不完备模糊信息系统,其中
a (O7)= b (O3)= c (O3)=*,由定义4,可以得到RaOPT (O2,O7)=1,RaOPT (O2,O3)=1,RaOPT (O2,O3)=1. 然而,若假设a (O7)= 0.1/H+1/N,可以求得O2与O7之间的相似程度为0.3,这个结果与RaOPT差距很大,所以说仅仅用RaOPT并不能客观地表示具有不完备模糊属性值的对象之间的相似程度,于是引入对象间的悲观相似度如定义5所示。
表1 不完备模糊信息系统
| U |
a |
b |
c | ||||||
|
H |
N |
L |
R |
S |
T |
m |
n |
p | |
|
O1 |
1 |
0 |
0 |
0 |
1 |
0 |
1 |
0 |
0.1 |
|
O2 |
1 |
0.3 |
0 |
0 |
1 |
0.4 |
1 |
0.5 |
0 |
|
O3 |
1 |
0 |
0 |
* |
* |
* |
* |
* |
* |
|
O4 |
0 |
1 |
1 |
0 |
0 |
1 |
0 |
1 |
0 |
|
O5 |
0 |
1 |
0 |
1 |
0.6 |
0 |
0.7 |
0 |
1 |
|
O6 |
0.1 |
0.4 |
1 |
1 |
1 |
0 |
1 |
0 |
1 |
|
O7 |
* |
* |
* |
0 |
0 |
1 |
0 |
1 |
0.2 |
|
O8 |
0 |
0.8 |
1 |
0 |
0.7 |
1 |
0.8 |
1 |
0 |
定义5 设S为一IFIS,其中a∈AT,对于"x,y ∈U,则x与y的悲观相似度表示为RaPES:
RaPES (x,y) = Ra (x,y),其中a (x)= *=> a (x)= φ .
在定义5中,我们使用空集来替代“*”,这样做的目的是由于目前的模糊属性值未知,所以就假定这样的模糊属性值是不存在的。
命题3 设S为一IFIS,其中a ∈AT,x,y∈U,若a (x)= *,则对于
,有RaPES(x,y) = 0。
,有RaPES(x,y) = 0。 证明:因为a (x)= *,所以根据定义5,就可以假设a (x)= φ,即
。那么根据定义2就可以得到
,其中v∈Va,所以RaPES(x,y) = 0。
。那么根据定义2就可以得到
,其中v∈Va,所以RaPES(x,y) = 0。 命题3说明了由于未知模糊属性值被认为是不存在的,所以具有未知模糊属性值的对象与其他对象的相似度就为0,即两者之间被认为是不可比的。




