量化容差关系的进一步研究

(整期优先)网络出版时间:2019-05-03
/ 3
摘 要 对量化容差关系中由于容差度阈值的变化而引起的论域覆盖的粒度、粗糙集的近似精度与粗糙熵、知识的粗糙熵的度量变化进行了讨论。建立了量化容差关系下知识依赖的概念,并探讨了容差度阈值和知识的变化对知识依赖度量的影响。对量化容差关系所产生的覆盖进行修正,以使得新覆盖的任一模块里的任意元素均两两满足量化容差关系,并进行了相关性质的证明。

关键字 粗糙集;量化容差关系;不完备信息系统;熵;知识依赖


1 引言

粗糙集理论[1](Rough Sets Theory,简称RST)是一种用于处理含糊和不精确性问题而又不同于模糊集理论的新型数学工具。 Pawlak提出的RST仅仅适用于所有属性值都已知的完备信息系统,然而现实世界中由于各种原因存在着大量的不完备信息系统(Incomplete Information Systems[2],简称IIS),因此如何使用RST处理IIS正逐渐成为RST研究领域的一个热点问题。使用RST处理IIS,大致可以分为两种方式:1、间接处理,即数据补齐或数据删除方法;2、直接处理,对基于不可分辨关系(等价关系)的RST模型进行扩充。由于间接处理方法会损害到数据的原有分布特征,挖掘出的规则往往带有不确定性,因此使用直接方法处理IIS就具有其独特的优势。

随着理论研究的不断深入,目前已经涌现出了很多扩展RST模型以处理IIS,如容差关系模型[2]、量化容差关系模型[3]、限制容差关系模型[4]、相似关系模型[3]等等。由于量化容差关系是一种推广的容差关系,量化容差类是一个用关于参考元素的容差度作为成员函数的模糊集合,因此文中主要围绕量化容差关系在RST中的若干问题进行讨论。

2 量化容差关系

2.1 容差关系

一个IIS是一个二元组: 955118902.jpg,其中 U 是一个被称为论域的非空有限的对象集合;AT是一个非空有限的属性集合。

对于任意 a∈AT,有 a:U→Va,其中Va 是属性 a 的值域(可包含空值,文中用〝*〞表示);V 为全体属性值域,即 955112793.jpg;定义 f为信息函数,对于955115671.jpg,有 f(x,a)∈Va.

定义1.1 令S为一IIS,属性集合955112761.jpg,则由 A 决定的容差关系如下表示:

955116194.jpg

2.2 量化容差关系

量化容差关系是容差关系的推广,在容差关系中加入了描述对象之间的相似程度这一参考因素。

令S 为一IIS,其中 955116164.jpg.假设对于955112318.jpg , x 在属性 a 上取值的概率为955115041.jpg( 表示集合Va 的基数).

定义1.2 令S为一IIS,对于955115196.jpg ,x,y 在属性集合 955112761.jpg上取等值的概率(容差度)为 955116000.jpg

其中955113753.jpg表示x,y在属性a上取等值的概率,其取值如下所示:

955112285.jpg

定义1.3 令S 为一IIS,955112761.jpg ,容差度阈值 λ∈[0,1],则量化容差关系955125343.jpg 定义如下:

955126144.jpg

若假定容差度为1,量化容差关系就退化成定义1.1中的容差关系。

定义1.4 令S 为一IIS, 955112761.jpg,容差度阈值λ∈[0,1],对于 955122317.jpg, x关于955121563.jpg 的量化容差类 955121698.jpg定义为:955129547.jpg

.

一般来说,在IIS中,量化容差关系对于论域构成了一个覆盖而非划分,若令 955125605.jpg表示覆盖,则955125491.jpg.

3 基本概念

a) 近似精度及粗糙熵

定义2.1 令 S为一IIS,955112761.jpg ,容差度阈值 λ∈[0,1],对于 955112318.jpg, X关于955121563.jpg 的上、下近似集合可表示为 955127111.jpg955127343.jpg,其中

95512744.jpg

定理2.1 令 S为一IIS,属性集合955112761.jpg ,若容差度阈值 λ1,λ2∈[0,1],且955127589.jpg,则

95512238.jpg

证明:对于955112318.jpg ,因为955127589.jpg ,所以 955123802.jpg.若 955122216.jpg,则必定有955126286.jpg ;反之则不一定成立。所以 95512517.jpg.同理可以证得955135373.jpg .

定理2.1说明粗糙集合的下近似集随着容差度阈值的减小而不断减小,上近似集却随着容差度阈值的减小而不断增大。

定义2.2 令 S为一IIS, 955112761.jpg955132735.jpg ,容差度阈值 λ∈[0,1],则 X关于 955121563.jpg的近似精度955134200.jpg ,粗糙性 955133626.jpg分别如下所示:

955139247.jpg

定理2.2 令 S为一IIS,属性集合 955112761.jpg,容差度阈值 λ1,λ2∈[0,1]且 955127589.jpg,则对于 955135003.jpg,有 955132911.jpg.

证明:利用定理2.1的结果,易证。

定理2.2说明随着容差度阈值的减小,粗糙集合的近似精度在不断减小,粗糙性在不断增大。

定义2.3 令S 为一IIS,属性集合 955112761.jpg,容差度阈值 λ∈[0,1],则知识A 的粗糙熵 955137273.jpg定义为:955139665.jpg

定理2.3 令 S为一IIS, 955112761.jpg,若容差度阈值λ1,λ2∈[0,1]且 955127589.jpg,则955137473.jpg .

证明:对于955112318.jpg ,因为 955127589.jpg,所以 955132482.jpg.于是可以得到不等式

955133398.jpg.

扩充这个不等式就可以得到955137473.jpg .

为了对粗糙集的不确定性进行更为精确的测量,已有学者开始研究各种不同的粗糙集的粗糙熵[5]。根据量化容差关系,可以定义如下两种不同形式的粗糙集的粗糙熵。

定义2.4 令 S为一IIS,属性集合 955112761.jpg,容差度阈值λ∈[0,1],对于 955135003.jpg, X关于知识A 的粗糙熵955138790.jpg 定义为:

95514168.jpg

定理2.4 令 S为一IIS,属性集合 955112761.jpg,若容差度阈值 λ1,λ2∈[0,1]且 955127589.jpg,则对于955135003.jpg955141898.jpg .

证明:利用定理2.2及2.3的结果,易证。

作为一种特殊的容差关系,量化容差关系当然也满足容差关系下的一些性质,如定理2.5所示。

定理2.5 令 为一IIS,属性集合 955148197.jpg,若容差度阈值λ∈[0,1],则955141913.jpg955149798.jpg955148419.jpg955147600.jpg.

b) 知识依赖

利用对象的分类,可以方便地研究两个不同属性子集,即知识之间的依赖关系[6]

定义2.5 令 S为一IIS,容差度阈值 λ1,λ2∈[0,1],属性集合 B对于属性集合A 的依赖关系表示为955149301.jpg ,当且仅当对于 955143340.jpg,若955143180.jpg ,则必定有 955149669.jpg.

定义2.6 令 S为一IIS,容差度阈值λ1,λ2∈[0,1],则知识 A与B 之间存在等价依赖 955146543.jpg当且仅当 955143763.jpg955147956.jpg .

知识的部分依赖表示知识之间的推理可以是部分的,换言之,只有部分关于B 的知识可以从 A推导出来。知识的部分依赖一般用知识的正区域来表示。

定义2.7 令 S为一IIS,955149695.jpg ,容差度阈值 λ1,λ2∈[0,1],则知识 A对于知识 B的正区域955145892.jpg 表示为:

955149938.jpg

.

定义2.8 令 S为一IIS,955149695.jpg ,容差度阈值 λ1,λ2∈[0,1],知识 B以程度 k依赖于知识 A,表示为 955148760.jpg,其中 955142225.jpg.

当k=0 时,知识依赖表示为 955152857.jpg;当k=1 时,知识依赖表示为955157262.jpg .

定理2.6 令 S为一IIS,955149695.jpg ,容差度阈值λ123∈[0,1]且955127589.jpg,如果有知识依赖 955155156.jpg955157152.jpg,那么 955159478.jpg.

证明:对于955151931.jpg ,根据定理2.1,因为 955153159.jpg,所以 955153098.jpg,即 955154283.jpg.所以 955159478.jpg.

定理2.6说明随着知识依赖的被依赖部分的容差度阈值逐渐减少,依赖部分对于被依赖部分的依赖程度逐渐减小。

定理2.7 令 S为一IIS,955149695.jpg ,容差度阈值λ123∈[0,1]且955184619.jpg,如

转贴于 中国论文下载中心 http://www.studa.net果有知识依赖955183490.jpg955185665.jpg,那么 955189655.jpg.

证明:对于 955112318.jpg,因为 955184619.jpg,所以 955182979.jpg.

对于955182482.jpg ,若 955215225.jpg,则 955215114.jpg,反之则不一定成立,所以955215465.jpg ,即 955189655.jpg.

定理2.7说明随着知识依赖的依赖部分的容差度阈值逐渐减少,依赖部分对于被依赖部分的依赖程度逐渐增大。

定理2.8 令 S为一IIS,若 955148197.jpg且容差度阈值λ∈[0,1],则有知识依赖955223260.jpg .

证明:对于 955143340.jpg,若 955228622.jpg,则 955223311.jpg.因为 955148197.jpg,所以 95522397.jpg,即 955225703.jpg.满足定义2.5,所以 955223260.jpg.

定理2.9 令 S为一IIS, 955225179.jpg,容差度阈值λ1,λ2∈[0,1],如果有知识依赖 955229915.jpg,那么 955189655.jpg.

证明:对于 955143340.jpg,若 955221770.jpg,则 955221561.jpg,即955224757.jpg .对于955226840.jpg ,可以得到955227448.jpg ,于是有955229420.jpg,即955189655.jpg .

定理2.10 令 S为一IIS,955225179.jpg ,容差度阈值λ1,λ2∈[0,1],如果有知识依赖 955233726.jpg955237085.jpg,那么 955159478.jpg.

证明:类似于定理2.9的证明,对于 955236612.jpg,有955235561.jpg .

对于955237801.jpg ,若 95523689.jpg,则 955232577.jpg,反之则不一定,所以955237142.jpg ,即 955159478.jpg.

4 基于量化容差关系的覆盖

1) 覆盖粒度

定义3.1 在一IIS中,955232973.jpg , 分别为论域 U 的两种不同覆盖,若对于955237396.jpg ,必定95523168.jpg 使得 955238109.jpg,并且对于 955242387.jpg,必定 955244616.jpg使得 955244623.jpg,则称覆盖 955248893.jpg比覆盖 9552477.jpg更为精细,或者说9552477.jpg955248893.jpg更为粗糙,表示为 955248893.jpg<9552477.jpg.

定理3.1 令 S为一IIS, 955112761.jpg,若容差度阈值 λ1,λ2∈[0,1]且 955127589.jpg,则 955241594.jpg<955247645.jpg.

证明:对于 955236612.jpg,因为 955127589.jpg,所以955249370.jpg .满足定义3.1,所以 955241194.jpg.

定理3.2 令 S为一IIS,容差度阈值λ∈[0,1],若 955148197.jpg,则 95524469.jpg.

证明:对于 955143340.jpg,因为 955148197.jpg,所以 955249544.jpg,即 955241782.jpg,满足定义3.1,所以955254082.jpg<955257023.jpg

定理3.1和3.2说明在量化容差关系下,随着容差度阈值的减小,覆盖的精细程度也在不断地减小;随着知识的不断增加,覆盖的精细程度不断地增大。

2) 覆盖修正

955258045.jpg,由定义1.4可知, 955257318.jpg中的所有元素都只是与 x之间存在量化容差关系,而对于 955256859.jpg,并不一定能保证 m,n之间也存在着量化容差关系。因此有必要重新定义由量化容差关系所产生的论域覆盖,以保证覆盖中任一模块中的任意两个元素之间都具有量化容差关系。

定义3.2 令 S为一IIS,属性集合 955112761.jpg,容差度阈值 λ∈[0,1],则论域的覆盖955259506.jpg 表示如下:

955256979.jpg

.

3) 相关性质

定理3.3 令 S为一IIS,属性集合 955112761.jpg,容差度阈值λ∈[0,1],则

95525295.jpg

证明:(1)对于 955255991.jpg,有955255205.jpg ,于是 955253028.jpg,使得 9552538.jpg.所以955256951.jpg.

又因为 y为 955254260.jpg中任意取得,所以

955252554.jpg

(2)对于 955253883.jpg,必定 95525640.jpg使得 9552538.jpg955257342.jpg.而此时根据量化容差类的定义,有955255888.jpg .又因为 y为 955258015.jpg中任意取得,所以有95525213.jpg 综合(1)(2),定理得证。

由定理3.3可得看出,覆盖955262261.jpg 相比于覆盖 955267071.jpg更为精细,即 955269146.jpg.

定理3.4 令 S为一IIS,955112761.jpg ,容差度阈值λ1,λ2∈[0,1]且 955127589.jpg,则对于955262446.jpg ,必定 955262119.jpg,使得 955261579.jpg.

证明:对于 955262446.jpg,令 9552538.jpg,则 955264444.jpg,因为 955267203.jpg,所以 955269957.jpg,即必定有955265474.jpg 使得 955266962.jpg.因为 x,y为 M中任意取得,所以 95526258.jpg.

定理3.5 令 S为一IIS, 955148197.jpg,容差度阈值 λ∈[0,1],对于 955261408.jpg,必定 95526250.jpg,使得 955269636.jpg.

证明:对于 955268111.jpg,令9552538.jpg ,则 955273526.jpg.因为 955148197.jpg,所以 955279106.jpg,即必定存在955278151.jpg 使得 955276059.jpg.因为 x,y为 M中任意取得,所以95526258.jpg .

定义3.3 令 S为一IIS, 955112761.jpg,容差度阈值λ∈[0,1],对于955293548.jpg ,论域覆盖为

955291073.jpg,X 的上、下近似集合可表示为955292936.jpg ,其中

955308406.jpg

定理3.6 955305686.jpg, .

证明:(1)令 955302151.jpg,则 955309722.jpg95530483.jpg.根据定理3.3,必定 955304656.jpg,使得 955302147.jpg且M∩X≠Φ ,即955301515.jpg .所以 955302266.jpg.

95530325.jpg,则955304586.jpg 使得x∈M 且M∩X≠Φ .由定理3.3可知, 955308360.jpg,即 955309722.jpg95530483.jpg955307574.jpg .所以 955306567.jpg.

(2)令 955308110.jpg,则 955304789.jpg.由定理3.3,对于 95530204.jpg且 x∈M,必定 955309481.jpg,即 955309457.jpg.所以 955302974.jpg.

5 结束语

作为一种RST扩展模型以便于直接处理IIS,量化容差关系用容差度描述对象之间的相似程度,是容差关系的进一步拓展。

本文对基于量化容差关系的RST中的一些基本概念,如覆盖的精细程度、粗糙集的近似精度、粗糙熵、知识的粗糙熵以及函数依赖进行了讨论,研究了容差度阈值的变化对这些概念的度量的影响。分析了由量化容差关系产生的论域的覆盖,发现在这个覆盖里,任一模块中的元素都只是与模块的生成元素存在量化容差关系,于是重新定义了基于量化容差关系的覆盖,使得任一模块中的任意两个元素之间都具有量化容差关系,并联系原有覆盖进行了相关性质的讨论。

参考文献

[1] Pawlak. Z. Rough sets and intelligent data analysis[J]. Journal of Information Sciences. 2002,(147) :1-12

[2] Kryszkiewicz. M. Rough set approach to incomplete information systems[J]. Journal of Information Sciences. 1998,(112) :39-49

[3] Jerzy. Stefanowski. Incomplete information tables and rough classification[J]. Journal of Computational Intelligence. 2001,(17) :545-566

[4] 王国胤. Rough集理论不完备信息系统中的扩充. 计算机研究与发展. 2002,39(10):1238-1243

[5] Qiang Li,Jianhua Li,Xiang Li,and Shenghong Li. Evaluation incompleteness of knowledge in data mining[J]. Springer-Verlag,LNCS(3309). 2004,278-284

[6] D.A.Bell,J.W.Guan. Computational methods for rough classification and discovery[J]. Journal of the American Society for Information Science. 1998,(49) :403-414