基于模糊关联规则的汽车评价知识构建及应用

(整期优先)网络出版时间:2018-12-22
/ 2

基于模糊关联规则的汽车评价知识构建及应用

陈雨姚祥杰石胜文吴钟豪

东风柳州汽车有限公司广西柳州545000

摘要:基于模糊概念格和汽车评价知识的融合研讨,在本章中我们对构建汽车评价知识库的一些基本流程进行了解释和说明,并通过实例进行了演示,也对构建过程中对知识库产生影响的相关参数进行了探讨与分析。

关键词:模糊关联;汽车;构建

1前言

利用模糊概念格构建的汽车评价知识库分析概念以及格结构知识与知识间的层次关系。本文运用模糊关联规则格的方法对基于模糊概念格表示的知识库进行改进,将提取规则过程中的部分参数进行重新定义,用于构建汽车评价的关联知识,以补充和完善由模糊概念和格结构表示的知识库。在此基础上,依据模糊关联规则对汽车缺省的评价信息进行推理。

2模糊关联规则的提取

模糊关联规则是将模糊集理论与数据挖掘技术结合,也就是将经典的关联规则扩展到包含模糊属性的事物数据库中,将每个属性的数值指定划分数目,然后将每个属性的数值映射到模糊集合中去,找出支持度分别大于最小支持度的频繁项目集,通过处理这些频繁项目集,产生模糊关联规则,最终得出人们感兴趣的规则形式。模糊关联规则性能的好坏的评价指标与布尔型规则一样,主要是依据支持度和置信度度量,在模糊关联规则中这两项的计算是通过数据项对各属性的隶属度获得。

为了更方便地提取汽车评价的模糊关联规则,进而构建汽车评价的关联知识,须将模糊关联规则、模糊概念格与汽车评价融合。首先,将事物数据库与汽车评价构建的模糊形式背景相对应,在模糊形式背景中,若属性隶属度大于5,则表示该汽车的此属性评价较高,若属性的隶属度小于5,则表示汽车此属性评价较低。通过上述划分,模糊形式背景中的属性可划分为好评和差评两个子属性。据此,模糊概念也可以按照属性隶属度大小将概念中的模糊属性划分为两个类型的子属性。其次,为了便于规则提取,须重新定义模糊概念,使得模糊概念格结点附带内涵属性集的部分统计信息。

依据第1节中的算法从汽车经济性方而的评价知识库中提取模糊关联规则,进而构建关联知识。依据算法中的、tep1,扫描模糊概念格中的每个概念,将概念的模糊内涵中属性划分为好评和差评两个子属性,再利用模糊内涵计算模糊参数E(B)和B,将计算结果添加到模糊概念中,再依据算法标记频繁节点,这些频繁结点实现了对频繁项集的压缩存储,从中提取关联规则,只需将满足阂值及父子关系的结点提出,生成候选二元组就得到相应的模糊关联规则。

上述原来模糊概念与属性项集相对应,当模糊概念规则格结点附带了模糊概念中模糊内涵的统计信息,其结点实现了对项集的压缩存储。对于参数阂值的设定如下:

(1)平均隶属度E表示概念内涵中所有属性的评价的平均好坏程度,不是传统属性属于对象的程度。

(2)偏离程度阂值y反映了概念内涵中所有属性评价好坏的偏离程度,如果该值较大,那么好坏评价的偏差就较大。

(3)支持度和置信度是度量关联规则的基本指标,支持度和置信度越高,产生的规则数量越少。

3.1.1在表1中,概念2中利润的隶属度(0.60563)较高,表示汽车厂商的利润小,其子概念10中费用的隶属度(0.63158)也较高,因此由这两个概念组成的候选二元组提取的关联规则1可以解释为汽车的利润小,则用户承担的费用就低。

3.1.2通过模糊关联规则表示的汽车评价关联知识是模糊性的,其模糊性主要体现在属性的隶属度上,因此模糊关联规则反映的是属性隶属度之间的关联关系,不再是普通关联规则所反映的属性之间的直接关联。再结合汽车评价知识库,库中(表1)模糊概念的属性隶属度表示汽车属性的评价好坏程度,而且隶属度越高评价越高,因此,模糊关联规则反映的是汽车中一些属性的评价好坏程度与另一些属性的评价好坏程度的关联关系。

3.1.3这些规则的兴趣度都在0.66以上比较高,有较高的实际利用价值。因此,可以把得到的模糊关联规则集作为最终的知识集合保留在知识库中,作为规则性知识补充和完善知识库。

3.2基于关联规则的知识推理应用

利用提取的模糊关联规则不仅可以作为知识库中的关联知识,而且还可以用于知识推理。以下是在一个真实语料中用于知识推理的实例。

首先模糊关联规则和汽车评论语料都使用属性隶属度表示,在此基础上,用于汽车评论语料中的知识推理。具体操作:将规则中属性为差评的隶属度赋值为5,属性为好评的隶属度赋值为5,将汽车评论语料转换为相应的模糊形式背景。

其次,利用转换后的模糊关联规则检索汽车评论语料的模糊形式背景。检索结果要求为两种类型的汽车,一种是只含规则前件的汽车,另一种是含有规则前件和后件的汽车。

从汽车评论语料中检索出的同时含有规则前件和后件的汽车数量远远小于只含规则前件的汽车数量。这说明了在汽车评论中存在大量的信息缺省问题。例如,迷迪的一条评论:“养护费用高”,依据规则则可以推理出迷迪汽车的经济性比较差,于是可以补充评论成为:“养护费用高,经济性较差”。因此,通过构造的关联知识规则,可以将汽车评论数据中非完备模糊形式背景完备化。

4结束语:

本文针对由模糊概念格表示的汽车评价知识库,构建了用于汽车评价的模糊关联规则格,从知识库中挖掘了模糊关联规则,这些规则不仅可以作为规则性知识去补充和完善汽车评价知识库,还可以用于知识推理。由于规则的获取结果主要依赖于基于模糊概念格的汽车评价知识库的规模和质量,因此需要将其进行有效的融合和相互指导是我们下一步需要考虑的问题。

参考文献:

[1]郭晓敏.基于模糊概念格的汽车评价知识库构建[D].山西大学,2016.

[2]王素格,郭晓敏,张少霞.基于模糊关联规则的汽车评价知识构建及应用[J].山西大学学报(自然科学版),2016,39(03):423-428.

[3]杨敬锋,薛月菊,胡月明,陈志民,陈强.基于精简模糊分类关联规则的分组模糊判决方法[J].系统工程理论与实践.2008(03)

[4]王宇龙,赖华,余正涛,洪旭东,刘书龙.融合结构和内容特征提取多类型网页文本要素[J].山西大学学报(自然科学版).2016(03)