模糊规则生成方法及装置与流程

文档序号:13615462阅读:528来源:国知局
本发明涉及数据处理
技术领域
:,具体而言,涉及一种模糊规则生成方法及装置。
背景技术
::决策粗糙集dtrs(decision-theoreticroughset,dtrs)理论由加拿大regina大学的yao教授于20世纪90年代初提出的一种粗糙集理论与方法。该理论在经典粗糙集rs(roughset,rs)中引入了概率包含关系,并通过bayes风险决策方法确定概念边界,建立了具有噪声容忍机制的粗糙集正域、负域及边界域模型,该模型在数据分析、机器学习、图形处理等领域取得了较成功应用。虽然dtrs模型扩展了经典粗糙集模型,然而,dtrs仍然具有局限性。首先,在数据表达上,dtrs模型仍以不分明关系形成的等价类为基础,因此,它所涉及的概念和知识都是清晰的。在实际问题中,也会涉及到一些模糊概念和模糊知识,如在决策表中,条件属性“气温”可取模糊语言变量冷、温和、热、微热与极热等。在粗糙集模型中表现为:或者知识库的知识是清晰的而被近似的概念是模糊的,或者知识库的知识和被近似的概念都是模糊的。这两种情况,dtrs模型都难以有效处理。技术实现要素:本发明的目的在于提供一种模糊规则生成方法及装置,以改善dtrs模型存在的上述问题。为了实现上述目的,本发明采取的技术方案如下:第一方面,本发明实施例提供了一种模糊规则生成方法,所述方法包括获取模糊决策表,所述模糊决策表包括非空有限对象集合、非空有限条件属性集和非空有限决策属性;基于所述模糊决策表,建立fdtrs模型,基于所述fdtrs模型及预设的风险损失值,获得所述模糊决策表中的正域、负域与边界域,再获得所述非空有限条件属性集中每个条件属性相对于决策属性的近似分类精度;基于所述每个条件属性相对于决策属性的近似分类精度,获得所述模糊决策表中的属性约简集;基于所述属性约简集、所述非空有限对象集合、所述非空有限决策属性及预设的计算规则,计算所述属性约简集中每个条件属性的模糊语言变量相对于决策属性的分类值;若所述分类值不小于预设阈值,生成模糊规则。第二方面,本发明实施例提供了一种模糊规则生成装置,所述装置包括获取单元、分类精度获得单元、属性约简集获得单元、计算单元和生成单元。获取单元,用于获取模糊决策表,所述模糊决策表包括非空有限对象集合、非空有限条件属性集和非空有限决策属性。分类精度获得单元,用于基于所述模糊决策表,建立fdtrs模型,基于所述fdtrs模型及预设的风险损失值,获得所述模糊决策表中的正域、负域与边界域,再获得所述非空有限条件属性集中每个条件属性相对于决策属性的近似分类精度。属性约简集获得单元,用于基于所述每个条件属性相对于决策属性的近似分类精度,获得所述模糊决策表中的属性约简集。计算单元,用于基于所述属性约简集、所述非空有限对象集合、所述非空有限决策属性及预设的计算规则,计算所述属性约简集中每个条件属性的模糊语言变量相对于决策属性的分类值。生成单元,用于若所述分类值不小于预设阈值,生成模糊规则。本发明实施例提供了一种模糊规则生成方法及装置,获取模糊决策表,所述模糊决策表包括非空有限对象集合、非空有限条件属性集和非空有限决策属性;再基于所述模糊决策表,建立fdtrs模型,基于所述fdtrs模型及预设的风险损失值,获得所述模糊决策表中的正域、负域与边界域,再获得所述非空有限条件属性集中每个条件属性相对于决策属性的近似分类精度;然后基于所述每个条件属性相对于决策属性的近似分类精度,获得所述模糊决策表中的属性约简集;基于所述属性约简集、所述非空有限对象集合、所述非空有限决策属性及预设的计算规则,计算所述属性约简集中每个条件属性的模糊语言变量相对于决策属性的分类值;若所述分类值不小于预设阈值,生成模糊规则。实践表明,本发明生成的模糊规则准确、有效。本发明的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明实施例了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。附图说明为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1为一种可应用于本发明实施例中的电子设备的结构框图;图2为本发明实施例提供的模糊规则生成方法的流程图;图3为本发明实施例提供的dtrs、rs、fdtrs模型在相同数据集上准确率的对比示意图;图4为本发明实施例提供的模糊规则生成装置的结构框图。具体实施方式为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。应注意到:相似的标号、字母和描述在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。图1示出了一种可应用于本发明实施例中的电子设备100的结构框图。如图1所示,电子设备100可以包括存储器102、存储控制器104、一个或多个(图1中仅示出一个)处理器106、外设接口108、输入输出模块110、音频模块112、显示模块114、射频模块116和模糊规则生成装置。存储器102、存储控制器104、处理器106、外设接口108、输入输出模块110、音频模块112、显示模块114、射频模块116各元件之间直接或间接地电连接,以实现数据的传输或交互。例如,这些元件之间可以通过一条或多条通讯总线或信号总线实现电连接。模糊规则生成方法分别包括至少一个可以以软件或固件(firmware)的形式存储于存储器102中的软件功能模块,例如所述模糊规则生成装置包括的软件功能模块或计算机程序。存储器102可以存储各种软件程序以及模块,如本申请实施例提供的模糊规则生成方法及装置对应的程序指令/模块。处理器106通过运行存储在存储器102中的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现本申请实施例中的模糊规则生成方法。存储器102可以包括但不限于随机存取存储器(randomaccessmemory,ram),只读存储器(readonlymemory,rom),可编程只读存储器(programmableread-onlymemory,prom),可擦除只读存储器(erasableprogrammableread-onlymemory,eprom),电可擦除只读存储器(electricerasableprogrammableread-onlymemory,eeprom)等。处理器106可以是一种集成电路芯片,具有信号处理能力。上述处理器可以是通用处理器,包括中央处理器(centralprocessingunit,简称cpu)、网络处理器(networkprocessor,简称np)等;还可以是数字信号处理器(dsp)、专用集成电路(asic)、现成可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。其可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。所述外设接口108将各种输入/输入装置耦合至处理器106以及存储器102。在一些实施例中,外设接口108、处理器106以及存储控制器104可以在单个芯片中实现。在其他一些实例中,他们可以分别由独立的芯片实现。输入输出模块110用于提供给用户输入数据实现用户与电子设备100的交互。所述输入输出模块110可以是,但不限于,鼠标和键盘等。音频模块112向用户提供音频接口,其可包括一个或多个麦克风、一个或者多个扬声器以及音频电路。显示模块114在电子设备100与用户之间提供一个交互界面(例如用户操作界面)或用于显示图像数据给用户参考。在本实施例中,所述显示模块114可以是液晶显示器或触控显示器。若为触控显示器,其可为支持单点和多点触控操作的电容式触控屏或电阻式触控屏等。支持单点和多点触控操作是指触控显示器能感应到来自该触控显示器上一个或多个位置处同时产生的触控操作,并将该感应到的触控操作交由处理器106进行计算和处理。射频模块116用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通信网络或者其他设备进行通信。可以理解,图1所示的结构仅为示意,电子设备100还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。于本发明实施例中,电子设备100可以作为用户终端,或者作为服务器。用户终端可以为pc(personalcomputer)电脑、平板电脑、手机、笔记本电脑、智能电视、机顶盒、车载终端等终端设备。请参阅图2,本发明实施例提供了一种模糊规则方法,所述方法可以包括步骤s200、步骤s210、步骤s220、步骤s230和步骤s240。步骤s200:获取模糊决策表,所述模糊决策表包括非空有限对象集合、非空有限条件属性集和非空有限决策属性。在本实施例中,阐述dtrs模型,在dtrs模型中,用状态集即ω={x,xc}表示具有互补关系的两种状态,动作集即a={ap,an,ab}分别表示划分当前对象到正域pos(x),负域neg(x)和边界域bnd(x)的动作,即ap表示当前对象x∈pos(x)的动作;an表示当前对象x∈neg(x)的动作;ab表示当前对象x∈bnd(x)的动作。用λ(aip|x∈x)当前对象x∈x时,执行动作ai引起的损失;用λ(ain|x∈xc)当前对象x∈xc时,执行动作ai引起的损失。进行三种不同活动的损失为:r(ap|[x])=λppp(x|[x])+λpnp(xc|[x])、r(an|[x])=λnpp(x|[x])+λnnp(xc|[x])、r(ab|[x])=λbpp(x|[x])+λbnp(xc|[x]),其中,p(x|[x])和p(xc|[x])分别表示x∈[x]属于x与xc的概率,与之对应的损失函数分别为λip=λ(aip|x)、λin=λ(ain|xc),i=p,n,b表示三种动作。例如,λpp表示将一个对象x∈a划分到pos(a)的损失函数。根据bayes决策过程得到以下的最小风险决策规则(p)~(b):(p)若r(ap|[x])≤r(an|[x])且r(ap|[x])≤r(ab|[x]),则x∈posπ(x);(n)若r(an|[x])≤r(ap|[x])且r(an|[x])≤r(ab|[x]),则x∈negπ(x);(b)若r(ab|[x])≤r(ap|[x])且r(ab|[x])≤r(an|[x]),则x∈bndπ(x)。因此,每个对象就确定地分到这三个区域之一。因为p(x|[x])+p(xc|[x])=1,可以将规则简化为,将[x]中任意一个对象分类只依赖于p(x|[x])和损失函数为λij(i=p,n,b,j=p,n),通常损失函数满足λpp≤λbp≤λnp和λnn≤λbn≤λpn,其实际意义是对于实际属于x的对象x,将其划分到x的正区域所带来的风险要小于或等于将其划分到边界域带来的风险。这两者的风险都小于将其划分到x的负区域所带来的风险。同理,对于不属于x的对象x,将其划分到x的负区域所带来的风险要小于或等于将其划分到边界域所带来的风险。这两者的风险都小于将其划分到x的正区域所带来的风险。对于这种类型的损失函数,以上的最小风险决策规则(p)~(b)可以分别改写成规则(1)、(2)和(3)。(p)若p(x|[x])≥γ且p(x|[x])≥α,则x∈pos(x)(1)(n)若p(x|[x])≤β且p(x|[x])≤β,则x∈neg(x)(2)(b)若β<p(x|[x])<α,则x∈bnd(x)(3)规则(1)、(2)和(3)中,有:由条件λpp≤λbp≤λnp和λnn≤λbn≤λpn,公式(4)、(5)和(6),可知,α∈(0,1],β∈(0,1],γ∈(0,1]。可见,决策规则(p)~(b)可以通过参数α,β,γ来确定,而这些参数可以由上述公式(4)、(5)、(6)和用户给出的风险损失值λij计算得到。从以上dtrs模型中可以看出:dtrs模型以不分明关系形成的等价类为基础,所涉及的概念和知识仍是清晰的。为了让dtrs模型能有效处理决策表中的模糊知识,本发明实施例提供了一种模糊规则生成方法,即基于fdtrs模型(fuzzydecision-theoreticroughset,fdtrs)的规则生成方法。首先,引入模糊决策表fdt(fuzzydecisiontable,fdt)的定义。定义1(模糊决策表fdt):模糊信息表fit(fuzzyinformationtable,fit)定义为:fit=(u,at),u是非空有限对象集合,也称论域;at为非空有限属性集合,对任意的bi∈at,其中表示bi的值域,可以表示为一个模糊语言术语集合且对任意的是定义在论域u上的一个模糊子集;对任意的x∈u,bi(x)是定义在上的模糊子集,它可以表示成:其中,表示x在上的隶属度。如果at=c∪{d},c和d分别称为条件属性集和决策属性,此模糊信息表称为模糊决策表fdt。dtrs模型以不分明关系对论域的划分形成的等价类为前提,fdtrs模型则以模糊不分明关系对论域的模糊划分为基础。进一步地,定义2(模糊划分):设集合簇是定义在论域u上的模糊集,若满足条件(7),称为p论域u上的一个模糊划分:定义3(模糊不分明关系):给定模糊信息表fit=(u,at),b∈at,b上的一个模糊不分明关系fu-ind(fuzzyindiscernibilityrelation,fu-ind),定义如下:(8)中,称fu-ind(b)(xi,xj)为xi,xj在属性b上的模糊不分明度。则对任意的b上的一个模糊不分明关系fu-ind(b)定义如下:(9)中,称fu-ind(b)(xi,xj)为xi,xj在属性b上的模糊不分明度。fu-ind(b)(.,.)的值域为[0,1],是论域u上的模糊集,满足自反性,对称性。因此,模糊不分明关系是一种模糊相似关系。设τij=fu-ind(b)(xi,xj),则模糊不分明关系fu-ind(b)可用矩阵表示如下:为了后续描述方便,记θb(xi)表示与xi有模糊不分明关系fu-ind(b)的模糊类,它可以用模糊集合表示为:θb(xi)=τi1/x1+τi2/x2+...+τi|u|/x|u|(11)定理1:给定模糊信息表fis=(u,at),则fu-ind(b)构成了论域u上的一个模糊划分。证明:令由(10)式知:在中,总存在k,使τik=1,于是有成立;另一方面,对任意的x∈u,有成立,于是对任意的i,r,设如果i≠r,则由定义2知,结论成立。基于以上,首先分析论域上的对象x在特定模糊知识空间上包含于集合的程度,然后给出fdtrs模型的表示方法。定义4(包含度):给定模糊信息表fit=(u,at),对任意的和在属性子集b上,给定对象x(x∈u),xi包含于x的程度σb(x,x)定义为:(12)式中,i(θb(x),x)表示模糊集θb(x)蕴涵于x的程度,在本实施例中,i(θb(x),x)由下面的条件概率定义:定理2:给定模糊信息表fit=(u,at),如果模糊不分明关系fu-ind(b)退化为一个不分明关系,则对任意的y∈u/fu-ind(b),对任意的x∈y,证明:在fit中,如果模糊不分明关系fu-ind(b)退化为一个不分明关系,很显然,对任意的xi,xj∈u,有xi,xj∈u=0或1成立。即在公式(10)中,则有τij=0或1(j=1,2,...,|u|),于是使τij=1的对象xj构成了在不分明关系fu-ind(b)上的等价类,由公式(12)得:进一步地,由公式(13)得:很显然,与x处于同一等价类y的对象来说,均有上式成立。定理2说明:如果模糊不分明关系fu-ind(b)退化为一个不分明关系,则定义4中的包含度退化为dtrs模型中的x∈[x]属于x的概率p(x|[x])。定义5(fdtrs模型):给定模糊信息表fit=(u,at),对任意的和对任意的x∈u,最小风险决策规则(p)~(b)定义如下:(p)若σb(x,x)≥γ且σb(x,x)≥α,则x∈posb(x)(14)(n)若σb(x,x)≤β且σb(x,x)≤γ,则x∈negb(x)(15)(b)若β<σb(x,x)<α,则x∈bndb(x)(16)(14)、(15)和(16)中α,β,γ的物理含义如上述(4)、(5)、(6)定义,且α∈(0,1],β∈(0,1],γ∈(0,1]。损失函数满足关系(λpn-λbn)(λnp-λbp)>(λbp-λpp)(λbn-λnn)。根据公式(4)、(5)、(6),可以得到α>β与α>γ>β。于是,定义5可以重新定义如下:定义6:给定模糊信息系统fit=(u,at),对任意的和对任意的x∈u,最小风险决策规则(p)~(b)定义如下:(p)若σb(x,x)≥α,则(n)若σb(x,x)≤β,则(b)若β<σb(x,x)<α,则定义5或定义6中的数学模型,根据风险损失值,建立模糊信息表中正域、负域与边界域的计算方法,称为fdtrs模型。定义7(近似分类精度):给定模糊决策表fdt=(u,c∪{d}),对任意的b∈c,则属性b相对于决策d的α正域的近似分类精度定义为:同理,对于任意的则属性集b相对于决策d的α正域的近似分类精度定义为:定义8(属性约简):给定模糊决策表fdt=(u,c∪{d}),对任意的如果满足以下条件:(1)近似分类精度非减性:即(2)属性独立性:即称b是c中相对于决策d的一个α约简。定义8指出了属性集即c的一个最小属性子集即b对决策d的α-近似分类精度不小于属性集c对决策d的α-近似分类精度。步骤s210:基于所述模糊决策表,建立fdtrs模型,基于所述fdtrs模型及预设的风险损失值,获得所述模糊决策表中的正域、负域与边界域,再获得所述非空有限条件属性集中每个条件属性相对于决策属性的近似分类精度。进一步地,基于获得所述非空有限条件属性集中条件属性b相对于决策属性d的近似分类精度,fdt=(u,c∪{d})为所述模糊决策表,u为所述非空有限对象集合,c为所述非空有限条件属性集,b∈c,b为所述非空有限条件属性集中的一个条件属性,{d}为所述决策属性,为条件属性b对决策属性d的α正域中对象个数,α由所述fdtrs模型中风险损失值计算而得,x为决策属性d对u划分形成的等价类。步骤s220:基于所述每个条件属性相对于决策属性的近似分类精度,获得所述模糊决策表中的属性约简集。进一步地,按照所述定义7,按照所述每个条件属性的近似分类精度的大小,将所有条件属性的近似分类精度从大到小排列,获得排序后的待处理条件属性集p;当时,重复如下循环体:令p为p中第一个属性,使redu=redu∪{p},计算p=p-{p};检测redu中的条件属性b,若b满足则redu=redu-{b},重复本步骤,获得所述模糊决策表中的属性约简集redu;其中,redu表示属性约简集,redu的初始值置为空集,为redu相对于决策属性d中的α正域近似分类精度,为所述非空有限条件属性集c对所述非空有限决策属性d的α正域近似分类精度。p表示排序后的待处理条件属性集。具体地,属性约简arfdtrs(attributereductionbasedonfdtrs)方法如下:模糊决策表fdt=(u,c∪{d}),由专家经验确定bayes风险损失值λij(i=p,n,b,j=p,n);根据公式(4),计算得α;根据公式(17),计算根据定义7,计算令初始约简集为redu,其初始集合为根据定义(7)计算近似分类精度按条件属性的近似分类精度由大到小排列所有条件属性,令排序后的条件属性集为p;当时,重复如下循环体:令p为p中第一个属性,使redu=redu∪{p},计算p=p-{p};当检测到初始约简集redu不满足定义8中独立性条件时,重复如下循环体:对所有b∈redu,若则redu=redu-{b}。最终获得的redu即所述模糊决策表中的属性约简集。步骤s230:基于所述属性约简集、所述非空有限对象集合、所述非空有限决策属性及预设的计算规则,计算所述属性约简集中每个条件属性的模糊语言变量相对于决策属性的分类值。所述预设的计算规则为进一步地,基于计算所述属性约简集中每个属性约简的决策值,xi为所述非空有限对象集合中的第i个对象,xi∈u,dk∈u/{d}={d1,d2,...,dm},k=1,2…m,每个属性约简对应有每个对每个fν∈f,获得每个属性约简的隶属度值,为所述每个属性约简的隶属度值,proposition[k]为每个属性约简的决策值。进一步地,基于获得每个属性约简的隶属度值。步骤s240:若所述分类值不小于预设阈值,生成模糊规则。具体地,定义rgfdtrs(rulegenerationbasedonfdtrs)方法如下:输入fdt=(u,c∪{d})的属性约简集为redu,预设阈值为计算u/{d},设u/{d}={d1,d2,...,dm};令fdt的分类规则集即ruleset,初始化对任意的xi∈u,令依次选取redu中一个属性b,令对每个对每个fν∈f,计算计算各隶属度值在决策类d1,d2,...,dm上所占的比例,即如果存在fκ,dj,使则产生成模糊规则:ruleset←ruleset∪{b=fκ→d=dj},模糊规则的可信度为proposition[k],令f=f\{fκ},否则把fκ加入到fν;redu=redu-{b},直到输出ruleset,即生成模糊规则。为了更进一步地说明本发明实施例提供的基于fdtrs模型的模糊规则生成的有益效果,以pima糖尿病数据集(样本数:768,条件属性集c的个数为8,决策d的个数为2)为例进行说明。设pima糖尿病数据集的条件属性集c为{c0,c1,c2,c3,c4,c5,c6,c7},c0,c1,c2,c3,c4,c5,c6,c7的含义分别表示“怀孕次数”、“口服葡萄糖2小时后血糖浓度”、“舒张压(mmhg)”、“肱三头肌皱褶厚度(mm)”、“2小时血清胰岛素(mu/ml)”、“体重(kg)/身高(m^2)”、“糖尿病家族史”及“年龄”。决策属性d,d={0,1},含义分别表示糖尿病测试结果为“阴性”与“阳性”。实验分为两个部分,第一部分是对arfdtrs方法与rgfdtrs进行验证,另一部分对fdtrs模型与经典rs模型、dtrs进行对比实验。在使用fdtrs模型时,需要将连续值属性作模糊化处理。即给定模糊决策表fdt=(u,c∪{d}),需建立c(c∈c)的模糊隶属函数。常见的隶属函数可分为low、middle与high三种类型。在本实施例中,选用梯形分布来刻画这三种类型的模糊集,即降半梯形分布、梯形模糊分布与升半梯形分布,其定义如下:公式(22)、(23)和(24)中,m为属性c的均值,m1为[min(c),m)的均值,m2为(m,max(c)]的均值,其中,min(c),max(c)分别是属性c的最小值与最大值。进一步地,实验对arfdtrs与rgfdtrs方法进行测试。用arfdtrs算法生成属性约简集,然后在属性约简集的基础上利用rgfdtrs算法获取pima糖尿病数据表中的模糊规则。在实验1中,根据专家经验,λpp=0,λbp=0.2,λnp=0.7,λpn=0.9,λbn=0.3,λnn=0,预设规则阈值为进一步地,对生成的一部分模糊规则进行分析。关于决策d=0的最一般规则是:rule1:这条规则的含义是:如果口服葡萄糖2小时后血糖浓度低,则糖尿病测试结果为阴性,其可信度为0.91。rule2:c1=“middle”and这条规则的含义是:如果口服葡萄糖2小时后血糖浓度正常,且体重偏轻,则糖尿病测试结果为阴性,其可信度为0.87。rule3:c1=“middle”andc4=“middle”andc5=“middle”and这条规则的含义是:如果每2小时血浆中胰岛素浓度正常,且每2小时血浆中胰岛素浓度正常,体重正常,糖尿病家族史低,则糖尿病测试结果为阴性,其可信度为0.90。rule4:c4=“middle”andc5=“low”and这条规则的含义是:如果每2小时血浆中胰岛素浓度正常,体重偏轻,糖尿病家族史高,则糖尿病测试结果为阴性,其可信度为0.78。关于决策d=1的最一般规则是:rule1:c1=“high”andc4=“high”andc5=“middle”and这条规则的含义是:如果口服葡萄糖2小时后血糖浓度高,每2小时血浆中胰岛素浓度高,体重正常,糖尿病家族史中等,则糖尿病测试结果为阳性,其可信度为0.88。rule2:c1=“high”andc5=“middle”and这条规则的含义是:如果口服葡萄糖2小时后血糖浓度高,体重正常,糖尿病家族史高,则糖尿病测试结果为阳性,其可信度为0.84。如果对预设阈值进行调整,会产生相应的决策规则。从实验结果可以看出:经过arfdtrs属性约简,条件属性的个数从8个c0、c1、c2、c3、c4、c5、c6、c7减少到4个c1、c4、c5、c6,条件属性减少了50%,同时,也说明患糖尿病风险与c1、c4、c5、c6关系较大,而与c0、c2、c3、c7关系相对较小。另一方面,从使用rgdtrs方法获取的模糊知识来看,rgdtrs所产生的规则,符合医学领域客观实际,更进一步说明了arfdtrs方法与rgfdtrs方法的有效性。进一步地,实验对fdtrs与dtrs、rs方法模型进行对比,对pima糖尿病数据集分别使用fdtrs、dtrs、rs模型进行实验,设训练数据集为tr,测试数据集为te。实验中,dtrs模型与rs模型均使用基于信息熵的离散化方法,分别使用基于信息熵的属性约简以及基于正域约简的方法,均使用基于值约简的规则生成方法。fdtrs模型使用公式(22)、(23)与(24)的数据模糊化方法。在对测试数据集进行测试时,在基于dtrs与rs模型中,使用少数优先的规则匹配策略;在基于fdtrs方法生成的模糊规则中,采用max-min推理(∨,∧)策略,其中,“∨”、“∧”分别表示取大、取小运算符,实验中的dtrs模型与fdtrs模型中的风险损失值设置同上一实验,实验结果的分类准确率如图3所示。从图3中可见,在不同比例的训练数据集tr,测试数据集的情况下,fdtrs测试准确率明显高于rs和dtrs方法。这是因为在arfdtrs方法与rgfdtrs方法中,使用基于fdtrs模型对数据预处理采用模糊化方法,进行匹配时使用模糊推理机制,充分考虑了现实世界中存在的不确定性,具有在不确定及模糊环境中进行推理和学习的能力。本发明实施例提供了一种模糊规则生成方法,获取模糊决策表,所述模糊决策表包括非空有限对象集合、非空有限条件属性集和非空有限决策属性;再基于所述模糊决策表,建立fdtrs模型,基于所述fdtrs模型及预设的风险损失值,获得所述模糊决策表中的正域、负域与边界域,再获得所述非空有限条件属性集中每个条件属性相对于决策属性的近似分类精度;然后基于所述每个条件属性相对于决策属性的近似分类精度,获得所述模糊决策表中的属性约简集;基于所述属性约简集、所述非空有限对象集合、所述非空有限决策属性及预设的计算规则,计算所述属性约简集中每个条件属性的模糊语言变量相对于决策属性的分类值;若所述分类值不小于预设阈值,生成模糊规则。实践表明,本发明生成的模糊规则准确、有效。请参阅图4,本发明实施例提供了一种模糊规则生成装置300,所述装置300可以包括获取单元310、分类精度获得单元320、属性约简集获得单元330、计算单元340和生成单元350。获取单元310,用于获取模糊决策表,所述模糊决策表包括非空有限对象集合、非空有限条件属性集和非空有限决策属性。分类精度获得单元320,用于基于所述模糊决策表,建立fdtrs模型,基于所述fdtrs模型及预设的风险损失值,获得所述模糊决策表中的正域、负域与边界域,再获得所述非空有限条件属性集中每个条件属性相对于决策属性的近似分类精度。所述分类精度获得单元320可以包括分类精度获得子单元321。分类精度获得子单元321,用于基于获得所述非空有限条件属性集中条件属性b相对于决策属性d的近似分类精度,fdt=(u,c∪{d})为所述模糊决策表,u为所述非空有限对象集合,c为所述非空有限条件属性集,b∈c,b为所述非空有限条件属性集中的一个条件属性,{d}为所述决策属性,为条件属性b对决策属性d的α正域中对象个数,α由所述fdtrs模型中风险损失值计算而得,x为决策属性d对u划分形成的等价类。属性约简集获得单元330,用于基于所述每个条件属性相对于决策属性的近似分类精度,获得所述模糊决策表中的属性约简集。所述属性约简集获得单元330可以包括属性约简集获得子单元331。属性约简集获得子单元331,用于按照所述每个条件属性的近似分类精度的大小,将所有条件属性的近似分类精度从大到小排列,获得排序后的待处理条件属性集p;当时,重复如下循环体:令p为p中第一个属性,使redu=redu∪{p},计算p=p-{p};检测redu中的条件属性b,若b满足则redu=redu-{b},重复本步骤,获得所述模糊决策表中的属性约简集redu;其中,redu表示属性约简集,redu的初始值置为空集,为redu相对于决策属性d中的α正域近似分类精度,为所述非空有限条件属性集c对所述非空有限决策属性d的α正域近似分类精度。计算单元340,用于基于所述属性约简集、所述非空有限对象集合、所述非空有限决策属性及预设的计算规则,计算所述属性约简集中每个条件属性的模糊语言变量相对于决策属性的分类值。计算单元340可以包括计算子单元341。计算子单元341,用于基于计算所述属性约简集中每个属性约简的决策值,xi为所述非空有限对象集合中的第i个对象,xi∈u,dk∈u/{d}={d1,d2,...,dm},k=1,2…m,每个属性约简对应有每个对每个fν∈f,获得每个属性约简的隶属度值,为所述每个属性约简的隶属度值,proposition[k]为每个属性约简的决策值。所述计算子单元341,还用于基于获得每个属性约简的隶属度值。生成单元350,用于若所述分类值不小于预设阈值,生成模糊规则。以上各单元可以是由软件代码实现,此时,上述的各单元可存储于存储器102内。以上各单元同样可以由硬件例如集成电路芯片实现。本发明实施例提供的模糊规则生成装置300,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本
技术领域
:的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1