一种药监行业知识库的平台及其构建方法

文档序号:6460212阅读:159来源:国知局

专利名称::一种药监行业知识库的平台及其构建方法
技术领域
:本发明涉及药监行业知识库平台软件领域,尤其涉及一种行业可通用的,基于药监行业知识库平台及其构建方法,本发明不仅能应用于药i^领域,对其他领域的行业应用也有指导'昆-^。
背景技术
:药监行业知识库平台是一种以行业为导向,可有效地沉淀行业知识,生成解决方案,快速的知识获取及知识库建立、更新、维护、管理、使用的应用软件的平台。它打破了一般的知识库平台的应用模式,专门针对特定领域进行了分析与实现。从而使得药监行业知识库知识资产得到最大限度的共享和复用,更有效率的在更大范围内发挥药监行业知识库的核心价值。下面我们对目前已有技术做一个简单回顾。在知识库平台软件方面,我们所了解到的知识库有Pangu常识知识库、CYC海量知识库、台湾龙巻风知识库、蓝领知识库以及一些特定领域如机械设计知识库、故障诊断知识库等。这些知识库涉及的领域多种多样,依据知识表示方式的不同及行业的区别,他们得知识库平台的构建方式也有很大差异。这些知识库平台的优势在于形成了高效知识查询、提供了容量巨大的知识存储场所。缺陷在于知识获取特别是药监行业知识库中新知识的获取和再生还不成熟。与现有的知识库平台技术相比,本发明有本质上的差异。现有技术都是集中在知识的简单查询和存储设计上的开发。缺少对知识库中知识新生和解决方案分析与建设。事实上,特定领域行业知识库是存在的,并可将其用于该领域,使得该领域的知识能够有效地沉淀和积累及知识查询。华深慧正凭借在药监行业应用领域的多年经验,总结并积累了药监行业的业务模型、数据模型、行业构件及解决方案等,实现了药监行业各种模型及方案的良好实践,并开发基于药监行业知识库平台。在此基础上,形成了本发明。
发明内容本发明的目的在于提供一种基于药监的领域知识库平台及其构建方法。基于药监行业的知识库平台包括知识管理子系统,内容管理子系统,系统管理子系统及字典管理子系统。生成的药监行业知识库平台是一个在行业范围内可通用的知识库平台,基于此,可以实现知识库平台的灵活运用,适应行业的千变万化,使得药监行业知识能有效的积累和复用。本发明所给出的构建该知识库平台的主要方法为数据库和知识库相结合,数据库对数据进行存储和管理,知识库的主要功能是针对知识进行关联、推演、存储和管理,有效的实现知识的表示和推理机制,尤其是对一些不确定、不完全、不精确的知识的表示。一般的或者通用的知识库构建方式不在本发明陈述中。为实现上述目的,本发明解决方案如下-1.一种药监行业知识库平台的架构图l给出了该平台的架构及各部分的详细功能。整个应用的架构分5个部分,分别是基础设施层,该层包括中间件和操作系统(0S)及网络等;数据层,包括各种库的管理及知识的管理;应用支撑层,应用层以及表示层基于该平台的各种具体的个性化应用。基础设施层是网络、服务器及操作系统和中间件,中间件位于异构的硬件平台和操作系统之上,它屏蔽了异构的硬件平台和操作系统的差异,并为上层的应用提供诸如负载平衡、事务管理、可靠消息传递等服务。数据层包括药监行业内的各种知识库,如行业模型、数据模型、构件库等,还包括规则库、元数据库、本体库等;其中规则库包括知识的关联和推理及行业解决方案的生成等准则,元数据包含对各种知识描述的核心元数据及相关的扩展元数据,支持知识目录的生成、修改及删除并维护更新库目录,本体库里面包括所有的本体概念、属性以及语义关系、约束等。应用支撑层,独立于其具体实现的硬件平台、操作系统和编程语言,并且以一种统一和通用的方式进行交互和向上层提供相应的服务,它会被多个子系统共享,如权限管理、日志管理、字典管理、工作流管理等等应用层,主要提供行业解决方案及管理工具,在行业解决方案成中主要包括其建模、演示、仿真等。表示层对外提供知识査看的接口,主要包括知识检索,方案中心,个性化定制等功能,方案中心可以根据方案的基本描述情况,将知识库中的知识进行推演组合成方案展现出来。如果没有相关方案,它将为之提供最相近的知识素材,从而转向成知识的高级搜索。在这样一个药监行业知识库平台之上,可以通过知识的入库,新的知识的产生,知识的检索,实现新的知识的获取和行业解决方案的生成,提高知识的复用率,也提高了知识库中知识资产的价值。2.给出药监行业知识库平台的构建方法a)药监行业知识库平台的构建方法主要思想是首先是知识著录,即包括手工著录,也包括自动抓取。按照一定的规则对知识进行描述,并对知识进行分类标引,得到知识分类,同是可以对知识进行类别之间的手动关联,或者知识之间的自动关联,最后将知识入库。b)知识检索及解决方案展示。对于知识检索,接收关键词或布尔语句査询或自然语言査询,并返回包含特定概念(按查询的上下文相关性排列)的检索结果;对于方案展示,输入方案的简单描述集,在知识库中进行检索,并按关联性返回内容相关的知识,同时实现知识自动组合及链接,以方案的形式展现。综上所述,本发明的技术方案为一种药监行业的知识库平台的构建方法,其歩骤为1)知识著录,所谓知识著录,实际上是指人为地为元数据打上相应的标签,比如表明知识的背景、内容、结构、来源等的相应标签;2)分类标引,它的实现过程及原理是这样的用户首先根据专家意见建立出多个分类树,每个分类的设置是通过选定相应的数据库和设置训练文档,然后分类服务器结合规则库中根据内部计算法则把该训练文档分成相应的带权重的分词,根据这些分词及权重到规则库中查询相应的分类结果并按相关度排序返回。各个分类之间的联系,可以通过合并结果集的方式来完成。3)知识关联,根据知识的分词和权重自动到库里査询得到与该知识相关的内容,并按照相关度排序自动地推送给用户。4)对方案描述集中的每个方案进行查询如果子库中没有与其相匹配的方案,则进行方案的生成处理并将新生成的方案加入到方案库中,更新目录;如果方案库中己有与其相匹配的方案,则调用方案,实现方案的展现。所述方案划分的原则为根据业务概念进行划分。所述基本方案描述集的数据结构包括方案编号,方案名称,所属域,业务对象,版本号,方案功能,备注。所述方法步骤4)中采用基于语义的方案查询匹配方法进行方案査询,其步骤为.-1)建立语义基础建立规则库、维度记录模型、分词表、环境和操作分类表;所述规则库是对解决方案命名的一系列规则的集合,所述维度记录模型是用来表示库表记录的,所述库表记录包括记录的名称、记录的属6性、属性所属的角色、属性的权重,所述词根表为一词汇集,所述操作分类表的操作划分包括增加、删除、修改、査询、验证;2)输入要查询的方案描述集;3)将被确认的方案名与方案库中的已有方案进行环境匹配、操作匹配、以及对象名称匹配度、对象组成匹配度的计算;4)査看匹配的方案,如确定是所得方案,则结束,否则进行重新匹配。所述基于语义的构件査询匹配方法步骤3)中采用维度记录相似度的算法计算所述对象组成匹配度。一种药监行业的知识库平台,其特征在于包括行业知识本体知识库,规则库,元数据库及子库;所述行业知识本体库,以owl文件的形式存在,里面包括所有的本体概念、属性以及语义关系、约束等;所述规则库,据需要自己定义,以文本形式存储;所述元数据库包括核心元数据,用于知识的描述;扩展元数据,用于对特定知识的描述;库管理工具,用于维护元数据和知识目录。进一步的,所述平台还包括操作系统和中间件构成的平台底层,所述中间件位于异构的硬件平台和所述操作系统之上,用于屏蔽所述异构的硬件平台和操作系统之间的差异。所述库管理工具还包括一中间件适配层,所述中间件适配层集成了主流的中间件产品,用于屏蔽了所述中间件产品之间的差异。所述知识检索与匹配工具为基于语义的知识查询匹配工具。本发明的积极效果在本发明的知识库平台之上,可以通过一般知识的映射和演化,实现新的知识的产生,基于此平台,可以实现知识的关联,推演和知识的重用,并且能快速生成解决方案,从而使得知识库知识资产得到最大限度的共享和复用,更有效率的在更大范围内发挥知识库的核心价值。图1知识库平台架构;图2药监行业知识库建设步骤;图3知识检索的步骤;图4知识库平台网络部署图。具体实现方式-*一种药监行业的知识库平台的构建方法知识库平台的建设的步骤如图2所示,首先是知识著录。注1知识描述与关联具体功能点如下所示功能点名称功能点编号描述列表01,01.01.01以列表形式呈现"知识提交"的数据信息,信息是之前保存未被提交的;查询01.01.01.02提供简单的复合査询功能;增加01.01.01.03登记知识贡献,为后续操作提供数据支持;编辑01.01.01.04修改自己具有修改权限的未提交的接待信息;详情01.01.01.05查看每条信息的详细情况;删除01.01.01.06对于录入错误的接待单信息可以进行删除,前提是只能删除自己录入的还没有被提交的接待单,作为接待登记的一个组成功能;提交01.01.01.07对于新建或修改的信息确认无误后需要提交到后续环节进行处理;保存01.01.01.08对于新建或修改的信息确认无误后不想现在就提交到后续环节进行处理时可以先保存下填写的信息方便以后再进行提交。注2知识的分类标引平台对所著录的知识实现自动分类标引入库或者手动分类标引入库注3高级检索——知识解决方案展现(1)高级检索中的方案生成功能是一个基本功能。方案描述集是一个方案的列表,下表描述了每个方案的具体描述项。对每个方案的描述,所述基本方案描述集的数据结构包括方案编号,方案名称,所属域,业务对象,版本号,方案功能,备注。重点是方案描述,业务对象和所属的域。<table>tableseeoriginaldocumentpage9</column></row><table>下表是一个方案描述清单的实例,由于篇幅限制,只给出其中一部分。<table>tableseeoriginaldocumentpage9</column></row><table>注3参见下述的基于语义的知识查询匹配算法。*基于语义的知识査询匹配方法图3为基于语义的知识的查询匹配流程图,在实现基于语义的知识查询之前,要建立语义基础并对知识库进行解析。解析的对象是知识描述集中知识的名称,知识的名称反映了知识的领域,因为这个命名通常都是按照某种规则进行的,是有语义的。a建立语义基础建立规则库、维度记录模型、词根表、环境和分类表规则库包括对方案命名的一系列规则的集合。比如对方案的命名采用三段式,"环境"+"对象"+"操作",或者其它的命名方式和约定。维度记录模型(DRMDimensionRecordModel)是用来表示库表记录的,一个记录可以定义为一个四元组,DRM:=(RN,A,Role,Weight),其中,RN(RecordName)表示记录的名称,A(attribute)表示记录的属性,Role={Dimension,Measurement,Generic}表示属性所属的角色,即维度、度量值和一般属性。维度是是决定实体变化的独立的属性,是分析问题的角度,蕴涵着一定的分类特征和层级关系。度量值表示记录中关注的具有数量特征的属性;一般属性是指除维度和度量值之外的记录属性。Weight是各个属性的权重。维度记录模型有效的表示了记录的组成,标识了各个组成成分的角色,维度、度量值和一般属性,并对不同角色的属性给出了相对应的权重值,使得方案的匹配更有针对性。词根表是一个词汇集,它是领域概念在编程实现时的编写或縮写约定。在领域应用范围内,环境和操作的取值是一定的。因此,按照领域应用的实际情况对环境和操作的取值进行分类汇总,就可以形成环境和操作分类表。如将环境划分用户界面层"UserInterface,,、业务逻辑层"BusinessLogic,,、数据层"DatabaseLayer,,、通用层"Utility"四类;将操作划分为"增加、删除、修改、查询、验证"五大类,每一大类又进行具体的细分。b对方案库中的方案进行基于规则库、维度记录模型、词根表、环境和操作分类表的解析,将方案名称划分为环境、对象和操作三类信息,其中,"对象"包括"含义"和"组成"两项,其"含义"项与词根表中的词条相对应,"组成"项是一个领域对象模型,它由若干维度记录中的若干元素组成,而维度记录与库表记录一一对应,并被表示成鱼刺图的形式。如图3所示,基于语义的查询分为几个步骤。a首先由査询者提出査询需求,根据其需求和命名规则库,系统可以给出一个被确认的方案(也可由查询者直接给出命名);b被确认的知识(包括环境、对象和操作信息)将与解析知识库中的已有知识名进行环境匹配、操作匹配、以及对象名称匹配度、对象组成匹配度的计算。c最后按给定的阈值,查看匹配的知识,如确定所査询知识,则结束,否则进行重新命名和匹配。维度记录模型、分词表、分类表构成了解析和匹配的语义基础。算法维度记录相似度计算&'"V(dn,dr2)10输入dn,dT2是两个维度记录,阈值a输出维度记录相似度S/w^1)对dn,dr2的度量值生成配对的两个词汇集合分别为dn.M和dr2.M2)比较dn和dr2的维度名称,具有相同的维度名称的维度的属性集构成配对的词汇集和,记做dn.Di和dr2.Di(i^,2,...,n)3)将未形成配对的角色为维度和度量值的属性和一般属性一起,构成两个配对的词汇集合,记做dn.G和dr2.G4)构造l个度量值相似矩阵、n个维度属性相似矩阵和一个一般属性相似矩阵。按公式(2)计算nsim(Li,Nj)(Li和Nj代表两个配对的词汇集中的第i个和第j个词汇,l&'《/,"排到矩阵的第i行,第j列;如果其大于指定的阈值a,则令其所在的行和列上的其他元素均为O;并不再计算这些元素对应的词汇相似度的值5)对每一个相似矩阵,重复(6)-(13)步6)用各行元素的最大值减去各行元素7)将每列元素减去本列中的最小值,此时每行及每列中必然都含有零元素8)从包含零最少的行(或列)开始,取一个零作上标记*,划去其所在行和列9)重复步骤8),直到所有的O被标记或者被划去,如被标记的O的个数不够min(l,n),则继续;如果被标记的0有min(l,n)个,则按每个0所在的行列分别取原词汇相似度值与其对应的在dn中的权值相乘,累加到S/^v,并转5),计算下一个相似矩阵,如计算完所有矩阵,则返回5VmA,算法完10)对没有标记0的行标*,对标了*的行的所有0对应的列标*,对标了*的列上所有标记了0的行标*,直到不能标*为止11)将没有标*的行与标了*的列划上直线。这样,我们用最少的直线覆盖了所有的O12)找出没有被直线覆盖的所有元素中的最小元素记为Xij13)对标记了f的行减去Xij,对标记了+的列加上xy,返回步骤8)算法完1权利要求1.一种药监物资行业知识库平台的构建方法,其步骤为1)知识著录2)依据行业知识本体对知识进行描述、关联、分类标引然后入库3)对知识进行检索或高级检索,高级检索的过程中有一个知识解决方案获取的功能如果第一次查询,知识库中没有相关的知识,则进行知识的高级检索,如果有,将以方案的方式展现,如果没有重新生成知识方案并加入知识库,更新目录,同时展现。如果知识库中已有相关的知识方案,则直接展现。2.如权利要求l所述的方法,其特征在于所述知iR库平台是专门针对药监行业的,是其它知识库所不能比拟的。3.如权利要求l所述的方法,其特征在于所述基本解决方案的数据结构包括方案编号,方案名称,所属域,业务对象,版本号,方案功能,备注。4.如权利要求l所述的方法,其特征在于步骤3)中采用基于语义的知识查询匹配方法进行知识査询,其步骤为1)建立语义基础建立规则库、维度记录模型、词根表、环境和操作分类表;所述规则库是对知识命名的一系列规则的集合,所述维度记录模型是用来表示库表记录的,所述库表记录包括记录的名称、记录的属性、属性所属的角色、属性的权重,所述词根表为一分词表,'2)对平台知识库中的知识进行基于命名规则库、维度记录模型、词根表、环境和操作分类表的解析将知识名称划分为环境、对象和操作三类信息,其中,"对象"包括"含义"和"组成"两项,所述"含义"项与所述词根表中的词条相对应,所述"组成"项是一个领域对象模型,它由维度记录中的元素组成,所述维度记录与所述库表记录一一对应,并被表示成鱼刺图的形式;3)输入要查询的知识描述;4)将被确认的知识描述与知识库中己有的知识进行环境匹配、操作匹配、以及对象名称匹配度、对象组成匹配度的计算;5)按设定的临界值,査看匹配的知识,决定是否继续査询。5.如权利要求5)所述的方法,其特征在于步骤4)中采用维度记录相似度的算法计算所述对象组成匹配度。6.—种药监行业知识库的平台,其特征在于包括行业知识本体库,规则库,元数据库以及各子知识库。所述行业知识本体库,以owl文件的形式存在,里面包括所有的本体概念、属性以及语义关系、约束等;所述规则库,据需要自己定义,以文本形式存储;所述元数据库包括核心元数据,用于知识的描述;扩展元数据,用于对特定知识的描述;库管理工具,用于维护元数据和知识目录。7.如权利要求6所述的平台,其特征在于还包括操作系统和中间件构成的平台底层,所述中间件位于异构的硬件平台和所述操作系统之上,用于屏蔽所述异构的硬件平台和操作系统之间的差异。8.如权利要求6所述的平台,其特征在于知识査询为基于语义的知识査询。9.如权利要求6所述的平台,其特征在于知识著录时可以对知识进行手动关联或者自动关联。10.如权利要求6所述的平台,其特征在于知识库系统对知识进行自动分类标引,当然也可以以手工的方式进行标引。全文摘要本发明公开了一种药监行业知识库的平台及其构建方法,其构建方法为首先知识的采集及著录;然后对其分类,并根据类别扩展信息的不同对知识描述加以扩展;在知识库中对知识进行检索,通过知识关联和演化从而实现新知识的构建;基于药监行业的知识库平台包括本体库及规则库等。在本发明的知识库平台之上,可以通过一般知识的映射和演化,实现新的知识的产生,基于此平台,可以实现知识的关联,推演和知识的重用,并且能快速生成解决方案,从而使得知识库知识资产得到最大限度的共享和复用,更有效率的在更大范围内发挥知识库的核心价值。文档编号G06F17/30GK101493820SQ20081005689公开日2009年7月29日申请日期2008年1月25日优先权日2008年1月25日发明者强李,邓亚明申请人:北京华深慧正系统工程技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1