一种企业知识管理方法、系统、电子设备及存储介质与流程

文档序号:26050615发布日期:2021-07-27 15:25阅读:97来源:国知局
一种企业知识管理方法、系统、电子设备及存储介质与流程

本发明属于知识图谱技术领域,尤其涉及一种企业知识管理方法、系统、电子设备及存储介质。



背景技术:

企业知识包括行业词库、字典库、规则库、模型库及行业共识等,绝大部分采用分级目录管理的方式进行知识的管理,不同来源、不同类型的知识的在更新、融合、管理中面临着挑战。

现有知识管理主要采取分级分类管理的方式,将各类行业词库、字典库、规则库、模型库等,按照一定的业务逻辑组合成知识目录,将数据存储在数据库中,供查询使用。其缺点在于语义表现力不足,知识关联简单,维度单一。现有基于图的知识管理主要集中在工程化的结构化知识抽取部分及基于nlp技术的实体识别、抽取方面,缺少一种有效的将两部分结合在一起、进行知识管理的机制及方法。



技术实现要素:

本申请实施例提供了一种企业知识管理方法、系统、电子设备及存储介质,以至少解决现有企业知识管理方法无法将两部分结合在一起、进行知识管理的问题。

第一方面,本申请实施例提供了一种企业知识管理方法,包括:结构化数据处理步骤,获取企业知识中的结构化数据,并对所述结构化数据中需图谱化的内容进行一第一定义,根据所述第一定义将所述结构化数据中需图谱化的内容生成一知识图谱;非结构化数据处理步骤,获取所述企业知识中的非结构化数据,并对所述非结构化数据中需图谱化的内容进行一第二定义,根据所述第二定义将所述非结构化数据中需图谱化的内容补充入所述知识图谱;优先级策略设定步骤,设定所述结构化数据和所述非结构化数据的优先级,所述知识图谱中进入新内容时,根据所述优先级确定覆盖关系;可视化界面构建步骤,构建一可视化界面,将所述知识图谱可视化并显示于所述可视化界面。

优选的,所述结构化数据处理步骤进一步包括:分析所述结构化数据中的业务字段内容,并对所述业务字段内容中的实体、关系类别和属性进行定义。

优选的,所述非结构化数据处理步骤进一步包括:通过自然语言处理技术对所述非结构化数据进行分析,并根据所述第二定义构建一抽取器,通过所述抽取器对所述非结构化数据中的实体、关系类别和属性进行抽取,并将抽取出的所述非结构化数据中的实体、关系类别和属性补充入所述知识图谱。

优选的,所述方法还包括一知识图谱动态补充步骤:根据一预设周期,对所述知识图谱进行补充,通过增量运行的方式补充所述结构化数据,通过全量运行的方式补充所述非结构化数据。

第二方面,本申请实施例提供了一种企业知识管理系统,适用于上述一种企业知识管理方法,包括:结构化数据处理模块,获取企业知识中的结构化数据,并对所述结构化数据中需图谱化的内容进行一第一定义,根据所述第一定义将所述结构化数据中需图谱化的内容生成一知识图谱;非结构化数据处理模块,获取所述企业知识中的非结构化数据,并对所述非结构化数据中需图谱化的内容进行一第二定义,根据所述第二定义将所述非结构化数据中需图谱化的内容补充入所述知识图谱;优先级策略设定模块,设定所述结构化数据和所述非结构化数据的优先级,所述知识图谱中进入新内容时,根据所述优先级确定覆盖关系;可视化界面构建模块,构建一可视化界面,将所述知识图谱可视化并显示于所述可视化界面。

在其中一些实施例中,所述结构化数据处理模块进一步包括:分析所述结构化数据中的业务字段内容,并对所述业务字段内容中的实体、关系类别和属性进行定义。

在其中一些实施例中,所述非结构化数据处理模块进一步包括:通过自然语言处理技术对所述非结构化数据进行分析,并根据所述第二定义构建一抽取器,通过所述抽取器对所述非结构化数据中的实体、关系类别和属性进行抽取,并将抽取出的所述非结构化数据中的实体、关系类别和属性补充入所述知识图谱。

在其中一些实施例中,所述系统还包括一知识图谱动态补充模块:根据一预设周期,对所述知识图谱进行补充,通过增量运行的方式补充所述结构化数据,通过全量运行的方式补充所述非结构化数据。

第三方面,本申请实施例提供了一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的一种企业知识管理方法。

第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面所述的一种企业知识管理方法。

本发明可应用于知识图谱技术领域。相比于相关技术,本申请实施例采用行业图谱库的方式,充分利用图丰富的语义表达能力,更适合存储及管理企业种类丰富、标准不一、来源多样的基本知识。具体的,以可视化的方式进行基于图的知识管理,简化了知识管理的操作及门槛;定义了结构化数据获取的图谱schema与非结构化数据获取schema融合操作的流程及规则,使得多渠道获取的知识从机制上能够有效融合,增加了逻辑上的限定,增强知识落地性。

附图说明

此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1为本发明的企业知识管理方法流程图;

图2为本发明的企业知识管理系统的框架图;

图3为本发明的电子设备的框架图;

以上图中:

1、结构化数据处理模块;2、非结构化数据处理模块;3、优先级策略设定模块;4、知识图谱动态补充模块;5、可视化界面构建模块;60、总线;61、处理器;62、存储器;63、通信接口。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。

显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其他类似情景。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。

在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本申请所描述的实施例在不冲突的情况下,可以与其它实施例相结合。

除非另作定义,本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

本申请实施例将企业内部的知识按照图谱的形式进行组织与管理,并定义业务关注的实体、关系及事件。

以下,结合附图详细介绍本发明的实施例:

图1为本发明的企业知识管理方法流程图,请参见图1,本发明企业知识管理方法包括如下步骤:

s1:获取企业知识中的结构化数据,并对所述结构化数据中需图谱化的内容进行一第一定义,根据所述第一定义将所述结构化数据中需图谱化的内容生成一知识图谱。

可选的,分析所述结构化数据中的业务字段内容,并对所述业务字段内容中的实体、关系类别和属性进行定义。

在具体实施中,对于结构化数据,通过分析数据库表中包含的业务字段内容,定义部分图谱包括的实体、关系类别及其可具备的属性,并导入从结构化数据出发定义的图谱schema。

在具体实施中,由于结构化图谱构建是个复杂的工程化逻辑,为了保证结构化数据图谱生成工作输出成果与知识库中管理知识的高度一致性,在知识库中,对于结构化数据出发定义的schema仅支持增量同步,不支持删除、修改的操作。

s2:获取所述企业知识中的非结构化数据,并对所述非结构化数据中需图谱化的内容进行一第二定义,根据所述第二定义将所述非结构化数据中需图谱化的内容补充入所述知识图谱。

可选的,通过自然语言处理技术对所述非结构化数据进行分析,并根据所述第二定义构建一抽取器,通过所述抽取器对所述非结构化数据中的实体、关系类别和属性进行抽取,并将抽取出的所述非结构化数据中的实体、关系类别和属性补充入所述知识图谱。

在具体实施中,对于非结构化数据,通过对文本数据的分析及实体识别算法能力的综合分析,构建实体/关系抽取器,完成图谱实体、关系类别及属性定义的补充,并在知识图谱中同步非结构化数据定义的图谱schema。

在具体实施中,同步非结构化数据定义的schema的时候,如果是全新的schema直接新增,如果是结构化数据中已经涉及的schema,将识别器信息追加进原有schema定义中。

在具体实施中,对于来源仅为非结构化数据定义的图谱部分,支持手动增、删、改操作,用户可以根据识别器的不断丰富及优化,在页面上增加新的实体或修改原有实体关联的识别器;对于来源为结构化和非结构化两部分的schema,仅支持修改识别器,不支持删除操作。

s3:设定所述结构化数据和所述非结构化数据的优先级,所述知识图谱中进入新内容时,根据所述优先级确定覆盖关系。

在具体实施中,数据优先级策略的设定可以选择结构化优先,也可以选择非结构化优先,优先级高的覆盖优先级低的数据。

s4:根据一预设周期,对所述知识图谱进行补充,通过增量运行的方式补充所述结构化数据,通过全量运行的方式补充所述非结构化数据。

在具体实施中,知识抽取任务支持定时及周期性执行,结构化数据采取增量运行方式,完成数据追加;非结构化数据采取全量运行方式,采取全覆盖策略进行更新。

s5:构建一可视化界面,将所述知识图谱可视化并显示于所述可视化界面。

图2为根据本发明的企业知识管理系统的框架图,请参见图2,包括:

结构化数据处理模块1:获取企业知识中的结构化数据,并对所述结构化数据中需图谱化的内容进行一第一定义,根据所述第一定义将所述结构化数据中需图谱化的内容生成一知识图谱。

可选的,分析所述结构化数据中的业务字段内容,并对所述业务字段内容中的实体、关系类别和属性进行定义。

在具体实施中,对于结构化数据,通过分析数据库表中包含的业务字段内容,定义部分图谱包括的实体、关系类别及其可具备的属性,并导入从结构化数据出发定义的图谱schema。

在具体实施中,由于结构化图谱构建是个复杂的工程化逻辑,为了保证结构化数据图谱生成工作输出成果与知识库中管理知识的高度一致性,在知识库中,对于结构化数据出发定义的schema仅支持增量同步,不支持删除、修改的操作。

非结构化数据处理模块2:获取所述企业知识中的非结构化数据,并对所述非结构化数据中需图谱化的内容进行一第二定义,根据所述第二定义将所述非结构化数据中需图谱化的内容补充入所述知识图谱。

可选的,通过自然语言处理技术对所述非结构化数据进行分析,并根据所述第二定义构建一抽取器,通过所述抽取器对所述非结构化数据中的实体、关系类别和属性进行抽取,并将抽取出的所述非结构化数据中的实体、关系类别和属性补充入所述知识图谱。

在具体实施中,对于非结构化数据,通过对文本数据的分析及实体识别算法能力的综合分析,构建实体/关系抽取器,完成图谱实体、关系类别及属性定义的补充,并在知识图谱中同步非结构化数据定义的图谱schema。

在具体实施中,同步非结构化数据定义的schema的时候,如果是全新的schema直接新增,如果是结构化数据中已经涉及的schema,将识别器信息追加进原有schema定义中。

在具体实施中,对于来源仅为非结构化数据定义的图谱部分,支持手动增、删、改操作,用户可以根据识别器的不断丰富及优化,在页面上增加新的实体或修改原有实体关联的识别器;对于来源为结构化和非结构化两部分的schema,仅支持修改识别器,不支持删除操作。

优先级策略设定模块3:设定所述结构化数据和所述非结构化数据的优先级,所述知识图谱中进入新内容时,根据所述优先级确定覆盖关系。

在具体实施中,数据优先级策略的设定可以选择结构化优先,也可以选择非结构化优先,优先级高的覆盖优先级低的数据。

知识图谱动态补充模块4:根据一预设周期,对所述知识图谱进行补充,通过增量运行的方式补充所述结构化数据,通过全量运行的方式补充所述非结构化数据。

在具体实施中,知识抽取任务支持定时及周期性执行,结构化数据采取增量运行方式,完成数据追加;非结构化数据采取全量运行方式,采取全覆盖策略进行更新。

可视化界面构建模块5:构建一可视化界面,将所述知识图谱可视化并显示于所述可视化界面。

另外,结合图1描述的一种企业知识管理方法可以由电子设备来实现。图3为本发明的电子设备的框架图。

电子设备可以包括处理器61以及存储有计算机程序指令的存储器62。

具体地,上述处理器61可以包括中央处理器(cpu),或者特定集成电路(applicationspecificintegratedcircuit,简称为asic),或者可以被配置成实施本申请实施例的一个或多个集成电路。

其中,存储器62可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器62可包括硬盘驱动器(harddiskdrive,简称为hdd)、软盘驱动器、固态驱动器(solidstatedrive,简称为ssd)、闪存、光盘、磁光盘、磁带或通用串行总线(universalserialbus,简称为usb)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器62可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器62可在数据处理装置的内部或外部。在特定实施例中,存储器62是非易失性(non-volatile)存储器。在特定实施例中,存储器62包括只读存储器(read-onlymemory,简称为rom)和随机存取存储器(randomaccessmemory,简称为ram)。在合适的情况下,该rom可以是掩模编程的rom、可编程rom(programmableread-onlymemory,简称为prom)、可擦除prom(erasableprogrammableread-onlymemory,简称为eprom)、电可擦除prom(electricallyerasableprogrammableread-onlymemory,简称为eeprom)、电可改写rom(electricallyalterableread-onlymemory,简称为earom)或闪存(flash)或者两个或更多个以上这些的组合。在合适的情况下,该ram可以是静态随机存取存储器(staticrandom-accessmemory,简称为sram)或动态随机存取存储器(dynamicrandomaccessmemory,简称为dram),其中,dram可以是快速页模式动态随机存取存储器(fastpagemodedynamicrandomaccessmemory,简称为fpmdram)、扩展数据输出动态随机存取存储器(extendeddateoutdynamicrandomaccessmemory,简称为edodram)、同步动态随机存取内存(synchronousdynamicrandom-accessmemory,简称sdram)等。

存储器62可以用来存储或者缓存需要处理和/或通信使用的各种数据文件,以及处理器61所执行的可能的计算机程序指令。

处理器61通过读取并执行存储器62中存储的计算机程序指令,以实现上述实施例中的任意一种企业知识管理方法。

在其中一些实施例中,电子设备还可包括通信接口63和总线60。其中,如图3所示,处理器61、存储器62、通信接口63通过总线60连接并完成相互间的通信。

通信端口63可以实现与其他部件例如:外接设备、图像/数据采集设备、数据库、外部存储以及图像/数据处理工作站等之间进行数据通信。

总线60包括硬件、软件或两者,将电子设备的部件彼此耦接在一起。总线60包括但不限于以下至少之一:数据总线(databus)、地址总线(addressbus)、控制总线(controlbus)、扩展总线(expansionbus)、局部总线(localbus)。举例来说而非限制,总线60可包括图形加速接口(acceleratedgraphicsport,简称为agp)或其他图形总线、增强工业标准架构(extendedindustrystandardarchitecture,简称为eisa)总线、前端总线(frontsidebus,简称为fsb)、超传输(hypertransport,简称为ht)互连、工业标准架构(industrystandardarchitecture,简称为isa)总线、无线带宽(infiniband)互连、低引脚数(lowpincount,简称为lpc)总线、存储器总线、微信道架构(microchannelarchitecture,简称为mca)总线、外围组件互连(peripheralcomponentinterconnect,简称为pci)总线、pci-express(pci-x)总线、串行高级技术附件(serialadvancedtechnologyattachment,简称为sata)总线、视频电子标准协会局部(videoelectronicsstandardsassociationlocalbus,简称为vlb)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线60可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。

该电子设备可以执行本申请实施例中的一种企业知识管理方法。

另外,结合上述实施例中的一种企业知识管理方法,本申请实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种企业知识管理方法。

而前述的存储介质包括:u盘、移动硬盘、只读存储器(readonlymemory,简称为rom)、随机存取存储器(randomaccessmemory,简称为ram)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1