基于条款库的是非判别系统的制作方法

文档序号:31514695发布日期:2022-09-14 11:47阅读:48来源:国知局
基于条款库的是非判别系统的制作方法

1.本发明属于电学知识问答技术领域,具体是基于条款库的是非判别系统。


背景技术:

2.随着电学领域的快速发展,相关的专业知识和相关标准持续更新,为相关工作人员的工作带来了一定困扰,尤其是对于刚进该领域的工作人员或者其他非本领域人员来说,想要准确地判断某个电学问题是否正确,对应的条款是什么,需要耗费较大的精力去慢慢查找,不利于行业的发展,因此,本发明提供了基于条款库的是非判别系统,用于帮助对应的用户判断对应的问题是否正确。


技术实现要素:

3.为了解决上述方案存在的问题,本发明提供了基于条款库的是非判别系统。
4.本发明的目的可以通过以下技术方案实现:
5.基于条款库的是非判别系统,包括词库模块、条款库、标准问答模块、组合问答模块、关联模块、判别模块和服务器;
6.所述词库模块用于建立主题词库;通过条款库储存对应的标准条款;标准问答模块基于条款库中的标准条款建立对应的标准问答库;所述组合问答模块用于基于主题词库建立组合问答库,建立语句模型,通过建立的语句模型对主题词库中主题词进行组合,输出组合问答,输出组合问答的主题词集,进行主题词集的数值转化,获得主题词集数值;设置对应组合问答的语境值,将语境值和对应的主题词集数值进行整合,获得匹配矢量,将匹配矢量映射到向量空间中,将根据当前的组合问答进行汇总建立组合问答库;
7.通过关联模块将组合问答和标准问答进行相关联;所述判别模块用于判断识别问题是否正确,获取识别的用户问题,将识别的用户问题转化为问题矢量,将问题矢量输入到对应的向量空间中,计算问题矢量与对应匹配矢量之间的相似度,根据计算的相似度高低匹配对应的组合问答,根据匹配的组合问答获得对应的标准问答,再根据获得的标准问答匹配对应的标准条款,根据标准问答、标准条款对用户问题进行是非判断,获得对应的判断结果。
8.进一步地,词库模块的工作方法包括:
9.设置词典制定规则,进行审核格式转化,获得标准限制条件;建立数据库和采集渠道,通过建立的采集渠道进行数据采集,并将采集的数据输入到数据库中进行储存,将数据库标记为素材库,对素材库内的数据进行主题词提取设置,标记为初始词,通过设置的标准限制条件对初始词进行校核,将校核成功的初始词标记为主题词,将主题词进行整合并建立主题词库。
10.进一步地,标准问答模块的工作方法包括:
11.识别条款库中的标准条款,获取标准条款的应用方向,基于获取的应用方向设置对应的问题检索式,根据设置的问题检索式进行问题检索,获得若干个问答问题,将获得的
问答问题进行去重,获得待选问答,将待选问答进行筛选,获得标准问答,并打上对应的标准条款标签,将获得的标准问答进行整合后建立标准问答库。
12.进一步地,置对应组合问答的语境值的方法包括:
13.识别对应的主题词集数值,标记为zti,其中i表示主题词,其中i=1、2、
……
、n,n为正整数;识别组合问答对应的标准问答,匹配对应的标准附加值,标记为bz,设置组合问答的语境调整系数,标记为α,根据语境值公式计算语境值,其中b1、b2均为比例系数,取值范围为0《b1≤1,0《b2≤1。
14.进一步地,关联模块的工作方法包括:
15.识别组合问答库中的组合问答和标准问答库中的标准问答,将组合问答与标准问答进行相似度计算,获得对应的相似度,根据相似度将组合问答分配给对应的标准问答,打上对应的从属标签,建立从属问答表。
16.进一步地,将识别的用户问题转化为问题矢量的方法包括:
17.进行用户问题的关键词提取,获得问题关键词集,将获得的问题关键词集进行赋值,获得问题关键词集赋值,设置用户问题的语境值,整合为对应的问题矢量。
18.进一步地,将获得的问题关键词集进行赋值的方法包括:
19.将问题关键词集与主题词库中的主题词进行匹配,获得对应的赋值,将未匹配到的问题关键词标记为相似关键词,根据相似关键词匹配对应的相似赋值,整合为关键词集赋值。
20.进一步地,根据相似关键词匹配对应的相似赋值的方法为:
21.将相似关键词输入到主题词库中进行词义相似度计算,获得对应最高的相似度,以及对应主题词的赋值,分别标记为xs和fz,根据公式xf=b3
×
xs
×
fz
×
η计算对应的相似赋值,其中,b1为比例系数,取值范围为0《b1≤1,η为相似调整系数。
22.与现有技术相比,本发明的有益效果是:
23.通过词库模块、条款库、标准问答模块、组合问答模块、关联模块和判别模块之间的相互配合,实现当用户输入问答问题时,可以快速地进行是非判断,同时可以获得对应的条款,当用户需要时可以获取对应的条款,实现对问题的智能判断,极大地帮助用户进行为题解答,避免用户的无效查找,为行业和企业的发展提供帮助。
附图说明
24.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
25.图1为本发明原理框图。
具体实施方式
26.下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普
通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
27.如图1所示,基于条款库的是非判别系统,包括词库模块、条款库、标准问答模块、组合问答模块、关联模块、判别模块和服务器;
28.所述词库模块用于建立主题词库,具体方法包括:
29.设置词典制定规则,进行审核格式转化,获得标准限制条件;建立数据库和采集渠道,通过建立的采集渠道进行数据采集,并将采集的数据输入到数据库中进行储存,将数据库标记为素材库,对素材库内的数据进行主题词提取设置,标记为初始词,通过设置的标准限制条件对初始词进行校核,将校核成功的初始词标记为主题词,将主题词进行整合并建立主题词库。
30.其中,数据库中使用过的素材数据将不会再使用。
31.对素材库内的数据进行主题词提取设置,基于文本数据进行主题词的提取和设置为本领域常识,因此不进行详细叙述。
32.通过设置的标准限制条件对初始词进行校核,可以由专家组建立对应的学习模型,通过建立的学习模型进行校核,还可以根据需要对校核后的主题词再采用人工审核的方式进行二次校核。
33.词典制定规则采用人工的方式进行设置,主要原则是主题词应简短明确,应从电网设备技术标准中抽取,也可来自电网设备全过程管理工作中与技术标准相适应的电力相关术语,属于电力行业术语,经词频统计和规范化处理后业务确定后审核决定;还应包括如下的约束条件:
34.主题词库应从大量的国内外电网设备技术文献和档案文献中抽取,经词频统计和规范化处理后择优选定;主题词以概念为单元,可选单词和复词,但必须是概念明确、专指性强的单义词;主题词不宜过长,要便于计算机输入和检索要求;主题词一般包括实体、行为、状态、时间、空间五个方面的术语;选定的主题词应为名词或名词型词组;选定的主题词应尽量与国内外有关主题词表兼容。
35.进行审核格式转化就是将采用人工制定的词典制定规则转化为系统识别语言规则,获得可以直接进行系统识别判断的标准限制条件,可以采用现有的技术方式进行转化。
36.所述采集渠道用于进行词典文本数据的采集,采用人工的方式设置,先确定对应的词典覆盖范围,再根据对应的词典覆盖范围建立对应的数据采集通道,可以根据现有的技术方案实现对指定词典覆盖范围内的数据采集;其中词典覆盖范围为:变压器、断路器、电压互感器等72类电网设备主标准、从标准等相关技术标准中的电力相关名词、术语。可参考电网设备管理工作中涉及的专业术语,例如电网设备规划可研、工程设计、设备采购、设备制造、设备验收、设备安装、设备调试、竣工验收、运维检修、退役报废等全过程管理工作中与技术标准相适应的电力相关名词、术语。
37.所述条款库用于储存对应的标准条款,用于为问答判断提供标准数据支持,具体的条款库可以使用现有的,或者采用人工的方式进行补充或重新建立。
38.所述标准问答模块用于基于条款库中的标准条款建立对应的标准问答库,具体方法包括:
39.识别条款库中的标准条款,获取标准条款的应用方向,基于获取的应用方向设置
对应的问题检索式,根据设置的问题检索式进行问题检索,获得若干个问答问题,将获得的问答问题进行去重,获得待选问答,将待选问答进行筛选,获得标准问答,并打上对应的标准条款标签,将获得的标准问答进行整合后建立标准问答库。
40.基于获取的应用方向设置对应的问题检索式为本领域常识,因此不进行详细叙述;将待选问答进行筛选,采用人工的方式进行筛选;在本技术中具体未公开的部分为本领域技术常识,因此不进行详细叙述。
41.所述组合问答模块用于基于主题词库建立组合问答库,建立语句模型,通过建立的语句模型对主题词库中主题词进行组合,输出组合问答,输出组合问答的主题词集,进行主题词集的数值转化,获得主题词集数值;设置对应组合问答的语境值,将语境值和对应的主题词集数值进行整合,获得匹配矢量,将匹配矢量映射到向量空间中,将根据当前的组合问答进行汇总建立组合问答库。
42.设置对应组合问答的语境值的方法包括:
43.识别对应的主题词集数值,标记为zti,其中i表示主题词,其中i=1、2、
……
、n,n为正整数;识别组合问答对应的标准问答,匹配对应的标准附加值,标记为bz,设置组合问答的语境调整系数,标记为α,根据语境值公式计算语境值,其中b1、b2均为比例系数,取值范围为0《b1≤1,0《b2≤1。
44.通过设置语境值,提高匹配矢量在后续问答匹配过程中的匹配准确性,进而提高是非判断的准确性。
45.识别组合问答对应的标准问答,通过关联模块可以获得对应的标准问答,根据具有的标准问答均设置一个对应的标准附加值,由专家组进行设置,建立对应的标准附加值匹配表,匹配后获得对应的标准附加值。
46.进行主题词集的数值转化的方法为:根据具有的主题词建立对应的赋值匹配表,根据赋值匹配表进行匹配,获得对应的主题词集赋值。
47.语句模型是基于cnn网络或dnn网络进行建立的,再通过设置对应的训练集进行训练获得,具体的建立和训练过程为本领域常识。
48.设置组合问答的语境调整系数,可以在建立和训练语句模型时同步输出对应的语境调整系数,或者重新建立一个神经网络模型进行设置。
49.所述关联模块用于将组合问答和标准问答进行相关联,识别组合问答库中的组合问答和标准问答库中的标准问答,将组合问答与标准问答进行相似度计算,获得对应的相似度,根据相似度将组合问答分配给对应的标准问答,打上对应的从属标签,建立从属问答表。
50.将组合问答与标准问答进行相似度计算,直接通过现有的相似度算法进行计算。
51.根据相似度将组合问答分配给对应的标准问答,就是根据计算的相似度高低,识别出对应含义的组合问答和标准问答,因为组合问答的数量一般是高于标准问答的,即一般来说,一个标准问答可能对应多个组合问答。
52.所述判别模块用于判断识别问题是否正确,具体方法包括:
53.获取识别的用户问题,进行用户问题的关键词提取,获得问题关键词集,将获得的问题关键词集进行赋值,获得问题关键词集赋值,设置用户问题的语境值,整合为对应的问
题矢量,将问题矢量输入到对应的向量空间中,计算问题矢量与对应匹配矢量之间的相似度,根据计算的相似度高低匹配对应的组合问答,根据匹配的组合问答获得对应的标准问答,再根据获得的标准问答匹配对应的标准条款,根据标准问答、标准条款对用户问题进行是非判断,获得对应的判断结果。
54.将获得的问题关键词集进行赋值的方法包括:
55.将问题关键词集与主题词库中的主题词进行匹配,获得对应的赋值,将未匹配到的问题关键词标记为相似关键词,根据相似关键词匹配对应的相似赋值,整合为关键词集赋值。
56.根据相似关键词匹配对应的相似赋值的方法为:
57.将相似关键词输入到主题词库中进行词义相似度计算,获得对应最高的相似度,以及对应主题词的赋值,分别标记为xs和fz,与之前的主题词数值采用不同的表示方式进行区分,根据公式xf=b3
×
xs
×
fz
×
η计算对应的相似赋值,其中,b1为比例系数,取值范围为0《b1≤1,η为相似调整系数,由专家组进行讨论设置的。
58.将相似关键词输入到主题词库中进行词义相似度计算,可以采用人工的方式设置对应的学习模型进行智能计算,或者建立不同主题词的相似词库,并对对应的相似词进行分级,不同级别对应不同的相似度,进行匹配后,获得对应的相似度,具体未公开的部分为本领域常识。
59.设置用户问题的语境值,采用与组合问答的语境值不用的设置方式,直接建立对应的神经网络模型进行训练,通过利用人工智能进行智能设置,虽然就有一定的误差,但是误差在允许范围内,具体的建立和训练过程为本领域常识。
60.根据标准问答、标准条款对用户问题进行是非判断,可以通过现有的技术实现对其的是非判断,或者建立对应的学习模型进行判断,具体地为本领域常识,因此不进行详细叙述。
61.上述公式均是去除量纲取其数值计算,公式是由采集大量数据进行软件模拟得到最接近真实情况的一个公式,公式中的预设参数和预设阈值由本领域的技术人员根据实际情况设定或者大量数据模拟获得。
62.以上实施例仅用以说明本发明的技术方法而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方法进行修改或等同替换,而不脱离本发明技术方法的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1