基于人工智能的知识库生成方法和智能机器人应答方法与流程

文档序号:25791129发布日期:2021-07-09 11:26阅读:220来源:国知局
基于人工智能的知识库生成方法和智能机器人应答方法与流程

1.本发明属于人工智能技术领域,具体涉及一种基于人工智能的知识库生成方法和一种智能机器人应答方法。


背景技术:

2.问答智能机器人在进行应答时,基于问题所得到的答案的准确性取决于机器人内部的知识库,通常情况下,知识库越全面,答案的准确性越高。目前的知识库的生成方式通常为人工构建,然而,人工构建需要很大的数据量,而且,所需的知识库的规模越大,构建所需的数据量越多,因此,人工构建知识库的方式效率较低,而且工作量很大,无法适应目前越来越准确的应答需求。


技术实现要素:

3.本发明提供一种基于人工智能的知识库生成方法和一种智能机器人应答方法,用于解决现有的知识库的生成方式的效率较低的技术问题。
4.一种基于人工智能的知识库生成方法,包括:
5.获取知识库生成指令,所述知识库生成指令包括目标知识库所属的目标领域;
6.根据所述知识库生成指令,从初始数据库中获取与所述目标领域相关的目标数据库;
7.根据所述目标数据库,从所述目标数据库中获取目标文本,所述目标文本为用于生成所述目标知识库的相关文本;
8.对所述目标文本进行解析,得到所述目标知识库。
9.更优地,所述根据所述知识库生成指令,从初始数据库中获取与所述目标领域相关的目标数据库,具体为:
10.根据所述知识库生成指令,将所述目标领域输入至预设的领域知识图谱中,确定与所述目标领域相关的关联领域;
11.从所述初始数据库中获取所述目标数据库,所述目标数据库包括与所述目标领域相对应的数据库和与所述关联领域相对应的数据库。
12.更优地,所述对所述目标文本进行解析,得到所述目标知识库,具体为:
13.获取所述目标文本中包含备选答案的目标语句,以及各备选答案在所述目标语句中的位置;
14.对所述目标语句和所述各备选答案在所述目标语句中的位置进行编码,得到目标语义向量;
15.对所述目标语义向量进行解码,得到所述目标知识库。
16.更优地,所述对所述目标语句和所述各备选答案在所述目标语句中的位置进行编码,得到目标语义向量,具体为:
17.通过预设的双向lstm结构的编码器对所述目标语句和所述各备选答案在所述目
标语句中的位置进行编码,得到目标语义向量。
18.更优地,所述通过预设的双向lstm结构的编码器对所述目标语句和所述各备选答案在所述目标语句中的位置进行编码,得到目标语义向量,具体为:
19.根据所述各备选答案在所述目标语句中的依存关系,得到备选答案树形结构序列;
20.计算所述各备选答案在所述备选答案树形结构序列中的位置向量;
21.将所述各备选答案在所述备选答案树形结构序列中的位置向量输入至所述双向lstm结构中;
22.根据所述双向lstm结构,对各备选答案进行语义编码,得到各备选答案对应的语义向量;
23.根据所述双向lstm结构,依据各备选答案在所述备选答案树形结构序列中的位置向量以及语义向量,生成各备选答案的目标语义向量。
24.更优地,所述对所述目标语义向量进行解码,得到所述目标知识库,具体为:
25.通过预设的单向lstm结构的解码器,在所述单向lstm结构中以所述目标语义向量为初始状态,解码输出目标答案,得到所述目标知识库。
26.一种智能机器人应答方法,包括:
27.获取待应答问题;
28.将所述待应答问题输入至目标知识库中,获取与所述待应答问题相对应的答案;
29.所述目标知识库按照上述的基于人工智能的知识库生成方法生成得到。
30.本发明的技术效果包括:知识库生成指令中包括目标知识库所属的目标领域,先根据知识库生成指令,从初始数据库中获取与目标领域相对应的目标数据库,目标数据库为与目标知识库密切相关的数据库,然后根据目标数据库,从目标数据库中获取目标文本,目标文本为用于生成目标知识库的相关文本,最后对目标文本进行解析,得到目标知识库,因此,本发明提供的知识库生成方法是一种根据数据自动进行知识库生成的方法,相较于人工构建知识库的方式,无需专门配设工作人员整理与生成的知识库相关的数据,知识库生成效率得到很大的提升,而且,不受知识库的规模的影响,即便较大规模的知识库,效率也不会降低,因此,本发明提供的知识库生成方法能够适应目前越来越准确的应答需求。
附图说明
31.图1是本发明提供的一种基于人工智能的知识库生成方法的流程图;
32.图2是本发明提供的一种智能机器人应答方法的流程图。
具体实施方式
33.基于人工智能的知识库生成方法实施例:
34.本实施例提供一种基于人工智能的知识库生成方法,该知识库生成方法可以应用于服务器、电脑设备等等。如图1所示,知识库生成方法包括以下步骤:
35.步骤1:获取知识库生成指令,所述知识库生成指令包括目标知识库所属的目标领域:
36.获取知识库生成指令,知识库生成指令用于启动知识库的生成过程。知识库生成
指令可由信号输入设备进行输入,比如键盘、触摸屏设备等。
37.本发明提供的知识库生成方法用于生成目标知识库,本实施例中,目标知识库对应有特定的领域,目标知识库对应的特定的领域为目标知识库所属的目标领域。知识库生成指令包括目标知识库所属的目标领域。
38.步骤2:根据所述知识库生成指令,从初始数据库中获取与所述目标领域相关的目标数据库:
39.预设有一个初始数据库,初始数据库为用于目标知识库生成的数据基础,初始数据库是一个数据库群,包括多个领域的数据库,作为一个具体实施方式,包括目前已知的所有领域的数据库,或者目标知识库生成过程中可能用到的多个领域的数据库。各数据库包括至少一个文本,文本的个数以及各文本的长度由实际情况进行设置,目标知识库由这些文本生成。本实施例不对各数据库中的各文本的格式做限定。
40.根据知识库生成指令,从初始数据库中获取与目标领域相关的目标数据库。作为一个具体实施方式,预设一个领域知识图谱,该领域知识图谱包括目前已知所有知识库涉及到的领域,以及各领域之间的关系,从该领域知识图谱中,就可以获取到任意两个领域之间的关系,比如:任意两个领域之间是否相关,以及相关性如何。那么,将目标领域输入至预设的领域知识图谱中,确定与目标领域相关的关联领域,本实施例中,根据领域知识图谱获取目标领域与其他各领域之间的相关性,并预设有一个相关性阈值,获取大于或者等于该相关性阈值的相关性,并确定这些相关性所对应的领域,这些领域为与目标领域具有较高相关性的领域,即为关联领域。
41.然后,将目标领域和得到的关联领域输入至初始数据库中,从初始数据库中获取目标数据库,目标数据库包括两部分,一部分为与目标领域相对应的数据库,另一部分为与关联领域相对应的数据库。
42.通过上述目标数据库获取方式,除了能够得到与目标领域相对应的数据库,还能够得到与目标领域相关的其他数据库,不但不会获取到无关的数据,而且,还可以提升数据库获取的全面性,进而提升后续目标知识库的全面性,进而提升根据目标知识库进行机器人应答的准确性。
43.作为其他的实施方式,可以只获取与目标领域相对应的数据库,该数据库为目标数据库。
44.步骤3:根据所述目标数据库,从所述目标数据库中获取目标文本,所述目标文本为用于生成所述目标知识库的相关文本:
45.目标数据库可以只包括一个数据库,也可以包括多个数据库,本实施例以一个目标数据库为例进行说明,若包括多个数据库,各数据库的处理过程相同。
46.根据目标数据库,从目标数据库中获取目标文本,目标文本为用于生成目标知识库的相关文本。目标文本可以是目标数据库中的所有的文本,即目标数据库中的各文本均是用于生成目标知识库的相关文本,或者,从目标数据库中选取部分文本(比如随机选取,或者按照预设的选取机制进行选取),选取得到的文本为目标文本。若目标文本不止一个,则各目标文本的处理过程相同,本实施例以其中一个目标文本为例进行说明。
47.步骤4:对所述目标文本进行解析,得到所述目标知识库:
48.对目标文本进行解析,得到目标知识库,解析过程由实际情况进行设置,可以采用
已有的解析策略进行解析处理,比如:将目标文本进行关键字提取,根据得到的关键字,以及对应的目标文本构成目标知识库。作为一个具体实施方式,以下给出解析的一种具体实现过程:
49.(4

1):获取目标文本中包含备选答案的目标语句,以及各备选答案在目标语句中的位置:
50.备选答案为与目标答案相关的各答案,备选答案可以包括最终的目标答案,而且,备选答案可以不止一个。
51.获取目标文本中包含备选答案的目标语句,以及各备选答案在目标语句中的位置。本实施例中,可以根据预设的获取模型来获取目标文本中包含备选答案的目标语句,以及各备选答案在目标语句中的位置,比如:获取模型为序列标注模型,通过序列标注模型对目标文本进行切分,切分成多个语句,然后对各个语句进行标注,得到备选答案所处的目标语句,以及各备选答案在目标语句中的位置。
52.作为其他的实施方式,备选答案可以是已知的,那么,就可以直接根据备选答案确定备选答案所处的目标语句,并获取各备选答案在目标语句中的位置。
53.(4

2):对目标语句和各备选答案在目标语句中的位置进行编码,得到目标语义向量:
54.本实施例中,通过预设的应答模型对目标语句和各备选答案在目标语句中的位置进行处理,得到目标知识库。其中,应答模型包括编码器和解码器,编码器为双向lstm结构的编码器。那么,通过双向lstm结构的编码器对目标语句和各备选答案在目标语句中的位置进行编码,得到目标语义向量,以下给出一种具体的实现过程:
55.根据各备选答案在目标语句中的依存关系,得到备选答案树形结构序列。作为一个具体实施方式,可以通过预设的依存分析工具,获取各备选答案在目标语句中的依存关系,进而构建备选答案树形结构序列,或者,各备选答案在目标语句中的依存关系是已知的,然后,根据各备选答案在目标语句中的依存关系,以及预设的依存分析工具,构建备选答案树形结构序列。
56.计算各备选答案在备选答案树形结构序列中的位置向量,位置向量表征各备选答案在备选答案树形结构序列中的位置。作为一个具体实施方式,可以将各备选答案在备选答案树形结构序列中的位置采用预设维度的向量来表示,从而得到各备选答案在备选答案树形结构序列中的位置向量。其中,预设维度可以由实际情况进行设置,本申请并不做具体限定。
57.将各备选答案在备选答案树形结构序列中的位置向量输入至双向lstm结构中。
58.根据双向lstm结构,对各备选答案进行语义编码,得到各备选答案对应的语义向量。应当理解,各备选答案的语义向量可以为多维向量,语义向量中每一维度的向量都表示了备选答案的语义信息。语义向量的维度可以由实际情况进行设置,本申请并不做具体限定。
59.根据双向lstm结构,依据各备选答案在备选答案树形结构序列中的位置向量以及语义向量,生成各备选答案的目标语义向量。本实施例中,对于任意一个备选答案,对该备选答案对应的位置向量以及语义向量做向量运算处理,得到该备选答案对应的目标语义向量,进而得到其他各备选答案的目标语义向量。
60.(4

3)对目标语义向量进行解码,得到目标知识库:
61.应答模型的解码器为单向lstm结构的解码器。那么,通过单向lstm结构的解码器,对目标语义向量进行解码,得到目标知识库,具体为:在单向lstm结构中以目标语义向量为初始状态,解码输出目标答案,得到目标知识库。其中,在解码输出目标答案过程中,可以按照预设顺序(比如时间顺序)依次进行解码,输出目标答案,直至解码结束,或者直至满足其他预设条件。应当理解,对任意一个备选答案的解析过程中,对该备选答案的目标语义向量进行解码,得到该备选答案对应的目标答案,具体地:将该备选答案对应的目标语义向量与预设数据库中存储的所有目标备选答案的语义向量做相似性运算,得到相似性运算结果,将预设数据库中的相似性运算结果符合预设相似性阈值的语义向量对应的目标备选答案作为该备选答案对应的目标答案。进一步地,相似性运算可以为点积运算,将点积结果作为相似性运算结果,并对点积结果进行概率化运算,得到概率化运算结果,选择概率化运算结果符合预设概率阈值的目标备选答案作为该备选答案对应的目标答案。
62.因此,通过上述过程可以得到各备选答案对应的目标答案,进而得到包含目标答案的目标知识库。
63.智能机器人应答方法实施例:
64.本实施例提供一种智能机器人应答方法,该智能机器人应答方法应用到智能机器人中,对获取到的待应答问题进行处理,得到对应的答案。那么,如图2所示,本实施例提供一种智能机器人应答方法,包括:
65.步骤1:获取待应答问题:
66.可以通过麦克风获取待应答问题的语音信号,然后识别为文字信号。
67.步骤2:将所述待应答问题输入至目标知识库中,获取与所述待应答问题相对应的答案:
68.将待应答问题输入至目标知识库中,获取与待应答问题相对应的答案。目标知识库按照上述基于人工智能的知识库生成方法实施例中给出的基于人工智能的知识库生成方法生成得到,由于该基于人工智能的知识库生成方法在上文已给出了详细说明,不再赘述。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1