基于人工智能的事理图谱构建方法及相关设备与流程

文档序号:29044024发布日期:2022-02-25 21:31阅读:182来源:国知局
基于人工智能的事理图谱构建方法及相关设备与流程

1.本发明涉及人工智能技术领域,尤其涉及一种基于人工智能的事理图谱构建方法及相关设备。


背景技术:

2.随着人工智能的发展,很多事件之间往往具有多重复合联系,分析多个事件的因果关系也起到了极为重要的影响。
3.目前,通常是研究员直接通过个人专业经验对多个事件的逻辑关系进行分析,进而确定出与当前事件相关联的下游事件,然而,这种方式受限于研究员的个人经验,导致无法准确并快速的预判出该下游事件。


技术实现要素:

4.鉴于以上内容,有必要提供一种基于人工智能的事理图谱构建方法及相关设备,能够提高关联事件的确定准确性。
5.一方面,本发明提出一种基于人工智能的事理图谱构建方法,所述基于人工智能的事理图谱构建方法包括:
6.获取多个文本信息;
7.抽取所述多个文本信息中的信息事件;
8.对所述信息事件进行聚类处理,得到至少一个事件类别及每个事件类别对应的聚类事件;
9.基于预设基础事件库及预先训练好的因果关系预测模型检测所述聚类事件之间的关联关系;
10.根据所述聚类事件及所述关联关系构建事理图谱;
11.当接收到关联事件确定请求时,根据所述关联事件确定请求识别出待测事件;
12.基于所述待测事件从所述事理图谱中提取关联事件。
13.根据本发明优选实施例,所述获取多个文本信息包括:
14.当接收到预设网站发出的安全响应信息时,从所述预设网站中爬取主题信息;
15.基于所述主题信息在所述预设网站的点击量,从所述主题信息中筛选出热门主题;
16.将所述热门主题作为查询对象写入预设语句,得到查询语句;
17.在文本库中运行所述查询语句,得到所述多个文本信息。
18.根据本发明优选实施例,所述抽取所述多个文本信息中的信息事件包括:
19.对每个文本信息进行分词处理,得到信息分词,并基于所述多个文本信息确定所述信息分词所在的信息语句;
20.检测所述信息分词在所述信息语句中的目标词性,并将所述目标词性为预设词性的信息分词确定为待选分词;
21.将所述待选分词与预设事件模板库中的模板事件进行匹配,并将与所述模板事件匹配成功的待选分词确定为第一初筛事件;
22.基于所述目标词性对所述信息分词进行向量化处理,得到文本向量;
23.将所述文本向量输入到预先训练好的命名实体识别模型中,并从所述命名实体识别模型的激活层中获取所述信息分词的输出概率及转移概率;
24.对所述输出概率及所述转移概率进行加权和运算,得到所述信息分词的标签分数;
25.将所述标签分数最高的信息分词确定为第二初筛事件,并将所述第一初筛事件及所述第二初筛事件确定为所述信息事件。
26.根据本发明优选实施例,所述对所述信息事件进行聚类处理,得到至少一个事件类别及每个事件类别对应的聚类事件包括:
27.从所述多个文本信息中提取与所述信息事件对应的事件信息;
28.基于所述事件信息计算预设事件对的事件距离,所述预设事件对包括任意两个信息事件;
29.将所述事件距离大于第一阈值的预设事件对确定为目标事件对;
30.统计所述目标事件对中每个信息事件的事件数量,并统计所述目标事件中所有事件的事件总量;
31.计算所述事件数量在所述事件总量上的比值作为每个信息事件在所述目标事件对上的事件比值;
32.将所述事件比值小于配置比值的信息事件确定为节点事件;
33.从所述事件距离中选取与所述节点事件对应的信息作为目标距离;
34.将所述目标距离小于第二阈值所对应的信息事件归类为同一事件类别,得到所述至少一个事件类别,并将同一事件类别的信息事件确定为所述聚类事件,所述第一阈值大于所述第二阈值。
35.根据本发明优选实施例,所述聚类事件包括第一事件及第二事件,所述基于预设基础事件库及预先训练好的因果关系预测模型检测所述聚类事件之间的关联关系包括:
36.从所述预设基础事件库中匹配出所述第一事件与所述第二事件的关联结果;
37.将所述聚类事件输入至所述因果关系预测模型中,得到所述第一事件与所述第二事件的预测结果,所述预测结果包括逻辑结果及所述逻辑结果的预测概率;
38.若所述关联结果与所述逻辑结果不同,获取所述预设基础事件库及所述因果关系预测模型的预测权值;
39.基于所述预测权值及所述预测概率对所述关联结果及所述预测结果进行加权和处理,得到所述关联结果的第一预测分值及所述逻辑结果的第二预测分值;
40.根据所述第一预测分值及所述第二预测分值从所述关联结果及所述逻辑结果中选取所述关联关系。
41.根据本发明优选实施例,所述根据所述关联事件确定请求识别出待测事件包括:
42.从所述关联事件确定请求中提取待测语句;
43.将所述待测语句转换为待测向量;
44.利用双向长短期记忆网络对所述待测向量进行特征抽取,得到正向长短期记忆网
络中的第一特征向量,及反向长短期记忆网络中的第二特征向量;
45.拼接所述第一特征向量及所述第二特征向量,得到所述待测向量的目标向量;
46.从预设曲线中获取与所述目标向量中每个向量元素对应的信息作为元素分值;
47.将所述元素分值最大的向量元素所对应的信息确定为所述待测事件。
48.根据本发明优选实施例,所述基于所述待测事件从所述事理图谱中提取关联事件包括:
49.从所述事理图谱中确定与所述待测事件相匹配的事件作为匹配事件;
50.检测所述匹配事件在所述事理图谱中所处的事件路径;
51.从所述事件路径中提取所述匹配事件的下游事件作为所述关联事件。
52.另一方面,本发明还提出一种基于人工智能的事理图谱构建装置,所述基于人工智能的事理图谱构建装置包括:
53.获取单元,用于获取多个文本信息;
54.抽取单元,用于抽取所述多个文本信息中的信息事件;
55.聚类单元,用于对所述信息事件进行聚类处理,得到至少一个事件类别及每个事件类别对应的聚类事件;
56.检测单元,用于基于预设基础事件库及预先训练好的因果关系预测模型检测所述聚类事件之间的关联关系;
57.构建单元,用于根据所述聚类事件及所述关联关系构建事理图谱;
58.识别单元,用于当接收到关联事件确定请求时,根据所述关联事件确定请求识别出待测事件;
59.提取单元,用于基于所述待测事件从所述事理图谱中提取关联事件。
60.另一方面,本发明还提出一种电子设备,所述电子设备包括:
61.存储器,存储计算机可读指令;及
62.处理器,执行所述存储器中存储的计算机可读指令以实现所述基于人工智能的事理图谱构建方法。
63.另一方面,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可读指令,所述计算机可读指令被电子设备中的处理器执行以实现所述基于人工智能的事理图谱构建方法。
64.由以上技术方案可以看出,本发明通过对所述信息事件进行聚类处理,能够避免所述聚类事件中存在与其他事件无关的干扰事件,从而在后续分析所述关联关系时能够避免对干扰事件进行分析,同时,对所述信息事件进行分类,以得到至少一个事件类别,进而能够基于同一事件类别的聚类事件进行关联关系的检测,从而能够双重提高所述关联关系的检测效率,进一步地,通过结合所述预设基础事件库及所述因果关系预测模型能够准确的检测出所述关联关系,同时,由于所述聚类事件中不包含干扰事件,因此能够提高所述关联关系的准确性,从而能够准确的生成所述事理图谱,进而基于所述事理图谱能够准确的提取到所述关联事件。
附图说明
65.图1是本发明基于人工智能的事理图谱构建方法的较佳实施例的流程图。
66.图2是本发明基于人工智能的事理图谱构建装置的较佳实施例的功能模块图。
67.图3是本发明实现基于人工智能的事理图谱构建方法的较佳实施例的电子设备的结构示意图。
具体实施方式
68.为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
69.如图1所示,是本发明基于人工智能的事理图谱构建方法的较佳实施例的流程图。根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。
70.所述基于人工智能的事理图谱构建方法可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
71.人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
72.所述基于人工智能的事理图谱构建方法应用于一个或者多个电子设备中,所述电子设备是一种能够按照事先设定或存储的计算机可读指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(application specific integrated circuit,asic)、可编程门阵列(field-programmable gate array,fpga)、数字信号处理器(digital signal processor,dsp)、嵌入式设备等。
73.所述电子设备可以是任何一种可与用户进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(personal digital assistant,pda)、游戏机、交互式网络电视(internet protocol television,iptv)、智能穿戴式设备等。
74.所述电子设备可以包括网络设备和/或用户设备。其中,所述网络设备包括,但不限于单个网络电子设备、多个网络电子设备组成的电子设备组或基于云计算(cloud computing)的由大量主机或网络电子设备构成的云。
75.所述电子设备所处的网络包括,但不限于:互联网、广域网、城域网、局域网、虚拟专用网络(virtual private network,vpn)等。
76.s10,获取多个文本信息。
77.在本发明的至少一个实施例中,所述多个文本信息是指热门主题所对应的文本。所述多个文本信息可以从新闻网站中获取到。
78.在本发明的至少一个实施例中,所述电子设备获取多个文本信息包括:
79.当接收到预设网站发出的安全响应信息时,从所述预设网站中爬取主题信息;
80.基于所述主题信息在所述预设网站的点击量,从所述主题信息中筛选出热门主题;
81.将所述热门主题作为查询对象写入预设语句,得到查询语句;
82.在文本库中运行所述查询语句,得到所述多个文本信息。
83.其中,所述预设网站可以是任意公开网站,例如,所述预设网站可以是与金融有关的金融网站。
84.所述安全响应信息是指所述主题信息的爬取许可信息。
85.所述主题信息是指所述预设网站中存储的所有主题,例如,所述主题信息可以是房贷利率的调整。
86.所述点击量是指所述预设网站中与所述主题信息有关的所有文本的总点击量。
87.所述热门主题是指在所述预设网站中,所述点击量最大的主题信息。
88.所述文本库中存储有多个主题信息的相关文本。
89.通过所述安全响应信息能够确保所述主题信息的爬取合法性,进而通过所述点击量的分析能够准确的确定出所述热门主题,进而基于所述查询语句对所述文本库中的所有文本进行筛选,能够提高所述多个文本信息的获取效率。
90.s11,抽取所述多个文本信息中的信息事件。
91.在本发明的至少一个实施例中,所述信息事件是指所述多个文本信息中出现的事件信息。
92.在本发明的至少一个实施例中,所述电子设备抽取所述多个文本信息中的信息事件包括:
93.对每个文本信息进行分词处理,得到信息分词,并基于所述多个文本信息确定所述信息分词所在的信息语句;
94.检测所述信息分词在所述信息语句中的目标词性,并将所述目标词性为预设词性的信息分词确定为待选分词;
95.将所述待选分词与预设事件模板库中的模板事件进行匹配,并将与所述模板事件匹配成功的待选分词确定为第一初筛事件;
96.基于所述目标词性对所述信息分词进行向量化处理,得到文本向量;
97.将所述文本向量输入到预先训练好的命名实体识别模型中,并从所述命名实体识别模型的激活层中获取所述信息分词的输出概率及转移概率;
98.对所述输出概率及所述转移概率进行加权和运算,得到所述信息分词的标签分数;
99.将所述标签分数最高的信息分词确定为第二初筛事件,并将所述第一初筛事件及所述第二初筛事件确定为所述信息事件。
100.其中,所述目标词性是指所述信息分词在所述信息语句中所充当的角色,例如,所述目标词性为宾语,所述目标词性为主语等。
101.所述预设词性是根据大数据分析后确定的,所述预设词性可以设置为主语,本发明对所述预设词性的具体确定方式不作阐述。
102.所述预设事件模板库中存储有多个模板事件。所述第一初筛事件是指存在所述预设事件模板库中的待选分词。
103.通过对所述信息分词的词性的检测,能够准确的从所述信息分词中筛选出所述待选分词,进而基于所述预设事件模板库能够准确的确定出所述第一初筛事件,通过所述目标词性对所述信息分词进行向量化处理,能够生成反映出所述目标词性的文本向量,提高所述文本向量的表征能力,通过所述命名实体识别模型对所述文本向量进行分析,能够准
确的确定出所述第二初筛事件,进而结合所述第一初筛事件及所述第二初筛事件能够提高所述信息事件的全面性。
104.s12,对所述信息事件进行聚类处理,得到至少一个事件类别及每个事件类别对应的聚类事件。
105.在本发明的至少一个实施例中,所述至少一个事件类别是指相似事件所对应的类别。所述聚类事件是指相似事件。
106.在本发明的至少一个实施例中,所述电子设备对所述信息事件进行聚类处理,得到至少一个事件类别及每个事件类别对应的聚类事件包括:
107.从所述多个文本信息中提取与所述信息事件对应的事件信息;
108.基于所述事件信息计算预设事件对的事件距离,所述预设事件对包括任意两个信息事件;
109.将所述事件距离大于第一阈值的预设事件对确定为目标事件对;
110.统计所述目标事件对中每个信息事件的事件数量,并统计所述目标事件中所有事件的事件总量;
111.计算所述事件数量在所述事件总量上的比值作为每个信息事件在所述目标事件对上的事件比值;
112.将所述事件比值小于配置比值的信息事件确定为节点事件;
113.从所述事件距离中选取与所述节点事件对应的信息作为目标距离;
114.将所述目标距离小于第二阈值所对应的信息事件归类为同一事件类别,得到所述至少一个事件类别,并将同一事件类别的信息事件确定为所述聚类事件,所述第一阈值大于所述第二阈值。
115.其中,所述事件信息是指描述所述信息事件的信息。
116.所述配置比值可以根据实际需求设定。
117.通过所述第一阈值能够从所述信息事件中筛选出所述节点事件,能够避免所述信息事件中的干扰事件对所述事理图谱的影响,通过所述第二阈值能够准确的对所述信息事件进行归类,提高所述至少一个事件类别的确定准确性及所述聚类事件的准确性。
118.s13,基于预设基础事件库及预先训练好的因果关系预测模型检测所述聚类事件之间的关联关系。
119.在本发明的至少一个实施例中,所述预设基础事件库中存储有多个金融事件之间的逻辑关系。
120.所述因果关系预测模型是基于bert网络构建生成的,并基于所述bert网络的预测准确性对所述bert网络中的学习率进行调整,直至所述预测准确性大于预设阈值。
121.所述关联关系是指预测分值最大所对应的结果信息,例如,关联结果a的第一预测分值为0.22,逻辑结果b的第二预测分值为0.78,则所述关联关系为所述逻辑结果b。
122.在本发明的至少一个实施例中,所述聚类事件包括第一事件及第二事件,所述电子设备基于预设基础事件库及预先训练好的因果关系预测模型检测所述聚类事件之间的关联关系包括:
123.从所述预设基础事件库中匹配出所述第一事件与所述第二事件的关联结果;
124.将所述聚类事件输入至所述因果关系预测模型中,得到所述第一事件与所述第二
事件的预测结果,所述预测结果包括逻辑结果及所述逻辑结果的预测概率;
125.若所述关联结果与所述逻辑结果不同,获取所述预设基础事件库及所述因果关系预测模型的预测权值;
126.基于所述预测权值及所述预测概率对所述关联结果及所述预测结果进行加权和处理,得到所述关联结果的第一预测分值及所述逻辑结果的第二预测分值;
127.根据所述第一预测分值及所述第二预测分值从所述关联结果及所述逻辑结果中选取所述关联关系。
128.通过结合所述预设基础事件库及所述因果关系预测模型对所述关联关系的分析,能够提高所述关联关系的准确性。
129.s14,根据所述聚类事件及所述关联关系构建事理图谱。
130.在本发明的至少一个实施例中,所述事理图谱中的图谱节点表示所述聚类事件,所述事理图谱中的连线表示两个节点之间具有的逻辑关系,不同的连线表示两个节点之间具有的逻辑关系不同,所述逻辑关系包括因果关系等。
131.在本发明的至少一个实施例中,所述电子设备根据所述聚类事件及所述关联关系构建事理图谱包括:
132.将所述聚类事件作为图谱节点,所述关联关系作为所述图谱节点的逻辑关系构建所述事理图谱。
133.通过所述聚类事件及所述关联关系能够快速的构建出所述事理图谱。
134.s15,当接收到关联事件确定请求时,根据所述关联事件确定请求识别出待测事件。
135.在本发明的至少一个实施例中,所述关联事件确定请求可以由有关联事件确定请求的用户触发生成。
136.所述待测事件是指需要进行关联事件检测的事件。
137.在本发明的至少一个实施例中,所述电子设备根据所述关联事件确定请求识别出待测事件包括:
138.从所述关联事件确定请求中提取待测语句;
139.将所述待测语句转换为待测向量;
140.利用双向长短期记忆网络对所述待测向量进行特征抽取,得到正向长短期记忆网络中的第一特征向量,及反向长短期记忆网络中的第二特征向量;
141.拼接所述第一特征向量及所述第二特征向量,得到所述待测向量的目标向量;
142.从预设曲线中获取与所述目标向量中每个向量元素对应的信息作为元素分值;
143.将所述元素分值最大的向量元素所对应的信息确定为所述待测事件。
144.其中,所述待测语句是指需要进行关联事件分析的语句。
145.所述双向长短期记忆网络中包括所述正向长短期记忆网络及所述反向长短期记忆网络。
146.所述预设曲线是根据预设矩阵及预设偏置值构建而生成的,所述预设矩阵及所述预设偏置值是根据实际需求设定的。
147.通过所述双向长短期记忆网络对所述待测语句进行特征分析,能够剔除所述待测语句中无关信息的影响,提高所述目标向量度所述待测语句的表征能力,通过所述预设曲
线能够快速的确定出所述元素分值,从而能够快速的识别出所述待测事件。
148.s16,基于所述待测事件从所述事理图谱中提取关联事件。
149.在本发明的至少一个实施例中,所述关联事件是指与所述待测事件处于同一事件路径的下游事件。
150.需要强调的是,为进一步保证上述关联事件的私密和安全性,上述关联事件还可以存储于一区块链的节点中。
151.在本发明的至少一个实施例中,所述电子设备基于所述待测事件从所述事理图谱中提取关联事件包括:
152.从所述事理图谱中确定与所述待测事件相匹配的事件作为匹配事件;
153.检测所述匹配事件在所述事理图谱中所处的事件路径;
154.从所述事件路径中提取所述匹配事件的下游事件作为所述关联事件。
155.其中,所述匹配事件是指所述事理图谱中与所述待测事件的事件相似度大于相似阈值的事件。
156.所述事件路径是指所述匹配事件所处的链路。
157.通过确定出的所述匹配事件提取所述关联事件,能够避免因事件描述不统一而造成对关联事件的遗漏,从而提高了所述关联事件的提取全面性。
158.由以上技术方案可以看出,本发明通过对所述信息事件进行聚类处理,能够避免所述聚类事件中存在与其他事件无关的干扰事件,从而在后续分析所述关联关系时能够避免对干扰事件进行分析,同时,对所述信息事件进行分类,以得到至少一个事件类别,进而能够基于同一事件类别的聚类事件进行关联关系的检测,从而能够双重提高所述关联关系的检测效率,进一步地,通过结合所述预设基础事件库及所述因果关系预测模型能够准确的检测出所述关联关系,同时,由于所述聚类事件中不包含干扰事件,因此能够提高所述关联关系的准确性,从而能够准确的生成所述事理图谱,进而基于所述事理图谱能够准确的提取到所述关联事件。
159.如图2所示,是本发明基于人工智能的事理图谱构建装置的较佳实施例的功能模块图。所述基于人工智能的事理图谱构建装置11包括获取单元110、抽取单元111、聚类单元112、检测单元113、构建单元114、识别单元115及提取单元116。本发明所称的模块/单元是指一种能够被处理器13所获取,并且能够完成固定功能的一系列计算机可读指令段,其存储在存储器12中。在本实施例中,关于各模块/单元的功能将在后续的实施例中详述。
160.获取单元110获取多个文本信息。
161.在本发明的至少一个实施例中,所述多个文本信息是指热门主题所对应的文本。所述多个文本信息可以从新闻网站中获取到。
162.在本发明的至少一个实施例中,所述获取单元110获取多个文本信息包括:
163.当接收到预设网站发出的安全响应信息时,从所述预设网站中爬取主题信息;
164.基于所述主题信息在所述预设网站的点击量,从所述主题信息中筛选出热门主题;
165.将所述热门主题作为查询对象写入预设语句,得到查询语句;
166.在文本库中运行所述查询语句,得到所述多个文本信息。
167.其中,所述预设网站可以是任意公开网站,例如,所述预设网站可以是与金融有关
的金融网站。
168.所述安全响应信息是指所述主题信息的爬取许可信息。
169.所述主题信息是指所述预设网站中存储的所有主题,例如,所述主题信息可以是房贷利率的调整。
170.所述点击量是指所述预设网站中与所述主题信息有关的所有文本的总点击量。
171.所述热门主题是指在所述预设网站中,所述点击量最大的主题信息。
172.所述文本库中存储有多个主题信息的相关文本。
173.通过所述安全响应信息能够确保所述主题信息的爬取合法性,进而通过所述点击量的分析能够准确的确定出所述热门主题,进而基于所述查询语句对所述文本库中的所有文本进行筛选,能够提高所述多个文本信息的获取效率。
174.抽取单元111抽取所述多个文本信息中的信息事件。
175.在本发明的至少一个实施例中,所述信息事件是指所述多个文本信息中出现的事件信息。
176.在本发明的至少一个实施例中,所述抽取单元111抽取所述多个文本信息中的信息事件包括:
177.对每个文本信息进行分词处理,得到信息分词,并基于所述多个文本信息确定所述信息分词所在的信息语句;
178.检测所述信息分词在所述信息语句中的目标词性,并将所述目标词性为预设词性的信息分词确定为待选分词;
179.将所述待选分词与预设事件模板库中的模板事件进行匹配,并将与所述模板事件匹配成功的待选分词确定为第一初筛事件;
180.基于所述目标词性对所述信息分词进行向量化处理,得到文本向量;
181.将所述文本向量输入到预先训练好的命名实体识别模型中,并从所述命名实体识别模型的激活层中获取所述信息分词的输出概率及转移概率;
182.对所述输出概率及所述转移概率进行加权和运算,得到所述信息分词的标签分数;
183.将所述标签分数最高的信息分词确定为第二初筛事件,并将所述第一初筛事件及所述第二初筛事件确定为所述信息事件。
184.其中,所述目标词性是指所述信息分词在所述信息语句中所充当的角色,例如,所述目标词性为宾语,所述目标词性为主语等。
185.所述预设词性是根据大数据分析后确定的,所述预设词性可以设置为主语,本发明对所述预设词性的具体确定方式不作阐述。
186.所述预设事件模板库中存储有多个模板事件。所述第一初筛事件是指存在所述预设事件模板库中的待选分词。
187.通过对所述信息分词的词性的检测,能够准确的从所述信息分词中筛选出所述待选分词,进而基于所述预设事件模板库能够准确的确定出所述第一初筛事件,通过所述目标词性对所述信息分词进行向量化处理,能够生成反映出所述目标词性的文本向量,提高所述文本向量的表征能力,通过所述命名实体识别模型对所述文本向量进行分析,能够准确的确定出所述第二初筛事件,进而结合所述第一初筛事件及所述第二初筛事件能够提高
所述信息事件的全面性。
188.聚类单元112对所述信息事件进行聚类处理,得到至少一个事件类别及每个事件类别对应的聚类事件。
189.在本发明的至少一个实施例中,所述至少一个事件类别是指相似事件所对应的类别。所述聚类事件是指相似事件。
190.在本发明的至少一个实施例中,所述聚类单元112对所述信息事件进行聚类处理,得到至少一个事件类别及每个事件类别对应的聚类事件包括:
191.从所述多个文本信息中提取与所述信息事件对应的事件信息;
192.基于所述事件信息计算预设事件对的事件距离,所述预设事件对包括任意两个信息事件;
193.将所述事件距离大于第一阈值的预设事件对确定为目标事件对;
194.统计所述目标事件对中每个信息事件的事件数量,并统计所述目标事件中所有事件的事件总量;
195.计算所述事件数量在所述事件总量上的比值作为每个信息事件在所述目标事件对上的事件比值;
196.将所述事件比值小于配置比值的信息事件确定为节点事件;
197.从所述事件距离中选取与所述节点事件对应的信息作为目标距离;
198.将所述目标距离小于第二阈值所对应的信息事件归类为同一事件类别,得到所述至少一个事件类别,并将同一事件类别的信息事件确定为所述聚类事件,所述第一阈值大于所述第二阈值。
199.其中,所述事件信息是指描述所述信息事件的信息。
200.所述配置比值可以根据实际需求设定。
201.通过所述第一阈值能够从所述信息事件中筛选出所述节点事件,能够避免所述信息事件中的干扰事件对所述事理图谱的影响,通过所述第二阈值能够准确的对所述信息事件进行归类,提高所述至少一个事件类别的确定准确性及所述聚类事件的准确性。
202.检测单元113基于预设基础事件库及预先训练好的因果关系预测模型检测所述聚类事件之间的关联关系。
203.在本发明的至少一个实施例中,所述预设基础事件库中存储有多个金融事件之间的逻辑关系。
204.所述因果关系预测模型是基于bert网络构建生成的,并基于所述bert网络的预测准确性对所述bert网络中的学习率进行调整,直至所述预测准确性大于预设阈值。
205.所述关联关系是指预测分值最大所对应的结果信息,例如,关联结果a的第一预测分值为0.22,逻辑结果b的第二预测分值为0.78,则所述关联关系为所述逻辑结果b。
206.在本发明的至少一个实施例中,所述聚类事件包括第一事件及第二事件,所述检测单元113基于预设基础事件库及预先训练好的因果关系预测模型检测所述聚类事件之间的关联关系包括:
207.从所述预设基础事件库中匹配出所述第一事件与所述第二事件的关联结果;
208.将所述聚类事件输入至所述因果关系预测模型中,得到所述第一事件与所述第二事件的预测结果,所述预测结果包括逻辑结果及所述逻辑结果的预测概率;
209.若所述关联结果与所述逻辑结果不同,获取所述预设基础事件库及所述因果关系预测模型的预测权值;
210.基于所述预测权值及所述预测概率对所述关联结果及所述预测结果进行加权和处理,得到所述关联结果的第一预测分值及所述逻辑结果的第二预测分值;
211.根据所述第一预测分值及所述第二预测分值从所述关联结果及所述逻辑结果中选取所述关联关系。
212.通过结合所述预设基础事件库及所述因果关系预测模型对所述关联关系的分析,能够提高所述关联关系的准确性。
213.构建单元114根据所述聚类事件及所述关联关系构建事理图谱。
214.在本发明的至少一个实施例中,所述事理图谱中的图谱节点表示所述聚类事件,所述事理图谱中的连线表示两个节点之间具有的逻辑关系,不同的连线表示两个节点之间具有的逻辑关系不同,所述逻辑关系包括因果关系等。
215.在本发明的至少一个实施例中,所述构建单元114根据所述聚类事件及所述关联关系构建事理图谱包括:
216.将所述聚类事件作为图谱节点,所述关联关系作为所述图谱节点的逻辑关系构建所述事理图谱。
217.通过所述聚类事件及所述关联关系能够快速的构建出所述事理图谱。
218.当接收到关联事件确定请求时,识别单元115根据所述关联事件确定请求识别出待测事件。
219.在本发明的至少一个实施例中,所述关联事件确定请求可以由有关联事件确定请求的用户触发生成。
220.所述待测事件是指需要进行关联事件检测的事件。
221.在本发明的至少一个实施例中,所述识别单元115根据所述关联事件确定请求识别出待测事件包括:
222.从所述关联事件确定请求中提取待测语句;
223.将所述待测语句转换为待测向量;
224.利用双向长短期记忆网络对所述待测向量进行特征抽取,得到正向长短期记忆网络中的第一特征向量,及反向长短期记忆网络中的第二特征向量;
225.拼接所述第一特征向量及所述第二特征向量,得到所述待测向量的目标向量;
226.从预设曲线中获取与所述目标向量中每个向量元素对应的信息作为元素分值;
227.将所述元素分值最大的向量元素所对应的信息确定为所述待测事件。
228.其中,所述待测语句是指需要进行关联事件分析的语句。
229.所述双向长短期记忆网络中包括所述正向长短期记忆网络及所述反向长短期记忆网络。
230.所述预设曲线是根据预设矩阵及预设偏置值构建而生成的,所述预设矩阵及所述预设偏置值是根据实际需求设定的。
231.通过所述双向长短期记忆网络对所述待测语句进行特征分析,能够剔除所述待测语句中无关信息的影响,提高所述目标向量度所述待测语句的表征能力,通过所述预设曲线能够快速的确定出所述元素分值,从而能够快速的识别出所述待测事件。
232.提取单元116基于所述待测事件从所述事理图谱中提取关联事件。
233.在本发明的至少一个实施例中,所述关联事件是指与所述待测事件处于同一事件路径的下游事件。
234.需要强调的是,为进一步保证上述关联事件的私密和安全性,上述关联事件还可以存储于一区块链的节点中。
235.在本发明的至少一个实施例中,所述提取单元116基于所述待测事件从所述事理图谱中提取关联事件包括:
236.从所述事理图谱中确定与所述待测事件相匹配的事件作为匹配事件;
237.检测所述匹配事件在所述事理图谱中所处的事件路径;
238.从所述事件路径中提取所述匹配事件的下游事件作为所述关联事件。
239.其中,所述匹配事件是指所述事理图谱中与所述待测事件的事件相似度大于相似阈值的事件。
240.所述事件路径是指所述匹配事件所处的链路。
241.通过确定出的所述匹配事件提取所述关联事件,能够避免因事件描述不统一而造成对关联事件的遗漏,从而提高了所述关联事件的提取全面性。
242.由以上技术方案可以看出,本发明通过对所述信息事件进行聚类处理,能够避免所述聚类事件中存在与其他事件无关的干扰事件,从而在后续分析所述关联关系时能够避免对干扰事件进行分析,同时,对所述信息事件进行分类,以得到至少一个事件类别,进而能够基于同一事件类别的聚类事件进行关联关系的检测,从而能够双重提高所述关联关系的检测效率,进一步地,通过结合所述预设基础事件库及所述因果关系预测模型能够准确的检测出所述关联关系,同时,由于所述聚类事件中不包含干扰事件,因此能够提高所述关联关系的准确性,从而能够准确的生成所述事理图谱,进而基于所述事理图谱能够准确的提取到所述关联事件。
243.如图3所示,是本发明实现基于人工智能的事理图谱构建方法的较佳实施例的电子设备的结构示意图。
244.在本发明的一个实施例中,所述电子设备1包括,但不限于,存储器12、处理器13,以及存储在所述存储器12中并可在所述处理器13上运行的计算机可读指令,例如基于人工智能的事理图谱构建程序。
245.本领域技术人员可以理解,所述示意图仅仅是电子设备1的示例,并不构成对电子设备1的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述电子设备1还可以包括输入输出设备、网络接入设备、总线等。
246.所述处理器13可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器13是所述电子设备1的运算核心和控制中心,利用各种接口和线路连接整个电子设备1的各个部分,及执行所述电子设备1的操作系统以及安装的各类应用程序、程序代码等。
247.示例性的,所述计算机可读指令可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器12中,并由所述处理器13执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段,该计算机可读指令段用于描述所述计算机可读指令在所述电子设备1中的执行过程。例如,所述计算机可读指令可以被分割成获取单元110、抽取单元111、聚类单元112、检测单元113、构建单元114、识别单元115及提取单元116。
248.所述存储器12可用于存储所述计算机可读指令和/或模块,所述处理器13通过运行或执行存储在所述存储器12内的计算机可读指令和/或模块,以及调用存储在存储器12内的数据,实现所述电子设备1的各种功能。所述存储器12可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据等。存储器12可以包括非易失性和易失性存储器,例如:硬盘、内存、插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)、至少一个磁盘存储器件、闪存器件、或其他存储器件。
249.所述存储器12可以是电子设备1的外部存储器和/或内部存储器。进一步地,所述存储器12可以是具有实物形式的存储器,如内存条、tf卡(trans-flash card)等等。
250.所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机可读指令来指令相关的硬件来完成,所述的计算机可读指令可存储于一计算机可读存储介质中,该计算机可读指令在被处理器执行时,可实现上述各个方法实施例的步骤。
251.其中,所述计算机可读指令包括计算机可读指令代码,所述计算机可读指令代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机可读指令代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)。
252.本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
253.结合图1,所述电子设备1中的所述存储器12存储计算机可读指令实现一种基于人工智能的事理图谱构建方法,所述处理器13可执行所述计算机可读指令从而实现:
254.获取多个文本信息;
255.抽取所述多个文本信息中的信息事件;
256.对所述信息事件进行聚类处理,得到至少一个事件类别及每个事件类别对应的聚类事件;
257.基于预设基础事件库及预先训练好的因果关系预测模型检测所述聚类事件之间的关联关系;
258.根据所述聚类事件及所述关联关系构建事理图谱;
259.当接收到关联事件确定请求时,根据所述关联事件确定请求识别出待测事件;
260.基于所述待测事件从所述事理图谱中提取关联事件。
261.具体地,所述处理器13对上述计算机可读指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
262.在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
263.所述计算机可读存储介质上存储有计算机可读指令,其中,所述计算机可读指令被处理器13执行时用以实现以下步骤:
264.获取多个文本信息;
265.抽取所述多个文本信息中的信息事件;
266.对所述信息事件进行聚类处理,得到至少一个事件类别及每个事件类别对应的聚类事件;
267.基于预设基础事件库及预先训练好的因果关系预测模型检测所述聚类事件之间的关联关系;
268.根据所述聚类事件及所述关联关系构建事理图谱;
269.当接收到关联事件确定请求时,根据所述关联事件确定请求识别出待测事件;
270.基于所述待测事件从所述事理图谱中提取关联事件。
271.所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
272.另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
273.因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
274.此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。所述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一、第二等词语用来表示名称,而并不表示任何特定的顺序。
275.最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1