实体关系抽取方法、终端和计算机可读存储介质与流程

文档序号:24236261发布日期:2021-03-12 13:08阅读:80来源:国知局
实体关系抽取方法、终端和计算机可读存储介质与流程

本申请涉及计算机技术领域,尤其涉及一种实体关系抽取方法、终端和计算机可读存储介质。



背景技术:

随着国际先进国家和中国在量子领域科学研究、产业化、市场化的推展,特别是量子计算机、量子加密技术逐步开始商业应用,量子科技在中国各行各业的影响与日俱增。从公开发表的网络新闻文本中识别量子相关的实体,并抽取这些量子相关实体之间的关系、构建量子企业间的关系图谱成为重要研究内容。目前,量子相关实体之间的关系主要以手动方式甄别为主,基于量子相关实体的信息提取、实体关系抽取的方法还不多。综上所述,现有量子相关的网络新闻和资信文本实体关系联合抽取主要存在以下问题:因为行业急剧发展,众多量子相关的实体名称未能及时进行识别,以及各家量子相关实体之间的关系有待梳理。



技术实现要素:

本申请实施例通过提供一种实体关系抽取方法、终端和计算机可读存储介质,旨在解决因为行业急剧发展,众多量子相关的实体名称未能及时进行识别,以及各家量子相关实体之间的关系有待梳理的问题。

为实现上述目的,本申请一方面提供一种实体关系抽取方法,所述实体关系抽取方法包括以下步骤:

获取与量子相关的文本数据,构建自注意力机制;

基于所述自注意力机制构建双向长短期记忆网络,并基于所述双向长短期记忆网络计算实体感知注意力;

将所述双向长短期记忆网络中的第一数据和所述实体感知注意力中的第二数据进行联合训练,得到训练模型;

将所述文本数据输入至所述训练模型中进行训练,得到抽取结果。

可选地,所述构建自注意力机制的步骤包括:

对查询和键值进行点乘计算,得到权重因子;

将所述权重因子进行缩放处理以获取缩放数据,将所述缩放数据进行归一化,得到权重系数,并将所述权重系数与设定值进行加权求和。

可选地,所述基于所述自注意力机制构建双向长短期记忆网络的步骤包括:

获取所述自注意力机制的数据层的数据;

基于所述数据层的数据构建向前长短期记忆网络和向后长短期记忆网络,并基于所述向前长短期记忆网络和所述向后长短期记忆网络组成所述双向长短期记忆网络。

可选地,所述基于所述双向长短期记忆网络计算实体感知注意力的步骤包括:

基于所述双向长短期记忆网络计算相对位置特征和潜在类型的实体特征;

根据所述相对位置特征和所述潜在类型的实体特征得到所述实体感知注意力。

可选地,所述将所述双向长短期记忆网络中的第一数据和所述实体感知注意力中的第二数据进行联合训练的步骤包括:

获取所述双向长短期记忆网络中参数共享层的第一数据以及所述实体感知注意力中联合解码层的第二数据;

将所述参数共享层的第一数据和所述联合解码层的第二数据进行联合训练。

可选地,所述将所述参数共享层的第一数据和所述联合解码层的第二数据进行联合训练的步骤包括:

构建损失函数的梯度下降优化器;

基于所述损失函数的梯度下降优化器对所述参数共享层的第一数据和所述联合解码层的第二数据进行联合训练。

可选地,所述获取与量子相关的文本数据的步骤之后,包括:

对所述文本数据进行结构化预处理,并进行分词和量子实体的识别操作,得到包含多个所述量子实体的句子;

基于所述句子组成语料库。

可选地,所述获取与量子相关的文本数据的步骤之后,还包括:

基于所述文本数据进行量子实体命名,以及确定所述量子实体之前的关系。

此外,为实现上述目的,本申请另一方面还提供一种终端,所述终端包括存储器、处理器及存储在存储器上并在处理器上运行的实体关系抽取程序,所述处理器执行所述实体关系抽取程序时实现如上所述实体关系抽取方法的步骤。

此外,为实现上述目的,本申请另一方面还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有实体关系抽取程序,所述实体关系抽取程序被处理器执行时实现如上所述实体关系抽取方法的步骤。

本实施例通过获取与量子相关的文本数据,构建自注意力机制;基于自注意力机制构建双向长短期记忆网络,并基于双向长短期记忆网络计算实体感知注意力;将双向长短期记忆网络中的第一数据和实体感知注意力中的第二数据进行联合训练,得到训练模型;将文本数据输入至训练模型中进行训练,得到抽取结果。解决了因为行业急剧发展,众多量子相关的实体名称未能及时进行识别,以及各家量子相关实体之间的关系有待梳理的问题,避免了繁琐的特征工程,提高了实体关系联合抽取效率。

附图说明

图1为本申请实施例方案涉及的硬件运行环境的终端结构示意图;

图2为本申请实体关系抽取方法第一实施例的流程示意图;

图3为本申请实体关系抽取方法第二实施例的流程示意图;

图4为本申请实体关系抽取方法中构建自注意力机制的流程示意图;

图5为本申请实体关系抽取方法中基于所述自注意力机制构建双向长短期记忆网络的流程示意图;

图6为本申请实体关系抽取方法中基于所述双向长短期记忆网络计算实体感知注意力的流程示意图;

图7为本申请实体关系抽取方法中将所述双向长短期记忆网络中的第一数据和所述实体感知注意力中的第二数据进行联合训练的流程示意图。

本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。

本申请实施例的主要解决方案是:获取与量子相关的文本数据,构建自注意力机制;基于所述自注意力机制构建双向长短期记忆网络,并基于所述双向长短期记忆网络计算实体感知注意力;将所述双向长短期记忆网络中的第一数据和所述实体感知注意力中的第二数据进行联合训练,得到训练模型;将所述文本数据输入至所述训练模型中进行训练,得到抽取结果。

由于现有量子相关的网络新闻和资信文本实体关系联合抽取存在以下问题:因为行业急剧发展,众多量子相关的实体名称未能及时进行识别,以及各家量子相关实体之间的关系有待梳理。本申请通过获取与量子相关的文本数据,构建自注意力机制;基于自注意力机制构建双向长短期记忆网络,并基于双向长短期记忆网络计算实体感知注意力;将双向长短期记忆网络中的第一数据和实体感知注意力中的第二数据进行联合训练,得到训练模型;将文本数据输入至训练模型中进行训练,得到抽取结果。解决了因为行业急剧发展,众多量子相关的实体名称未能及时进行识别,以及各家量子相关实体之间的关系有待梳理的问题,避免了繁琐的特征工程,提高了实体关系联合抽取效率。

如图1所示,图1为本申请实施例方案涉及的硬件运行环境的终端结构示意图。

如图1所示,该终端可以包括:处理器1001,例如cpu,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器1005可以是高速ram存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

可选地,终端还可以包括摄像头、rf(radiofrequency,射频)电路,传感器、遥控器、音频电路、wifi模块、检测器等等。当然,所述终端还可配置陀螺仪、气压计、湿度计、温度传感器等其他传感器,在此不再赘述。

本领域技术人员可以理解,图1中示出的终端结构并不构成对终端设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图1所示,作为一种计算机可读存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及实体关系抽取程序。

在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中实体关系抽取程序,并执行以下操作:

获取与量子相关的文本数据,构建自注意力机制;

基于所述自注意力机制构建双向长短期记忆网络,并基于所述双向长短期记忆网络计算实体感知注意力;

将所述双向长短期记忆网络中的第一数据和所述实体感知注意力中的第二数据进行联合训练,得到训练模型;

将所述文本数据输入至所述训练模型中进行训练,得到抽取结果。

参考图2,图2为本申请实体关系抽取方法第一实施例的流程示意图。

本申请实施例提供了实体关系抽取方法的实施例,需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

实体关系抽取方法包括:

步骤s10,获取与量子相关的文本数据,构建自注意力机制;

随着量子技术的发展,互联网中存在大量与量子相关的文本数据,这些数据背后通常蕴含着大量的知识,基于这些知识构建量子企业间的关系图谱成为重要研究内容。为了自动化地从海量文本数据中构建关系图谱,实体关系抽取逐渐成为一个热门的研究任务,其中,实体关系抽取任务旨在识别文本中存在的(实体,关系类型,实体)三元组,如(学校a,合作,公司b),学校a与公司b是与量子相关的实体,学校a与公司b之间的实体关系为合作关系。而文本中存在的三元组又可以分为三类,即普通三元组、单实体重叠三元组、以及实体对重叠三元组。其中,单实体重叠三元组是指两个关系三元组共享同一个实体;实体对重叠三元组是指两个实体间存在多重关系。

终端中包括公开数据采集模块和私有数据采集模块,其中,公开数据采集模块用于在公开网络和新闻媒体上收集与量子科技有关的企业信息及商业活动的原始网络公开数据。私有数据采集模块用于在量子行业内和科研范围内采集与量子相关的私有数据。其中,数据采集的领域包括:量子计算机类型包括超导、离子阱以及光量子,超冷原子、半导体量子,光量子,超冷原子,拓扑量子计算等其他型式的量子计算机以及通用型量子计算机&专用型量子计算机;量子计算机硬件机配件的研发,量子编码、量子软件,量子通信、量子信息学、量子加密、量子密钥分发、量子模拟器、量子材料、量子传感和计量、量子隐形传态、量子测量、量子网络与量子互联网,量子退相干和可扩展性研究、保真度等。

进一步地,采集的数据内容包括:量子产品和服务的交易行为,量子产品在实体落地后产生的经济效应,量子相关实体开设分支实体,量子相关实体开发分支实体,量子相关实体(全资子公司、下属公司、控股公司、持股股东、收购公司)持股或者控股其他实体,量子相关新实体的创立,量子相关科技应用和产品的销售渠道公司、有量子相关科技应用潜力的公司、各国政府及地方政府及地区发布与量子相关的政策的法规,实体和个人与量子相关的专利申请及批准及转让,量子相关的科研论文的发表、突破性的研究进展,科普名人在知名媒体上进行量子相关科普工作(比如bilibili、知乎、简书、抖音平台等),知名微信公众号以及其他有影响力的公共平台内发布的公开信息等。

进一步地,网络公开数据和私有数据来源包括但不限于以下方面:商务活动及商务活动中的交易合同金额、股权投资比例等;量子专题研讨会、讨论会;新闻报道;专利批准;核心期刊论文发表;量子相关科研人员和从业人员的增长情况。

终端在采集到与量子相关的文本数据后,进行自注意力机制的构建,其中,自注意力机制是指让每个输入都会彼此交互(自),然后找到它们应该更加关注的输入(注意力),参考图4,所述构建自注意力机制的步骤包括:

步骤s11,对查询和键值进行点乘计算,得到权重因子;

步骤s12,将所述权重因子进行缩放处理以获取缩放数据,将所述缩放数据进行归一化,得到权重系数,并将所述权重系数与设定值进行加权求和。

终端在构建自注意力机制的过程中,先进行缩放点乘注意力计算:q(查询)和k(键值)进行点乘得到初步权重因子,并对q,k点乘结果除以变量进行缩放处理(为了防止梯度消失);对以上得到的权重分值进行归一化处理,即用softmax计算,使所有权重因子的和为1;根据归一化后的权重系数对value(值)进行加权求和。此步骤的公式为

其中,dk是词嵌入向量的大小。

进一步计算多头注意力(multi-headattention),其中,多头注意力主要在h个scaleddot-productattention基本单元上重复计算h次,这样可以从不同的维度和表示子空间里学习到相关的信息,也即,多头注意力其实是把多个自注意力连接起来,其对应的公式为:

multihead(q,k,v)=concat(head1,.....,headh)wo

headi=attention(qwiq,kwik,vwiv)

步骤s20,基于所述自注意力机制构建双向长短期记忆网络,并基于所述双向长短期记忆网络计算实体感知注意力;

双向长短期记忆网络是由长短期记忆网络lstm(longshort-termmemory)演变而成的,其中,长短期记忆网络是一种时间递归神经网络,适合于处理和预测时间序列中间隔和延迟相对较长的重要事件,是解决循环神经网络rnn结构中存在的“梯度消失”问题而提出的。例如,预测“thecloudsareinthe(...)"时,这种情况下,相关的信息和预测的词位置之间的间隔很小,rnn会使用先前的信息预测出词是“sky”。但是如果想要预测”igrewupinfrance...ispeakfluent(...)”,语言模型推测下一个词可能是一种语言的名字,但是具体是什么语言,需要用到间隔很长的前文中france,在这种情况下,rnn因为“梯度消失”的问题,并不能利用间隔很长的信息。此时,需要用到双向长短期记忆网络,双向rnn由两个普通的rnn所组成,一个正向的rnn,利用过去的信息,一个逆序的rnn,利用未来的信息,这样在时刻t,既能够使用t-1时刻的信息,又能够利用到t+1时刻的信息,也即,利用正向的rnn时,可以预测出词是“french”。

进一步地,参考图5,所述基于所述自注意力机制构建双向长短期记忆网络的步骤包括:

步骤s21,获取所述自注意力机制的数据层的数据;

步骤s22,基于所述数据层的数据构建向前长短期记忆网络和向后长短期记忆网络,并基于所述向前长短期记忆网络和所述向后长短期记忆网络组成所述双向长短期记忆网络。

在构建双向长短期记忆网络的过程中,先获取自注意力机制的数据层,基于数据层构建向前长短期记忆网络和向后长短期记忆网络,并基于向前长短期记忆网络和向后长短期记忆网络组成双向长短期记忆网络。具体地,构建向前长短期记忆网络:

构建向后长短期记忆网络:

由向前长短期记忆网络和向后长短期记忆网络组成双向长短期记忆网络:

进一步地,参考图6,所述基于所述双向长短期记忆网络计算实体感知注意力的步骤包括:

步骤s23,基于所述双向长短期记忆网络计算相对位置特征和潜在类型的实体特征;

步骤s24,根据所述相对位置特征和所述潜在类型的实体特征得到所述实体感知注意力。

终端在构建完双向长短期记忆网络后,基于双向长短期记忆网络计算相对位置特征和潜在类型的实体特征,根据相对位置特征和潜在类型的实体特征得到所述实体感知注意力。具体地,实体感知注意力机制兼顾了相对位置特征和潜在类型的实体特征,其中,相对位置特征表示为:

潜在类型的实体特征为:

基于上述的相对位置特征和潜在类型的实体特征得到实体感知注意力机制,其公式为:

步骤s30,将所述双向长短期记忆网络中的第一数据和所述实体感知注意力中的第二数据进行联合训练,得到训练模型;

终端在完成双向长短期记忆网络的构建以及实体感知注意力的计算后,将所述双向长短期记忆网络中的第一数据和所述实体感知注意力中的第二数据进行联合训练,得到训练模型。参考图7,所述将所述双向长短期记忆网络中的第一数据和所述实体感知注意力中的第二数据进行联合训练的步骤包括:

步骤s31,获取所述双向长短期记忆网络中参数共享层的第一数据以及所述实体感知注意力中联合解码层的第二数据;

步骤s32,将所述参数共享层的第一数据和所述联合解码层的第二数据进行联合训练。

终端对实体关系联合抽取模型进行训练包括建立损失函数,损失函数包括两部分,实体抽取损失和关系抽取损失,当损失函数越小时,模型的精度越高,模型能够更好的抽取句子中的三元组。在一实施例中,根据实体感知注意机制注入完全连接型的softmax层进行分类计算,得到关系类型的条件概率p(y|s,θ),其中,p(y|s,θ)对应的计算公式为:

p(y|s,θ)=softmax(woz+bo)

其中y是目标关系类,s是输入的句子,是整个网络中可供学习的参数。

构建损失函数adadelta梯度下降优化器l:

其中,|d|是训练数据集的大小。为防止参数的过度拟合,引入参数λ。l采用adadelta梯度下降优化器取得最小值可求得参数θ。

进一步基于该损失函数adadelta梯度下降优化器l对参数共享层的第一数据和联合解码层的第二数据进行联合训练,得到训练模型。

步骤s40,将所述文本数据输入至所述训练模型中进行训练,得到抽取结果。

终端在得到实体关系抽取的训练模型后,将待进行实体关系抽取的文本数据基于训练模型输出对应的实体关系抽取结果。例如,当前待进行实体关系抽取的文本数据为“量子公司a是量子公司b的子公司,两个公司之间密切相连”,则经过训练模型后的结果为(量子公司a,附属,量子公司b),也即,量子公司a与量子公司b为量子实体,他们之间的关系为附属关系。

本实施例通过获取与量子相关的文本数据,构建自注意力机制;基于自注意力机制构建双向长短期记忆网络,并基于双向长短期记忆网络计算实体感知注意力;将所述双向长短期记忆网络中的第一数据和所述实体感知注意力中的第二数据进行联合训练,得到训练模型,参数共享层是基于双向长短期记忆网络获得的,联合解码层是基于实体感知注意力获得的;将待进行实体关系抽取的文本数据基于训练模型输出对应的实体关系抽取结果。解决了因为行业急剧发展,众多量子相关的实体名称未能及时进行识别,以及各家量子相关实体之间的关系有待梳理的技术问题,避免了繁琐的特征工程,提高了实体关系联合抽取效率。

进一步地,参考图3,提出本申请实体关系抽取方法第二实施例。

所述实体关系抽取方法第二实施例与所述实体关系抽取方法第一实施例的区别在于,所述获取与量子相关的文本数据的步骤之后,包括:

步骤s13,对所述文本数据进行结构化预处理,并进行分词和量子实体的识别操作,得到包含多个所述量子实体的句子;

步骤s14,基于所述句子组成语料库。

终端在获取到量子实体相关的数据后,将网络新闻和资信文本语句中每个单词映射为低维向量,通过向量拼接形成整个句子,表示为

x=(x1,x2,x3,.....xn)

其中,n为为词语个数,x为网络新闻和资信文本语句向量化表示,xi为单词wi的向量表示,其中,wi为词向量,ci为单词基于字符的向量表示。

进一步对该数据进行结构化预处理,包括数据清洗、文本分词、实体识别、关系标记、依存分析等;并进行分词和量子实体识别工作,得到句子级别的包含两个及两个以上量子实体的句子所组成实验语料库。例如:给定文本数据“清华大学和华中科技大学均开设有与量子相关的专业。”,经过分词处理后,可以得到词序列x={“清华大学”,“和”,“华中科技大学”,“均”,“开设”,“有”,“与量子相关的专业”,“。”},识别到的量子实体为“清华大学”和“华中科技大学”。其中,语料库用于预定义实体关系抽取目标类型,对与量子相关的原始文本进行标注,构建实体关系抽取模型训练数据集和测试数据集。实体关系数据集句子进行词嵌入并向量表示为

s=(w1,w2,w3,....wn)

进一步地,所述获取与量子相关的文本数据的步骤之后,还包括:

基于所述文本数据进行量子实体命名,以及确定所述量子实体之前的关系。

终端在获取到文本数据后,是需要基于该文本数据对量子实体进行命名,以及确定量子实体之前的关系。其中,量子实体的命名可以为识别与量子有关的企业、公司之间的联合体、非法人经营实体、非营利性机构和社会团体,大学及科研机构等等。基于该识别操作确定与量子相关的实体,包括所有与量子科技相关或者应用量子科技的公司(无限责任公司、有限责任公司、两合公司、股份有限公司、股份两合公司等)、公司之间的联合体、非法人经营实体、非营利性机构和社会团体、大学、科研院所及其他科研机构等等。其中,总实体之间关系包括但不限于以下关系:

1、合作cooperate(出资、合作、共同出资、合资)等商业活动;

2、关联公司affiliatecompany;

3、联营associate;

4、附属subsidiary(子公司、下属公司);

5、股权stock(a实体是b实体的控股股东、控股公司);

6、收购buy(公司之间的买卖收购);

7、合并merge(两个实体之间组合);

8、建立establish(a实体建立b实体的从属及控制关系);

9、风险关联(riskcorrelation);

10、长期合作协议(longtermcooperativeagreement)。

本实施例通过基于采集到的文本数据进行数据处理,构建语料库,并进行实体命名和确定实体之间的关系,为实体关系抽取模型提供了数据基础。

本申请还提出一种实体关系抽取装置,在一实施例中,所述实体关系抽取装置包括存储器、处理器及存储在存储器上并可在处理器上运行的实体关系抽取程序,实体关系抽取程序被处理器执行时实现以下步骤:

获取与量子相关的文本数据,构建自注意力机制;

基于所述自注意力机制构建双向长短期记忆网络,并基于所述双向长短期记忆网络计算实体感知注意力;

将所述双向长短期记忆网络中的第一数据和所述实体感知注意力中的第二数据进行联合训练,得到训练模型;

将所述文本数据输入至所述训练模型中进行训练,得到抽取结果。

在一实施例中,所述实体关系抽取装置包括获取模块,构建模块,训练模块和抽取模块。

所述获取模块,用于获取与量子相关的文本数据,构建自注意力机制;

所述构建模块,用于基于所述自注意力机制构建双向长短期记忆网络,并基于所述双向长短期记忆网络计算实体感知注意力;

所述训练模块,用于将所述双向长短期记忆网络中的第一数据和所述实体感知注意力中的第二数据进行联合训练,得到训练模型;

所述训练模块,用于将所述文本数据输入至所述训练模型中进行训练,得到抽取结果。

进一步地,所述获取模块包括计算单元;

所述计算单元,用于对查询和键值进行点乘计算,得到权重因子;

所述计算单元,还用于将所述权重因子进行缩放处理以获取缩放数据,将所述缩放数据进行归一化,得到权重系数,并将所述权重系数与设定值进行加权求和。

进一步地,所述构建模块包括获取单元和构建单元;

所述获取单元,用于获取所述自注意力机制的数据层的数据;

所述构建单元,用于基于所述数据层的数据构建向前长短期记忆网络和向后长短期记忆网络,并基于所述向前长短期记忆网络和所述向后长短期记忆网络组成所述双向长短期记忆网络。

进一步地,所述构建模块还包括计算单元;

所述计算单元,用于基于所述双向长短期记忆网络计算相对位置特征和潜在类型的实体特征;

所述计算单元,还用于根据所述相对位置特征和所述潜在类型的实体特征得到所述实体感知注意力。

进一步地,所述训练模块包括构建单元和训练单元;

所述构建单元,用于获取所述双向长短期记忆网络中参数共享层的第一数据以及所述实体感知注意力中联合解码层的第二数据;

所述训练单元,用于将所述参数共享层的第一数据和所述联合解码层的第二数据进行联合训练。

进一步地,所述训练单元包括计算子单元;

所述计算子单元,用于构建损失函数的梯度下降优化器;

所述计算子单元,还用于基于所述损失函数的梯度下降优化器对所述参数共享层的第一数据和所述联合解码层的第二数据进行联合训练。

进一步地,所述获取模块还包括处理单元;

所述处理单元,用于对所述文本数据进行结构化预处理,并进行分词和量子实体的识别操作,得到包含多个所述量子实体的句子;

所述处理单元,还用于基于所述句子组成语料库。

进一步地,所述处理单元,还用于基于所述文本数据进行量子实体命名,以及确定所述量子实体之前的关系。

上述的实体关系抽取装置各个模块功能的实现与上述方法实施例中的过程相似,在此不再一一赘述。

此外,本申请还提供一种终端,所述终端包括存储器、处理器及存储在存储器上并在处理器上运行的实体关系抽取程序,所述终端通过获取与量子相关的文本数据,构建自注意力机制;基于自注意力机制构建双向长短期记忆网络,并基于双向长短期记忆网络计算实体感知注意力;将双向长短期记忆网络中的第一数据和实体感知注意力中的第二数据进行联合训练,得到训练模型;将文本数据输入至训练模型中进行训练,得到抽取结果。解决了因为行业急剧发展,众多量子相关的实体名称未能及时进行识别,以及各家量子相关实体之间的关系有待梳理的问题,避免了繁琐的特征工程,提高了实体关系联合抽取效率。

此外,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有实体关系抽取程序,所述实体关系抽取程序被处理器执行时实现如上所述实体关系抽取方法的步骤。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

应当注意的是,在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的单词“一”或“一个”不排除存在多个这样的部件。本申请可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

尽管已描述了本申请的可选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括可选实施例以及落入本申请范围的所有变更和修改。

显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1