基于人工智能的语义相似度获取方法及装置与流程

文档序号:12465055阅读:207来源:国知局
基于人工智能的语义相似度获取方法及装置与流程

本发明涉及信息处理技术领域,尤其涉及一种基于人工智能的语义相似度获取方法及装置。



背景技术:

人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语音识别、图像识别、自然语言处理和专家系统等。

基于人工智能对用户的搜索行为进行分析,可以得知用户在搜索时目的是通过搜索结果能够尽快获取到与用户所输入的搜索词相关的内容。

根据搜索词的语义进行检索是实现知识检索的关键之一,而相似度计算则是语义检索的基础。目前语义相似度模型可以计算用户搜索时所输入的搜索词(query)与候选搜索条目(title)之间的相似度,在获取query与title之间的相似度之后,搜索引擎可以对获取到的相似度进行排序,按照排序结果返回搜索结果。图1为现有的语义相似度模型的结构示意图。该语义相似度模型包括:底层为嵌入(embedding)层、变换(BOW)层、对比(FC)层以及顶层打分(Score)层。其中,embedding层由所有字典词的向量化表示组成,当用户在搜索时输入的一个句子后,embedding层可以将该句子映射成一个二维向量,每一个子向量为其术语(term)对应的term-embedding;BOW层表示对二维向量所作的变换,将二维向量变换成一个一维向量,该层也可以被替换成卷积与pooling;FC层为全联通层,该FC层对一维向量做线性变换,可选的可以在线性变换后增加一个激活函数,通过该激活函数加上非线性转换;Score层用于对得到的query和title之间的相似度做度量。例如,query为“百度巴西葡语”,而title“巴西葡语”,在对query和title切词后,可得到query和title离散的词序列,query的离散词序列包括:百度、巴西、葡语,而title离散的词序列包括:巴西、葡语。通过图1所示的语义相似度计模型计算query和title之前的相似度时,将query切词后的每个单词作为一个粒度,然后利用query所有的单词对query做一个单粒度向量表示,相应地,将title切词后的每个单词作为一个粒度,然后利用title所有的单词对title做一个单粒度向量表示。这种单粒度的语义相似度计算,获取到相似度精度较差,导致搜索结果不够理想。

为了提高搜索精度,如图2所示,对语义相似模型进行了改进,在相似度计算的过程中,对query和title进行切词后,利用分词语料进行特征提取,获取到query和title的多个粒度特征,如query的基础粒度特征(query-basic)query的二元特征(query-basic-bigram),title的基础粒度特征(title-basic)、title的二元特征(title-basic-bigram)。如图2所示虽然引入了多粒度来表示query和title,但是在计算query和title之间的相似度之前,语义相似度模型中并不对query和title的多粒度特征不进行区分,在变换BOW层直接将query的多粒度特征相加,得到query的多粒度表示,将title的多粒度特征相加,得到title的多粒度表示。

现有的语音相似度模型由于不对多粒度特征进行区别直接将多粒度相加,得到query和title的多粒度表示,使得搜索引擎得到的搜索结果精确性较差。



技术实现要素:

本发明旨在至少在一定程度上解决相关技术中的技术问题之一。

为此,本发明的第一个目的在于提出一种基于人工智能的语义相似度获取方法,以实现对现有语音相似度模型进行优化,用于解决现有技术中的语音相似度模型由于不对多粒度特征进行区别直接将多粒度相加,得到query和title的多粒度表示,使得搜索引擎得到的搜索结果精确性较差。

本发明的第二个目的在于提出一种基于人工智能的语义相似度获取装置。

本发明的第三个目的在于提出另一种基于人工智能的语义相似度获取装置。

本发明的第四个目的在于提出一种非临时性计算机可读存储介质。

本发明的第五个目的在于提出一种计算机程序产品。

为达上述目的,本发明第一方面实施例提出了一种基于人工智能的语义相似度获取方法,包括:

获取搜索词与搜索条目的粒度特征;

基于所述搜索词的每个粒度特征与所述搜索条目的粒度特征进行相似度计算,得到每个粒度特征对应的权重;

利用每个粒度特征对应的权重对所述搜索词和所述搜索条目进行加权计算,得到所述搜索词的粒度向量和所述搜索条目的粒度向量;

基于所述搜索词的粒度向量和所述搜索条目的粒度向量,计算所述搜索词与所述搜索条目之间的相似度。

本发明实施例的基于人工智能的语义相似度获取方法,通过在得到query和title的粒度特征后,获取每个粒度特征的权重,通过该权重可以体现出不同粒度的特征所具有的重要程度,然后在对query和title进行多粒度表示时,加入了每个粒度特征的权重这一因数,从而在计算query和title相似度时,不同粒度特征根据自己的重要性发挥不同的作用,使得相似度计算精度更高,实现对现有语音相似度模型的优化,并且可以使得搜索结果精准,能够更符合用户的需求。

为达上述目的,本发明第二方面实施例提出了一种基于人工智能的语义相似度获取装置,包括:

特征获取模块,用于获取搜索词与搜索条目的粒度特征;

权重计算模块,用于基于所述搜索词的每个粒度特征与所述搜索条目的粒度特征进行相似度计算,得到每个粒度特征对应的权重;

向量获取模块,用于利用每个粒度特征对应的权重对所述搜索词和所述搜索条目进行加权计算,得到所述搜索词的粒度向量和所述搜索条目的粒度向量;

相似度计算模块,用于基于所述搜索词的粒度向量和所述搜索条目的粒度向量,计算所述搜索词与所述搜索条目之间的相似度。

本发明实施例的基于人工智能的语义相似度获取装置,通过在得到query和title的粒度特征后,获取每个粒度特征的权重,通过该权重可以体现出不同粒度的特征所具有的重要程度,然后在对query和title进行多粒度表示时,加入了每个粒度特征的权重这一因数,从而在计算query和title相似度时,不同粒度特征根据自己的重要性发挥不同的作用,使得相似度计算精度更高,实现对现有语音相似度模型的优化,并且可以使得搜索结果精准,能够更符合用户的需求。

为达上述目的,本发明第三方面实施例提出了另一种基于人工智能的语义相似度获取装置,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为:获取搜索词与搜索条目的粒度特征;基于所述搜索词的每个粒度特征与所述搜索条目的粒度特征进行相似度计算,得到每个粒度特征对应的权重;利用每个粒度特征对应的权重对所述搜索词和所述搜索条目进行加权计算,得到所述搜索词的粒度向量和所述搜索条目的粒度向量;基于所述搜索词的粒度向量和所述搜索条目的粒度向量,计算所述搜索词与所述搜索条目之间的相似度。

为了实现上述目的,本发明第四方面实施例提出了一种非临时性计算机可读存储介质,当所述存储介质中的指令由服务器端的处理器被执行时,使得服务器端能够执行一种基于人工智能的语义相似度获取方法,所述方法包括:获取搜索词与搜索条目的粒度特征;基于所述搜索词的每个粒度特征与所述搜索条目的粒度特征进行相似度计算,得到每个粒度特征对应的权重;利用每个粒度特征对应的权重对所述搜索词和所述搜索条目进行加权计算,得到所述搜索词的粒度向量和所述搜索条目的粒度向量;基于所述搜索词的粒度向量和所述搜索条目的粒度向量,计算所述搜索词与所述搜索条目之间的相似度。

为了实现上述目的,本发明第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行一种基于人工智能的语义相似度获取方法,所述方法包括:获取搜索词与搜索条目的粒度特征;基于所述搜索词的每个粒度特征与所述搜索条目的粒度特征进行相似度计算,得到每个粒度特征对应的权重;利用每个粒度特征对应的权重对所述搜索词和所述搜索条目进行加权计算,得到所述搜索词的粒度向量和所述搜索条目的粒度向量;基于所述搜索词的粒度向量和所述搜索条目的粒度向量,计算所述搜索词与所述搜索条目之间的相似度。

本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:

图1为现有单粒度的语义相似度模型的结构示意图;

图2为现有的多粒度语义相似度模型的结构示意图;

图3为本发明实施例所提供的一种基于人工智能的语义相似度获取方法的流程示意图;

图4为本发明实施例所提供一种的语义相似度模型的结构示意图;

图5为本发明实施例所提供的另一种基于人工智能的语义相似度获取方法的流程示意图;

图6为本发明实施例所提供另一种的语义相似度模型的结构示意图;

图7为本发明实施例所提供的一种基于人工智能的语义相似度获取装置的结构示意图;

图8为本发明实施例提供的一种向量获取模块的结构示意图;

图9为本发明实施例提供的一种相似度计算模块的结构示意图。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。

下面参考附图描述本发明实施例的基于人工智能的语义相似度获取方法和装置。

图3为本发明实施例所提供的一种基于人工智能的语义相似度获取方法的流程示意图。该基于人工智能的语义相似度获取方法包括以下步骤:

S101、获取搜索词与搜索条目的粒度特征。

具体地,对搜索词(query)和搜索条目(title)进行切词,得到query和title的分词语料,利用神经网络对分词语料进行特征提取,得到query的粒度特征和title的粒度特征。

在通过神经网络对query和title的分词语料进行特征提取之前,首先需要利用训练语料对神经网络进行训练,在训练之前对训练语料进行切词,然后利用切词后的词形成多粒度的分词语料,基于分词语料对神经网络进行训练,在训练完成后就可以得到一个稳定收敛的神经网络。

在输入的query和title切词后,就可以将query和title对应的分词语料输入到神经网络中进行特征提取,得到搜索词和搜索条目的粒度特征。例如,query为“百度巴西葡语”,而title“巴西葡语”,在对query和title切词后,可得到query和title离散的词序列,query的离散词序列包括:百度、巴西、葡语,而title离散的词序列包括:巴西、葡语。在获取到query和title离散的词序列之后,可以对分词后的词进行组合,得到query和title的粒度特征。例如,query的粒度特征可以包括:query的基础粒度特征(query-basic,简称qb)、query的短语粒度特征(query-phrase,简称qp)以及query的基础粒度的二元粒度特征(query-basic-bigram,简称简称qbb)等等,相应地,title的粒度特征可以包括:title的基础粒度特征(title-basic,简称tb)、title的短语粒度特征(title-phrase,变成tp)以及title的基础粒度的二元特征(title-basic-bigram,简称tbb)等等。

S102、基于搜索词的每个粒度特征与搜索条目的粒度特征进行相似度计算,得到每个粒度特征对应的权重。

具体地,将query的每个粒度特征分别与title的同类型的粒度特征进行相似计算,得到每个粒度特征对应的权重。优选地,将query的每个粒度特征分别与title的同类型的粒度特征进行余弦相似度计算,得到每个粒度特征对应的权重。例如,将query-basic与title-basic进行余弦相似度计算,得到该basic粒度特征的权重,将query-phrase与title-phrase进行余弦相似度计算,得到该phrase粒度特征的权重,该权重可以体现出不同粒度的特征所具有的重要程度。

S103、利用每个粒度特征对应的权重对搜索词和搜索条目进行加权计算,得到搜索词的粒度向量和搜索条目的粒度向量。

具体地,在获取到每个粒度特征对应的权重后,将query的每个粒度特征与该粒度特征所对应的权重做乘积,将query所有粒度特征与对应的权重做乘积得到的值进行相加,就可以得到该query的粒度向量。

相应地,将title的每个粒度特征与该粒度特征所对应的权重做乘积,将title所有粒度特征与对应的权重做乘积得到的值进行相加,就可以得到该title的粒度向量表示。

本实施例中,在获取query和title的粒度向量时,由于加入了每个粒度特征的权重这一因数,能够根据粒度的重要程度来表示query的粒度向量和title的粒度向量,使得粒度向量表示更佳精确。

实际应用中,需要对通过余弦相似度计算得到的每个粒度特征对应的权重进行归一化处理,得到每个粒度特征的归一化权重。优选地,可以利用回归函数(softmax)对每个粒度特征的权重进行归一化处理。

S104、基于搜索词的粒度向量和搜索条目的粒度向量,计算搜索词与搜索条目之间的相似度。

在获取到query的粒度向量和title的粒度向量之后,就可以基于该query的粒度向量和title的粒度向量,计算该query和title之间的相似度。

图4其为本实施例提供的一种语音相似模型的结构示意图。如图4所示,该语义相似模型包括:粒度加权层、对比层以及评分层,在该粒度加权层实现对query和title的粒度向量表示。在该粒度加权层中设置有三个余弦相似度计算模块、一个归一化模块和加权模块,其中,qb与tb、qp与tp以及qbb与tbb分别通过一个余弦相似度计算模块,得到basic粒度特征对应的权重、phrase粒度特征对应的权重以及basic粒度的digram特征的权重。在获取到权重后,通过归一化模块对获取到的各粒度特征的权重进行归一化处理,然后在加权模块将粒度特征与所对应的归一化权重进行相乘加权,得到query的粒度向量(q_1)和title的粒度向量(t_1)。该语义相似模型可以执行本实施例提供的基于人工智能的语音相识度获取方法。

具体地,在粒度加权层获取到query的粒度向量和title的粒度向量,然后将query的粒度向量和title的粒度向量输入到的对比层即FC层,通过该FC层进行线性变换或者非线性变换,得到query和title之间的相似度,然后通过语义相似模型中的score层对query和title的相似度进行评分,在评分完成后,按照评分进行排序,将排序结果反馈给用户。

本发明实施例的基于人工智能的语义相似度获取方法,通过在得到query和title的多粒度特征后,获取每个粒度特征的权重,通过该权重可以体现出不同粒度的特征所具有的重要程度,然后在对query和title进行多粒度表示时,加入了每个粒度特征的权重这一因数,从而在计算query和title相似度时,不同粒度特征根据自己的重要性发挥不同的作用,使得相似度计算精度更高,实现对现有语音相似度模型的优化,并且可以使得搜索结果精准,能够更符合用户的需求。

图5为本发明实施例所提供的另一种基于人工智能的语义相似度获取方法的流程示意图。该基于人工智能的语义相似度获取方法包括以下步骤:

S201、获取搜索词与搜索条目的粒度特征。

S202、基于搜索词的每个粒度特征与搜索条目的粒度特征进行相似度计算,得到每个粒度特征对应的权重。

S203、利用每个粒度特征对应的权重对搜索词和搜索条目进行加权计算,得到搜索词的粒度向量和搜索条目的粒度向量。

关于S201~S203的介绍,可参加上述实施例中相关内容的记载,此次不再赘述。

S204、对搜索词的每个粒度特征与搜索条目的粒度向量进行相似度计算得到第一权重,以及对搜索条目的每个粒度特征与搜索条目的粒度向量进行相似度计算得到第二权重。

S205、将搜索词的每个粒度特征与第一权重进行加权计算,并将搜索条目的每个粒度特征与第二权重进行加权计算。

具体地,对query的每个粒度特征与title的粒度向量进行相似度计算得到第一权重,以及对title每个粒度特征与query的粒度向量相似度进行计算得到第二权重。将query的每个粒度特征与第一权重进行加权计算,即将query的每个粒度特征与第一权重乘积,将所有乘积相加。相应地,将title的每个粒度特征与第一权重进行加权计算,即将title的每个粒度特征与第二权重乘积,将所有乘积相加。

S206、利用加权计算的结果更新搜索词的粒度向量和搜索条目的粒度向量。

在获取到query和title的加权计算的结果后,利用query的加权计算的结果更新为query的粒度向量,利用title的加权计算的结果更新title的粒度向量。

S207、对搜索词的粒度向量和搜索条目的粒度向量的相似度进行计算,得到搜索词和搜索条目之间的相似度。

在获取到query的粒度向量和title的粒度向量之后,就可以基于该query的粒度向量和title的粒度向量,计算该query和title之间的相似度。

图6其为本实施例提供另一种的语音相似模型的结构示意图。如图6所示,该语义相似模型包括:第一粒度加权层和第二粒度加权层、对比层以及评分层,在该第一粒度加权层和第二粒度加权层实现对query和title的粒度向量表示。在该第一粒度加权层中设置有二个第一余弦相似度计算模块、一个第一归一化模块和第一加权模块,其中,qb与tb以及qbb与tbb分别通过一个第一余弦相似度计算模块,得到basic粒度特征对应的权重、basic粒度的digram特征对应的权重。在获取到各粒度特征对应的权重后,通过第一归一化模块对各粒度特征的权重进行归一化处理,然后在第一加权模块将粒度特征与所对应的归一化权重进行乘积相加,得到一个query的粒度向量(q_1)和title的粒度向量(t_1)。

进一步地,第二粒度加权层包括:四个第二余弦相似度计算模块、两个第二归一化模块以及两个第二加权模块。

针对query,将basic粒度特征和basic粒度的digram特征分别与第一粒度加权层得到的title的粒度向量即t_1,分别通过两个第二余弦相似度计算模块进行相似度计算得到第一权重,然后通过第二归一化模块对第一权重进行归一化处理,然后在第二加权模块将query的qb和qbb分别与所对应的归一化后第一权重进行乘积相加,得到一个query的粒度向量(q_2)。

相应地,针对title,将basic粒度特征和basic粒度的digram特征分别与第一粒度加权层得到的query的粒度向量即q_1,分别通过两个第二余弦相似度计算模块进行相似度计算得到第二权重,然后通过第二归一化模块对第二权重进行归一化处理,然后在第二加权模块将title的tb和tbb分别与归一化后第二权重进行乘积相加,得到一个title的粒度向量(t_2)。

在获取到q_2和t_2输入到的对比层即FC层,通过该FC层进行线性变换或者非线性变换,得到query和title之间的相似度,然后通过语义相似模型中的score层对query和title的相似度进行评分,在评分完成后,按照评分进行排序,将排序结果反馈给用户。

进一步地,本实施例中,可以在第二粒度加权模块进行迭代操作,即对S206中获取的query粒度向量和title粒度向量即利用加权计算的结果更新后的搜索词的粒度向量和搜索条目的粒度向量进行迭代计算,按照预设的迭代次数,迭代执行对query的每个粒度特征与title的粒度向量进行相似度计算得到第一权重,以及对搜索条目的每个粒度特征与title的粒度向量进行相似度计算得到第二权重,以及将query的每个粒度特征与第一权重进行加权计算,并将title的每个粒度特征与第二权重进行加权计算,直到迭代次数完成为止。

例如,迭代次数设置为2,即将q_2和t_2作为新的q_1和t_1,重新将qb、qbb分别与q_1进行余弦相似度计算,以及将tb、tbb与t_1进行余弦相似度计算以及后续操作,得到q_3和t_3,此时完成一次迭代过程,将q_3和t_3作为新的q_1和t_1,重新将qb、qbb分别与q_1进行余弦相似度计算,以及将tb、tbb与t_1进行余弦相似度计算以及后续操作,得到q_4和t_4,此时完成第二次迭代过程。

进一步地将q_4和t_4作为新的q_1和t_1执行后的query和title之间的相似度计算。

本发明实施例的基于人工智能的语义相似度获取方法,通过在得到query和title的多粒度特征后,获取每个粒度特征的权重,通过该权重可以体现出不同粒度的特征所具有的重要程度,然后在对query和title进行多粒度表示时,加入了每个粒度特征的权重这一因数,从而在计算query和title相似度时,不同粒度特征根据自己的重要性发挥不同的作用,使得相似度计算精度更高,实现对现有语音相似度模型的优化,并且可以使得搜索结果精准,能够更符合用户的需求。

本实施例中,利用粒度特征的权重进行多跳粒度加权,进一步地,提高了相似度计算的精确性,从而搜索结果更符合用户的需求。

图7为本发明实施例提供的一种基于人工智能的语义相似度获取装置的结构示意图。该基于人工智能的语义相似度获取装置包括:特征获取模块11、权重计算模块12、向量获取模块13和相似度计算模块14。

其中,特征获取模块11,用于获取搜索词与搜索条目的粒度特征。

特征获取模块11,具体用于:

对所述搜索词和所述搜索条目进行切词,得到所述搜索词和所述搜索条目的分词语料。

利用神经网络对所述分词语料进行特征提取,得到所述搜索词的粒度特征和所述搜索条目的粒度特征。

权重计算模块12,用于基于所述搜索词的每个粒度特征与所述搜索条目的粒度特征进行相似度计算,得到每个粒度特征对应的权重;

权重计算模块12,具体用于将所述搜索词的每个粒度特征分别与所述搜索条目的同类型的粒度特征进行相似计算,得到每个粒度特征对应的权重。

进一步地,权重计算模块12,具体用于:

将所述搜索词的每个粒度特征分别与所述搜索条目的同类型的粒度特征进行余弦相似度计算,得到每个粒度特征对应的权重。

向量获取模块13,用于利用每个粒度特征对应的权重对所述搜索词和所述搜索条目进行加权计算,得到所述搜索词的粒度向量和所述搜索条目的粒度向量。

图8为本实施例中向量获取模块一种可选的结构示意图。该向量获取模块13包括:归一化单元131和向量获取单元132。

归一化单元131,用于对每个粒度特征对应的权重进行归一化处理,得到每个粒度对应的归一化权重。

向量获取单元132,用于针对所述搜索词和所述搜索条目,将每个粒度特征与对应的所述归一化权重的乘积相加,得到所述搜索词的粒度向量和所述搜索条目的粒度向量。

相似度计算模块14,用于基于所述搜索词的粒度向量和所述搜索条目的粒度向量,计算所述搜索词与所述搜索条目之间的相似度。

图9为本实施例中相似度计算模块一种可选的结构示意图。该相似度计算模块14包括:权重单元141、加权计算单元142、更新单元143、相似度计算单元144以及迭代单元145。

权重单元141,用于对所述搜索词的每个粒度特征与所述搜索条目的粒度向量进行相似度计算得到第一权重,以及对所述搜索条目的每个粒度特征与所述搜索条目的粒度向量进行相似度计算得到第二权重。

加权计算单元142,用于将所述搜索词的每个粒度特征与所述第一权重进行加权计算,并将所述搜索条目的每个粒度特征与所述第二权重进行加权计算。

更新单元143,用于利用加权计算的结果更新所述搜索词的粒度向量和所述搜索条目的粒度向量。

相似度计算单元144,用于对所述搜索词的粒度向量和所述搜索条目的粒度向量的相似度进行计算,得到所述搜索词和所述搜索条目之间的相似度。

进一步地,迭代单元145,用于对经过所述加权计算更新后的所述搜索词的粒度向量和所述搜索条目的粒度向量,按照预设的迭代次数迭代执行所述对所述搜索词的每个粒度特征与所述搜索条目的粒度向量进行相似度计算得到第一权重,以及对所述搜索条目的每个粒度特征与所述搜索条目的粒度向量进行相似度计算得到第二权重,以及将所述搜索词的每个粒度特征与所述第一权重进行加权计算,并将所述搜索条目的每个粒度特征与所述第二权重进行加权计算,直到所述迭代次数完成为止。

进一步地,加权计算单元142,具体用于:

对所述第一权重和所述第二权重进行归一化处理;

将所述搜索词的每个粒度特征与归一化后的所述第一权重进行加权计算;

将所述搜索条目的每个粒度特征与归一化后的所述第二权重进行加权计算。

本发明实施例的基于人工智能的语义相似度获取方法,通过在得到query和title的多粒度特征后,获取每个粒度特征的权重,通过该权重可以体现出不同粒度的特征所具有的重要程度,然后在对query和title进行多粒度表示时,加入了每个粒度特征的权重这一因数,从而在计算query和title相似度时,不同粒度特征根据自己的重要性发挥不同的作用,使得相似度计算精度更高,实现对现有语音相似度模型的优化,并且可以使得搜索结果精准,能够更符合用户的需求。

本实施例中,利用粒度特征的权重进行多跳粒度加权,进一步地,提高了相似度计算的精确性,从而搜索结果更符合用户的需求。

为了实现上述实施例,本发明还提出另一种基于人工智能的语义相似度获取装置,包括:处理器,以及用于存储所述处理器可执行指令的存储器。

其中,处理器被配置为:获取搜索词与搜索条目的粒度特征;基于所述搜索词的每个粒度特征与所述搜索条目的粒度特征进行相似度计算,得到每个粒度特征对应的权重;利用每个粒度特征对应的权重对所述搜索词和所述搜索条目进行加权计算,得到所述搜索词的粒度向量和所述搜索条目的粒度向量;基于所述搜索词的粒度向量和所述搜索条目的粒度向量,计算所述搜索词与所述搜索条目之间的相似度。

为了实现上述实施例,本发明还提出一种非临时性计算机可读存储介质,当所述存储介质中的指令由服务器端的处理器被执行时,使得服务器端能够执行一种基于人工智能的语义相似度获取方法,所述方法包括:获取搜索词与搜索条目的粒度特征;基于所述搜索词的每个粒度特征与所述搜索条目的粒度特征进行相似度计算,得到每个粒度特征对应的权重;利用每个粒度特征对应的权重对所述搜索词和所述搜索条目进行加权计算,得到所述搜索词的粒度向量和所述搜索条目的粒度向量;基于所述搜索词的粒度向量和所述搜索条目的粒度向量,计算所述搜索词与所述搜索条目之间的相似度。

为了实现上述实施例,本发明还提出一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行一种基于人工智能的语义相似度获取方法,所述方法包括:获取搜索词与搜索条目的粒度特征;基于所述搜索词的每个粒度特征与所述搜索条目的粒度特征进行相似度计算,得到每个粒度特征对应的权重;利用每个粒度特征对应的权重对所述搜索词和所述搜索条目进行加权计算,得到所述搜索词的粒度向量和所述搜索条目的粒度向量;基于所述搜索词的粒度向量和所述搜索条目的粒度向量,计算所述搜索词与所述搜索条目之间的相似度。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。

应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。

此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1