一种基于个性化深度神经网络的相似度确定方法及装置的制造方法

文档序号:10725107阅读:459来源:国知局
一种基于个性化深度神经网络的相似度确定方法及装置的制造方法
【专利摘要】本发明实施例公开了一种基于个性化深度神经网络的相似度确定方法及装置。该方法包括:获取用户输入的查询文本以及用户个性化信息,其中所述用户个性化信息是依据所述用户的历史搜索行为,或者所述用户持有的智能终端的属性信息确定的;对所述查询文本、搜索条目以及所述用户个性化信息进行深度神经网络处理,并依据深度神经网络处理结果确定所述查询文本与所述搜索条目之间的相似度。本发明实施例的技术方案,通过在深度神经网络学习中,融合了用户个性化信息,提升了传统语义相似度确定的模型效果,从而提高了查询文本与搜索条目之间相似度的准确性。
【专利说明】
一种基于个性化深度神经网络的相似度确定方法及装置
技术领域
[0001] 本发明涉及通信技术领域,尤其涉及一种基于个性化深度神经网络的相似度确定 方法及装置一种图像分割方法及装置。
【背景技术】
[0002] 针对用户输入的查询文本,为用户返回搜索结果是搜索引擎系统的基础。其中确 定用户输入的查询文本与查询文本对应的搜索条目之间的相似度,是为用户返回搜索结果 的前提。
[0003] 目前,基于深度神经网络(Deep Neural Network,DNN)的相似度确定方法,仅对用 户输入的查询文本以及查询文本对应的搜索条目进行DNN处理,并基于DNN处理结果得到相 似度,而未考虑自然语言文本的一词多义或一义多词现象,因而现有相似度确定的准确性 低,不能满足用户的个性化需求,在实际应用中往往不能达到令人满意的效果。

【发明内容】

[0004] 有鉴于此,本发明实施例提供一种基于个性化深度神经网络的相似度确定方法及 装置,以提高相似度确定的准确性,从而满足用户的个性化需求。
[0005] 第一方面,本发明实施例提供了一种基于个性化深度神经网络的相似度确定方 法,包括:
[0006] 获取用户输入的查询文本以及用户个性化信息,其中所述用户个性化信息是依据 所述用户的历史搜索行为,或者所述用户持有的智能终端的属性信息确定的;
[0007] 对所述查询文本、搜索条目以及所述用户个性化信息进行深度神经网络处理,并 依据深度神经网络处理结果确定所述查询文本与所述搜索条目之间的相似度。
[0008] 第二方面,本发明实施例提供了一种基于个性化深度神经网络的相似度确定装置 方,包括:
[0009] 查询文本获取模块,用于获取用户输入的查询文本以及用户个性化信息,其中所 述用户个性化信息是依据所述用户的历史搜索行为,或者所述用户持有的智能终端的属性 信息确定的;
[0010] 相似度确定模块,用于对所述查询文本、搜索条目以及所述用户个性化信息进行 深度神经网络处理,并依据深度神经网络处理结果确定所述查询文本与所述搜索条目之间 的相似度。
[0011] 本发明实施例提供的技术方案,通过在深度神经网络学习中,融合了用户个性化 信息,从而依据用户输入的查询文本、查询文本对应的搜索条目以及用户个性化信息得到 了个性化的神经网络,提升了传统语义相似度确定的模型效果,从而提高了查询文本与搜 索条目之间相似度的准确性。
【附图说明】
[0012] 图1是本发明实施例一提供的一种基于个性化深度神经网络的相似度确定方法的 流程图;
[0013] 图2a是本发明实施例二提供的一种基于个性化深度神经网络的相似度确定方法 的流程图;
[0014] 图2b是本发明实施例二提供的基于个性化深度神经网络的相似度确定方法的原 理示意图;
[0015] 图3a是本发明实施例三提供的一种基于个性化深度神经网络的相似度确定方法 的流程图;
[0016] 图3b是本发明实施例三提供的基于个性化深度神经网络的相似度确定方法的原 理示意图;
[0017] 图4a是本发明实施例四提供的一种基于个性化深度神经网络的相似度确定方法 的流程图;
[0018] 图4b是本发明实施例四提供的基于个性化深度神经网络的相似度确定方法的原 理示意图;
[0019] 图5是本发明实施例五提供的一种基于个性化深度神经网络的相似度确定装置的 结构图。
【具体实施方式】
[0020] 下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描 述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便 于描述,附图中仅示出了与本发明相关的部分而非全部结构。
[0021] 实施例一
[0022] 图1是本发明实施例一提供的一种基于个性化深度神经网络的相似度确定方法的 流程图。本实施例的方法可以由基于个性化深度神经网络的相似度确定装置来执行,该装 置可通过硬件和/或软件的方式实现,且本实施例的方法一般可适用于用户想要得到查询 文本与搜索条目之间相似度的情形。参见图1,本实施例提供的基于个性化深度神经网络的 相似度确定方法具体可以包括如下:
[0023] S11、获取用户输入的查询文本以及用户个性化信息。
[0024] 具体的,在检测到用户通过触摸屏或键盘等输入设备在搜索输入框中进行文本输 入时,获取用户输入的查询文本以及用户个性化信息。其中,用户个性化信息可以是依据所 述用户的历史搜索行为确定的。相应地,还可以获取用户登录搜索引擎所使用的用户标识 信息如用户身份标识号(Identificati 〇n,ID)等,并且依据用户标识信息获取用户个性化 信息。用户的历史搜索行为可以包括用户的历史查询文本以及用户从历史查询文本对应的 搜索条目中选择的历史搜索条目。其中,用户个性化信息也可以是依据所述用户持有的智 能终端的属性信息确定。
[0025] 示例性的,用户个性化信息可以包括用户的兴趣,用户所在地域,或者,用户持有 的智能终端的型号、品牌、操作系统或浏览器等。其中,用户的兴趣可以包括体育、文学、IT、 游戏、电子、水果、食物或农产品等,是依据用户的历史搜索行为得到的。用户所在地域也可 以依据用户历史搜索行为得到。
[0026] S12、对所述查询文本、搜索条目以及所述用户个性化信息进行深度神经网络处 理,并依据深度神经网络处理结果确定所述查询文本与所述搜索条目之间的相似度。
[0027] 其中,深度神经网络技术用于学习词的向量表示,即通过深度神经网络处理将词 表示成实数组成的向量。具体的,利用深度神经网络学习技术,依据用户个性化信息对用户 个体进行建模,得到每个用户对应的个性化的用户嵌入,并把用户嵌入引入到传统深度神 经网络语义模型中,并且基于包含用户嵌入的深度神经网络语义模型,确定查询文本与搜 索条目之间的相似度,如余弦相似度。由于包含用户嵌入的深度神经网络语义模型既保持 了传统的查询文本与搜索条目之间的语义相似度,又具有个性化的用户嵌入,以最大程度 地满足用户的个性化需求,提高了查询文本与搜索条目之间相似度的准确性。
[0028] 需要说明的是,搜索条目指的是查询文本对应的搜索条目,且本实施例中对搜索 条目个数不作具体限定。例如,查询文本是苹果时,搜索条目可以是农产品价格和手机零配 件等。
[0029] 本实施例提供的技术方案,通过在深度神经网络学习中,融合了用户个性化信息, 从而依据用户输入的查询文本、查询文本对应的搜索条目以及用户个性化信息得到了个性 化的神经网络,提升了传统语义相似度确定的模型效果,从而提高了查询文本与搜索条目 之间相似度的准确性。
[0030] 示例性的,依据深度神经网络处理结果确定所述查询文本与所述搜索条目之间的 相似度之后,可以包括:根据所述查询文本与所述搜索条目之间的相似度,对所述搜索条目 进行排序。具体的,针对任一搜索条目,若该搜索条目与查询文本的相似度越大,则该搜索 条目排序越在前。
[0031] 实施例二
[0032] 本实施例在上述实施例一的基础上提供了一种新的基于个性化深度神经网络的 相似度确定方法。在本实施例中将用户个性化信息视为查询文本的一部分信息,在深度神 经网络模型顶层将用户个性化信息的表示与查询文本的表示进行融合。
[0033]图2a是本发明实施例二提供的一种基于个性化深度神经网络的相似度确定方法 的流程图,图2b是本发明实施例二提供的基于个性化深度神经网络的相似度确定方法的原 理示意图。为了便于理解,本实施例中以查询文本是苹果,搜索条目是农产品价格为例进行 说明。结合图2a和图2b,本实施例提供的基于个性化深度神经网络的相似度确定方法具体 可以包括如下:
[0034] S21、获取用户输入的查询文本以及用户个性化信息。
[0035] 其中,所述用户个性化信息是依据所述用户的历史搜索行为,或者所述用户持有 的智能终端的属性信息确定的。具体的,获取用户在搜索输入框中输入的查询文本-苹果。 [0036] S22、通过深度神经网络处理,将所述查询文本表示成查询向量,将搜索条目表示 成搜索向量,并将所述用户个性化信息表示成用户嵌入向量。
[0037] 具体的,通过词嵌入(Word Embedding)处理将查询文本表示成查询中间向量,并 经过深度神经网络处理,将查询中间向量表示成查询向量。相应地,获取查询文本对应的搜 索条目-农产品价格,通过词嵌入处理将搜索条目表示成搜索中间向量,并经过深度神经网 络处理,将搜索中间向量表示成查询向量;获取用户个性化信息,通过词嵌入处理将用户个 性化信息处理成用户中间向量,并经过深度神经网络处理将用户中间向量表示成用户嵌入 向量。
[0038] S23、融合所述查询向量与所述用户嵌入向量,以得到新的查询向量。
[0039] 具体的,可以确定查询向量的权重值以及用户嵌入向量的权重值,且二者权重值 之和等于1,并基于二者权重值对查询向量与用户嵌入向量进行加权叠加,以得到新的查询 向量。需要说明的是,一般查询向量的权重值大于或等于用户嵌入向量的权重值,如二者权 重值可以均等于0.5。
[0040] S24、确定新的查询向量与所述搜索向量之间的相似度。
[0041] 具体的,可以将新的查询向量与搜索向量绘制到向量空间中,确定新的查询向量 与搜索向量之间的夹角,并得到夹角对应的余弦值,该余弦值用来表征向量的余弦相似度。 夹角越小,余弦值越接近于1,则新的查询向量与搜索向量越相似。
[0042] 本实施例提供的技术方案,通过将用户个性化信息视为查询文本的一部分信息, 在深度神经网络模型顶层将用户个性化信息的表示与查询文本的表示进行融合,得到新的 查询向量,通过深度神经网络处理将搜索条目表示成搜索向量,并将新的查询向量与搜索 向量之间的相似度作为查询文本与搜索条目之间的相似度。由于该方法在深度神经网络学 习中,融合了用户个性化信息,提高了查询文本与搜索条目之间相似度的准确性。
[0043] 实施例三
[0044]本实施例在上述实施例一的基础上提供了一种新的基于个性化深度神经网络的 相似度确定方法。在本实施例中增加了搜索条目的向量表示与用户个性化信息的向量表示 之间的相似度确定。
[0045]图3a是本发明实施例三提供的一种基于个性化深度神经网络的相似度确定方法 的流程图,图3b是本发明实施例三提供的基于个性化深度神经网络的相似度确定方法的原 理示意图。为了便于理解,本实施例中以查询文本是苹果,搜索条目是农产品价格为例进行 说明。结合图3a和图3b,本实施例提供的基于个性化深度神经网络的相似度确定方法具体 可以包括如下:
[0046] S31、获取用户输入的查询文本以及用户个性化信息。
[0047] 其中,所述用户个性化信息是依据所述用户的历史搜索行为,或者所述用户持有 的智能终端的属性信息确定的。
[0048] S32、通过深度神经网络处理,将所述查询文本表示成查询向量,将搜索条目表示 成搜索向量,并将所述用户个性化信息表示成用户嵌入向量。
[0049] 具体的,可以基于深度神经网络语义模型对查询文本、搜索条目和用户个性化信 息进行处理,得到查询向量、搜索向量和用户嵌入向量。
[0050] S33、确定所述查询向量与所述搜索向量之间的第一相似度。
[0051] 具体的,可以确定查询向量与搜索向量之间的余弦相似度,作为第一相似度。
[0052] S34、确定所述用户嵌入向量与所述搜索向量之间的第二相似度。
[0053] 具体的,可以确定用户嵌入向量与搜索向量之间的余弦相似度,作为第二相似度。
[0054] S35、依据所述第一相似度和所述第二相似度,确定所述查询文本与所述搜索条目 之间的相似度。
[0055] 具体的,可以确定第一相似度的权重值以及第二相似度的权重值,且二者权重值 之和等于1,并基于二者权重值对第一相似度与第二相似度进行加权叠加,将叠加结果作为 查询文本与搜索条目之间的相似度。需要说明的是,一般第一相似度的权重值大于或等于 第二相似度的权重值,如第一相似度的权重值为0.7,第二相似度的权重值为0.3。
[0056]本实施例提供的技术方案,通过增加搜索条目的向量表示与用户个性化信息的向 量表示之间的相似度确定,以得到第二相似度,并确定查询向量与搜索向量之间的第一相 似度,且依据第二相似度和第一相似度得到查询文本与搜索条目之间的相似度。由于该方 法在深度神经网络学习中,融合了用户个性化信息,提高了查询文本与搜索条目之间相似 度的准确性。
[0057]实施例四
[0058] 本实施例在上述实施例一的基础上提供了一种新的基于个性化深度神经网络的 相似度确定方法。在本实施例中将用户个性化信息当作查询文本的一部分,在深度神经网 络模型底层将用户个性化信息与查询文本进行融合,相当于在查询文本中增加了用户个性 化信息。
[0059] 图4a是本发明实施例四提供的一种基于个性化深度神经网络的相似度确定方法 的流程图,图4b是本发明实施例四提供的基于个性化深度神经网络的相似度确定方法的原 理示意图。为了便于理解,本实施例中以查询文本是苹果,搜索条目是农产品价格为例进行 说明。结合图4a和图4b,本实施例提供的基于个性化深度神经网络的相似度确定方法具体 可以包括如下:
[0060] S41、获取用户输入的查询文本以及用户个性化信息。
[0061]其中,所述用户个性化信息是依据所述用户的历史搜索行为,或者所述用户持有 的智能终端的属性信息确定的。
[0062] S42、通过词嵌入处理,将所述查询文本表示成查询中间向量,并将所述用户个性 化信息表示成用户中间向量。
[0063] S43、融合所述查询中间向量与所述用户中间向量,以得到用户新增向量。
[0064] 示例性的,融合所述查询中间向量与所述用户中间向量,以得到用户新增向量,可 以包括:通过深度神经网络处理,将所述查询文本表示成查询向量,并将所述用户个性化信 息表示成用户嵌入向量;确定所述查询向量与所述搜索向量之间的第三相似度,并确定所 述用户嵌入向量与所述搜索向量之间的第四相似度;对所述第三相似度与所述第四相似度 作归一化处理,得到所述查询中间向量的第一权重和所述用户中间向量的第二权重;依据 所述第一权重和所述第二权重,融合所述查询中间向量与所述用户中间向量,以得到用户 新增向量。
[0065]需要说明的是,也可以依据用户需要,设置查询向量的第一权重和用户中间向量 的第二权重。
[0066] S44、通过深度神经网络处理,将所述用户新增向量表示成新的查询向量,并将搜 索条目表示成搜索向量。
[0067] 需要说明的是,本实施例中对深度神经网络处理算法不作具体限定,只需基于深 度神经网络语义模型,将用户新增向量表示成新的查询向量,并将搜索条目表示成搜索向 量即可。
[0068] S45、依据所述新的查询向量与所述搜索向量,确定所述查询文本与所述搜索条目 之间的相似度。
[0069] 本实施例提供的技术方案,通过将用户个性化信息当作查询文本的一部分,在深 度神经网络模型底层将用户个性化信息与查询文本进行融合,即通过在查询文本中增加用 户个性化信息,提高了查询文本与搜索条目之间相似度的准确性。
[0070] 实施例五
[0071] 图5是本发明实施例五提供的一种基于个性化深度神经网络的相似度确定装置的 结构图。该装置一般可适用于用户想要得到查询文本与搜索条目之间相似度的情形。参见 图5,本实施例提供的基于个性化深度神经网络的相似度确定装置的具体结构如下:
[0072] 查询文本获取模块51,用于获取用户输入的查询文本以及用户个性化信息,其中 所述用户个性化信息是依据所述用户的历史搜索行为,或者所述用户持有的智能终端的属 性信息确定的;
[0073] 相似度确定模块52,用于对所述查询文本、搜索条目以及所述用户个性化信息进 行深度神经网络处理,并依据深度神经网络处理结果确定所述查询文本与所述搜索条目之 间的相似度。
[0074] 示例性的,相似度确定模块52可以包括:
[0075] 第一处理单元,用于通过深度神经网络处理,将所述查询文本表示成查询向量,将 搜索条目表示成搜索向量,并将所述用户个性化信息表示成用户嵌入向量;
[0076] 第一向量融合单元,用于融合所述查询向量与所述用户嵌入向量,以得到新的查 询向量;
[0077] 第一相似度确定单元,用于确定新的查询向量与所述搜索向量之间的相似度。
[0078] 示例性的,相似度确定模块52可以包括:
[0079] 第二处理单元,用于通过深度神经网络处理,将所述查询文本表示成查询向量,将 搜索条目表示成搜索向量,并将所述用户个性化信息表示成用户嵌入向量;
[0080] 第一向量确定单元,用于确定所述查询向量与所述搜索向量之间的第一相似度;
[0081] 第二向量确定单元,用于确定所述用户嵌入向量与所述搜索向量之间的第二相似 度;
[0082] 第二相似度确定单元,用于依据所述第一相似度和所述第二相似度,确定所述查 询文本与所述搜索条目之间的相似度。
[0083] 示例性的,相似度确定模块52可以包括:
[0084]词嵌入处理单元,用于通过词嵌入处理,将所述查询文本表示成查询中间向量,并 将所述用户个性化信息表示成用户中间向量;
[0085]第二向量融合单元,用于融合所述查询中间向量与所述用户中间向量,以得到用 户新增向量;
[0086] 第三处理单元,用于通过深度神经网络处理,将所述用户新增向量表示成新的查 询向量,并将搜索条目表示成搜索向量;
[0087] 第三相似度确定单元,用于依据所述新的查询向量与所述搜索向量,确定所述查 询文本与所述搜索条目之间的相似度。
[0088] 示例性,第二向量融合单元可以包括:
[0089] 神经网络处理子单元,用于通过深度神经网络处理,将所述查询文本表示成查询 向量,并将所述用户个性化信息表示成用户嵌入向量;
[0090] 向量确定子单元,用于确定所述查询向量与所述搜索向量之间的第三相似度,并 确定所述用户嵌入向量与所述搜索向量之间的第四相似度;
[0091] 权重确定子单元,用于对所述第三相似度与所述第四相似度作归一化处理,得到 所述查询中间向量的第一权重和所述用户中间向量的第二权重;
[0092] 向量确定子单元,用于依据所述第一权重和所述第二权重,融合所述查询中间向 量与所述用户中间向量,以得到用户新增向量。
[0093] 示例性的,用户个性化信息包括用户的兴趣,用户所在地域,或者,用户持有的智 能终端的型号、品牌、操作系统或浏览器。
[0094]示例性的,上述装置可以包括:
[0095] 搜索条目排序模块,用于在依据深度神经网络处理结果确定所述查询文本与所述 搜索条目之间的相似度之后,根据所述查询文本与所述搜索条目之间的相似度,对所述搜 索条目进行排序。
[0096] 另外,为了验证本实施例中提供的深度神经网络模型的有效性,针对不同指标进 行了如下多组对比实验,实验效果均超过了非个性化深度神经网络的最佳结果。
[0097] 实验目的:验证个性化神经网络在真实的网页搜索环境下判断文本相似度的效 果。
[0098]训练数据:来自于某搜索引擎的日志语料(2015年8月-2015年10月)的训练集。
[0099]测试数据:来自于某搜索引擎的日志语料(2015年11月)的测试集。
[0100] 评估方法:评估测试数据的正逆序比和AUC(Area Under roc Curve,R0C曲线下的 面积)指标。
[0101]实验设置:分别采用方案一:在深度神经网络模型顶层将用户个性化信息的表示 与查询文本的表示进行融合,方案二:增加搜索条目的向量表示与用户个性化信息的向量 表示之间的相似度确定,方案三:在深度神经网络模型底层将用户个性化信息与查询文本 进行融合,以及非个性化模型(不考虑用户个性化信息),在训练数据上训练模型,并分别在 测试上测试正逆序比和AUC指标,最后和非个性化的传统神经网络模型进行对比,结果如 下:
[0103]相对于传统的神经网络模型,三种个性化神经网络方案均取得了优异的效果提 升,并且方案三中将用户个性化信息作为附加词添加到查询文本中的方案效果最佳,在非 个性化模型的基础上正逆序提高了〇. 377 (搜索排序中一般正逆序比提高0.2即为效果提升 明显),AUC指标提尚3.6%。综上,本发明实施例中提供的基于个性化深度神经网络确定查 询文本与搜索条目相似度的方法可以显著提高传统语义相似度确定的效果。
[0104]本实施例提供的技术方案,相对于传统的个性化策略,采用了深度学习技术,避免 了较为繁琐的特征工程,减少了人力成本,并且不需要维护成本较高的用户轮廓 (profile),因而减少了成本以及资源消耗。
[0105]注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解, 本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、 重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行 了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还 可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
【主权项】
1. 一种基于个性化深度神经网络的相似度确定方法,包括: 获取用户输入的查询文本以及用户个性化信息,其中所述用户个性化信息是依据所述 用户的历史搜索行为,或者所述用户持有的智能终端的属性信息确定的; 对所述查询文本、搜索条目以及所述用户个性化信息进行深度神经网络处理,并依据 深度神经网络处理结果确定所述查询文本与所述搜索条目之间的相似度。2. 根据权利要求1所述的方法,其特征在于,对所述查询文本、搜索条目以及所述用户 个性化信息进行深度神经网络处理,并依据深度神经网络处理结果确定所述查询文本与所 述搜索条目之间的相似度,包括: 通过深度神经网络处理,将所述查询文本表示成查询向量,将搜索条目表示成搜索向 量,并将所述用户个性化信息表示成用户嵌入向量; 融合所述查询向量与所述用户嵌入向量,以得到新的查询向量; 确定新的查询向量与所述搜索向量之间的相似度。3. 根据权利要求1所述的方法,其特征在于,对所述查询文本、搜索条目以及所述用户 个性化信息进行深度神经网络处理,并依据深度神经网络处理结果确定所述查询文本与所 述搜索条目之间的相似度,包括: 通过深度神经网络处理,将所述查询文本表示成查询向量,将搜索条目表示成搜索向 量,并将所述用户个性化信息表示成用户嵌入向量; 确定所述查询向量与所述搜索向量之间的第一相似度; 确定所述用户嵌入向量与所述搜索向量之间的第二相似度; 依据所述第一相似度和所述第二相似度,确定所述查询文本与所述搜索条目之间的相 似度。4. 根据权利要求1所述的方法,其特征在于,对所述查询文本、搜索条目以及所述用户 个性化信息进行深度神经网络处理,并依据深度神经网络处理结果确定所述查询文本与所 述搜索条目之间的相似度,包括: 通过词嵌入处理,将所述查询文本表示成查询中间向量,并将所述用户个性化信息表 示成用户中间向量; 融合所述查询中间向量与所述用户中间向量,以得到用户新增向量; 通过深度神经网络处理,将所述用户新增向量表示成新的查询向量,并将搜索条目表 示成搜索向量; 依据所述新的查询向量与所述搜索向量,确定所述查询文本与所述搜索条目之间的相 似度。5. 根据权利要求4所述的方法,其特征在于,融合所述查询中间向量与所述用户中间向 量,以得到用户新增向量,包括: 通过深度神经网络处理,将所述查询文本表示成查询向量,并将所述用户个性化信息 表示成用户嵌入向量; 确定所述查询向量与所述搜索向量之间的第三相似度,并确定所述用户嵌入向量与所 述搜索向量之间的第四相似度; 对所述第三相似度与所述第四相似度作归一化处理,得到所述查询中间向量的第一权 重和所述用户中间向量的第二权重; 依据所述第一权重和所述第二权重,融合所述查询中间向量与所述用户中间向量,以 得到用户新增向量。6. 根据权利要求1所述的方法,其特征在于,用户个性化信息包括用户的兴趣,用户所 在地域,或者,用户持有的智能终端的型号、品牌、操作系统或浏览器。7. 根据权利要求1所述的方法,其特征在于,依据深度神经网络处理结果确定所述查询 文本与所述搜索条目之间的相似度之后,包括: 根据所述查询文本与所述搜索条目之间的相似度,对所述搜索条目进行排序。8. -种基于个性化深度神经网络的相似度确定装置,包括: 查询文本获取模块,用于获取用户输入的查询文本以及用户个性化信息,其中所述用 户个性化信息是依据所述用户的历史搜索行为,或者所述用户持有的智能终端的属性信息 确定的;相似度确定模块,用于对所述查询文本、搜索条目以及所述用户个性化信息进行深 度神经网络处理,并依据深度神经网络处理结果确定所述查询文本与所述搜索条目之间的 相似度。9. 根据权利要求8所述的装置,其特征在于,相似度确定模块包括: 第一处理单元,用于通过深度神经网络处理,将所述查询文本表示成查询向量,将搜索 条目表示成搜索向量,并将所述用户个性化信息表示成用户嵌入向量; 第一向量融合单元,用于融合所述查询向量与所述用户嵌入向量,以得到新的查询向 量; 第一相似度确定单元,用于确定新的查询向量与所述搜索向量之间的相似度。10. 根据权利要求8所述的装置,其特征在于,相似度确定模块包括: 第二处理单元,用于通过深度神经网络处理,将所述查询文本表示成查询向量,将搜索 条目表示成搜索向量,并将所述用户个性化信息表示成用户嵌入向量; 第一向量确定单元,用于确定所述查询向量与所述搜索向量之间的第一相似度; 第二向量确定单元,用于确定所述用户嵌入向量与所述搜索向量之间的第二相似度; 第二相似度确定单元,用于依据所述第一相似度和所述第二相似度,确定所述查询文 本与所述搜索条目之间的相似度。11. 根据权利要求8所述的装置,其特征在于,相似度确定模块包括: 词嵌入处理单元,用于通过词嵌入处理,将所述查询文本表示成查询中间向量,并将所 述用户个性化信息表示成用户中间向量; 第二向量融合单元,用于融合所述查询中间向量与所述用户中间向量,以得到用户新 增向量; 第三处理单元,用于通过深度神经网络处理,将所述用户新增向量表示成新的查询向 量,并将搜索条目表示成搜索向量; 第三相似度确定单元,用于依据所述新的查询向量与所述搜索向量,确定所述查询文 本与所述搜索条目之间的相似度。12. 根据权利要求11所述的装置,其特征在于,第二向量融合单元包括: 神经网络处理子单元,用于通过深度神经网络处理,将所述查询文本表示成查询向量, 并将所述用户个性化信息表示成用户嵌入向量; 向量确定子单元,用于确定所述查询向量与所述搜索向量之间的第三相似度,并确定 所述用户嵌入向量与所述搜索向量之间的第四相似度; 权重确定子单元,用于对所述第三相似度与所述第四相似度作归一化处理,得到所述 查询中间向量的第一权重和所述用户中间向量的第二权重; 向量确定子单元,用于依据所述第一权重和所述第二权重,融合所述查询中间向量与 所述用户中间向量,以得到用户新增向量。13. 根据权利要求8所述的装置,其特征在于,用户个性化信息包括用户的兴趣,用户所 在地域,或者,用户持有的智能终端的型号、品牌、操作系统或浏览器。14. 根据权利要求8所述的装置,其特征在于,包括: 搜索条目排序模块,用于在依据深度神经网络处理结果确定所述查询文本与所述搜索 条目之间的相似度之后,根据所述查询文本与所述搜索条目之间的相似度,对所述搜索条 目进行排序。
【文档编号】G06K9/62GK106095983SQ201610445828
【公开日】2016年11月9日
【申请日】2016年6月20日
【发明人】廖梦, 姜迪, 石磊, 李辰, 王昕煜
【申请人】北京百度网讯科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1