推荐方法、模型训练方法、装置、设备和存储介质与流程

文档序号:31150847发布日期:2022-08-17 02:39阅读:48来源:国知局
推荐方法、模型训练方法、装置、设备和存储介质与流程

1.本发明实施例涉及计算机技术领域,尤其涉及一种推荐方法、模型训练方法、装置、设备和存储介质。


背景技术:

2.目前,相似企业推荐的方法主要依赖于企业的基本工商信息,包括企业所属行业、企业地区、企业注册资本等等。通过对这些字段进行聚类或者相似度计算等方法,可以在一定程度上寻找到一些广义的相似企业。
3.现有技术中有一种方案利用企业的名称以及企业的经营范围这两种特征,根据文本中的词语推导出主题模型,用于企业的相似推荐。但是,这种推荐方法的结果常常不够准确。


技术实现要素:

4.有鉴于此,本发明实施例提供一种推荐方法、模型训练方法、装置、设备和存储介质,以解决或缓解上述问题。
5.根据本发明实施例的第一方面,提供了一种推荐方法,包括:获取候选主体在多个维度的第一描述信息,根据所述第一描述信息确定所述候选主体在每个维度上的关键词;以及,获取目标主体在所述多个维度的第二描述信息,并根据所述第二描述信息确定所述目标主体在每个维度上的关键词;根据所述候选主体和所述目标主体在多个同一维度上的关键词确定所述候选主体与所述目标主体的相似度;根据所述相似度,在所述候选主体中选择与所述目标主体相似的主体作为所述目标主体的推荐主体。
6.根据本发明实施例的第二方面,提供了一种模型训练方法,包括:获取训练数据,所述训练数据包括候选主体在多个维度的第一描述信息、目标主体在所述多个维度的第二描述信息、以及所述第一描述信息与所述第二描述信息的相似度标签;基于所述训练数据,对神经网络进行训练,得到相似度预测模型。
7.根据本发明实施例的第三方面,提供了一种主体推荐装置,包括:获取模块,获取候选主体在多个维度的第一描述信息,并且获取目标主体在所述多个维度的第二描述信息;第一确定模块,根据所述第一描述信息确定所述候选主体在每个维度上的关键词,并且根据所述第二描述信息确定所述目标主体在每个维度上的关键词;第二确定模块,根据所述候选主体和所述目标主体在多个同一维度上的关键词,确定所述候选主体与所述目标主体的相似度;推荐模块,根据所述相似度,在所述候选主体中选择与所述目标主体相似的主体作为所述目标主体的推荐主体。
8.根据本发明实施例的第四方面,提供了一种模型训练装置,包括:获取模块,获取训练数据,所述训练数据包括候选主体在多个维度的第一描述信息、目标主体在所述多个维度的第二描述信息、以及所述第一描述信息与所述第二描述信息的相似度标签;训练模块,基于所述训练数据,对神经网络进行训练,得到相似度预测模型。
9.根据本发明实施例的第五方面,提供了一种电子设备,所述设备包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如第一方面或第二方面所述的方法对应的操作。
10.根据本发明实施例的第六方面,提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面或第二方面所述的方法。
11.在本发明实施例的方案中,能够根据候选主体和目标主体在多个同一维度上的关键词确定候选主体与目标主体的相似度,由于相同的多个维度能够更全面反映候选主体和目标主体之间的关联程度,因此根据相似度,在候选主体中选择与目标主体相似的主体作为目标主体的推荐主体时,能够进行更准确的主体推荐。
附图说明
12.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
13.图1为本发明的一个实施例的推荐方法的示意性流程图;
14.图2为本发明的另一实施例的相似度预测模型的架构的示意图;
15.图3为本发明的另一实施例的相似度预测模型的一个示例的向量处理的示意图;
16.图4为本发明的另一实施例的相似度预测模型的另一示例的向量处理的示意图;
17.图5为本发明的另一实施例的模型训练方法的示意性流程图;
18.图6为本发明的另一实施例的主体推荐装置的示意性框图;
19.图7为本发明的另一实施例的模型训练装置的示意性框图;
20.图8为本发明的另一实施例的电子设备的硬件结构。
具体实施方式
21.为了使本领域的人员更好地理解本发明实施例中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明实施例一部分实施例,而不是全部的实施例。基于本发明实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本发明实施例保护的范围。
22.下面结合本发明实施例附图进一步说明本发明实施例具体实现。
23.通常,在利用企业的名称以及企业的经营范围这两种特征进行企业推荐的情况下,存在诸多缺点。一方面,企业名称和经营范围包含的信息量较少,并且企业名称和经营范围由于企业在工商注册的时候主观填报而存在申报不准、虚假填写或者经营内容重大变更等各种因素的干扰。另一方面,诸如企业经营范围等文字描述的核心信息难以提取,并且相似企业的定义比较宽泛,对于不同的服务场景没有区分作用。因此,本发明实施例提供了一种推荐方法,能够解决上述问题。
24.图1为本发明的一个实施例的推荐方法的示意性流程图。图1的推荐方法可以适用于任意适当的具有数据处理能力的电子设备,包括但不限于:服务器、移动终端(如手机、
pad等)和pc机等。该推荐方法包括:
25.110:获取候选主体在多个维度的第一描述信息,根据第一描述信息确定候选主体在每个维度上的关键词;以及,获取目标主体在多个维度的第二描述信息,并根据第二描述信息确定目标主体在每个维度上的关键词。
26.应理解,文中的描述信息包括文本信息、语音信息和视觉信息中的至少一种。文中的主体包括但不限于企业、或非企业机构、组织等。
27.还应理解,多个维度的描述信息包括但不限于工商注册中的经营范围信息、主体的专利、著作权、招聘信息等。多个维度的描述信息可以分为主体唯一对应的描述信息和非唯一对应的描述信息。主体唯一对应的描述信息包括但不限于主体的工商登记的经营范围、主体的百度百科描述等。非唯一对应的描述信息包括但不限于专利、著作权或者招聘信息等。对于唯一对应的文本信,可以将主体唯一对应的描述直接当文本,参考tfidf(词频逆文档频率)的计算逻辑,得到tfidf的值。对于非唯一对应的描述信息,可以将文本得到的统计结果(例如,关键词)融合到主体维度。
28.还应理解,对于多个维度的描述信息,例如,可以基于专利信息挖掘出主体最关注的核心技术点,从而预测出主体最可能的主营业务(例如,可以用推理模型实现)。又例如,通过招聘信息可以挖掘出主体最需要的各种职位类型,从而推断出主体的主营业务方向。又例如,以专利信息为例,可以对专利简介文本进行分词,统计每个词在该文本中出现的次数。在一家主体具有多篇专利申请的情况下,可以利用主体唯一标识号进行聚合统计,统计出每个词在每一家主体中出现的次数。
29.还应理解,对于诸如著作权或者招聘信息的信息,可以分别采用以上方案,提取各自的关键词。此外,对于这些描述信息,可以包括名称和描述类信息。以专利信息为例,可以包括专利名称以及专利简介。招聘信息也包括招聘职位名称和招聘职位描述两种文本。可以将名称和描述分别进行tfidf计算,从而提取各自的关键词。
30.120:根据候选主体和目标主体在多个同一维度上的关键词确定候选主体与目标主体的相似度。
31.应理解,候选主体与目标主体可以属于一组主体中的主体,可以对该一组主体中的各个主体的多个维度的描述信息的统计,然后确定主体对,以主体对的方式进行相似度计算。
32.130:根据相似度,在候选主体中选择与目标主体相似的主体作为目标主体的推荐主体。
33.应理解,可以根据每个主体出现的词语的tfidf值的从大到小进行排序,可取每个主体的前n个词语作为主体的专利关键词。
34.还应理解,利用筛选出来的专利关键词的词嵌入进行加权求和得到目标主体的专利整体嵌入。词语的词嵌入可以是使用通用语料训练出来的词向量,也可以是针对专利文章专门优化训练的词向量。得到专利向量嵌入之后,可以根据欧式距离等向量距离度量公式,求得跟目标主体最相似的候选主体。
35.在本发明实施例的方案中,能够根据候选主体和目标主体在多个同一维度上的关键词确定候选主体与目标主体的相似度,由于相同的多个维度能够更全面反映候选主体和目标主体之间的关联程度,因此根据相似度,在候选主体中选择与目标主体相似的主体作
为目标主体的推荐主体时,能够进行更准确的主体推荐。
36.在本发明的另一实现方式中,根据候选主体和目标主体在多个同一维度上的关键词确定候选主体与目标主体的相似度,包括:根据候选主体在第一维度上的关键词确定候选主体的在第一维度上的第一特征词向量;以及,根据目标主体在第一维度上的关键词确定目标主体在第一维度上的第二特征词向量;将第一特征词向量和第二特征词向量输入预先训练的相似度预测模型中,得到候选主体与目标主体在第一维度上的相似度。
37.在本发明的另一实现方式中,相似度预测模型包括注意力机制层和全连接层,将第一特征词向量和第二特征词向量输入到预先训练的相似度预测模型中,包括:将第一特征词向量和第二特征词向量输入到注意力机制层中,进行线性变换处理;将经过线性变换处理的第一特征词向量和第二特征词向量输入到全连接层中。
38.具体而言,以上多维度嵌入的拼接计算方式对于整体数据而言,融合层使用拼接将所有的域强行放在同一个向量空间中来学习,会导致训练不够充分的情形。通过使用模型将经营范围、专利、招聘、著作权各种域的信息融合在一起,例如,在经营范围或者招聘等某些特定的域(强关联特征)起到非常强的作用,使得在这些域的参数学习的比较充分。而对于专利、著作权等一些信息(弱关联特征),即时这些参数训练得不够充分,对后续预测结果影响不是特别明显。例如,比如对于主体来说,并不是每个主体都会同时具有专利、招聘、著作权等等信息。对于一些没有信息的维度来说,可以将这些维度上的嵌入信息置零。如果某个主体的强关联特征(例如,经营范围)为空,但是专利等弱关联特征专利信息不为空,则模型不应该强行利用经营范围的信息,而是应该更加关注弱关联特征。因此,在本示例中,由于在输入到全连接层之前,采用注意力机制对特征词向量进行线性变换处理,因此有利于学习到特征词向量中不同维度之间的隐含上下文关系,从而提高了模型的预测准确度。
39.在本发明的另一实现方式中,根据候选主体和目标主体在多个同一维度上的关键词确定候选主体与目标主体的相似度,还包括:将候选主体在第二维度上的关键词进行词向量处理,得到候选主体在第二维度上的第一特征词向量;以及,将目标主体在第二维度上的关键词进行词向量处理,得到目标主体在第二维度上的第二特征词向量;将候选主体在第一维度上的第一特征向量以及在第二维度上的第一特征向量进行加权计算,得到候选主体的第一特征词向量;以及,将目标主体在第一维度上的第二特征向量以及在第二维度上的第二特征向量进行加权计算,得到目标主体的第二特征词向量。
40.具体而言,可以将候选主体的多组关键词以及目标主体的多组关键词进行词向量处理,得到候选主体的多组关键词向量和目标主体的多组关键词向量。可以对候选主体的多组关键词向量和目标主体的多组关键词向量进行加权计算,得到候选主体的特征词向量和目标主体的特征词向量。
41.由于根据主体的多组关键词,确定了主体的特征词向量,因此提高了模型训练效率。
42.在本发明的另一实现方式中,根据相似度,在候选主体中选择与目标主体相似的主体作为目标主体的推荐主体,包括:在候选主体所在的候选主体集合中,确定满足召回主体数目的多个主体,其中,召回主体数目基于推荐主体数目和召回比例信息确定;基于相似度,从满足召回主体数目的多个主体中选择目标主体的推荐主体。
43.具体而言,有时关键词经常会出现在不同的行业之间。例如“零售”、“设备”等等这
种词语可能适用于各种不同的行业。如果笼统的计算tfidf得到的结果很有可能不是我们预想的跟主营业务相关的。在本示例中,由于在推荐主体之前,确定满足召回主体数目的一组主体,再进行主体推荐,因此减小了因推荐相似度指标不够准确而导致的误推荐率。
44.下面以招聘描述为例描述召回比例信息在本示例中的作用。通常,在招聘领域,不同行业之间很多职位信息是可能相通的。以关键词“java”为例。在全量主体范围来看,招聘“java”相关职位的主体可能比例不大,使得“java”这个词的idf值可能较大。因此如果候选主体是信息技术相关的主体,则“java”这个词可能作为一个关键的词语融入到整体嵌入信息中,导致目标主体的相似候选主体是以信息技术为主营业务,但是很多行业现在都会跟信息技术产生一定交叉融合,如会存在“信息技术+电商”、“信息技术+医疗”、“信息技术+教育”等等各种组合。
45.在推荐主体的时候,推荐数目通常较少。例如对于“***有限公司”,主体名称反映其主要是经营网络信息技术相关的业务,并且招聘信息反映出招聘了java、python等软件开发相关的职位。但是,该主体主营业务可能与电子商务,换言之,主营业务目的是贸易,信息技术是辅助手段。对该目标主体推荐相似候选主体的时候,如果使用传统的tfidf方案,推荐的排名靠前的主体大部分都是纯做网络开发或者其他跟贸易没什么关系的信息技术类主体的话,则很有可能达不到我们理想的推荐效果。而最合理的推荐主体应该是跟该主体主营业务相似的在线电商主体。
46.因此,例如,对目标主体推荐最相似的前k个主体的话,那么我们先利用传统的tfidf方案对相似主体进行粗召回,可以设定召回倍n,那么粗召回的个数就是k*n个主体。比如我们目标是推荐top 5的主体,粗召回倍数设定为1000,那么应该粗召回5000个主体。在粗召回的5000个主体中,存在主营业务相似的主体的个数理论上应该是比单独只召回5个主体中能匹配上的个数要大很多。在全量主体来看,可能“零售”这个词出现的主体要比“java”这个词出现的主体要多,那么筛选出来的关键词很可能只保留了“java”而忽略了“零售”。
47.在本发明的另一实现方式中,根据第一描述信息确定候选主体在每个维度上的关键词,包括:从第一描述信息中获得每个维度的关键词的词频逆文档频率得分;根据词频逆文档频率得分对同一维度的关键词进行排序,得到候选主体在每个维度上的关键词,根据第二描述信息确定目标主体在每个维度上的关键词,包括:从第二描述信息中获得每个维度的关键词的词频逆文档频率得分;根据词频逆文档频率得分对同一维度的关键词进行排序,得到目标主体在每个维度上的关键词。
48.在本发明的另一实现方式中,获得每个维度的关键词的词频逆文档频率得分,包括:获得每个维度的每个关键词的词频得分和逆文档频率得分;根据词频得分和逆文档频率得分得到每个维度的关键词的词频逆文档频率得分,其中,词频得分表示特定关键词在特定维度的描述信息中出现的次数与特定维度的描述信息中的多个关键词的数目之间比例关系,逆文档频率得分表示召回主体数目与特定维度的描述信息中出现特定关键词的主体数目之间的比例关系。
49.由于词频逆文档频率得分对待选取的关键词进行排序,并且词频逆文档频率得分是统计学中非常重要的指标,对关键词有极准确的指示作用,提高了关键词的排序的准确度,进而提高了输入样本的价值。
50.具体而言,词频得分表示该关键词在该维度的描述信息中出现的次数与该维度的描述信息中的多个关键词的数目之间比例关系,逆文档频率得分表示多个主体的数目与该维度的描述信息中出现该关键词的主体数目之间的比例关系。例如,可以表示为:tf=词在目标主体专利文本中出现的次数/主体专利文本中所有词的个数;idf=log(主体总数/语料库中出现某单词的不同主体个数)。
51.换言之,词频得分tf表述某个词在一个主体专利文档出现的频率越多则对该主体越重要;逆文档频率得分idf表述该词在越多的主体专利中出现,则说明它对主体没有很强的区分度,所占的权重也就越小。因此整体的tfidf=tf*idf。
52.具体而言,对于上述示例中,从召回的5000个主体中,再进行一次tfidf计算。在这5000个主体中,信息技术主体战多数,诸如“java”、“python”这种软件开发必备的一些关键词会出现在这批召回的大部分的主体中,使得在tfidf的计算中权重就会降低。相对而言,与主体主营业务相关的关键词(诸如“贸易”“零售”等)在召回的主体中就会权重较大,在计算整体主体嵌入时会更突显其主营业务相关的信息,从而在这批信息技术主体中更精准地找到“在线电商”类的主体。因此,在本示例中,由于逆文档频率得分表示召回主体数目与该维度的描述信息中出现该关键词的主体数目之间的比例关系,因此利用召回主体数目得到了更准确的逆文档频率得分,进而提高了训练数据的价值。
53.图2为本发明的另一实施例的相似度预测模型的架构的示意图。具体而言,利用有监督数据来训练如图2的模型,使得模型得到最优的各种全连接层的参数。文中的有监督数据可以是指通过标注或者历史名单等形式获得的主体对,如果相似,则标签是1,如果不相似,则标签是0。标注的方法可以使用人工标注,例如,可以使用召回的方式找一批主体对,然后让人精标。也可以从一些现有的数据中直接获得相似主体数据。例如从已有的竞品主体中作为相似主体,或者同一家主体的多个客户也可以作为相似主体对等等。不相似的主体对可以使用相似主体对的主体中交叉组合后产生。
54.在模型训练阶段,将主体对的两个主体分别按照如图2的双塔神经网络结构进行嵌入。利用双方主体的各种信息的嵌入进行余弦相似度计算后,通过sigmoid激活函数后计算与真实标签之间的交叉熵作为损失函数,优化整个网络参数。
55.图3为本发明的另一实施例的相似度预测模型的一个示例的向量处理的示意图。如图所示,针对主体的专利、著作权、招聘等各种维度的描述信息,可以得到不同的嵌入。文本的名称和描述也可以分别进行嵌入。而对于主体规模、财务指标等连续型数值特征可归一化之后直接拼接成一个连续向量。而对于行业、地区等类型特征,在一个示例中,可以使用onehot编码(独热编码),但是这种方式通常比较稀疏。将类型变量后面再接一层嵌入层作为类型特征的向量。在相似主体推荐时,将前面得到的各个维度嵌入拼接在一起,如图4中的基本拼接方案。然后通过全连接层之后进行后续计算。
56.图4为本发明的另一实施例的相似度预测模型的另一示例的向量处理的示意图。如图所示,w1和w2为两个待训练的矩阵。对于不同的输入,乘以训练好的w1和w2之后,得到每个域的权重ai不同,从而能够动态地调整不同域之间权值的分配,学习到特征词向量中不同维度之间的隐含上下文关系。
57.图5为本发明的另一实施例的模型训练方法的示意性流程图。图5的模型训练方法可以适用于任意适当的具有数据处理能力的电子设备,包括但不限于:服务器和pc机等,该
模型训练方法包括:
58.510:获取训练数据,训练数据包括候选主体在多个维度的第一描述信息、目标主体在多个维度的第二描述信息、以及第一描述信息与第二描述信息的相似度标签。
59.520:基于训练数据,对神经网络进行训练,得到相似度预测模型。
60.在本发明实施例的方案中,能够根据候选主体和目标主体在多个同一维度上的关键词确定候选主体与目标主体的相似度,由于相同的多个维度能够更全面反映候选主体和目标主体之间的关联程度,因此根据相似度,在候选主体中选择与目标主体相似的主体作为目标主体的推荐主体时,能够进行更准确的主体推荐。
61.在本发明的另一实现方式中,神经网络为通过共享参数的第一全连接层、第二全连接层和激活函数层构成的双塔型神经网络,第一全连接层和第二全连接层的输出分别连接到激活函数层的输入,其中,基于训练数据,对神经网络进行训练,包括:根据第一描述信息确定候选主体在每个维度上的关键词,并且根据第二描述信息确定目标主体在每个维度上的关键词;分别基于候选主体在每个维度上的关键词和目标主体在每个维度上的关键词作为第一全连接层和第二全连接层的输入,并且将激活函数层的输出与相似度标签之间交叉熵作为损失函数,对双塔型神经网络进行训练。
62.由于神经网络为通过共享参数的第一全连接层、第二全连接层和激活函数层构成的双塔型神经网络,能够提高第一描述信息和第二描述信息相对独立的训练,因此提高了模型的训练精度。此外,第一全连接层和第二全连接层的输出分别连接到激活函数层的输入,并且激活函数层的输出与相似度标签之间交叉熵作为损失函数,因此提高了模型的训练效率。
63.在本发明的另一实现方式中,双塔型神经网络还包括第一融合层和第二融合层,第一融合层和第二融合层的输出分别连接到第一全连接层和第二全连接层的输入,对双塔型神经网络进行训练,包括:分别将第一描述信息和第二描述信息输入到第一融合层和第二融合层,得到候选主体的在第一维度上的第一特征词向量和目标主体在第一维度上的第二特征词向量;分别将第一特征词向量和第二特征词向量作为第一全连接层和第二全连接层的输入,并且将激活函数层的输出与相似度标签之间交叉熵作为损失函数,对双塔型神经网络进行训练。
64.由于输入到各个全连接层之前,经过相应的融合层,提高了融合处理效率,即,分别将第一描述信息和第二描述信息输入到第一融合层和第二融合层,得到候选主体的在第一维度上的第一特征词向量和目标主体在第一维度上的第二特征词向量,因此通过第一特征词向量和第二特征词向量,进一步提高了模型的训练效率。
65.在本发明的另一实现方式中,分别将第一描述信息和第二描述信息输入到第一融合层和第二融合层,得到候选主体的在第一维度上的第一特征词向量和目标主体在第一维度上的第二特征词向量,包括:分别将第一描述信息和第二描述信息输入到第一融合层和第二融合层,进行基于多个维度的注意力机制处理,得到第一组特征向量和第二组特征向量;将第一组特征向量和第二组特征向量,进行融合处理,得到候选主体的在第一维度上的第一特征词向量和目标主体在第一维度上的第二特征词向量。
66.由于在输入到全连接层之前,采用注意力机制对特征词向量进行线性变换处理,因此有利于学习到特征词向量中不同维度之间的隐含上下文关系,从而提高了模型的预测
准确度。
67.图6为本发明的另一实施例的主体推荐装置的示意性框图。图6的主体推荐装置可以适用于任意适当的具有数据处理能力的电子设备,包括但不限于:服务器、移动终端(如手机、pad等)和pc机等,该主体推荐装置包括:
68.获取模块610,获取模块,获取候选主体在多个维度的第一描述信息,并且获取目标主体在多个维度的第二描述信息;
69.第一确定模块620,根据第一描述信息确定候选主体在每个维度上的关键词,并且根据第二描述信息确定目标主体在每个维度上的关键词;
70.第二确定模块630,根据候选主体和目标主体在多个同一维度上的关键词,确定候选主体与目标主体的相似度;
71.推荐模块640,根据相似度,在候选主体中选择与目标主体相似的主体作为目标主体的推荐主体。
72.在本发明实施例的方案中,能够根据候选主体和目标主体在多个同一维度上的关键词确定候选主体与目标主体的相似度,由于相同的多个维度能够更全面反映候选主体和目标主体之间的关联程度,因此根据相似度,在候选主体中选择与目标主体相似的主体作为目标主体的推荐主体时,能够进行更准确的主体推荐。
73.在本发明的另一实现方式中,第二确定模块具体用于:根据候选主体在第一维度上的关键词确定候选主体的在第一维度上的第一特征词向量;以及,根据目标主体在第一维度上的关键词确定目标主体在第一维度上的第二特征词向量;将第一特征词向量和第二特征词向量输入预先训练的相似度预测模型中,得到候选主体与目标主体在第一维度上的相似度。
74.在本发明的另一实现方式中,相似度预测模型包括注意力机制层和全连接层,第二确定模块具体用于:将第一特征词向量和第二特征词向量输入到注意力机制层中,进行线性变换处理;将经过线性变换处理的第一特征词向量和第二特征词向量输入到全连接层中。
75.在本发明的另一实现方式中,第二确定模块具体用于还包括:将候选主体在第二维度上的关键词进行词向量处理,得到候选主体在第二维度上的第一特征词向量;以及,将目标主体在第二维度上的关键词进行词向量处理,得到目标主体在第二维度上的第二特征词向量;将候选主体在第一维度上的第一特征向量以及在第二维度上的第一特征向量进行加权计算,得到候选主体的第一特征词向量;以及,将目标主体在第一维度上的第二特征向量以及在第二维度上的第二特征向量进行加权计算,得到目标主体的第二特征词向量。
76.在本发明的另一实现方式中,推荐模块具体用于:在候选主体所在的候选主体集合中,确定满足召回主体数目的多个主体,其中,召回主体数目基于推荐主体数目和召回比例信息确定;基于相似度,从满足召回主体数目的多个主体中选择目标主体的推荐主体。
77.在本发明的另一实现方式中,第一确定模块具体用于:从第一描述信息中获得每个维度的关键词的词频逆文档频率得分;根据词频逆文档频率得分对同一维度的关键词进行排序,得到候选主体在每个维度上的关键词,以及从第二描述信息中获得每个维度的关键词的词频逆文档频率得分;根据词频逆文档频率得分对同一维度的关键词进行排序,得到目标主体在每个维度上的关键词。
78.在本发明的另一实现方式中,第一确定模块具体用于:获得每个维度的每个关键词的词频得分和逆文档频率得分;根据词频得分和逆文档频率得分得到每个维度的关键词的词频逆文档频率得分,其中,词频得分表示特定关键词在特定维度的描述信息中出现的次数与特定维度的描述信息中的多个关键词的数目之间比例关系,逆文档频率得分表示召回主体数目与特定维度的描述信息中出现特定关键词的主体数目之间的比例关系。
79.本实施例的装置用于实现前述多个方法实施例中相应的方法,并具有相应的方法实施例的有益效果,在此不再赘述。此外,本实施例的装置中的各个模块的功能实现均可参照前述方法实施例中的相应部分的描述,在此亦不再赘述。
80.图7为本发明的另一实施例的模型训练装置的示意性框图。图7的模型训练装置可以适用于任意适当的具有数据处理能力的电子设备,包括但不限于:服务器和pc机等,该模型训练装置包括:
81.获取模块710,获取训练数据,训练数据包括候选主体在多个维度的第一描述信息、目标主体在多个维度的第二描述信息、以及第一描述信息与第二描述信息的相似度标签。
82.训练模块720,基于训练数据,对神经网络进行训练,得到相似度预测模型。
83.由于训练数据中的候选主体在多个维度的第一描述信息、以及目标主体在多个维度的第二描述信息反映了候选主体和目标主体在多个维度的数据,因此通过上述样本进行训练得到的相似度预测模型能够得到更准确的相似度预测结果。
84.在本发明的另一实现方式中,神经网络为通过共享参数的第一全连接层、第二全连接层和激活函数层构成的双塔型神经网络,第一全连接层和第二全连接层的输出分别连接到激活函数层的输入,其中,训练模块具体用于:根据第一描述信息确定候选主体在每个维度上的关键词,并且根据第二描述信息确定目标主体在每个维度上的关键词;分别基于候选主体在每个维度上的关键词和目标主体在每个维度上的关键词作为第一全连接层和第二全连接层的输入,并且将激活函数层的输出与相似度标签之间交叉熵作为损失函数,对双塔型神经网络进行训练。
85.在本发明的另一实现方式中,双塔型神经网络还包括第一融合层和第二融合层,第一融合层和第二融合层的输出分别连接到第一全连接层和第二全连接层的输入。训练模块具体用于:分别将第一描述信息和第二描述信息输入到第一融合层和第二融合层,得到候选主体的在第一维度上的第一特征词向量和目标主体在第一维度上的第二特征词向量;分别将第一特征词向量和第二特征词向量作为第一全连接层和第二全连接层的输入,并且将激活函数层的输出与相似度标签之间交叉熵作为损失函数,对双塔型神经网络进行训练。
86.在本发明的另一实现方式中,训练模块具体用于:分别将第一描述信息和第二描述信息输入到第一融合层和第二融合层,进行基于多个维度的注意力机制处理,得到第一组特征向量和第二组特征向量;将第一组特征向量和第二组特征向量,进行融合处理,得到候选主体的在第一维度上的第一特征词向量和目标主体在第一维度上的第二特征词向量。
87.本实施例的装置用于实现前述多个方法实施例中相应的方法,并具有相应的方法实施例的有益效果,在此不再赘述。此外,本实施例的装置中的各个模块的功能实现均可参照前述方法实施例中的相应部分的描述,在此亦不再赘述。
88.图8为本发明的另一实施例的电子设备的硬件结构;如图8所示,该电子设备的硬件结构可以包括:处理器801,通信接口802,存储介质803和通信总线804;
89.其中处理器801、通信接口802、存储介质803通过通信总线804完成相互间的通信;
90.可选地,通信接口802可以为通信模块的接口;
91.其中,所述处理器具体可以配置为:获取候选主体在多个维度的第一描述信息,根据所述第一描述信息确定所述候选主体在每个维度上的关键词;以及,获取目标主体在所述多个维度的第二描述信息,并根据所述第二描述信息确定所述目标主体在每个维度上的关键词;根据所述候选主体和所述目标主体在多个同一维度上的关键词确定所述候选主体与所述目标主体的相似度;根据所述相似度,在所述候选主体中选择与所述目标主体相似的主体作为所述目标主体的推荐主体;
92.或者,所述处理器具体可以配置为:获取训练数据,所述训练数据包括候选主体在多个维度的第一描述信息、目标主体在所述多个维度的第二描述信息、以及所述第一描述信息与所述第二描述信息的相似度标签;基于所述训练数据,对神经网络进行训练,得到相似度预测模型。
93.所述处理器可以是通用处理器,包括中央处理器(central processing unit,简称cpu)、网络处理器(network processor,简称np)等;还可以是数字信号处理器(dsp)、专用集成电路(asic)、现成可编程门阵列(fpga)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
94.所述存储介质可以是,但不限于,随机存取存储介质(random access memory,ram),只读存储介质(read only memory,rom),可编程只读存储介质(programmable read-only memory,prom),可擦除只读存储介质(erasable programmable read-only memory,eprom),电可擦除只读存储介质(electric erasable programmable read-only memory,eeprom)等。
95.特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在存储介质上的计算机程序,该计算机程序包含配置为执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。在该计算机程序被中央处理单元(cpu)执行时,执行本发明的方法中限定的上述功能。需要说明的是,本发明所述的存储介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。存储介质例如可以但不限于是电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储介质(ram)、只读存储介质(rom)、可擦式可编程只读存储介质(eprom或闪存)、光纤、便携式紧凑磁盘只读存储介质(cd-rom)、光存储介质件、磁存储介质件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任
意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何存储介质,该存储介质可以发送、传播或者传输配置为由指令执行系统、装置或者器件使用或者与其结合使用的程序。存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。
96.可以以一种或多种程序设计语言或其组合来编写配置为执行本发明的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如”c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络:包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
97.附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个配置为实现规定的逻辑功能的可执行指令。上述具体实施例中有特定先后关系,但这些先后关系只是示例性的,在具体实现的时候,这些步骤可能会更少、更多或执行顺序有调整。即在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
98.描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。这些模块的名称在某种情况下并不构成对该模块本身的限定。
99.作为另一方面,本发明还提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例所描述的方法。
100.作为另一方面,本发明还提供了一种存储介质,该存储介质可以是上述实施例中描述的装置中所包含的;也可以是单独存在,而未装配入该装置中。上述存储介质承载有一个或者多个程序,当上述一个或者多个程序被该装置执行时,使得该装置:获取候选主体在多个维度的第一描述信息,根据所述第一描述信息确定所述候选主体在每个维度上的关键词;以及,获取目标主体在所述多个维度的第二描述信息,并根据所述第二描述信息确定所述目标主体在每个维度上的关键词;根据所述候选主体和所述目标主体在多个同一维度上的关键词确定所述候选主体与所述目标主体的相似度;根据所述相似度,在所述候选主体中选择与所述目标主体相似的主体作为所述目标主体的推荐主体;
101.或者,使得该装置:获取训练数据,所述训练数据包括候选主体在多个维度的第一描述信息、目标主体在所述多个维度的第二描述信息、以及所述第一描述信息与所述第二描述信息的相似度标签;基于所述训练数据,对神经网络进行训练,得到相似度预测模型。
102.在本公开的各种实施方式中所使用的表述“第一”、“第二”、“所述第一”或“所述第二”可修饰各种部件而与顺序和/或重要性无关,但是这些表述不限制相应部件。以上表述
仅配置为将元件与其它元件区分开的目的。例如,第一用户设备和第二用户设备表示不同的用户设备,虽然两者均是用户设备。例如,在不背离本公开的范围的前提下,第一元件可称作第二元件,类似地,第二元件可称作第一元件。
103.当一个元件(例如,第一元件)称为与另一元件(例如,第二元件)“(可操作地或可通信地)联接”或“(可操作地或可通信地)联接至”另一元件(例如,第二元件)或“连接至”另一元件(例如,第二元件)时,应理解为该一个元件直接连接至该另一元件或者该一个元件经由又一个元件(例如,第三元件)间接连接至该另一个元件。相反,可理解,当元件(例如,第一元件)称为“直接连接”或“直接联接”至另一元件(第二元件)时,则没有元件(例如,第三元件)插入在这两者之间。
104.以上描述仅为本发明的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本发明中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本发明中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1