基于语义搜索的专家推荐方法、装置、设备及存储介质与流程

文档序号:22627725发布日期:2020-10-23 19:36阅读:来源:国知局

技术特征:

1.一种基于语义搜索的专家推荐方法,其特征在于,包括:

获得用户输入的文本信息;

对所述文本信息进行预处理,得到包括多个学术词语的学术词语集合;

基于所述学术词语集合中的多个学术词语查询学术数据库,获得包括多个候选专家的候选专家列表;

根据所述候选专家列表确定专家推荐结果。

2.根据权利要求1所述的方法,其特征在于,对所述文本信息进行预处理,得到包括多个学术词语的学术词语集合,包括:

对所述文本信息进行分词并去除停用词,得到包括多个分词词语的分词词语集合;

对所述分词词语集合中的分词词语进行语义化解析,转换获得包括多个学术词语的学术词语集合。

3.根据权利要求2所述的方法,其特征在于,对所述分词词语集合中的分词词语进行语义化解析,转换获得包括多个学术词语的学术词语集合,包括:

将所述分词词语与预先构建的学术词语图谱进行匹配,其中,所述预先构建的学术词语图谱包括多个学术词语;

根据所述分词词语与所述学术词语图谱中的学术词语的相似度选择学术词语作为所述分词词语的匹配结果;

组合作为匹配结果的学术词语得到所述学术词语集合。

4.根据权利要求3所述的方法,其特征在于,基于所述学术词语集合中的多个学术词语查询学术数据库,获得包括多个候选专家的候选专家列表,包括:

基于所述多个学术词语检索学术发表文档的信息及其引用量;

聚合检索到的学术发表文档的作者信息形成候选专家列表。

5.根据权利要求1至4中任一项所述的方法,其特征在于,根据所述候选专家列表确定专家推荐结果,包括:

根据所述候选专家列表和专家画像确定专家推荐结果,其中,所述专家画像包括学术与业界合作相关指标。

6.根据权利要求5所述的方法,其特征在于,所述学术与业界合作相关指标包括业界学术合作活跃度,所述业界学术合作活跃度是基于以下方式得到的:

统计专家在历史时间段内的历史学术发表数据;

根据所述历史学术发表数据中合作者为企业的组织信息生成专家业界合作记录;

根据所述专家业界合作记录的数量计算业界学术合作活跃度。

7.根据权利要求6所述的方法,其特征在于,根据所述候选专家列表和专家画像确定专家推荐结果,包括:

根据所述专家画像、专家的学术发表文档的信息及其引用量,确定多个候选专家的专家评分;

按照每个候选专家的专家评分由高到低的顺序,对所述多个候选专家进行排序;

根据排序后的专家列表生成专家推荐结果;

其中,专家评分采用以下公式计算:

其中,score表示专家评分;表示专家的学术发表文档的总引用量;表示专家的第k篇学术发表文档的引用量;表示专家被检索出的第k篇学术发表文档的发表年份;n表示专家的学术发表文档的总数量;y表示当前年份;表示专家画像中包含的第j个指标;m表示专家画像中指标的总数量;表示对当前项进行数值归一化的函数。

8.一种基于语义搜索的专家推荐装置,其特征在于,包括:

获取模块,被配置为获得用户输入的文本信息;

输入预处理模块,被配置为对所述文本信息进行预处理,得到包括多个学术词语的学术词语集合;

专家检索模块,被配置为基于所述学术词语集合中的多个学术词语查询学术数据库,获得包括多个候选专家的候选专家列表;

专家排序模块,被配置为根据所述候选专家列表确定专家推荐结果。

9.一种电子设备,包括处理器和存储有程序指令的存储器,其特征在于,所述处理器被配置为在执行所述程序指令时,执行如权利要求1至7任一项所述的基于语义搜索的专家推荐方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的基于语义搜索的专家推荐方法。


技术总结
本申请提供一种基于语义搜索的专家推荐方法、装置、设备及存储介质,该专家推荐方法包括:获得用户输入的文本信息;对文本信息进行预处理,得到包括多个学术词语的学术词语集合;基于学术词语集合中的多个学术词语查询学术数据库,获得包括多个候选专家的候选专家列表;根据候选专家列表确定专家推荐结果。借助于上述技术方案,本申请能够自动、快速地为具体的专家合作需求给出匹配的学术专家,提高专家推荐结果的成功率。

技术研发人员:王笑尘;唐杰;刘德兵;张鹏;仇瑜;张伟
受保护的技术使用者:北京智源人工智能研究院
技术研发日:2020.08.28
技术公布日:2020.10.23
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1