一种用于专家推荐的数据处理方法及装置

文档序号:36252869发布日期:2023-12-03 05:40阅读:33来源:国知局
一种用于专家推荐的数据处理方法及装置

本发明涉及计算机信息处理,更具体地说,涉及一种用于专家推荐的数据处理方法及装置。


背景技术:

1、产学研合作是企业与高校或研究机构为实现自身需求或利益,以科技创新和研究成果转化为目标的一种合作方式,是促进科技成果转化的最有效途径之一。在产业转型升级过程中,产学研合作非常重要。企业研发新产品经常遭遇技术困难,希望与专家协作解决并希望通过某些途径寻找到相关领域的专家。

2、目前,企业寻找专家的主要途径是通过相关人士推荐。这种以熟人社交为基础的推荐方式往往导致信息不完整,较难找到对口专家,会较大的影响产学研合作效果。判断一个专家是否能够匹配企业的技术人员需求,一般需要分析研究专家的特长。专家特长可以用其发表的论文或者专利等成果表征,原理上可以根据企业技术人员需求通过信息匹配方式推荐专家。

3、近年来,随着自然语言处理技术的发展,关于文本方面的推荐方法在社交平台和电子商务领域得到广泛应用。推荐方法通常分为基于内容、基于协同过滤、基于规则等几种方法。基于内容的推荐通过挖掘商品的内容特征为用户推荐与自己偏好商品特征相类似的商品。与之类似,如果以成果文本表征专家特长,以需求文本表征技术难题,根据相似度计算结果,可以提出一种基于内容的专家推荐方法,为企业推荐相关领域的专家,达成企业和高校的互利共赢。

4、经检索,中国专利申请,申请号201911175078.6,公开日2020年5月15日,公开了一种专家推荐方法及系统。该方法包括:根据基础关键词,获取关键词序列;将关键词序列输入到若干现有专家推荐系统中,获取推荐结果集合;对于任一推荐结果序列中的任一专家,根据任一现有专家推荐系统的类型、任一专家在任一推荐结构序列中的推荐程度,获取任一专家的推荐评分;根据每一专家的推荐评分,获取专家推荐结果。该方法可以在不依赖于本地数据库的前提下,在多个现有的专家推荐系统的基础上,给用户呈现更加全面、标准更加统一的推荐结果序列。但是该方法并未考虑到现有平台的算法具有一定缺陷,并不能做到精确地推荐专家,也无法满足企业与高校或研究机构之间的产学研合作。


技术实现思路

1、1.要解决的技术问题

2、针对现有技术中存在的企业人才需求得不到及时解决、高校专家资源无法得到有效利用进而导致不能很好地实现企业与高校或研究机构产学研合作的问题,本发明提供了一种用于专家推荐的数据处理方法及装置,基于实践度算法对企业问题词项向量数据和相似专家聚类簇的中心词项向量数据进行匹配处理,得到匹配结果数据,从而可以较好地缓解人工方式进行专家推荐存在的效率低下、准确性不足等问题,进而有效推进企业与高校或研究机构产学研合作。

3、2.技术方案

4、本发明的目的通过以下技术方案实现。

5、一种用于专家推荐的数据处理方法,包括:

6、获取待匹配数据,所述待匹配数据包括待匹配企业需求数据和待匹配专家信息数据;

7、构建科研词典,对待匹配企业需求数据进行数据处理,得到企业问题词项向量数据;

8、构建专家语义模型,对待匹配专家信息数据进行聚类,得到相似专家聚类簇的中心词项向量数据;

9、基于实践度算法,对企业问题词项向量数据和相似专家聚类簇的中心词项向量数据进行匹配处理,得到匹配结果数据。

10、进一步地,构建专家语义模型,对待匹配专家信息数据进行聚类,得到相似专家聚类簇的中心词项向量数据,包括:

11、获取专家信息数据并提取出专家信息数据中的专家主题特征数据,通过专家主题特征数据构建专家知识表示模型;

12、在专家知识表示模型中提取特征词数据,通过特征词数据建立词袋模型并构建专家-词项矩阵,对专家-词项矩阵处理得到语义专家-词项矩阵,通过语义专家-词项矩阵构建专家语义模型;

13、对专家语义模型进行聚类,得到相似专家聚类簇的中心词项向量数据。

14、进一步地,通过专家主题特征数据构建专家知识表示模型的步骤包括:

15、基于专家主题特征数据定义专家知识集数据,通过专家知识集数据表征专家物元知识模型;

16、通过向量空间模型对专家物元知识模型扩展,得到专家知识表示模型。

17、进一步地,从专家知识表示模型中提取出所有专家的特征词数据,将特征词数据进行去重处理后,通过特征词数据建立词袋模型并构建专家词项向量数据,通过专家词项向量数据构建专家-词项矩阵;

18、将专家-词项矩阵降维处理,对降维处理后的专家-词项矩阵进行逆运算得到语义专家-词项矩阵,通过语义专家-词项矩阵构建专家语义模型。

19、进一步地,专家语义模型表示为:

20、sem=(id,index,sw)

21、其中,sem表示专家语义模型,id表示专家的标识字段,index表示专家位于语义专家-词项矩阵中对应的位置,sw表示词项在语义专家-词项矩阵中的权重集合。

22、进一步地,在专家语义模型中获得不同关键词数据中的潜在相关度数据,再对语义专家-词项矩阵进行降维和逆运算处理获取语义专家-词项矩阵中的潜在语义信息数据,得到专家之间相似度矩阵数据;

23、通过k-means算法对专家之间相似度矩阵数据进行聚类,得到相似专家聚类簇的中心词项向量数据。

24、进一步地,构建科研词典,对待匹配企业需求数据进行数据处理,得到企业问题词项向量数据,包括:

25、获取并解析科研数据得到关键词数据,对关键词数据处理构建科研词典;

26、根据已构建的科研词典,以最长匹配原则对待匹配企业需求数据进行数据处理,并依据词袋模型得到企业问题词项向量数据。

27、进一步地,通过实践度算法对企业问题词项向量数据和相似专家聚类簇的中心词项向量数据进行匹配处理的计算公式为:

28、recommend(question)=λ×similarity(question,exper)+μ×practoce(question,expert)

29、其中,recommend表示匹配结果,question表示企业问题词项向量数据,expert表示相似专家聚类簇的中心词项向量数据,recommend(question)表示在企业问题词项向量数据下的匹配结果,λ、μ均表示赋予潜在语义相似度和实践度的权重,similarity(question,expert)表示基于潜在语义所得到的企业问题词项向量数据和相似专家聚类簇的中心词项向量数据的余弦相似度,practice(question,expert)表示基于潜在语义所得到的企业问题词项向量数据和相似专家聚类簇的中心词项向量数据的实践度计算结果。

30、一种用于专家推荐的数据处理装置,包括:

31、数据获取模块,获取待匹配数据,所述待匹配数据包括待匹配专家信息数据和待匹配企业需求数据;

32、企业需求数据模块,构建科研词典,对待匹配企业需求数据进行数据处理,得到企业问题词项向量数据;

33、专家信息数据模块,构建专家语义模型,对待匹配专家信息数据进行文本聚类,得到相似专家聚类簇的中心词项向量数据;

34、数据匹配模块,基于实践度算法,对企业问题词项向量数据和相似专家聚类簇的中心词项向量数据进行匹配处理,得到匹配结果数据。

35、一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述的用于专家推荐的数据处理方法。

36、3.有益效果

37、相比于现有技术,本发明的优点在于:

38、本发明的一种用于专家推荐的数据处理方法及装置,通过构建科研词典对待匹配企业需求数据进行数据处理得到企业问题词项向量数据,通过构建专家语义模型,对待匹配专家信息数据进行聚类,得到相似专家聚类簇的中心词项向量数据,最后基于实践度算法,对企业问题词项向量数据和相似专家聚类簇的中心词项向量数据进行匹配处理得到匹配结果数据,进而获得专家推荐结果,由此,可以较好地缓解人工方式进行专家推荐存在的效率低下、准确性不足等问题,进而有效推进企业与高校或研究机构产学研合作。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1