一种专利推荐方法和专利推荐装置与流程

文档序号:22966702发布日期:2020-11-19 21:38阅读:167来源:国知局
一种专利推荐方法和专利推荐装置与流程

本发明涉及专利信息技术领域,特别是涉及一种专利推荐方法和专利推荐装置。



背景技术:

随着互联网技术的迅猛发展,给人们日常生活带来了海量专利信息,但是存在着专利信息过载问题,用户找到自己所需专利并非易事,同时专利提供方找到潜在用户也是如此。传统的专利推荐方法,存在平台、专利信息、服务的差异,没有完备的解决方案,同时在互联网初始阶段由于用户的数量、个人信息等数据很少,难以进行有效的专利推荐。



技术实现要素:

为了解决上述技术问题,本发明提供了一种专利推荐方法和专利推荐装置。

本发明提供的一种专利推荐方法,包括以下步骤:

获取用户对应的供需信息、行为信息、历史交易信息;供需信息包括技术领域,行为信息包括浏览的专利,历史交易信息包括历史交易的专利;

分别确定供需信息、行为信息、历史交易信息对应的多件专利;

分别确定各件专利与供需信息、行为信息、历史交易信息的相似度;

根据相似度和预先计算得到的供需信息、行为信息、历史交易信息各自的权重,计算得到各件专利与用户的相关度;

根据相关度与预先设置的阈值之间的关系,确定向用户推荐的专利和/或专利包。

采用了上述技术方案,根据用户的供需信息、行为信息、历史交易信息选取的专利,计算专利的相似度,并根据预先计算得到的权重,计算相关度,判断相关度与预先设置的阈值之间的关系,确定向用户推荐的专利和/或专利包,此方法可以将相关的新专利推荐给新用户,解决用户冷启动和物品冷启动的问题。该专利推荐方法快速、准确的为用户推荐所需的专利。

进一步地,行为信息具体包括从用户行为日志中获取用户的浏览记录、检索记录、收藏记录。

采用了上述技术方案,根据用户的浏览记录、检索记录、收藏记录等信息获得用户的行为信息,同时根据用户的行为日志为用户准确的提供需要的专利以及将相关的新专利推荐给用户。

进一步地,分别确定各件专利与供需信息、行为信息、历史交易信息的相似度,具体包括:

根据各专利中技术领域相关关键词的词频大小,获得各件专利与用户供需信息的相似度s1;

根据用户对各专利浏览的次数、时间、命中次数,获得各件专利与用户行为信息的相似度s2;

根据各专利与用户历史交易专利的简单数据相关度或/和语义相关度,计算各件专利与用户历史交易信息的相似度s3。

进一步地,简单数据相关度包括ipc相关度或者引证相关度。

进一步地,语义相关度是对各专利的名称、摘要、权利要求、说明书进行专利词频计算得到。

进一步地,供需信息权重w1,行为信息权重w2,历史交易信息权重w3分别为:

其中,aij为供需信息、行为信息之间的重要度比例,aiz为供需信息、历史交易信息之间的重要度比例,ajz为行为信息、历史交易信息之间的重要度比例,其中:

进一步地,相关度为y,

采用了上述技术方案,通过确定各件专利与供需信息的相似度s1、行为信息的相似度s2、历史交易信息的相似度s3以及供需信息权重w1,行为信息权重w2,历史交易信息权重w3,并利用相关度y的计算公式得到相关度的值,比较相关度与预先设置的阈值的大小,确定向用户推荐的专利和/或专利包。

一种专利推荐装置,包括:

获取模块,用于获取用户对应的供需信息、行为信息、历史交易信息;供需信息包括技术领域,行为信息包括浏览的专利,历史交易信息包括历史交易的专利;

确定模块,用于分别确定供需信息、行为信息、历史交易信息对应的多件专利;并分别确定各件专利与供需信息、行为信息、历史交易信息的相似度;

计算模块,用于根据相似度和预先计算得到的供需信息、行为信息、历史交易信息各自的权重,计算得到各件专利与用户的相关度;

推荐模块,用于根据相关度与预先设置的阈值之间的关系,确定向用户推荐的专利和/或专利包。

采用了上述技术方案,专利推荐装置包括获取模块、确定模块、计算模块、推荐模块,通过获取用户的信息,确定与信息对应的多件专利,以及各件专利与信息之间的相似度,根据预先设定的权重计算各件专利与用户的相关度,根据相关度与预先设置的阈值之间的关系,确定向用户推荐的专利和/或专利包,该装置使专利推荐的过程更加准确、快速。

进一步地,确定模块具体用于:

根据各专利中技术领域相关关键词的词频大小,获得各件专利与用户供需信息的相似度s1;

根据用户对各专利浏览的次数、时间、命中次数,获得各件专利与用户行为信息的相似度s2;

根据各专利与用户历史交易专利的简单数据相关度或/和语义相关度,计算各件专利与用户历史交易信息的相似度s3。

进一步地,供需信息权重w1,行为信息权重w2,历史交易信息权重w3分别为:

其中,aij为供需信息、行为信息之间的重要度比例,aiz为供需信息、历史交易信息之间的重要度比例,ajz为行为信息、历史交易信息之间的重要度比例,其中:

相关度为y,

综上所述,通过获取用户对应的供需信息、行为信息、历史交易信息,以及对应的多件专利,并分别确定各件专利与供需信息、行为信息、历史交易信息的相似度s和权重w,进而求得用户与专利的相关度y,当相关度y大于相关度阈值时系,将专利和/或专利包推荐给用户,这样不仅可以快速、准确的为用户推荐提供所需的专利,同时也解决了用户冷启动、物品冷启动、系统冷启动的问题。

附图说明

图1示出了专利推荐方法的流程图。

具体实施方式

下面结合附图说明根据本发明的具体实施方式。

在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明并不限于下面公开的具体实施例的限制。

如图1所示,本发明提供的一种专利推荐方法,包括以下步骤:

s1、获取用户对应的供需信息、行为信息、历史交易信息;供需信息包括技术领域,行为信息包括浏览的专利,历史交易信息包括历史交易的专利;

进一步地,行为信息具体包括从用户行为日志中获取用户的浏览记录、检索记录、收藏记录。

采用上述技术方案,通过获取用户对应的供需信息、行为信息、历史交易信息,将信息存储在专利推荐装置中,便于后续的管理与维护,同时装置会根据用户的信息为新用户推荐专利,以及将相关的新专利推荐给新用户,解决用户冷启动、物品冷启动、系统冷启动的问题。

其中,用户冷启动是指如何向新用户推荐专利;物品冷启动是指如何将新物品推荐给用户;系统冷启动是指如何在一个新平台,运营初期就能进行有效推荐。

s2、分别确定供需信息、行为信息、历史交易信息对应的多件专利;

采用上述技术方案,通过确定供需信息可以对应找到与用户的供需信息相匹配的多件专利,与行为信息相匹配的多件专利以及与历史交易信息相匹配的多件专利。

s3、分别确定各件专利与供需信息、行为信息、历史交易信息的相似度,具体包括以下步骤:

s31、根据各专利中技术领域相关关键词的词频大小,获得各件专利与用户供需信息的相似度s1;

其中,词频tf(termfrequency)指的是一个词在专利中出现的次数,词频的计算公式如下:

词频tf=某个词在专利中出现的次数/专利的总字数。

具体地,可以设置词频与相似度的对应关系,例如,词频为0时,s1为0分;词频小于等于0.05时,s1为30分;词频大于0.05,小于0.1时,s1为70分;词频大于等于0.1时,s1为100分。当用户需求信息关键词的词频越大时,专利与用户供需信息的相似度s1的数值越大。

当然,供需信息的相似度s1还可以采用词项、汉明距离、余弦相似度等计算方法得到。

s32、根据用户对各专利浏览的次数、时间、命中次数,获得各件专利与用户行为信息的相似度s2;

具体地,可以设置用户行为与相似度的对应关系,例如,当用户浏览1次专利获得10分或者浏览专利5分钟获得10分,根据用户浏览的次数、时间、命中次数给予专利与用户行为信息的相似度s2;当用户浏览的次数越多或浏览的时间越长或者命中的次数越多,专利与用户行为信息的相似度s2的数值越大。

s33、根据各专利与用户历史交易专利的简单数据相关度或/和语义相关度,计算各件专利与用户历史交易信息的相似度s3。

进一步地,简单数据相关度包括ipc相关度或者引证相关度。

具体地,可以设置简单数据相关度与相似度的对应关系,例如,其中,ipc相关度具体为:当ipc相同时为100分,大组相同时为80分,小类相同时为60分,大类相同时为40分,部相同时为20分,此时获得专利与用户历史交易信息的相似度s3。若ipc信息完全不同,则根据专利之间的引证关系即引证相关度确定历史交易信息的相似度s3。

语义相关度是对各专利的名称、摘要、权利要求、说明书进行专利词频计算得到。

一般来说,一个词在专利中的词频越高,越能代表专利的主题;当两篇专利中包含相同的词越多,并且相同的词的词频越高时,说明两件专利的相似度越大。

具体地,各专利与用户历史交易专利之间的语义相关度可以采用余弦相似度计算得到,本发明在此不作赘述。

当然,历史交易信息的相似度s3还可以采用词项、汉明距离、余弦相似度等方法得到。

s4、根据相似度和预先计算得到的供需信息、行为信息、历史交易信息各自的权重,计算得到各件专利与用户的相关度;

s41、供需信息权重w1,行为信息权重w2,历史交易信息权重w3分别为:

其中,aij为供需信息、行为信息之间的重要度比例,aiz为供需信息、历史交易信息之间的重要度比例,ajz为行为信息、历史交易信息之间的重要度比例,其中:根据层次分析法可知,1:表示同等重要,3:略重要,5:重要,7:很重要,9:极重要,2表示介于1、3之间,4、6、8同理。

当然,不仅仅采用上述方式计算权重,还可以根据实际情况进行计算。

s42、相关度y,

其中,相关度y=s1*w1+s2*w2+s3*w3;

s5、根据相关度与预先设置的阈值之间的关系,确定向用户推荐的专利和/或专利包。

当相关度大于预先设置的阈值时,将专利和/或专利包推荐给用户。或者,将各专利的相关度按从大到小排序,并将相关度前x的专利/专利包推荐给用户。

一种专利推荐装置,包括:

获取模块,用于获取用户对应的供需信息、行为信息、历史交易信息;供需信息包括技术领域,行为信息包括浏览的专利,历史交易信息包括历史交易的专利;

确定模块,用于分别确定供需信息、行为信息、历史交易信息对应的多件专利;并分别确定各件专利与供需信息、行为信息、历史交易信息的相似度;

进一步地,确定模块具体用于:

根据各专利中技术领域相关关键词的词频大小,获得各件专利与用户供需信息的相似度s1;

根据用户对各专利浏览的次数、时间、命中次数,获得各件专利与用户行为信息的相似度s2;

根据各专利与用户历史交易专利的简单数据相关度或/和语义相关度,计算各件专利与用户历史交易信息的相似度s3。

计算模块,用于根据相似度和预先计算得到的供需信息、行为信息、历史交易信息各自的权重,计算得到各件专利与用户的相关度;

其中,供需信息权重w1,行为信息权重w2,历史交易信息权重w3分别为:

其中,aij为供需信息、行为信息之间的重要度比例,aiz为供需信息、历史交易信息之间的重要度比例,ajz为行为信息、历史交易信息之间的重要度比例,其中:

相关度为y,

推荐模块,用于根据相关度与预先设置的阈值之间的关系,确定向用户推荐的专利和/或专利包。

下面是本发明的具体实施例:

通过获取用户关注的技术领域、浏览的专利、历史交易的专利获得用户对应的供需信息、行为信息、历史交易信息;

通过上述信息分别确定与供需信息相匹配的多件专利、与行为信息相匹配的多件专利、与历史交易信息相匹配的多件专利。

通过各专利中技术领域相关关键词的词频大小,获得各件专利与用户供需信息的相似度s1,词频为0.07,由于词频大于0.05,小于0.1,所以s1为70分;

根据用户对各专利浏览的次数、时间、命中次数,获得各件专利与用户行为信息的相似度s2,由于用户浏览专利15分钟,浏览了3次,所以s2为60分;

根据各专利与用户历史交易专利的简单数据相关度或/和语义相关度,计算各件专利与用户历史交易信息的相似度s3,由于专利的大类相同,所以s3为40分;

由于,供需信息、行为信息之间的重要度比例aij为3,供需信息、专利对比信息之间的重要度比例aiz为5,行为信息、专利对比信息之间的重要度比例ajz为2,aii为1,ajj为1,azz为1,由于所以aji为azi为azj为

根据权重的计算公式可得,供需信息权重w1=0.65,行为信息权重w2=0.23,专利对比信息权重w3=0.12;

相关度

当相关度阈值为60时,64.1>60,将专利和/或专利包推荐给用户。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1