本发明属于知识产权交易和成果转化技术领域,具体涉及一种专利交易中潜在买方的自动匹配系统。
背景技术:
科技成果转化,是指为提高生产力水平而对科学研究与技术开发所产生的具有实用价值的科技成果所进行的后续试验、开发、应用、推广直至形成新产品、新工艺、新材料,发展新产业等活动。
专利的买卖便是科技成果转化的方式之一。为专利拥有人推送合适的潜在买方,能够在一定程度上促进科技成果的转化。目前有少量为待售专利匹配潜在买方的现有技术,但是这些技术主要是对专利文本的关键词与企业经营范围的关键词进行匹配,匹配结果误差较大。
技术实现要素:
本发明的目的在于针对现有技术的不足,提供一种为待售专利自动匹配潜在买方的专利匹配系统,解决了现有的网络专利资源数据库与技术对接交易平台无法实现精准对接潜在买方的缺陷。
本发明的目的是通过以下技术方案来实现的:
一种专利交易中潜在买方的自动匹配系统,其特征在于,该系统包括相互连接的匹配终端和数据服务器,所述的匹配终端包括数据提取单元、数据处理单元、数据评价单元和数据匹配单元,所述的数据服务器包括专利数据服务器和企业数据服务器;
所述的专利数据服务器用于存储所有的专利文件及专利信息;
所述的企业数据服务器用于存储企业的工商信息;
所述的数据评价单元用于对待售专利进行专利价值打分,并根据打分结果进行得分等级划分;
所述的数据提取单元用于从专利数据服务器中提取待售专利及每家企业所拥有的所有专利的分类号,并且从企业数据库中提取各个企业的工商信息中的经营关键词。
所述的数据处理单元用于对分类号及企业的经营关键词进行处理,包括将待售专利中每篇专利在每个分类体系下位于前列的若干分类号作为每篇专利的领域标签,对企业的所有专利在各个分类体系下的分类号进行频次统计、保留位于前列的若干个分类号,将其与企业经营关键词进行相关度分析、保留相关度位于前列的若干个分类号,作为企业的标签;
所述的数据匹配单元用于将得分等级最高的待售专利的领域标签均与每家企业的所有标签进行匹配,将得分等级次高的待售专利的领域标签与每家企业排在前列的若干个标签进行匹配,以此类推,将得分等级最低的待售专利的领域标签仅与每家企业排在第一位的标签进行匹配;当匹配成功后,统计与待售专利匹配成功的所有企业,获取每家企业所拥有的专利信息,分别计算待售专利与每家企业的匹配率,并按照匹配率从高到底进行排序后输出。
进一步地,所述的待售专利与每家企业的匹配率的计算方法具体如下:
设待售专利为a,提取专利文本中的n个关键词,关键词向量为
其中,xi-yj表示xi与yj的语义相似度,其由wordembedding的欧式距离求得,ai为加权权重;则专利a与专利bk的匹配率rk的计算公式为
进一步地,所述的数据匹配单元对企业的保留的分类号和企业经营关键词进行相关度分析时,将与经营关键词相关程度为80%以上的分类号定义为企业的a级领域标签,与经营关键词相关程度50%-80%的分类号定义为b级领域标签,与经营关键词相关程度50%以下的分类号定义为c级领域标签。
进一步地,所述的专利的分类号包括ipc分类号、cpc分类号、fi分类号、ft分类号、ec分类号中的一种或多种。
进一步地,所述的数据评价单元对待售专利进行打分的分值为1-5分,等级划分为1-2分为c级,3-4分为b级,5分为a级。
本发明的有益效果:
1.本发明将待售专利与企业专利的专利分类号作为专利领域标签进行匹配,相比关键词来说,专利分类号更能够反映专利的技术领域与解决的技术问题,因此匹配结果更加精准,匹配成功率更高;
2.本发明为待售专利进行分级,对不同级别的专利实行不同精度的匹配模式,能够减少工作量、节省时间,并增加匹配精准度。
附图说明
图1为本发明的为待售专利自动匹配潜在买方的专利匹配系统的架构图。
具体实施方式
下面根据附图和优选实施例详细描述本发明,本发明的目的和效果将变得更加明白,以下结合附图和实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,一种专利交易中潜在买方的自动匹配系统,该系统包括相互连接的匹配终端和数据服务器,匹配终端包括数据提取单元、数据处理单元、数据评价单元和数据匹配单元,数据服务器包括专利数据服务器和企业数据服务器;
专利数据服务器用于存储所有的专利文件及专利信息;
企业数据服务器用于存储企业的工商信息;
数据评价单元用于对待售专利进行专利价值打分,并根据打分结果进行得分等级划分;
数据提取单元用于从专利数据服务器中提取待售专利及每家企业所拥有的所有专利的分类号,并且从企业数据服务器中提取各个企业的工商信息中的经营关键词。
数据处理单元用于对分类号及企业的经营关键词等信息进行处理,包括将待售专利中每篇专利在每个分类体系下位于前列的若干分类号作为每篇专利的领域标签,对企业的所有专利在各个分类体系下的分类号进行频次统计、保留位于前列的若干个分类号,将其与企业经营关键词进行相关度分析、保留相关度位于前列的若干个分类号,作为企业的标签;
数据匹配单元用于将得分等级最高的待售专利的标签均与每家企业的所有标签进行匹配,将得分等级次高的待售专利的标签与每家企业排在前列的若干个标签进行匹配,以此类推,将得分等级最低的待售专利的标签仅与每家企业排在第一位的标签进行匹配,当匹配成功后,统计与待售专利匹配成功的所有企业,获取每家企业所拥有的专利信息,分别计算待售专利与每家企业的匹配率,并按照匹配率从高到底进行排序后输出。
优选地,待售专利与每家企业的匹配率的计算方法具体如下:
设待售专利为a,提取专利文本中的n个关键词,关键词向量为
其中,xi-yj表示xi与yj的语义相似度,其由wordembedding的欧式距离求得,ai为加权权重;则专利a与专利bk的匹配率rk的计算公式为
优选地,所述的数据匹配单元对企业的保留的分类号和企业经营关键词进行相关度分析时,将与经营关键词相关程度为80%以上的分类号定义为企业的a级领域标签,与经营关键词相关程度50%-80%的分类号定义为b级领域标签,与经营关键词相关程度50%以下的分类号定义为c级领域标签。
优选地,所述的专利的分类号包括ipc分类号、cpc分类号、fi分类号、ft分类号、ec分类号中的一种或多种。
优选地,所述的数据评价单元对待售专利进行打分的分值为1-5分,等级划分为1-2分为c级,3-4分为b级,5分为a级。
本领域普通技术人员可以理解,以上所述仅为发明的优选实例而已,并不用于限制发明,尽管参照前述实例对发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实例记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在发明的精神和原则之内,所做的修改、等同替换等均应包含在发明的保护范围之内。