多维度技术相关度评估的知识产权数据系统的制作方法

文档序号:12127376阅读:来源:国知局

技术特征:

1.一种多维度技术相关度评估的知识产权数据系统,其特征在于,所述系统包括:访问界面层、业务应用层、应用支撑层、数据资源层和IT基础设施层,所述各层以功能单元为单位,设置统一的接口;

所述数据资源层包括相关度描述评估模块,用于对检索得到的各技术文档的技术方案进行多维度技术描述,以便于用户根据技术文档的多维度技术描述,快速了解与待评价技术方案的技术相关度,该多维度技术描述包括:

将技术文档的技术特征进行分解,得到该技术文档中所有技术特征组成的集合T1={t1,t2,…,tn},其中t1,t2,…,tn分别代表技术文档中的技术特征,n为不小于3的整数;其中,这里的技术特征是指技术文档中相邻两个标点符号之间的字词组合;

将技术文档中出现的技术术语构成集合S1,统计S1中各个技术术语在技术特征中出现的频率,设定一个限定值K,K为自然数,把出现次数超过K的技术术语放入集合M1中,将其余技术术语放入集合N1中;其中,这里的技术术语是指出现在技术特征中的实词;

利用集合N1对T1中的技术特征进行处理,其过程是去除每个技术特征中在N1中出现的技术术语组合元素,经过处理的技术特征形成新的集合T2;

基于T2中的每个技术特征,找出技术特征中所有两个技术术语的技术术语组合,形成集合S2,找出S2中每个技术术语组合在技术特征中出现的频率,把出现频率次数超过K的技术术语组合放入M2中,把其余的技术术语组合放入N2中;

利用集合N2对T2中的技术特征进行处理,其过程是去除每个技术特征中在N2中出现的技术术语组合元素,经过处理的技术特征形成新的集合T3;

基于T3中的每个技术特征,找出技术特征中所有三个技术术语的技术术语组合,形成集合S3,找出S3中每个技术术语组合在技术特征中出现的频率,把发生频率次数超过K的技术术语组合放入M3中,其余的放入N3中;

重复上述步骤,直至找出所有满足限定值K的包含n个技术术语的技术术语组合特征,放入Mn中,n为大于3的整数,集合{M1,M2,…,Mn}中的技术术语组合构成技术文档文档的多维度技术描述,包括单个技术术语特征、两技术术语特征、三技术术语特征及n个技术术语的特征,n为大于3的整数。

2.根据权利要求1所述的系统,其特征在于,自上而下地基于业务的分解,对所述系统的各层设置业务模块,所述业务模块之间具有统一的数据接口,所述业务模块之间可实现任意业务模块间的数据交互及调用。

3.根据权利要求1所述的系统,其特征在于,所述数据资源层包括数据资源采集模块、数据资源加工模块、数据资源管理模块;

所述数据资源加工模块接收来自所述业务应用层和/或访问界面层的请求,对数据资源层中的数据进行加工操作,所述加工操作包括:

基于咨询请求,对所述专家数据库模块包含的数据进行加工;基于导航请求,对所述区域企业数据库模块、行业数据库模块包含的数据进行加工;基于运营请求,对所述交易数据库模块包含的数据进行加工。

4.根据权利要求3所述的系统,其特征在于,所述数据资源加工模块在根据用户的请求对数据进行加工时,建立预设的数据项中的每个数据项值与分组标识的对应关系、以及建立分组标识与索引库中包含该数据项值的各数据条目的标识之间的对应关系,获取到用户提交的加工条件时,执行下列操作:

根据加工条件中数据项的属性信息,确定出用于查找的第一条件和用于过滤的第二条件;通过所述第一条件对所述索引库进行查找,得到初步结果;以及查找所述第二条件中包含的数据项上的关键词所对应的数据项值,生成与所述第二条件对应的过滤信息;所述过滤信息中包括:过滤的数据项、对应的过滤方式、以及过滤的数据项上过滤值的形式和取值范围;根据所述过滤信息中过滤的数据项对应的过滤方式以及所述过滤值的形式和取值范围,确定对应的有效分组标识,生成仅允许或仅不允许所述有效分组标识所对应的数据条目通过的过滤器;或根据所述过滤信息直接查找到对应的预先缓存的、基于分组的过滤器;其中,所述基于分组的过滤器仅允许或仅不允许设定分组的数据条目通过;根据初步检索结果中命中数据条目的条目标识,确定命中数据条目所对应的分组标识;依次通过各过滤器对所确定出的分组标识进行过滤,根据各过滤器仅允许或仅不允许的有效分组标识,得到能够通过各过滤器的数据条目,即得到最终的数据加工结果。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1