一种文献检索及分析系统的制作方法

文档序号:9597962阅读:253来源:国知局
一种文献检索及分析系统的制作方法
【技术领域】
[0001]本发明涉及信息检索领域,具体涉及一种文献检索及分析系统。
【背景技术】
[0002]随着信息技术的迅速发展,电子文件由于其形式多样、容量大、体积小且便于信息共享和易于复制的优点而正在取代部分传统纸质出版物。随之而来的电子文献检索已经成为信息获取的较为有效的途径。
[0003]现今存在的电子文献检索方法通常是以统计词频的方式为基础实现的,这类方法都是机械式的进行统计和匹配,忽视了词语本身在语义上的实际意义和词语之间在语义上的关联性,检索效果并不理想。
[0004]同时各企业为了避免在技术推广应用方面出现不必要的专利纠纷,在进行市场评估时都会进行相应的风险分析。目前,这种方式主要是靠人工进行,即通过人工方式对企业竞争对手在有关国家或地区的专利申请、分析有关专利申请的保护范围进行分析。与企业相关的专利文献数量可能非常庞大,同时在对专利文献进行分析时需要依赖人员的专业知识及工作经验,人工成本较高,对专利风险评估是较为不利的。

【发明内容】

[0005]本发明的目的在于克服上述现有技术存在的技术缺陷,提供一种新的文献检索及分析系统。
[0006]本发明的目的是通过以下技术方案实现的:
一方面,本发明提供了一种文献检索及分析系统,包括:
基本检索模块,用于根据所述搜索请求在结构化数据库中进行搜索;
拓展检索模块,用于根据所述请求结合自然语言处理技术在数据库中进行搜索;
多数据源集成检索模块,用于对专利数据库的多数据源整合以及用户的跨库检索和多库检索等功能;
检索结果处理模块,用于对上述模块检索到的专利信息根据相关度进行抽取,获得特定技术领域术语集;
语义库建设模块,利用检索结果处理模块得到的特定技术领域的术语集并结合关联分析、专家评估等步骤,构建特定技术领域语义库,实现对专利的智能检索功能;
数据挖掘和自然语言处理模块,用于对检索到的专利信息数据的深入挖掘和自然语言的进一步处理;
专利信息智能分析结果可视化技术研究模块,用于对检索到的专利信息数据进行智能分析与可视化研究;
用户管理模块,用于将上述分析得到的数据汇总到用户管理模块进行总体管理,并根据用户需求进行最终端等输出。
[0007]所述多数据源集成检索模块包括多技术领域专业词库的词典型搜索和以语义分析为核心的语义网文档搜索两种检索策略;
所述语义库建设模块还包括相关度选择模块,用于选择检索处理模块得到的特定技术领域术语集中的语义相关的词条,构建特定技术领域语义库;
所述用户管理模块得到的文献检索分析汇总结果,能够根据用户需求选择在计算器终端进行显示或从终端进行最后的结果输出。
[0008]所述文献检索及分析系统中,以数据采集及加工为基础,从年份、申请人、发明人、关键词等多个专利著录项的角度出发,对专利数据进行统计、关联等分析,同时结合可视化技术对分析结果予以展示;可视化作为专利分析的一种手段,将数据挖掘、知识发现等技术综合运用到整个系统中;并且将信息对象进行综合、抽象、概念化、知识化、从而更方便简洁地实现可视化,并进一步发现专利之间地关系以及专利作者的信息等。
[0009]与现有技术相比,本发明的优点在于:实现了对专利信息的智能检索,并在此基础上对专利数据进行统计、关联等分析,同时结合可视化技术,对分析结果进行可视化展示。
【附图说明】
[0010]图1位本发明文献检索及分析系统示意图。
【具体实施方式】
[0011]为了使本发明的目的、技术方案及优点更加清楚明白,以下结合具体实施例对本发明进一步详细说明。应当理解,此处所描述的【具体实施方式】仅仅用以解释本发明,但并不用于限定本发明。
[0012]图1位本发明文献检索及分析系统一个实施例示意图,如图1所示,文献检索及分析系统包括:
基本检索模块101,用于根据所述搜索请求在结构化数据库中进行搜索。
[0013]拓展检索模块102,用于根据所述请求结合自然语言处理技术在数据库中进行搜索。
[0014]多数据源集成检索模块103,用于对专利数据库的多数据源整合以及用户的跨库检索和多库检索等功能。
[0015]检索结果处理模块104,用于对专利信息进行抽取,获得特定技术领域术语集。
[0016]语义库建设模块105,利用检索结果处理模块得到的术语集并结合关联分析、专家评估等步骤,构建特定技术领域语义库。
[0017]数据挖掘和自然语言处理模块106,用于数据的深入挖掘和自然语言的进一步处理。
[0018]专利信息智能分析结果可视化技术研究模块107,用于对检索到的专利信息数据进行智能分析与可视化研究。
[0019]用户管理模块108,用于将上述分析得到的数据汇总到用户管理模块,最终完成对所需文献的检索及分析汇总,并根据用户需求进行最终的输出。
[0020]基于本发明上述实施例提供的文献检索及分析系统,以国内外专利数据库技术为核心,通过构建特定技术领域语义库,综合运用以多技术领域专业词库为核心词典型搜索与语义分析为核心的与以往文档搜索两种检索策略,实现对专利数据仓库的多数据源整合以及用户的跨库检索和多库检索等功能,结合自然语言处理技术,实现对专利信息的智能检索;通过对检索的专利数据进行统计、关联分析,完成对专利信息的分析研究,结合可视化技术对分析结果进行可视化展示。
[0021]本发明的描述是为了示例和描述起见而给出的,并不是无遗漏的或者将本发明限于所公开的形式。其中很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好地说明本发明的原理和实际应用,并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。
【主权项】
1.一种文献检索及分析系统,包括:基本检索模块、拓展检索模块、多数据源集成检索模块、检索结果处理模块、语义库建设模块、数据挖掘和自然语言处理模块、专利信息智能分析结果可视化技术研究模块、用户管理模块; 所述基本检索模块,用于根据所述搜索请求在结构化数据库中进行搜索; 所述拓展检索模块,用于根据所述请求结合自然语言处理技术在数据库中进行搜索; 所述多数据源集成检索模块,用于对专利数据库的多数据源整合以及用户的跨库检索和多库检索等功能; 所述检索结果处理模块,用于对上述模块检索到的专利信息根据相关度进行抽取,获得特定技术领域术语集; 所述语义库建设模块,利用检索结果处理模块得到的特定技术领域的术语集并结合关联分析、专家评估等步骤,构建特定技术领域语义库,实现对专利的智能检索功能; 所述数据挖掘和自然语言处理模块,用于对检索到的专利信息数据的深入挖掘和自然语言的进一步处理; 所述专利信息智能分析结果可视化技术研究模块,用于对检索到的专利信息数据进行智能分析与可视化研究; 所述用户管理子模块,用于将上述分析得到的数据汇总到用户管理模块进行总体管理,并根据用户需求进行最终输出。2.根据权利要求1所述的一种文献检索及分析系统,其特征在于, 所述多数据源集成检索模块包括多技术领域专业词库的词典型搜索和以语义分析为核心的语义网文档搜索两种检索策略。3.根据权利要求1所述的一种文献检索及分析系统,其特征在于,所述语义库建设模块还包括相关度选择模块,用于选择检索处理模块得到的特定技术领域术语集中的语义相关的词条,构建特定技术领域语义库。4.根据权利要求1所述的一种文献检索及分析系统,其特征在于,所述专利信息智能分析结果可视化技术研究模块,将专利信息进行综合、抽象、概念化、知识化,并自动化生成专利化分析的可视化图谱,得到最后的可视化的专利分析结果。5.根据权利要求1所述的一种文献检索及分析系统,其特征在于, 所述用户管理模块得到的文献检索分析汇总结果,能够根据用户需求选择在计算器终端进行显示或从终端进行最后的结果输出。
【专利摘要】本发明提供一种文献检索及分析系统,包括:基本检索模块、拓展检索模块、多数据源集成检索模块、检索结果处理模块、语义库建设模块、数据挖掘和自然语言处理模块、专利信息智能分析结果可视化技术研究模块、用户管理模块;该文献检索及分析系统以数据采集及加工为基础,从年份、申请人、发明人、关键词等多个专利著录项的角度出发,对专利数据进行统计、关联等分析,同时结合可视化技术对分析结果予以展示,并进一步发现专利之间地关系以及专利作者的信息等。与现有技术相比,本发明的优点在于:实现了对专利信息的智能检索,并在此基础上对专利数据进行统计、关联等分析,同时结合可视化技术,对分析结果进行可视化展示。
【IPC分类】G06F17/30
【公开号】CN105354325
【申请号】CN201510804564
【发明人】刘延淮, 孙瑞阳
【申请人】上海熠派信息科技有限公司
【公开日】2016年2月24日
【申请日】2015年11月20日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1