专利文献资料检索的方法

文档序号:6438717阅读:180来源:国知局
专利名称:专利文献资料检索的方法
技术领域
本发明是关于一种应用于专利文献资料检索的技术,特别是指一种专利文献资料检索的方法。
背景技术
专利文献资料检索的重要性越来越重要,因为专利文献本身就是一项非常重要的技术文件,有助产研发人员开发的参考。另外公司在开发新产品时,最好知道有无侵犯他人专利,以便评估是否进入此市场,所以需进行专利检索。
目前美国专利商标局网站所提供的专利文献检索为非常知名,也常被使用的网站。还有其他国家如日本,中国,英国,欧洲专利局等也提供好用的专利文献检索工具。
在这些专利文献检索工具中,都有提供“关键字”查询,然而有时候仅以“关键字”查询常会查到自己不需要的专利文献。所以有些官方网站亦提供较高阶的查询,比如使用者除输入“关键字”外,亦可限制寻找哪些年的专利文献,或是限制哪些专利申请人所属的专利文献等等。其中对于技术的限制条件最重要,也最有用的是技术分类,如最有名也被普遍采用的是IPC(International Patent Classification,国际专利分类)分类。
限制“国际专利分类”相当好用,但是有个问题是“国际专利分类”的细分类别相当多,一般使用者根本不知道自己想查的技术是属于哪一类,或是使用者必须发相当多的时间去找出自己想查的技术是属于哪一类。
所以问题在于虽然“国际专利分类”对于查询专利文献非常有用,但使用者在查询专利文献时却常常不使用“国际专利分类”。
另外由于专利文献越来越庞大,专利文献资料量增加速度非常快,如果要维持全文检索,若能先去除一些不可能相关的专利文献,则可增加检索速度。
因此以上问题是有需要去解决的。

发明内容
本发明的主要目的是在提供专利文献资料检索的方法,并且会进行技术类别的判断,以便可去除一些不可能相关的专利文献再进行检索(如全文检索),或是进行检索后,让使用者知道哪些是较有可能的相关技术类别的专利文献。
为达成上述的目的,本发明专利文献资料检索的方法,是用于使用者输入至少一关键字于一电脑系统,该电脑系统包括有专利文献资料库,使得电脑系统寻找出舆该关键字相关的专利文献,另外电脑系统更有一关键字类别总表,该关键字类别总表纪录复数的技术类别,以及每一技术类别对应的复数特征字。
本发明的方法主要包括下列步骤步骤A将该关键字与一关键字类别总表进行比较;步骤B依照步骤A由复数的技术类别中分析出该关键字至少一有可能属于的技术类别,在此定义为候选技术类别;步骤C根据该关键字由属于候选技术类别的专利文献中进行检索;以及步骤D显示找出的专利文献。
依照上述的方法,则可去除一些不可能相关的专利文献再进行检索。
根据本发明的另一实施例方法包括下列步骤步骤A将该关键字与一关键字类别总表进行比较;步骤B依照步骤A由复数的技术类别中分析出该关键字至少一有可能属于的技术类别,在此定义为候选技术类别;步骤C根据该关键字进行专利文献的检索;以及步骤D显示找出的专利文献,其中显示的方式是有参考步骤B所找到的候选技术类别。
其中关键字类别总表的特征字并对应一比重权值。
3.如权利要求1所述的专利文献资料检索的方法,其特征在于,在步骤B中找出候选技术类别是利用符合关键宇的特效字所对应的比重权值来寻找出。
4.如权利要求1所述的专利文献资料检索的方法,其特征在于,其中关键字类别总表并记录与特征字同义或接近同义的关连性词汇。
5.一种专利文献资料检索的方法,是用于使用者输入至少一关键字于一电脑系统,该电脑系统包括有专利文献资料库,使得电脑系统寻找出与该关键字相关的专利文献,其特征在于,该方法主要包括下列步骤步骤A将该关键字与一关键字类别总表进行比较,其中关键字类别总表是储存于电脑系统中,关键字类别总表纪录复数的技术类别,以及每一技术类别对应的复数特征字;步骤B依照步骤A由复数的技术类别中分析出该关键字至少一有可能属于的技术类别,在此定义为候选技术类别;步骤C根据该关键宇进行专利文献的检索;以及步骤D显示找出的专利文献,其中显示的方式是有参考步骤B所找到的候选技术类别。
其中关键字类别总表的特征字并对应一比重权值。
其中在步骤B中找出候选技术类别是利用符合关键字的特效字所对应的比重权值来寻找出。
其中关键字类别总表并记录与特征字同义或接近同义的关连性词汇。
其中在步骤D中显示找出的专利文献有注明哪些是属于候选技术类别的专利文献。
其中在步骤D中显示找出的专利文献时,是将属于候选技术类别的专利文献排序在前。
依照另一实施例的方法,则可在进行检索后,让使用者知道哪些是较有可能的相关技术类别的专利文献。


为进一步说明本发明的技术内容,以下结合附图及实施例对本发明作一详细的描述,其中图1是说明关键字类别总表20产生方式的流程图。
图2是说明关键字类别总表20的实施例。
图3是说明更新关键字类别总表20及自动分类的流程图。
图4是向量表的实施例。
图5是说明向量表产生的实施例。
图6是本发明的流程图第一实施例。
图7是向量表的另一实施例。
图8是本发明的流程图第二实施例。
图9是本发明的流程图第一实施例。
图10是本发明的流程图第二实施例。
具体实施例方式
本发明关于专利检索的运用是在一电脑系统上进行,由于电脑系统为一相当已知的装置,任何具有一般知识的此行业人士都知道,且本发明并非在改变电脑系统的硬件,因此在此不再赘述电脑系统的功能。在本发明中,电脑系统包括有专利文献资料库以及检索引擎,使得电脑系统可以利用使用者输入的关键字寻找出相关的专利文献。而本发明特殊的处在于电脑系统内需有一关键字类别总表,使得本发明的方法才得以运作,因此以下先介绍关键字类别总表的产生方式,以及其意义为何。
请参见图1是说明关键字类别总表20产生方式的流程图,并请一并参考图2-图5。
步骤101针对现有的专利文献70进行寻找特征字(英文称Mining Term,现已发展出许多著名的技术)。现有的专利文献70都已经有分类,比如最有名也被普遍采用的是IPC(International Patent Classification,国际专利分类)分类。
在进行寻找特征字时的方式有许多种,比如现有的方式如透过自然语言处理技术的文法剖析程式,剖析出文件中的名词片语,再运用一些方法与准则,过滤掉不适合的词汇。另外亦可将专利文献70出现在词库中的片语撷取出来。其他著名的方法如透过对文件的分析,累积足够的统计参数后,再将统计参数符合某些条件的片语撷取出来。最简单的统计参数是计数词汇发生的频率,即词频,将词频落在某一范围的词汇取出。
步骤102词汇关连性运算。
比如在许多专利文献中,只要出现“3D”这个词汇,则出现“立体”的机率很高,则代表“3D”与“立体”为同义字或接近同义。
步骤103词汇集中度运算。比如在某一IPC分类中,特征字出现的频率的多寡。
步骤104建立关键字类别总表20。关键字类别总表20可有两个栏位,技术类别21栏位以及特征字25栏位。技术类别21比如采用IPC分类(实施例为一示意图,可比照IPC分类有五阶显分类),每一技术类别21并对应特征字25栏位,特征字25栏位纪录复数的特征字25。
技术类别21为“A”的有特征字“Key-A1”,“Key-A2”,“Key-A3”,“Key-A4”,“Key-A5”,“Key-A6”,“Key-A7”等等。每一特征字在本实施例的格式可采用特征字(比重权值,关连性词汇-1,关连性词汇-2,关连性词汇-3,…….关连性词汇-N)比如特征字“Key-A1”的比重权值为“80”,有两个关连性词汇,“Key-A11”,“Key-A12”。
比重权值越大代表此特征字与对应的技术类别关连性越大。比重权值的计算是由步骤103所计算分析出来的。
而关连性词汇则是由步骤102所计算分析出来的。
请参见图3关于说明更新关键字类别总表20及自动分类的流程图,此流程可以让一新专利文献71自动分类,亦可更新关键字类别总表20。
步骤301从新专利文献71中寻找特征字,此步骤如步骤101。
步骤302将新专利文献71的特征字与“关键字类别总表20”比较,分析。
步骤303得出向量表30,如图4。向量表30有两个栏位,一个为技术类别31栏位(即如同关键字类别总表20中的技术类别21栏位)以及比重权值32栏位。比如向量表30在技术类别31栏位的“A-D”类所对应的比重权值32栏位分别为“512”,“2008”,“13”,“0”,因此新专利文献71最有可能是“B”类。
向量表30即是在计算比重权值32栏位的数值,一种常见的方式介绍如下,请一并参见假设新专利文献71的特征字75a为桌子(15),轮子(5),办公(10),特征字并对应有一权值,比如桌子的权值为“15”。关于特征字的权值可有许多方式来计算,比如出现的频率,该特征字出现的地方(比如出现在发明名称中权值最大,出现在摘要或申请专利范围中权值次之,其他说明书部分权值最小),此为已知的技术,因此在此仅为举例。
另外假设关键字类别总表20a仅有A,B,C三类,而特征字分别为“椅子(20),轮子(14)”,“桌子(30),轮子(1)”,以及“办公(34),椅子(10)”。
向量表77a的产生是利用简单的乘法与加法产生。比如要计算向量表77a在“B”类的比重权值如下
(30×15)+(1×5)=455注特征字75a有“桌子”与“轮子”符合关键字类别总表20a在“B2”类的特征字。
由于“C,,类的比重权值为“340”,很接近“B”类的比重权值“ 455”,因此该新专利文献有可能是“B”类或“C”类。
步骤304更新“关键字类别总表20”。
由于有新专利文献71加入,因此“关键字类别总表20”可被更新,但一般的作法可等待一定数量的新专利文献71加入后,比如等每五千笔专利文献71加入后,再更新“关键字类别总表20”。
以下请参考本发明如何利用“关键字类别总表20”以较准确的方式检索专利的第一实施例。
步骤601接收使用者输入的搜寻关键字。此步骤如同一般的搜寻。
步骤602与“关键字类别总表20”比较。此步骤如同步骤301。
步骤603得出向量表。此步骤如同步骤302。
比如使用者输入的搜寻关键字为“桌子”与“轮子”,若使用者没有指定“桌子”与“轮子”出现之处,则可假设“桌子”与“轮子”的权值都为“1”。
假设“关键字类别总表20”如图5的关键字类别总表20a,则向量表可得出如图7所示的向量表77b。
步骤604分析有可能的类别,其中至少找出一可能的类别(在申请专利范围定义为候选技术类别)。
以步骤603所举的例子则“B”类(候选技术类别)是最有可能。
步骤605依照有可能的类别的专利文献进行检索。
假设所有的专利文献总共有一百万笔,已知技术当输入关键字后,若无输入寻找“类别”的限制,则会针对一百万笔的专利文献进行全文检索,因此可能找出非常多无关的资料。
由于步骤605等于是帮使用者指定寻找的“类别”,亦即有“类别”的限制,因此可大大缩减无关的资料,比如降低到寻找一万笔的专利文献。
需注意的是步骤605是依照有可能的类别的专利文献进行检索,所以可能不只一类,需看向量表得出的结果,比如若最有可能的类别的权重为“100”,则假设只要在最有可能的类别的权重的40%以内都可算为其他有可能的类别,所以任何类别的权重为“40”以上都会被归为有可能的类别。
步骤606显示结果。此步骤如同一般的搜寻后的显示结果。
以下请参考本发明如何利用“关键字类别总表20”以较准确的方式检索专利的第二实施例,请见图8。
在第二实施例中,步骤801-804与第一实施例的步骤601-604相同,因此在此不再赘述。
步骤805进行检索,此步骤如同一般的检索方式。在第一实施例中,是针对有可能的类别的专利文献范围进行检索,但在第二实施例中,仍如同一般的检索方式进行检索。
步骤806
显示结果。由于步骤805为一般的检索方式,所以此步骤可显示一般的检索方式找出的专利文献,但此步骤由于经过步骤802-804,因此在显示结果时可与一般传统方式不同,比如在显示找出的专利文献有注明哪些是属于候选技术类别的专利文献(如图9),使得使用者可以更加注意;或是将越有可能的技术类别的专利文献排序在前(如图10)等等。以及此步骤的重点在于显示结果的方式是有参考步骤804分析出有可能的类别。
上述实施例仅是为了方便说明而举例而已,本发明所主张的权利范围自应以申请专利范围所述为准,而非仅限于上述实施例。
权利要求
1.一种专利文献资料检索的方法,是用于使用者输入至少一关键字于一电脑系统,该电脑系统包括有专利文献资料库,使得电脑系统寻找出与该关键宇相关的专利文献,其特征在于,该方法主要包括下列步骤步骤A将该关键字与一关键字类别总表进行比较,其中关键字类别总表是储存于电脑系统中,关键字类别总表纪录复数的技术类别,以及每一技术类别对应的复数特征字;步骤B依照步骤A由复数的技术类别中分析出该关键字至少一有可能属于的技术类别,在此定义为候选技术类别;步骤C根据该关键字由属于候选技术类别的专利文献中进行检索;以及步骤D显示找出的专利文献。
2.如权利要求1所述的专利文献资料检索的方法,其特征在于,其中关键字类别总表的特征字并对应一比重权值。
3.如权利要求1所述的专利文献资料检索的方法,其特征在于,在步骤B中找出候选技术类别是利用符合关键宇的特效字所对应的比重权值来寻找出。
4.如权利要求1所述的专利文献资料检索的方法,其特征在于,其中关键字类别总表并记录与特征字同义或接近同义的关连性词汇。
5.一种专利文献资料检索的方法,是用于使用者输入至少一关键字于一电脑系统,该电脑系统包括有专利文献资料库,使得电脑系统寻找出与该关键字相关的专利文献,其特征在于,该方法主要包括下列步骤步骤A将该关键字与一关键字类别总表进行比较,其中关键字类别总表是储存于电脑系统中,关键字类别总表纪录复数的技术类别,以及每一技术类别对应的复数特征字;步骤B依照步骤A由复数的技术类别中分析出该关键字至少一有可能属于的技术类别,在此定义为候选技术类别;步骤C根据该关键宇进行专利文献的检索;以及步骤D显示找出的专利文献,其中显示的方式是有参考步骤B所找到的候选技术类别。
6.如权利要求5所述的专利文献资料检索的方法,其特征在于,其中关键字类别总表的特征字并对应一比重权值。
7.如权利要求6所述的专利文献资料检索的方法,其特征在于,在步骤B中找出候选技术类别是利用符合关键字的特效字所对应的比重权值来寻找出。
8.如权利要求7所述的专利文献资料检索的方法,其特征在于,其中关键字类别总表并记录与特征字同义或接近同义的关连性词汇。
9.如权利要求7所述的专利文献资料检索的方法,其特征在于,其中在步骤D中显示找出的专利文献有注明哪些是属于候选技术类别的专利文献。
10.如权利要求7所述的专利文献资料检索的方法,其特征在于,其中在步骤D中显示找出的专利文献时,是将属于候选技术类别的专利文献排序在前。
全文摘要
本发明是有关于一种应用于专利文献资料检索的技术。本发明的方法是在电脑系统寻找出与该关键字相关的专利文献,另外电脑系统更有一关键字类别总表,使得可由关键字与一关键字类别总表比较而找出有可能属于的技术类别。再利用有可能属于的技术类别,以便可去除一些不可能相关的专利文献再进行检索(如全文检索),或是进行检索后,让使用者知道哪些是较有可能的相关技术类别的专利文献。
文档编号G06F17/30GK1517912SQ0310152
公开日2004年8月4日 申请日期2003年1月16日 优先权日2003年1月16日
发明者廖基宏, 袁建中, 江美娟 申请人:财团法人资讯工业策进会
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1