一种专利文献数据检索的方法、系统和装置的制作方法

文档序号:1152990阅读:221来源:国知局

专利名称::一种专利文献数据检索的方法、系统和装置的制作方法
技术领域
:本发明涉及数据检索领域,尤其涉及一种专利文献数据检索的方法、系统和装置。
背景技术
:传统药物是指人类在自然界中发现并可直接供药用的植物、动物或矿物,以及基本不改变其药理化学属性的加工品。中药是我国传统药物的总称,它包括传统中药、民间药(草药)和民族药,除极少数(如铅丹等)为人工合成药外,绝大多数都属于天然药物的范畴。传统药物则是对世界范围内天然药物以及中药的积无括。近年来,随着对传统药物品种、药物成分和治疗机理的开发和深入研究,越来越多的药物专利被公开,专利中所涉及的中药和天然药物及其相关产物也随之增多。仅我国现有药用资源就达12000多种,如此繁多的种类,药物名称错综复杂,例如土木香,在药典中被收录为正名,同时它还是青木香、南木香、红木香等中药材的异名;再如人参、生晒参、糖参、红参、大力参由于是同种植物,其拉丁植物名均为PanaxGinsengC.A.Meyer。由此可见,无论是依据药物的中文名称还是拉丁植物名都不能明确的表示该药物,于是,这种"一药多名"和"一名多药"的情况对于传统药物的研究和专利的检索都造成了极大困扰。目前,应用于专利中天然药物或中药的分类代码极其有限,得到公认的包括国际专利分类(InternationalPatentClassification,缩写为IPC)中涉及天然药物的A61K035、A61K036和A61K033,其中A61K036/00表示来源于植物的材料,另外还有德温特CPI手工代码(CPIManualCodes),其中的B04(NaturalProducts)也是对天然药物进行的分类编码。但是,这些都只是将药物分到一个大类,没有具体到某一个药物,对于检索具体药物仍有困难。此外,针对中药分类与代码的研究也在深入,例如中国中医科学院广安门医院对中药饮片的编码研究,北京中医药大学在中药编码方面的尝试等。虽然这些编码能够规范常用中药材和饮片的名称,做到一物一名,但是范围极其有限,对于其他众多天然药物无能为力,也不能很好的解决专利检索的问题。在传统药物领域的技术创新、专利审查、专利侵权分析中,经常需要冲企索包含某种或者某几种传统药物的专利文献。现有的检索方法和检索系统都是采用关键词匹配的方法进行;险索,关键词存在即命中,不存在即无法命中。由于存在"一药多名"的情况,在现有的检索系统中对某种传统药物进行检索,只能命中输入的传统药物名,而对虽然表示同一物种但是名称不同的传统药物无法命中,这样就会造成漏检。由于存在"一名多药,,的情况,在现有的检索系统中对某种传统药物进行检索,所有出现该输入传统药物的文献都会命中,但是由于一个名称代表多个传统药物,这样就会造成误检。为了解决目前传统药物专利查询中存在的由于"一药多名"和"一名多药"情况造成的查全率和查准率低的问题,需要给出一种把同名异物和同物异名的数据区分开的检索方法。
发明内容本发明提供了一种专利文献检索的方法、系统和装置,用于避免在传统药物专利文献检索过程中,对同名异物传统药物的错检和对同物异名传统药物的漏^r,确保了专利文献数据才企索的全面性和准确性。本发明提供了一种专利文献数据检索的方法,应用于包括传统药物登记数据库、专利信息数据库、服务器和至少一个客户端的检索系统中,所述传统药物登记数据库中包括每篇专利文献中出现的传统药物名称与其所对应的传统药物分类编码,所述专利信息数据库存储有含有传统药物的专利文献以及所对应的传统药物登记数据库中所给出的传统药物分类编码,所述方法包括以下步骤服务器获取客户端输入的检索关键词;7所述服务器从所述传统药物登记数据库中提取与所述检索关键词相对应的传统药物分类编码;所述服务器根据所述传统药物分类编码,在所述专利信息数据库中检索包括所述传统药物分类编码的专利文献凄丈据。优选的,所述检索关键词为一个或多个,每个关键词具体为以下内容中的任意一种传统药物分类编码;传统药物中文正名;传统药物中文别名;传统药物英文名;传统药物拉丁名;传统药物拉丁动植物名。优选的,所述传统药物分类编码的编码方法具体为按照传统药物的整体特性及来源、传统药物的具体药物种类、传统药物的药用部位及自然属性、传统药物的性状及炮制方法对传统药物进行分类,建立4级8位分类编码ANNN-NX-NN,其中A表示大写字母,N表示数字,X表示数字或字母,所述4级8位分类编码与传统药物的中文正名、传统药物中文别名、传统药物英文名、传统药物拉丁名、传统药物拉丁动植物名相对应。优选的,所述4级8位分类编码ANNN-NX-NN,具体为所述4级8位分类编码的第1位表征传统药物的整体特性及来源,分为植物类、动物类、矿物类、综合类,分别用大写英文字母A-Z来表示;所述4级8位分类编码的第2、3、4位表征传统药物的具体药物种类,用阿拉伯数字000-999来表示;所述4级8位分类编码的第5、6位表征传统药物的药用部位及自然属性,用阿拉伯数字00-ZZ来表示;所述4级8位分类编码的第7、8位表征传统药物的性状及炮制方法,用阿拉伯数字00-99表示。优选的,所述服务器从所述传统药物登记数据库中提取与所述检索关键词相对应的传统药物分类编码,包括所述服务器根据所述检索关键词,在所述传统药物登记数据库查找与所述检索关键词相对应的传统药物分类编码,其中根据检索关键词查找相对应的分类编码的方式分为精确查找或模糊查找;将查找到的与所述检索关键词对应的传统药物分类编码和传统药物名称显示给客户端,根据所述客户端的检索需要提取与所述检索关键词相对应的传统药物分类编码。优选的,所述服务器根据所述传统药物分类编码,在所述专利信息数据库中检索包括所述传统药物分类编码的专利文献数据,之后还包括按照预设的输出顺序,输出包含所述传统药物分类编码的专利文献数据。本发明提供了一种专利文献数据检索的系统,包括,传统药物登记数据库,用于存储每篇专利文献中出现的传统药物名称与其所对应的传统药物分类编码;专利信息数据库,用于存储含有传统药物的专利文献以及其所对应的传统药物登记数据库中所给出的传统药物分类编码;服务器,用于接收客户端输入的检索关键词,在所述传统药物登记数据库中提取与所述检索关键词相对应的传统药物分类编码,根据所述传统药物分类编码,在所述专利信息数据库中检索包括所述传统药物分类编码的专利文献数据。客户端,用于向服务器提供检索关键词,并获取服务器输出的专利文献数据检索结果,按照预设的顺序显示检索结果。优选的,所述传统药物登记数据库中的传统药物分类编码的编码方法具体为按照传统药物的整体特性及来源、传统药物的具体药物种类、传统药物的药用部位及自然属性、传统药物的性状及炮制方法对传统药物进行分类编码,建立4级8位分类编码ANNN-NX-NN,其中A表示大写字母,N表示数字,X表示数字或字母,所述4级8位分类编码与传统药物的中文正名、传统药物中文别名、传统药物英文名、传统药物拉丁名、传统药物拉丁动植物名相对应,其中,所述4级8位分类编码的第1位表征传统药物的整体特性及来源,根据植物来源不同,分为植物类、动物类、矿物类、综合类,分别用大写英文字母A-Z来表示;所述4级8位分类编码的第2、3、4位表征传统药物的具体药物种类,用阿拉伯数字000-999来表示;所述4级8位分类编码的第5、6位表征传统药物的药用部位及自然属性,用阿拉伯数字00-ZZ来表示;所迷4级8位分类编码的第7、8位表征传统药物的性状及炮制方法,用阿拉伯数字00-99表示。本发明提供了一种专利文献数据检索的服务器,包括,获取模块,用于获取客户端输入的检索关键词;提取模块,用于根据获取模块获取的所述检索关键词,在传统药物登记数据库中提取与所述^r索关键词相对应的传统药物分类编码;检索模块,用于根据所述提取模块提取的所述传统药物分类编码,在所述专利信息数据库中检索包括所述传统药物分类编码的专利文献数据。优选的,所述获取模块,具体用于获取客户端输入的传统药物分类编码;传统药物中文正名;传统药物中文别名;传统药物英文名;传统药物拉丁名;传统药物拉丁动植物名中的任意一种。优选的,所述提取模块,具体用于根据所述检索关键词,在所述传统药物登记数据库查找与所述检索关键词相对应的传统药物分类编码,其中根据检索关键词查找相对应的分类编码的方式分为精确查找或模糊查找;将查找到的与所述检索关键词对应的传统药物分类编码和传统药物名称显示给客户端,根据所述客户端的检索需要提取与所述检索关键词相对应的传统药物分类编码。优选的,还包括,输出模块,用于按照预设的输出顺序,输出包含所述传统药物分类编码的专利文献数据。与现有技术相比,本发明具有以下优点通过实施本发明提供的一种专利文献数据检索的方法、系统和装置,在传统药物登记数据库中存储每篇专利文献中出现的传统药物名称与其所对应的传统药物分类编码,在专利信息数据库中存储有含有传统药物的专利文献以及其所对应的传统药物登记数据库中所给出的传统药物分类编码。利用传10统药物的唯一分类编码进行传统药物专利文献的^r索,避免了对同名异物传统药物的错检和对同物异名传统药物的漏检,确保了专利文献数据检索的全面性和准确性。为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本发明实施例一所提供的一种专利文献数据检索的方法的流程示意图2为本发明实施例二所提供的一种专利文献数据检索方法的流程示意图3为本发明实施例三所提供的一种专利文献数据检索方法的流程示意图4为本发明实施例四所提供的一种专利文献数据检索方法的流程示意图5为本发明实施例五所提供的一种专利文献数据;险索方法的流程示意图6为本发明实施例六所提供的一种专利文献数据检索的系统结构示意图7为本发明实施例七所提供的一种服务器结构示意图。具体实施例方式在本发明实施例中,传统药物登记数据库中包括每篇专利文献中出现的传统药物名称与其所对应的传统药物分类编码,专利信息数据库存储有含有传统药物的专利文献以及所对应的传统药物登记数据库中所给出的传统药物分类编码,客户端输入检索关键词,在传统药物登记数据库中获取与检索关键词相对应的传统药物分类编码,根据获取的传统药物分类编码在专利信息数据库中检索包含传统药物分类编码的传统药物专利文献数据。利用传统药物的唯一分类编码进行传统药物专利文献的检索,避免了对同名异物传统药物的错检和对同物异名传统药物的漏检,确保了专利文献数据检索的全面性和准确4生。下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。本发明实施例提出了一种专利文献数据检索的方法、系统和装置,应用于包括传统药物登记数据库、专利信息数据库、服务器和至少一个客户端的传统药物检索系统中,传统药物登记数据库中包括每篇专利文献中出现的传统药物名称与其所对应的传统药物分类编码,专利信息数据库存储有含有传统药物的专利文献以及其所对应的传统药物登记数据库中所给出的传统药物分类编码。如图1所示,为本发明实施例一提供的一种专利文献数据检索的方法的流程示意图,该方法具体包括以下步骤步骤IOI、服务器获取客户端输入的检索关键词;客户端输入的关键词为一个或多个,每个关键词具体为以下内容中的任意一种传统药物分类编码;传统药物中文正名;传统药物中文别名;传统药物英文名;传统药物拉丁名;传统药物拉丁动植物名等传统药物的其他相关信息。当客户端输入的关键词为多个时,多个检索关键词之间以特定的逻辑运算符连接,例如,多个检索关键词之间以"and"、"or"或"not"连接,服务器接收客户端输入的多个检索关键词,并在传统药物登记数据库中提取与多个检索关4建词相对应的传统药物分类编码。以下实施例中以客户端输入一个检索关键词为例进行说明。步骤102、服务器从传统药物登记数据库中提取与检索关键词相对应的传12统药物分类编码;服务器根据检索关键词,在传统药物登记数据库中查找与检索关键词相对应的传统药物分类编码,其中#^居^险索关^t词查找相对应的分类编码的方式分为精确查找或模糊查找;将查找到的与检索关键词对应的传统药物分类编码和传统药物名称显示给客户端,根据客户端的检索需要选择提取与检索关4定词相对应的分类编码。在检索关键词与传统药物登记数据库中的传统药物名称信息完全匹配时,在传统药物登记数据库中进行精确查找,查找与检索关键词相对应的传统药物分类编码;在检索关键词与传统药物登记数据库中的传统药物名称信息不完全匹配时,在传统药物登记数据库中进行模糊查找,查找包含该检索关键词的传统药物名称信息所对应的传统药物分类编码。具体的,根据检索关键词在传统药物登记数据库中进行精确查找和模糊查找的方式在此不再赘述。步骤103、服务器根据传统药物分类编码,在专利信息数据库中检索包括传统药物分类编码的专利文献数据。根据唯一的传统药物分类编码在专利信息数据库中进行查找,获取包含该传统药物分类编码的专利文献数据。由于传统药物名称与传统药物分类编码是——对应的,利用传统药物分类编码的唯一性特点,在进行相关传统药物的检索过程中,避免了对同名异物传统药物的错检和对同物异名传统药物的漏检,确保了专利文献数据检索的全面性和准确性。为了更好的理解本发明的具体实施方式,以下首先对本发明实施例中的传统药物分类编码的组织结构进行介绍。本发明实施例涉及的传统药物分类编码,按照传统药物的整体特性及来源、传统药物的具体药物种类、传统药物的药用部位及自然属性、传统药物的性状及炮制方法对传统药物进行分类,得到的传统药物分类编码与传统药物的中文正名、中文别名、英文名、拉丁名、拉丁动植物名相对应,其结构为4级8位分类编码,由大写英文字母和阿拉伯数字组成。具体的,本发明的传统药物分类方法和编码方法为根据专利文献中的通用名结合《中华人民共和国药典》中的名称,先确定传统天然药物的正名和别名,然后按照药物自然属性和亲缘关系分类的方法对传统药物进行分类,完成传统药物的分类后,对每一种传统药物进行分类编码。对应每一种传统药物,都对应有唯一的传统药物分类编码,将传统药物的中文正名、中文别名、英文名、拉丁名、拉丁动植物名等归入唯一的传统药物分类编码中。利用与各传统药物对应的唯一的分类编码,把同名异物和同物异名的数据区分开,实现一物一名,一名一码,物、名、码统一;同时,针对一些同来源的传统天然药物用药部位不同则功效不同的特点,通过建立同一天然药物物种编码,把繁多的数据联系起来,然后再利用不同的属性分类编码加以区分,实现了对传统药物的分类编码,该分类编码具备唯一性和准确性。本发明提供的传统药物分类编码(TraditionalChineseMedicineClassification,简称TCMC)为4级8位分类编码结构,该传统药物分类编码的前4位代表传统药物的种类,具体的,4级8位分类编码的第l位代表传统药物的整体特性及来源,第2、3、4位代表传统药物的具体种类,即对于同一物种的动物或植物,其前4位分类编码是相同的,传统药物分类编码的前4位相同,则表示属于同一物种;4级8位分类编码的第5、6位代表传统药物的属性,4级8位分类编码的最后2位^表传统药物的性状和炮制方法。分类编码的形式为ANNN-NX-NN(A表示大写字母,N表示数字,X表示数字或字母),本发明传统药物分类编码的结构及见表1。表l传统药物分类编码的结构列表级别TCMC各级别意义位数代码第1级传统天然药物的整体及来源分类1A-Z第2级传统天然药物的种3000-999第3级传统药物的属性分类(药用部位)200-ZZ(0-9,A-Z)第4级传统药物的特殊性状分类(如炮200-99制方法)以及前三级无法区分情况下的分类14具体的,TCMC的分类编码MJ'J如下1、部(Section):传统药物的第一级分类,即分类编码的第1位,是对传统药物的整体特性及来源的分类。具体的,根据传统天然药物的整体特性,将全部传统药物分为4个部,即植物类、动物类、矿物类和综合类(动、植物中无法明确分类的)。其中植物类根据植物来源的不同划分为8个小类,具体的植物来源及其各自的分类编码见表2;表2具体的植物来源及其各自的分类编码列表植物来源字母代码草本植物A、B、Y、Z乔木植物C、K灌木植物D、V藤本植物E食用真菌F蕨类植物G藻类植物H地衣莒藓动物类根据动物的类型划分为7个小类,具体的动物类型及其各自的分类编码见表3;表3具体的动物类型及其各自的分类编码列表植物来源字母代码哺乳动物M昆虫N水生动物P<table>tableseeoriginaldocumentpage16</column></row><table>矿物类不做细分,其字母代码为W;综合类相当于上位概念,如花粉、明胶、动物肉等,或一些特殊中药,如百草霜,以及一些专利中出现的无法查询来源和分类的天然药物,其分类编码为X。2、种(Species):传统药物的第二级分类,即分类编码的第2、3、4位,是对具体药物种类的细分,用阿拉伯数字000-999表示。具体的,在植物和动物药的分类编码时,通过二级分类,将天然动植物药物确定到种,即同一物种的动植物,前四位代码相同。矿物药和综合类药物由于没有分类,则按照自然排序的方法进行编码。3、属性分类(AttributiveClassification):传统药物的第三级分类,即分类编码的第5、6位,用阿拉伯数字OO-ZZ表示,是对传统药物的药用部位及自然属性的分类,其中,植物类传统药物按照药用部位及自然属性的分类编码见表4,动物类传统药物按照药用部位及自然属性的分类编码见表5。表4植物类传统药物按照药用部位及自然属性的分类编码列表<table>tableseeoriginaldocumentpage16</column></row><table><table>tableseeoriginaldocumentpage17</column></row><table>62蛋清91尿0W脖63蛋壳92粪便OX瘿64蛋壳膜93头OY躯干、身体65生殖腺94目艮OZ冠66阴茎95耳1A嘴67睾丸96齿IB鱼缚68精巢97舌若再有新的药用部位出现,则按次序依次往下排号。4.辅助分类(AncillaryClassification):传统药物的第四级分类,即分类编码的第7、8位,分类编码用阿拉伯数字00-99表示,是对传统药物的性状或炮制方法的区分,具体分类编码如表6。表6对传统药物的性状或炮制方法的具体分类编码列表代码分类代码分类00无21炒黄01油22炒焦02脂23炒炭03蜡24灰04蜜25炙05胶26煅06汁27炮07生、鲜28蒗"、、08粉29烫10制30制霜11清31发酵12法32发芽13仙33水飞14干燥40赤15糖制41白19其他制法42愛20炒99其他若再有新的药用部位出现,则按次序依次往下排号。在本发明中,应用4级分类结构,按照传统药物的整体特性及来源、具体药物种类、用药部位及自然属性和炮制方法的顺序将传统药物进行分类,建立8位分类编码(ANNN-NX-NN),4级8位分类编码能够准确的表征传统药物的品种及其属性,具有唯一性和准确性。在本发明实施例中,服务器在接受到客户端输入的检索关键词,获取对应于检索关键词的传统药物分类编码,利用唯一的传统药物分类编码在传统药物专利文献数据库中进行检索,检索出包含传统药物分类编码的专利文献数据,在输出的传统药物专利文献数据中,包含了所有与传统药物分类编码相对应的传统药物中文正名、传统药物中文别名、传统药物英文名、传统药物拉丁名、传统药物拉丁动植物名的传统药物专利文献。利用唯一的传统药物分类编码进行专利文献数据检索,针对当前传统药物的同名异物和同物异名的情况,有效的解决了在专利文献数据检索过程中出现误检或漏检,确保了在专利文献检索过程中的全面性和准确性。基于上述传统药物分类编码,本发明实施例提供了一种专利文献数据检索的方法,其中,将每篇专利文献中出现的传统药物名称与传统药物分类编码的对应关系存放在传统药物登记数据库中,在专利信息数据库存储有含有传统药物的专利文献以及其所对应的传统药物登记数据库中所给出的传统药物分类编码,服务器将传统药物登记数据库和专利信息数据库相关联,在接收到客户端输入的检索关键词,在传统药物登记数据库中获取与检索关键词相对应的传统药物分类编码,利用获取的传统药物分类编码在专利信息数据库中检索包含该分类编码的传统药物专利文献数据。利用传统药物分类编码进行检索实现了在传统药物专利文献检索过程中的全面性和准确性。如图2所示,为本发明实施例二所提供的一种专利文献数据;险索方法的流程示意图,其中,服务器接收到检索关键词巴豆,在传统药物登记数据库19中检索巴豆的分类编码并输出对应的分类编码,具体包括以下步骤步骤201、服务器接收到检索关键词,该检索关键词为传统药物巴豆。服务器获取客户端输入的传统药物检索关键词,该检索关键词为传统药物巴豆。步骤202、服务器与传统药物登记数据库链接,获取与巴豆相对应的传统药物分类编码,输出与巴豆相对应的传统药物分类编码数据。服务器接收到传统药物检索关键词巴豆,与传统药物登记数据库链接,在传统药物登记数据库中获取与传统药物名称巴豆相对应的传统药物巴豆分类编码,其中,根据检索关键词巴豆查找相对应的分类编码的方式分为精确查找或模糊查找方式。与传统药物巴豆相对应的部分分类编码数据列表如图7所示。表7与传统药物巴豆相对应的部分分类编码数据列表<table>tableseeoriginaldocumentpage20</column></row><table>从表7所示的与传统药物巴豆相对应的分类编码数据列表中,可以看出,与检索关键词巴豆相对应的精确查找结果为巴豆,C003-14-00;与检索关键词巴豆相对应的模糊查找结果为巴豆树4艮,C003-04-00;巴豆霜,C003-14-30;巴豆壳,C003-16-00。在表7所示的传统药物巴豆的4级8位分类编码中,按照巴豆的整体特性及来源、具体药物种类、药用部位及自然属性、性状及炮制方法对巴豆进行分类、编码。具体的,按照巴豆的整体特性及来源进行分类,巴豆是传统乔木植物药,其第一级编码为C;按照巴豆的具体药物种类进行分类,表示巴豆物种的分类编码为003,即所有属于巴豆这个物种的传统药物的前四位均为C003。按照巴豆的用药部位及自然属性,在含有巴豆不同用药部位作为发明点的专利文献中,包含有巴豆树根、巴豆果实、巴豆果皮,其中,植物果实分类编码为14;植物树根分类编码为04;植物果皮分类编码为16。即对巴豆进行第三级分类的结果为C003-14(巴豆果实),C003-04(巴豆根),C003-16(巴豆壳)。按照巴豆的性状及炮制方法对巴豆进行第四级分类,在含有巴豆作为发明点的专利文献中,包含的炮制方法有不炮制或制霜,而巴豆树根和巴豆壳可直接入药,一4殳无需炮制,得到的分类编码为C003-14-00、C003-14-30、C003-04-00、C003-16-00,分别表示巴豆(无炮制)、巴豆霜、巴豆树根、巴豆壳。服务器获取到与巴豆相对应的传统药物分类编码后,输出对应的传统药物分类编码数据,客户端可根据与分类编码相对应的传统药物名称信息选择所要进行检索的传统药物分类编码,利用该传统药物分类编码在专利信息数据中进行一企索,获取包含该传统药物分类编码的专利文献数据。完成对传统药物巴豆的分类编码后,将传统药物的名称(正名与别名)与传统药物的对应关系列表存放在传统药物登记数据库中,在服务器接收到检索关键词时,与传统药物登记数据库链接,在传统药物登记数据库中获取与检索关键词相对应的传统药物分类编码。通过本发明的传统药物分类编码,将传统药物的正名与别名进行归纳,并通过唯一的分类编码进行表示,实现了一物一名,一名一码,物、名、码相统一的对应关系,利用传统药物分类编码进行专利文献数据的检索,可以避免对同物异名传统药物和同名异物传统药物的漏检和错检索,确保了检索的全面性和准确性。如图3所示,为本发明实施例三所提供的一种专利文献数据检索方法的流程示意图,其中,服务器根据在传统药物登记数据库中获取的传统药物草珊瑚的分类编码,在专利信息数据库中^r索包括草珊瑚传统药物分类编码的专利文献数据,具体包括以下步骤步骤301、服务器在传统药物登记数据库中获取传统药物草珊瑚的分类编码。服务器获取检索关键词草珊瑚,与传统药物登记数据库链接,在传统药物登记数据库中获取与草珊瑚相对应的传统药物分类编码。在传统药物登记数据库中,传统药物按照传统药物分类编码顺序进行存放。在传统药物登记数据库中获取与草珊瑚对应的传统药物分类编码列表,部分列表如表8所示。_表8与传统药物草珊瑚相对应的部分分类编码数据列表分类编码中文名称_中文别名_A171-00-00草珊瑚接骨木;山胡椒;肺节风;接骨茶;九节风;九节茶;接骨金粟兰;肿节草;观音茶;接骨莲;接骨金素兰;见肿消;金粟兰;驱骨风;九节兰;驳骨茶;骨风消;接骨杉如表8所示,检索关键词为传统药物草珊瑚,服务器接收到检索关键词草珊瑚,在传统药物登记数据库中获取与草珊瑚相对应的传统药物分类编码为A171-00-00,同时获取到草珊瑚分类编码A171-00-00目录下所有草珊瑚的别名。步骤302、根据草珊瑚的分类编码A171-00-00在专利信息数据库进行检索,检索包括分类编码A171-00-00的专利文献数据。根据传统药物草珊瑚的分类编码A171-00-00,服务器与专利信息数据库链接,在专利信息数据库中纟t索包括分类编码A171-00-00的专利文献it据。根据传统药物草珊瑚的分类编码A171-00-00,在专利信息数据库中可以检索到分类编码A171-00-00目录下所有传统药物的专利文献数据,包括使用22草珊瑚正名和所有草珊瑚别名的专利文献数据。步骤303、按照预设的输出顺序,输出包含分类编码A171-00-00的专利文献lt据。利用分类编码A171-00-00在专利信息数据库中检索到包含该分类编码的专利文献数据为218篇,其中,使用草珊瑚正名和所有草珊瑚别名的所有专利文献数据。按照传统药物专利文献数据申请日的时间顺序,输出包含传统药物分类编码A171-00-00的专利文献数据,当然,还可以按照其他预设的输出顺序输出包含传统药物分类编码的专利文献,具体采用哪种输出方式均属于本发明的保护范围。通过本发明的传统药物分类编码,将传统药物的正名与别名进行归纳,并通过唯一的分类编码进行表示,实现了一物一名,一名一码,物、名、码相统一的对应关系,利用传统药物分类编码进行专利文献数据的检索,可以避免对同物异名传统药物的漏检。例如,在使用检索关4t词草珊瑚和草珊瑚分类编码A171-00-00在专利信息数据库中进行检索时,得到的检索结果如表9所示。表9以草珊瑚和A171-00-00在专利文献数据库中检索结果列表检索关键词命中专利数草珊瑚99篇A171-00-00218篇从表9可以看出,利用草珊瑚作为检索关键词,检索到的专利文献只包含使用草珊瑚这个名称的专利文献,数量为99篇,漏检了使用草珊瑚别名申请的另外119篇(218篇-99篇=119篇)专利文献,但是草珊瑚和所有草珊瑚的别名虽然名称不一样,但是都属于同一味传统药物,仅使用草珊瑚作为关键词无法全面的检索到使用其别名进行申请的专利文献。例如,利用草珊瑚正名在专利文献数据库中进行检索,漏检了以草珊瑚23别名"肿节风"进行申请的专利文献数据(申请号CN200710012092),具体专利文献数据如表10所示。表10使用草珊瑚(正名)的别名"肿节风"的专利文献数据信息列表申请号_CN200710012092_题目一种由益智仁、肿节风等中药以及高竭黑木耳与高锗蘑菇、肽_类物质等组成的具有抗肿瘤作用的野山葡萄酒及其制备方法文摘一种保健野山葡萄酒,由生物微量元素硒锗(高硒绿豆芽、高锗蘑菇)与蛆体液的萃取液和抗肿瘤中药如益智仁、肿节风,以及野山葡萄酒制成。该药酒能提高免疫力和抗病能力,能抑_制肿瘤细胞增殖,用于预防和治疗肿瘤。_当利用草珊瑚分类编码A171-00-00进行;险索,草珊瑚分类编码A171-00-00在专利文献数据库中检索到218篇包含分类编码A171-00-00的专利文献数据,即在专利信息数据库中,利用草珊瑚分类编码A171-00-00进行检索,相当于以A171-00-00目录下包含的草珊瑚(正名),以及草珊瑚的所有别名作为关键词进行检索,检索得到的专利文献数据涵盖了所有草珊瑚(正名),草珊瑚别名的专利文献数据,使得检索到的专利文献数据全面,避免了同物异名传统药物在4企索时的漏;险。通过使用本发明的专利文献数据^r索的方法,避免了同物异名传统药物在检索时的漏检,确保了专利文献检索的全面性。如图4所示,为本发明实施例四所提供的一种专利文献数据;险索方法的流程示意图,其中,服务器根据在传统药物登记数据库中获取的传统药物土木香的分类编码,在专利信息数据库中检索包括土木香传统药物分类编码的专利文献数据,具体包括以下步骤步骤401、服务器在传统药物登记数据库中获取传统药物土木香的分类编码。服务器获取检索关键词土木香,与传统药物登记数据库链接,在传统药表11与传统药物土木香相对应的部分分类编码凄t据列表分类编码中文名称中文别名A123-04-00土木香黄花菜;青木香;藏木香E462-04-00红木香土木香;紫金皮;风沙藤;紫金藤;内红消E474-04-00青木香土木香;痧药云南根土青木香独行根大痧药根;百两金;青藤香;铁扁担;独行木香E475-04-00南木香土木香;金不换藤子暗消如表ll所示,当检索关键词为传统药物土木香,在传统药物登记数据库中获取了4个不同的分类编码,分别为土木香作为正名的A123-04-00,土木香作为红木香别名的E462-04-00,土木香作为青木香别名的E474-04-00,以及土木香作为南木香别名的E475-04-00。步骤402、根据土木香作为正名的分类编码A123-04-00在专利信息数据库进行检索,检索包括分类编码A123-04-00的专利文献数据。根据传统药物土木香作为正名的分类编码A123-04-00,服务器与专利信息数据库链接,在专利信息数据库中检索包括分类编码A123-04-00的专利文献数据。根据传统药物土木香作为正名的分类编码A123-04-00,在专利信息数据库中可以检索到分类编码A123-04-00目录下所有传统药物的专利文献数包括土木香作为其他药物别名的专利文献数据。步骤403、按照预设的输出顺序,输出包含分类编码A123-04-00的专利文献数据。利用分类编码A123-04-00进行检索,检索得到包含土木香作为正名,以及所有作为土木香别名的专利文献数据。按照传统药物专利文献数据申请日的时间顺序,输出包含传统药物分类编码A123-04-00的专利文献数据。通过本发明的传统药物分类编码,将传统药物的正名与别名进行归纳,并通过唯一的分类编码进行表示,实现了一物一名,一名一码,物、名、码相统一的对应关系,利用传统药物分类编码进行专利文献数据的^r索,可以避免对同名异物传统药物的错检。例如,使用^r索关4建词土木香和土木香作为正名的分类编码A123-04-00在专利信息数据库中进行检索时,得到的检索结果如表12所示。表12以土木香和A123-04-00在专利文献数据库中检索结果列表才企索关键词命中专利数土木香205篇A123-04-00188篇从表12中可以看出,利用土木香作为检索关键词,检索到的专利文献数量为205篇,利用土木香作为正名的分类编码A123-04-00作为检索关键词,检索到的专利文献数量为188篇。上述检索结果数量上的不同在于土木香本身是一味中药的正名,同时也是红木香、青木香和南木香的别名,因此,在利用土木香作为检索关键词检索到的205篇专利文献中,检索结果中即包含了使用土木香作为正名申请的专利文献,也包含了使用土木香作为红木香、青木香和南木香的别名进行申请的专利文献。而作为正名的土木香与红木香、青木香和南木香是属于不同物种的传统药物,检索过程中出现了错检。例如,在用土木香作为检索关键词检索时,检索到了实际为青木香相关的专利文献(申请号KR1020030038122),造成了错#企,具体专利文献数据如表13所示。表13利用土木香作为检索关键词检索到青木香的专利文献数据信息中请号KR1020030038122~~Sl含土木香内酯(ALANTOLACTONE)或异土木香内i(ISOALANTOLACTONE)的青木香4是取物用于预防及治疗癌或炎症含土木香内酯(ALANTOLACTONE)或异土木香内i(ISOALANTOLACTONE)的青木香拔一取物。在干燥的青木香5kg中加100%的曱醇10升,环流冷却,在水浴进4亍3小时的^是取2次,过滤,减压浓缩,得到400g的提取物,用l升蒸馏水分散,依次用n-己烷、二氯曱烷、乙酸乙酯、n-丁醇提取,分别得到分化物20.2g、24.5g、27.8g、23.3g和水层31.7g,将n-己烷分化物用乙酸乙酯混合溶剂分成12个分化物,其中选活性最强的分化物进行PREPARATIVEHPLC得到活性成分土木香内酯及异土木香内酯。该活性成分可与营养剂、维生素、矿物质、调味剂、果胶酸以及其盐、有机酸、稳定剂、防腐剂、甘油、醇、碳酸化剂、果肉等混合,制成保健功能性食品。该组合物具有抗癌及炎症的作用。而在以土木香作为正名的分类编码A123-04-00作为检索关键词,检索到的专利文献仅包含分类编码A123-04-00目录下土木香作为正名和作为土木香别名的相关专利文献,检索结果为188篇专利文献。在检索到的188篇专利文献中,不包括土木香作为红木香、青木香和南木香的别名的相关专利文献,检索结果准确。因此,利用传统药物登记数据库中包括每篇专利文献中出现的传统药物名称与其所对应的传统药物分类编码,以及专利信息数据库存储有含有传统药物的专利文献以及所对应的传统药物登记数据库中所给出的传统药物分类编码,选择需要进行检索的分类编码,利用传统药物分类编码进行检索,避免了对同名异物传统药物检索时的误检与错检,确保了专利文献检索的全面性和准确性。根据本发明提供的传统药物分类编码的分类编码方法与特点,在本发明的具体实施过程中,还可以对传统药物分类编码进行拆分,用拆分后的分类编码进行检索,可以扩大专利文献检索的范围,在对专利文献数据的粗检索以及专利数据统计中应用较广泛。例如,利用传统药物分类编码的前4位编码进行检查,可以检索出同一物种、但是药物的药用部位和炮制方法不同的所有专利文献;利用传统药物分类编码的前6位编码进行4企查,可以;险索出同一物种、药用部位相同但是炮制方法不同的所有专利文献;利用传统药物27分类编码的8位编码则可以4企索出同一物种,且药物部位与炮制方法不同的具体专利文献数据。如图5所示,为本发明实施例五所提供的一种专利文献数据检索方法的流程示意图,其中,检索关键词为人参的分类编码A040-04和人参的分类编码A040-04-00,具体包括以下步骤步骤501、服务器接收到客户端输入的检索关键词,分别为人参的分类编码A040-04和人参的分类编码A040-04-00。步骤502、服务器与专利信息数据库链接,以分类编码A040-04和A040-04-00在专利信息数据库中进行检索,并输出检索结果。如表14所示为利用人参、人参的分类编码A040-04,A040-04-00作为检索关键词进行检索得到的检索结果数据统计表。表14利用分类编码A040-04,A040-04-00进行检索的4企索结果数据统计表4全索关4建词命中专利数A040-046810篇A040-04-005871篇上述检索结果数量上的不同在于当使用人参作为检索关键词在传统药物登记数据库中进行检索时,检索到的人参的分类编码列表部分如表15表示表15与传统药物人参相对应的传统药物分类编码列表分类编码中文名称A040-04-00人参A040-04-14生晒参A040-04-15糖参A040-04-28红参A040-04-29大力参其中,生晒参、糖参、红参、大力参与人参全部为同一物种,只是因为28炮制方法不同而所用名称不同。利用人参的分类编码A040-04进行检索,可以检索到8位分类编码中包含A040-04的所有专利文献,即把同属于人参物范围较广;而利用A040-04-00作为检索关键词进行检索,便可以检索出具体使用人参的专利文献,实现了对专利文献的精检索和粗检索,满足了传统药物专利4企索的具体需要。通过实施本发明提供的一种专利文献数据检索的方法,在传统药物登记数据库中存储每篇专利文献中出现的传统药物名称与其所对应的传统药物分类编码,在专利信息数据库中存储有含有传统药物的专利文献以及其所对应的传统药物登记数据库中所给出的传统药物分类编码。利用传统药物的唯一分类编码进行传统药物专利文献的检索,避免了对同名异物传统药物的错检和对同物异名传统药物的漏检,确保了专利文献数据检索的全面性和准确性。如图6所示,为本发明实施例六所提供的一种专利文献数据检索的系统结构示意图,包括,传统药物登记数据库610,用于存储每篇专利文献中出现的传统药物名称与其所对应的传统药物分类编码;专利信息数据库620,用于存储含有传统药物的专利文献以及其所对应的传统药物登记数据库中所给出的传统药物分类编码;服务器630,用于接收客户端输入的检索关键词,在传统药物登记数据库610中提取与检索关键词相对应的传统药物分类编码,根据传统药物分类编码,在专利信息数据库620中^^索包括传统药物分类编码的专利文献数据。客户端640,用于向服务器630提供检索关键词,并获取服务器630输出的专利文献数据检索结果,按照预设的顺序显示检索结果。其中,传统药物登记数据库610中的传统药物分类编码的编码方法具体为按照传统药物的整体特性及来源、传统药物的具体药物种类、传统药物的药用部位及自然属性、传统药物的性状及炮制方法对传统药物进行分类编码,建立4级8位分类编码ANNN-NX-NN,其中A表示大写字母,N表示数字,X表示数字或字母,4级8位分类编码与传统药物的中文正名、传统药物中文别名、传统药物英文名、传统药物拉丁名、传统药物拉丁动植物名相对应,其中,4级8位分类编码的第1位表征传统药物的整体特性及来源,根据植物来源不同,分为植物类、动物类、矿物类、综合类,分别用大写英文字母A-Z来表示;4级8位分类编码的第2、3、4位表征传统药物的具体药物种类,用阿拉伯数字000-999来表示;4级8位分类编码的第5、6位表征传统药物的药用部位及自然属性,用阿拉伯数字00-ZZ来表示;4级8位分类编码的第7、8位表征传统药物的性状及炮制方法,用阿拉伯数字00-99表示。具体的,该专利文献数据检索的系统中服务器630的结构,如图7所示,为本发明实施例七所提供的一种服务器结构示意图,包括获取模块710,用于获取客户端输入的检索关键词;提取模块720,与获取模块710连接,用于根据获取模块710获取的检索关键词,在传统药物登记数据库610中提取与检索关键词相对应的传统药物分类编码;检索模块730,与提取模块720连接,用于根据提取模块720提取的传统药物分类编码,在专利信息数据库620中检索包括传统药物分类编码的专利文献数据。其中,获取模块710,具体用于获取客户端输入的传统药物分类编码;传统药物中文正名;传统药物中文别名;传统药物英文名;传统药物拉丁名;传统药物拉丁动植物名中的任意一种。提取模块720,具体用于根据获取模块710获取的检索关键词,在传统药物登记数据库610查找与检索关键词相对应的传统药物分类编码,其中根据检索关键词查找相对应的分类编码的方式分为精确查找或模糊查找;将查找到的与检索关键词对应的传统药物分类编码和传统药物名称显示给客户端640,根据客户端640的检索需要提取与检索关键词相对应的传统药物分类编码。该服务器还包括输出模块740,与检索模块730连接,用于根据检索模块730检索出来的包括传统药物分类编码的专利文献数据,按照预设的输出顺序,输出包含传统药物分类编码的专利文献it据。通过实施本发明提供的一种专利数据检索的方法、系统和装置,在传统药物登记数据库中存储传统药物名称与传统药物分类编码的对应关系,在专利信息数据库中存储有专利文献以及每篇专利文献中包括的传统药物所对应的传统药物分类编码。利用传统药物的唯一分类编码进行传统药物专利文献的检索,避免了对同名异物传统药物的错检和对同物异名传统药物的漏检,确保了检索的全面性和准确性。通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明实施例可以通过石更件实现,也可以借助软件加必要的通用石更件平台的方式来实现。基于这样的理解,本发明实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。本领域技术人员可以理解附图只是一个优选实施例的示意图,附图中的模块或流程并不一定是实施本发明实施例所必须的。本领域技术人员可以理解实施例中的装置中的模块可以按照实施例描述进行分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。以上公开的仅为本发明的几个具体实施例,但是,本发明实施例并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明实施例的保护范围。3权利要求1、一种专利文献数据检索的方法,其特征在于,应用于包括传统药物登记数据库、专利信息数据库、服务器和至少一个客户端的检索系统中,所述传统药物登记数据库中包括每篇专利文献中出现的传统药物名称与其所对应的传统药物分类编码,所述专利信息数据库存储有含有传统药物的专利文献以及所对应的传统药物登记数据库中所给出的传统药物分类编码,所述方法包括以下步骤服务器获取客户端输入的检索关键词;所述服务器从所述传统药物登记数据库中提取与所述检索关键词相对应的传统药物分类编码;所述服务器根据所述传统药物分类编码,在所述专利信息数据库中检索包括所述传统药物分类编码的专利文献数据。2、如权利要求l所述的方法,其特征在于,所述检索关键词为一个或多个,每个关4定词具体为以下内容中的任意一种传统药物分类编码;传统药物中文正名;传统药物中文别名;传统药物英文名;传统药物拉丁名;传统药物拉丁动植物名。3、如权利要求l所述的方法,其特征在于,所述传统药物分类编码的编码方法具体为按照传统药物的整体特性及来源、传统药物的具体药物种类、传统药物的药用部位及自然属性、传统药物的性状及炮制方法对传统药物进行分类,建立4级8位分类编码ANNN-NX-NN,其中A表示大写字母,N表示数字,X表示数字或字母,所述4级8位分类编码与传统药物的中文正名、传统药物中文别名、传统药物英文名、传统药物拉丁名、传统药物拉丁动植物名相对应。4、如权利要求3所述的方法,其特征在于,所述4级8位分类编码ANNN-NX-NN,具体为所述4级8位分类编码的第1位表征传统药物的整体特性及来源,分为植物类、动物类、矿物类、综合类,分别用大写英文字母A-Z来表示;所述4级8位分类编码的第2、3、4位表征传统药物的具体药物种类,用阿拉伯数字000-999来表示;所述4级8位分类编码的第5、6位表征传统药物的药用部位及自然属性,用阿拉伯数字00-ZZ来表示;所述4级8位分类编码的第7、8位表征传统药物的性状及炮制方法,用阿拉伯数字00-99表示。5、如权利要求l所述的方法,其特征在于,所述服务器从所述传统药物登记数据库中提取与所述;f企索关键词相对应的传统药物分类编码,包括所述服务器根据所述检索关键词,在所述传统药物登记数据库查找与所述检索关键词相对应的传统药物分类编码,其中根据检索关键词查找相对应的分类编码的方式分为精确查找或才莫糊查找;将查找到的与所述检索关键词对应的传统药物分类编码和传统药物名称显示给客户端,根据所述客户端的检索需要提取与所述检索关键词相对应的传统药物分类编码。6、如权利要求l所述的方法,其特征在于,所述服务器根据所述传统药物分类编码,在所述专利信息数据库中检索包括所述传统药物分类编码的专利文献数据,之后还包括按照预设的输出顺序,输出包含所述传统药物分类编码的专利文献数据。7、一种专利文献数据检索的系统,其特征在于,包括,传统药物登记数据库,用于存储每篇专利文献中出现的传统药物名称与其所对应的传统药物分类编码;专利信息数据库,用于存储含有传统药物的专利文献以及其所对应的传统药物登记数据库中所给出的传统药物分类编码;服务器,用于接收客户端输入的检索关键词,在所述传统药物登记数据库中提取与所述检索关键词相对应的传统药物分类编码,根据所述传统药物分类编码,在所述专利信息数据库中检索包括所述传统药物分类编码的专利文献数据。客户端,用于向服务器提供检索关键词,并获取服务器输出的专利文献数据检索结果,按照预设的顺序显示检索结果。8、如权利要求7所述的系统,其特征在于,所述传统药物登记数据库中的传统药物分类编码的编码方法具体为按照传统药物的整体特性及来源、传统药物的具体药物种类、传统药物的药用部位及自然属性、传统药物的性状及炮制方法对传统药物进行分类编码,建立4级8位分类编码ANNN-NX-NN,其中A表示大写字母,N表示数字,X表示数字或字母,所述4级8位分类编码与传统药物的中文正名、传统药物中文别名、传统药物英文名、传统药物拉丁名、传统药物拉丁动植物名相对应,其中,所述4级8位分类编码的第1位表征传统药物的整体特性及来源,根据植物来源不同,分为植物类、动物类、矿物类、综合类,分别用大写英文字母A-Z来表示;所述4级8位分类编码的第2、3、4位表征传统药物的具体药物种类,用阿拉伯数字000-999来表示;所述4级8位分类编码的第5、6位表征传统药物的药用部位及自然属性,用阿拉伯数字00-ZZ来表示;所述4级8位分类编码的第7、8位表征传统药物的性状及炮制方法,用阿拉伯数字00-99表示。9、一种专利文献数据检索的服务器,其特征在于,包括,获取模块,用于获取客户端输入的检索关键词;提取模块,用于根据获取模块获取的所述检索关键词,在传统药物登记数据库中提取与所述检索关键词相对应的传统药物分类编码;检索模块,用于根据所述提取模块提取的所述传统药物分类编码,在所述专利信息数据库中检索包括所述传统药物分类编码的专利文献数据。10、如权利要求9所述的服务器,其特征在于,所述获取4莫块,具体用于获取客户端输入的传统药物分类编码;传统药物中文正名;传统药物中文别名;传统药物英文名;传统药物拉丁名;传统药物拉丁动植物名中的任意一种。11、如权利要求9所述的服务器,其特征在于,所述提取模块,具体用于根据所述检索关键词,在所述传统药物登记数据库查找与所述检索关键词相对应的传统药物分类编码,其中根据检索关键词查找相对应的分类编码的方式分为精确查找或模糊查找;将查找到的与所述检索关键词对应的传统药物分类编码和传统药物名称显示给客户端,根据所述客户端的检索需要提取与所述检索关键词相对应的传统药物分类编码。12、如权利要求11所述的服务器,其特征在于,还包括,输出模块,用于按照预设的输出顺序,输出包含所述传统药物分类编码的专利文献数据。全文摘要本发明公开了一种专利文献数据检索的方法、系统和装置,应用于包括传统药物登记数据库、专利信息数据库、服务器和至少一个客户端的检索系统中,传统药物登记数据库中包括每篇专利文献中出现的传统药物名称与其所对应的传统药物分类编码,专利信息数据库存储有含有传统药物的专利文献以及所对应的传统药物登记数据库中所给出的传统药物分类编码;该方法包括以下步骤服务器获取客户端输入的检索关键词;服务器从传统药物登记数据库中提取与检索关键词相对应的传统药物分类编码;服务器根据传统药物分类编码,在专利信息数据库中检索包括传统药物分类编码的专利文献数据。通过使用本发明,确保了检索的全面性和准确性。文档编号G06F17/30GK101673291SQ200910180699公开日2010年3月17日申请日期2009年10月28日优先权日2009年10月28日发明者刘延淮,刘晓燕,茵赵申请人:北京东方灵盾科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1