一种文献数据处理、检索、分析方法以及对应的装置与流程

文档序号:13164546阅读:401来源:国知局
一种文献数据处理、检索、分析方法以及对应的装置与流程

本发明涉及文献数据信息技术领域,尤其涉及一种文献数据处理方法和装置、文献检索/分析方法和装置。



背景技术:

随着科学技术的不断发展,各种技术文献越来越多,尤其是,代表先进技术的专利文献也是越来越多,现在已经有多个检索平台,能够提供多个检索手段对数据库内的专利文献、非专利文献进行检索,但是目前的检索手段基本都是针对文献本身的关键词、分类号、著录项目,尤其是著录项目,大多一直停留在官方直接录入的项目本身上。在专利数据开发方面,一开始大多关注对于技术点的加工,即对数据的加工重点在对摘要和索引词的加工,对于著入项目的加工以及更深层次的挖掘数据一直是项空白,因为更深一层的检索和分析也是空白。



技术实现要素:

鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的做标记的方法及电子设备。

本发明提供一种文献数据处理方法,该方法包括:

根据文献的第一字段名称提取转移前权利人名称;

根据文献的第二字段名称提取转移后权利人名称;

解析所述提取的转移前权利人名称的族名称,生成第一族名称;

解析所述提取的转移后权利人名称的族名称,生成第二族名称;

比较所述第一族名称和第二族名称,如果相同,则对相应的文献进行第一标记,如果不同,则进行第二标记。

可选的,解析所述提取的转移前权利人名称的族名称,生成第一族名称,包括:

预存储权利人名称以及其对应的族名称;

根据上述预存储的权利人名称以及其对应的族名称,确定所述提取的转移前权利人名称的族名称。

可选的,解析所述提取的转移后权利人名称的族名称,生成第一族名称,包括:

预存储权利人名称以及其对应的族名称,

根据上述预存储的权利人名称以及其对应的族名称,确定所述提取的转移后权利人名称的族名称。

可选的,所述权利人名称为母公司名称、子公司名称、分公司名称、公司名称、企事业单位中的至少一个。

可选的,所述族名称为总公司与其分公司、母公司与其子公司的统一标准名称;

可选的,该方法还包括:判断转移前权利人是否为发明人;如果是,判断申请人是否为转移后权利人,如果是,则做第一标记。

本发明还提供一种文献检索方法,用上述的第一标记和/或第二标记进行文献的检索。

本发明还提供一种文献检索方法,用上述的第一标记和/或第二标记进行预定文献集的划分或者从预定文献集中提取部分文献。

本发明提供一种文献数据处理装置,该装置包括:

第一提取单元,用于根据文献的第一字段名称提取转移前权利人名称;

第二提取单元,用于根据文献的第二字段名称提取转移后权利人名称;

第一解析单元,用于解析所述提取的转移前权利人名称的族名称,生成第一族名称;

第二解析单元,用于解析所述提取的转移后权利人名称的族名称,生成第二族名称;

标记单元,用于比较所述第一族名称和第二族名称,如果相同,则对相应的文献进行第一标记,如果不同,则进行第二标记。

可选的,所述第一解析单元包括:

预存储模块,用于预先存储权利人名称以及其对应的族名称;

第一族名称确定模块,用于根据上述预存储的权利人名称以及其对应的族名称,确定所述提取的转移前权利人名称的族名称。

可选的,所述第二解析单元包括:

预存储模块,用于预先存储权利人名称以及其对应的族名称;

第二族名称确定模块,用于根据上述预存储的权利人名称以及其对应的族名称,确定所述提取的转移后权利人名称的族名称。

可选的,该装置还包括:第一判断单元,用于判断转移前权利人是否为发明人;第二判断单元,用于在第一判断单元判断为是的情况下,判断申请人是否为转移后权利人,如果申请人为转移后权利人,则所述第二判断单元控制所述标记单元进行第一标记。

本发明还提供一种文献检索装置,其包括,检索单元,用于根据前述第一标记和/或第二标记进行文献的检索。

本发明还提供一种文献分析装置,包括分组单元,用于根据前述第一标记和/或第二标记进行预定文献集的划分或者从预定文献集中提取部分文献。

本申请实施例中提供的技术方案,至少具有如下技术效果或优点:

通过本申请,能够将很多看上去似乎是发生专利权转移而实际上属于内部转移的专利文献排除出去,帮助用户获取到真正发生专利权转移的专利文献。

通过在原始著入项目基础上形成新的文献信息项目,从而提出了一种新的检索手段、分析手段,便于用户获取到专利权发生实质转移的文献,并进而为专门针对专利权发生实质转移的文献的研究和分析提供数据基础。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了根据本发明提出的文献数据处理方法的流程图;

图2示出了根据本发明提出的文献数据处理装置的结构框图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

本发明提供一种文献数据处理方法,如图1所示,该方法包括:

s1.根据文献的第一字段名称提取转移前权利人名称;

s2.根据文献的第二字段名称提取转移后权利人名称;

s3.解析所述提取的转移前权利人名称的族名称,生成第一族名称;

s4.解析所述提取的转移后权利人名称的族名称,生成第二族名称;

s5.比较所述第一族名称和第二族名称,如果相同,则对相应的文献进行第一标记,如果不同,则进行第二标记。

只要专利权人信息发生变更,在有关专利权人的申请人事项和地址事项中,即会著入信息。在申请人事项中,具体内容有变更前权利人、变更后权利人,在地址事项中,具体内容有变更前地址、变更后地址,但实际上,有很多情况并不是真正的发生了专利权转移。这些情况有,专利权人的地址信息发生变化;母公司转给子公司、总公司转给分公司,专利权人增加了分公司或者兄弟公司等。举个实例,专利权人由奇智软件(北京)有限公司变更为奇智软件(北京)有限公司、北京奇虎科技有限公司。这些都不是真正发生专利权转移的情况。

如果利用受让人与申请人不同即认为发生专利权转移的逻辑来查找发生了专利权发生了转移的专利文献,那么在上述的情况下:在母公司转给子公司、总公司转给分公司,专利权人增加了分公司或者兄弟公司的情况,都会认为专利权发生了转移。比如通过构建检索式,lsan/奇智andnotan/奇智软件,其中,“lsan/奇智软件”表示专利权受让人为奇智软件公司,“an/奇智软件”表示申请人为奇智软件,来查找专利申请人不是奇智,但是专利权受让人或者被许可人是奇智公司的专利文献,就会把北京奇虎科技有限公司,北京奇虎测腾科技有限公司转让给奇智公司的专利文献都作为专利权发生了转移的专利文献。可见通过这样的逻辑实现查找发生了专利权转移的专利文献包括了太多的噪声。而本申请通过引入族名称,即建立每个专利权人的族名称,母公司和其子公司采用统一的族名称,总公司和其分公司采用统一的族名称。本申请并不限于上述两种情况,任何属于一个公司系统内的各个公司都采用统一的族名称。通过引入上述族名称,以区分族内的专利权转移以及族外的专利权转移。

作为一种优选实施方式,预存储权利人名称以及其对应的族名称,族名称是根据公司之间的关系建立的。

根据上述预存储的权利人名称以及其对应的族名称,确定所述提取的转移前权利人名称或者转移后权利人名称的族名称。

解析所述提取的转移后权利人名称的族名称,生成第一族名称,包括:

预存储权利人名称以及其对应的族名称,

根据上述预存储的权利人名称以及其对应的族名称,确定所述提取的转移后权利人名称的族名称。

所述权利人名称为母公司名称、子公司名称、分公司名称、公司名称、企事业单位中的至少一个。

所述族名称为总公司与其分公司、母公司与其子公司的统一标准名称;作为一种实施方式,可根据总公司与其分公司名称、或者母公司与其子公司中相同的部分来构建族名称,也可选择总公司与其分公司名称中知名度最大的一个公司名称或者大家公认的代表总公司与其分公司的一个名称作为族名称。大家公认的代表总公司与其分公司的一个名称可以是商标名称。比如360或者360公司可以作为奇智软件(北京)有限公司、北京测腾科技有限公司、北京奇虎科技有限公司等的族名称。对于一件专利文献,如果其在奇智软件(北京)有限公司和再比如雷军旗下设有小米科技、小米通讯、小米电子软件、小米支付、小米移动软件、小米软件技术、小米数码科技等至少7家公司,那么以小米作为这些公司的族名称。对小米通讯与小米电子软件之间的专利转让,因为小米通讯与小米电子软件的族名称均为小米,那么,则进行第一标记。本申请对族名称的建立和获取不做限定,比如人工梳理的各公司以及各公司之间的关系进行确定,也可根据已有的公司名录和公司关系(比如从工商部分获取基础数据)通过执行公司名称匹配和关联的算法自动加工。

作为另一种具体实施例,对于美国专利文献,有很多专利文献的情况是申请人是发明人(发明人为公司员工),但在授权后,需要转让给公司,这实质上是美国专利制度中的一种规范要求,并没有发生实质的专利权转移。对于这种情况,无法在发明人与公司名称之间建立族名称,但又为了这些专利文献不构成在查找发生专利权转移的专利文献时的噪声,为了解决这个问题,该方法还包括:判断转移前权利人是否为发明人;如果是,判断申请人是否为转移后权利人,如果是,则进行第一标记。在该实施例中,需要提取专利文献的发明人字段,并将所述发明人字段与转移前权利人进行比较。这种方式对于美国文献,能够准确地把公司内部员工将专利权转让给公司的专利文献排除在实质发生专利权转移的专利文献范围之外。

本发明还提供一种文献检索方法,用上述的第一标记和/或第二标记进行文献的检索。

本发明还提供一种文献检索或者分析方法,用上述的第一标记和/或第二标记进行预定文献集的划分或者从预定文献集中提取部分文献。

一种具体实施方式是在检索、分析前,对文献数据进行处理,即进行步骤s1-s5,进行第一标记和第二标记可以是在专利文献中增加一字段,字段名称比如可以是lstype,也可以是其他的字段名称,这个数据开发商可以自己定义。进一步,可以用“0”来表示第一标记内容,用“1”来表示第二标记内容。用户输入指令lstype/0或者lstype/1时,检索方法根据所述指令对lstype字段进行匹配,将符合用户输入的指令的文献提供给用户,或者对一定的文献集按照lstype字段进行分组,将字段lstype=0的文献分为一组,将字段lstype=1的文献分为另一组。

另一种实施方式是在检索、分析的过程中,进行步骤s1-s5,而不在专利文献中增加任何字段,具体过程如下:用户输入需要指令lstype/0或者lstype/1时,直接即时根据所述指令执行步骤s1-s5,将满足用户要求的标记的文献提供出来。或者对一定的文献集按照即时标记结果一篇一篇进行分组,将字段lstype=0的文献分为一组,将字段lstype=1的文献分为另一组。

一般来说,实质发生专利权转移的专利文献实际技术价值或者经济价值较大,受关注程度高,往往能关系到一个企业的发展策略和方向,通过上述实施方式,用户可根据第一标记、第二标记对文献进行检索和分析,以获取到实质发生了专利权专转移的文献数据。通过这些文献数据可以观察出一个公司、一个领域或者一个主题下的专利转让、专利运营状况,并可进一步为进行更深层面的分析提供数据基础。

本发明提供一种文献数据处理装置,如图2所示,该装置包括:

第一提取单元10,用于根据文献的第一字段名称提取转移前权利人名称;

第一解析单元20,用于解析所述提取的转移前权利人名称的族名称,生成第一族名称;

第二提取单元30,用于根据文献的第二字段名称提取转移后权利人名称;

第二解析单元40,用于解析所述提取的转移后权利人名称的族名称,生成第二族名称;

标记单元50,用于比较所述第一族名称和第二族名称,如果相同,则对相应的文献进行第一标记,如果不同,则进行第二标记。

所述文献数据处理装置可以是一种实体终端装置,也可以是一种基于虚拟功能模块的软件架构,可通过计算机程序在处理器设备上运行实现。不管是上述哪种结构设置,该文献数据处理装置可以与用于搜索文献集的检索模块、对数据进行分组的分析模块集成在一起,也可单独设立。

所述第一解析单元包括:包括:

预存储模块,用于预先存储权利人名称以及其对应的族名称;

第一族名称确定模块,用于根据上述预存储的权利人名称以及其对应的族名称,确定所述提取的转移前权利人名称的族名称。

所述第二解析单元包括:包括:

预存储模块,用于预先存储权利人名称以及其对应的族名称;

第二族名称确定模块,用于根据上述预存储的权利人名称以及其对应的族名称,确定所述提取的转移后权利人名称的族名称。

所述权利人名称为母公司名称、子公司名称、分公司名称、公司名称、企事业单位中的至少一个。

所述族名称为总公司与其分公司、母公司与其子公司的统一标准名称;作为一种实施方式,可根据总公司与其分公司名称、或者母公司与其子公司中相同的部分来构建族名称,也可选择总公司与其分公司名称中知名度最大的一个公司名称或者大家公认的代表总公司与其分公司的一个名称作为族名称。大家公认的代表总公司与其分公司的一个名称可以是商标名称。比如360或者360公司可以作为奇智软件(北京)有限公司、北京测腾科技有限公司、北京奇虎科技有限公司等的族名称。再比如雷军旗下设有小米科技、小米通讯、小米电子软件、小米支付、小米移动软件、小米软件技术、小米数码科技等至少7家公司,那么以小米作为这些公司的族名称。本申请对族名称的建立和获取不做限定,可根据公司之间的关系进行人工加工,也可根据公司的相关信息进行自动加工。

该装置还包括:第一判断单元,用于判断转移前权利人是否为发明人;第二判断单元,用于在第一判断单元判断为是的情况下,判断申请人是否为转移后权利人,如果申请人为转移后权利人,则所述第二判断单元控制所述标记单元进行第一标记。,对于美国专利文献,有很多专利文献的情况是申请人是发明人(发明人为公司员工),但在授权后,需要转让给公司,这实质上是美国专利制度中的一种规范要求,并没有发生实质的专利权转移。对于这种情况,无法在发明人与公司名称之间建立族名称,但又为了这些专利文献不构成在查找发生专利权转移的专利文献时的噪声,该方法还包括:判断转移前权利人是否为发明人;如果是,判断申请人是否为转移后权利人,如果是,则进行第一标记。在该实施例中,需要提取专利文献的发明人字段,并将所述发明人字段与转移前权利人进行比较。这种方式对于美国文献,能够准确地把公司内部员工将专利权转让给公司的专利文献排除在实质发生专利权转移的专利文献范围之外。

本发明还提供一种文献检索装置,其包括,检索单元,用于根据前述第一标记和/或第二标记进行文献的检索。一方面,检索单元通过对专利文献数据中设置的转移字段(包含所述第一标记、第二标记)进行匹配,从而根据用户指令将进行第一标记或者第二标记的文献提供给用户。另外也可即时利用处理资源(可以是服务器侧也可以是终端侧)对一定文献集内的文献执行步骤s1-s5,即临时进行所述第一标记、第二标记,从而根据用户指令将进行第一标记或者第二标记的文献提供给用户。

本发明还提供一种文献分析装置,包括分组单元,用于根据前述第一标记和/或第二标记进行预定文献集的划分或者从预定文献集中提取部分文献。

一方面,分析单元通过对专利文献数据中设置的转移字段(包含所述第一标记、第二标记)进行匹配,从而根据用户指令将进行第一标记或者第二标记的文献进行分组分析。另外也可即时利用处理资源(可以是服务器侧也可以是终端侧)对一定文献集内的文献执行步骤s1-s5,即临时进行所述第一标记、第二标记,根据所述第一标记、第二标记对一定文献集内的文献分组分析。

由于本实施例所介绍的文献检索、分析装置为利用通过步骤s1-s5产生第一标记、第一二标记进行的文献检索、分析的装置,本领域所属技术人员能够了解本实施例的文献检索、分析装置的具体实施方式以及其各种变化形式,比如该文献检索、分析装置可以是包括终端与服务器的检索、分析系统,也可以是单独的服务器装置,其能够实现步骤s1-s3,在此对于该电子设备如何实现本申请实施例中的数据处理方法、文献检索、分析方法不再详细介绍。只要本领域所属技术人员利用本申请实施例中产生的第一标记、第二标记进行检索和分析所采用的装置,都属于本申请所欲保护的范围。

本申请实施例中提供的技术方案,至少具有如下技术效果或优点:

通过本申请,能够将很多看上去似乎是发生专利权转移而实际上属于内部转移的专利文献排除出去,帮助用户获取到真正发生专利权转移的专利文献。

通过在原始著入项目基础上形成新的文献信息项目,从而提出了一种新的检索手段、分析手段,便于用户获取到专利权发生实质转移的文献,并进而为专门针对专利权发生实质转移的文献的研究和分析提供数据基础。

在原始文献数据不进行任何进一步加工的情况下,通过接收用户输入的指令,比如是lstype/0或者lstype/1时,即可检索发生实质专利权转移的专利文献或者对一定文献集关于实质专利权转移是否发生转移进行分组分析。

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本发明实施例的网关、代理服务器、系统中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1