一种对企业专利数据库中数据处理的方法及装置的制作方法

文档序号:6374039阅读:218来源:国知局
专利名称:一种对企业专利数据库中数据处理的方法及装置的制作方法
技术领域
本发明涉及数据处理领域,尤其涉及一种对企业专利数据库中数据处理的方法及
>J-U装直。
背景技术
专利为专利权的简称,是指专利权人对发明创造享有的专利权,即国家依法在一定时期内授予发明创造者或者其权利继受者独占使用其发明创造的权利。专利的特性决定了一个企业拥有专利的数量是表征该企业竞争力及科技含量的一个重要指标。随着知识产权法律制度的完善及执法力度的增强,企业对知识产权的保护意识也不断提高。对专利的分布情况分析,以及专利相关信息的检索已成为企业发展过程中的一项重要工作。因此,很多企业都已经或者正在建立企业内部的专利数据库,用于引导产品的研发及生产。现有技术下,建立企业内部专利数据库的过程大致为人工逐条输入专利申请号及与申请号相对应的相关信息,该相关信息包括上述专利的申请日、申请人、当前法律状态信息、摘要等;定时触发法律状态自动更新请求,开始对专利数据库中的本地专利的法律状态进行更新;依次对企业专利数据库中的每一个欲更新本地专利,登录到该本地专利对应的专利法律状态信息发布网站上,由计算机自动从该本地专利对应的专利法律状态信息发布网站进行检索,获取相应的检索结果页面,并将检索结果页面公布的法律状态与本地专利的法律状态进行对比,以对专利数据库中的法律状态进行更新。现有技术中,对企业专利数据库中数据进行处理过程中,采用人工方式逐条输入专利申请号及与专利申请号相对应的所有相关信息,耗费巨大的人力,效率低下;且仅对上述专利申请号对应的法律状态信息进行更新,若上述专利申请号对应的相关信息中出现输 入错误或者某些信息项缺失时,并不能对该输入错误项和信息缺失项进行及时更新,可操作性差。

发明内容
本发明实施例提供一种对企业专利数据库中数据处理的方法及装置,用以解决现有技术中对企业专利数据库中的数据处理时,存在的效率低下、可操作性差的问题。本发明实施例提供的具体技术方案如下一种对企业专利数据库中数据处理的方法,包括将数据文件标识及其对应的第一相关信息批量导入至数据库中;判定所述数据文件标识有效后,在目标检索页面中检索所述数据文件标识对应的第二相关信息;判断所述数据文件标识对应的第一相关信息与所述第二相关信息不同时,将所述数据文件标识对应的第一相关信息更新为第二相关信息。一种对企业专利数据库中数据处理的装置,包括
导入单元,用于将数据文件标识及其对应的第一相关信息批量导入至数据库中;检索单元,用于判定所述数据文件标识有效后,在目标检索页面中检索所述数据文件标识对应的第二相关信息;数据库更新单元,用于判定所述数据文件标识对应的第一相关信息与所述第二相关信息不同时,将所述数据文件标识对应的第一相关信息更新为第二相关信息。本发明实施例中,将数据文件标识及其对应的第一相关信息批量导入至数据库中;判定上述数据文件标识有效后,在目标检索页面中检索该数据文件标识对应的第二相关信息;判断上述数据文件标识对应的第一相关信息与上述第二相关信息不同时,将上述数据文件标识对应的第一相关信息更新为第二相关信息。采用本发明技术方案,能够批量导入数据文件标识及其对应的相关信息,及时对数据文件标识对应的相关信息进行更新,有效提高了数据输入的效率,避免了对专利相关信息中输入错误项和信息缺失项更新不及时的问题,可操作性强。


图I为本发明实施例中企业专利数据库中数据处理装置的结构示意图;图2为本发明实施例中企业专利数据库中数据处理的流程图;图3为本发明实施例中企业专利数据库中处理数据文件标识无效状态时的流程图;图4为本发明实施例中企业专利数据库中更新数据文件标识对应的法律状态项的流程图。
具体实施例方式为了解决现有技术中对企业专利数据库中数据处理时,存在的采用人工方式将专利相关信息逐条输入至数据库中,效率低下;且仅对上述专利对应的法律状态信息进行更新,并不能对专利相关信息中输入错误项和信息缺失项进行及时更新,可操作性差的问题。本发明实施例中,将数据文件标识及其对应的第一相关信息批量导入至数据库中;判定上述数据文件标识有效后,在目标检索页面中检索该数据文件标识对应的第二相关信息;判断上述数据文件标识对应的第一相关信息与上述第二相关信息不同时,将上述数据文件标识对应的第一相关信息更新为第二相关信息。采用本发明技术方案,能够批量导入数据文件标识及其对应的相关信息,及时对数据文件标识对应的相关信息进行更新,有效提高了数据输入的效率,避免了对专利相关信息中输入错误项和信息缺失项更新不及时的问题,可操作性强。下面结合附图对本发明优选的实施方式进行详细说明。参阅图I所示,本发明实施例中,企业专利数据库中数据处理的装置包括导入单元11,检索单元12,数据库更新单元13,其中,导入单元11,用于将数据文件标识及其对应的第一相关信息批量导入至数据库中;检索单元12,用于判定所述数据文件标识有效后,在目标检索页面中检索所述数据文件标识对应的第二相关信息;
数据库更新单元13,用于判定所述数据文件标识对应的第一相关信息与所述第二相关信息不同时,将所述数据文件标识对应的第一相关信息更新为第二相关信息。基于上述技术方案,参阅图2所示,本发明实施例中,在企业数据库中数据处理的详细流程如下步骤200 :将数据文件标识及其对应的第一相关信息批量导入至数据库中。具体为首先,将数据文件标识及其对应的第一相关信息预先整理在Excel表格或者word文件中。对应于企业专利数据库中相关信息,本发明实施例中,数据文件标识是指专利申请号。在上述Excel表格或者word文件中,专利申请号为必须输入项,即在预先整理的信息中,每一条专利信息必须包含专利申请号,而该专利信息中与专利申请号对应的相关信息项可以全部为空,也可以部分为空。上述专利申请号对应的相关信息包括与该专利申请号对应的申请人、申请日期、法律状态信息及摘要等。
利用导入函数,将上述数据文件标识及其对应的第一相关信息按照对应的关键字批量导入至企业专利数据库中。较佳的,提取上述预先整理的专利信息的关键字,在数据库中也存在相对应的关键字,在专利信息批量导入数据库的过程中,根据预先整理的专利信息中的关键字与数据库中相应的关键字进行匹配,按照匹配结果对上述预先整理的专利信息进行导入。例如,将预先整理的专利信息中与专利申请号对应的“申请日期”作为关键字,在预先整理的专利信息批量导入数据库的过程中,在数据库中寻找“申请日期”关键字,并进行匹配,按照匹配结果,将预先整理的专利信息中的“申请日期”项归至数据库中相应的位置。采用上述方法,可以使导入数据库的专利信息条理清晰,便于检索。步骤210 :判定上述数据文件标识有效后,在目标检索页面中检索该数据文件标识对应的第二相关信息。具体为首先,根据预设的方式判断数据文件标识的有效性。由于在上述导入数据库中的专利信息中,上述数据文件标识即为专利申请号,因此,本发明实施例中,判断数据文件标识的有效性即为判断专利申请号的有效性。上述预设方式可以为通过专利申请号的格式判断其有效性,如位数;也可以通过确定专利申请号中包含的某一字段与其第一相关信息中的对应字段匹配,例如,在中国专利申请号第五位为本专利申请的类型,当已知某专利的专利类型,通过校验专利申请号第五位数字对应的专利类型与数据库中记录的该条专利的专利类型相同,则证明上述专利申请号有效,又如,假如专利申请号为14位,当已知前12位时,按照中国专利申请号的结构特点,即可得到上述专利申请号中小数点后一位的数字,当上述数字与数据库中记录的该专利申请号中小数点后一位完全相同时,则证明上述申请号有效。较佳的,采用上述方法的组合,综合判断导入数据库中专利申请号的有效性,提高判定的准确率。当判定上述专利申请号为有效后,则进入专利信息检索页面,检索与上述专利申请号对应的相关信息,并将在目标检索页面中检索得到的第二专利信息页面提取HTML信息,并存储上述HTML信息。特殊的,在本发明实施例中,为了便于用户查看专利申请号对应的相关信息中的法律状态,对专利申请号对应的第一法律状态仅设置为以下几种状态,分别为未公开、公开、实审、驳回、视撤、授权、撤销、部分无效、完全无效、期限届满、终止和延长。将上述专利申请号对应的法律状态作为特征字。检索专利信息检索页面的第二法律状态的特征字,当上述专利信息检索页面的第二法律状态特征字和数据库中的第一法律状态特征字相同,则不执行操作;若不同,则更新数据库中相关信息。当专利信息检索页面中无上述特征字,则将专利信息检索页面中的信息作为法律状态历史记录存储至数据库中,但并不更新数据库中对应的法律状态。步骤220 :判定上述数据文件标识对应的第一相关信息与第二相关信息不同时,将该数据文件标识对应的第一相关信息更新为第二相关信息。具体为提取数据库中专利申请号对应的第一相关信息的关键字,将上述关键字与上述已存储的HTML信息中的与上述第一相关信息对应的第二相关信息相应的关键字进行匹配,判断第一相关信息中各个关键字与第二相关信息中相应的各个关键字分别对应的信息是否完全相同,若不同,则将第二相关信息对应于相应的关键字存储至数据库中,替换原有的 专利申请号对应的第一相关信息,即更新数据库;若相同,则不执行操作。例如,某专利申请号对应的第一相关信息关键字分别为“申请人”为甲公司,“申请日期”为2007年3月,“发明名称”为一种数据处理方法及装置,其他关键字信息为空;已存储的第二相关信息与第一相关信息对应的关键字分别为“申请人”为甲公司,“申请日期”为2007年4月,“发明名称”为一种数据处理方法及装置。比较第一相关信息中各个关键字对应信息与第二相关信息中各个关键字对应的信息可知,第一相关信息中“申请日期项”为错误,将第一相关信息替换为第二相关信息,此时,根据第二相关信息可以将数据库中上述专利申请号对应的其他相关信息相应的关键字缺失项补全。 本发明实施例中,可以直接将HTML信息中的第二相关信息导入数据库中的相应位置,替换上述第一相关信息。通常,将上述存储在缓存中的专利申请号及其对应的第二相关信息更新至数据库中后,根据预设周期定期清除上述缓存中的检索结果。上述数据库中待检索专利申请号对应的第一相关信息的某些或者全部关键字项可能为空,此时,用第二相关信息替换数据库中专利申请号对应的第一相关信息,补全数据库中专利申请号对应的相关信息,更新企业专利数据库。在上述步骤210中,当判定专利申请号为有效时,即可根据专利信息检索页面的信息对数据库中专利申请号及其对应的相关信息进行更新。另一方面,当判定上述专利申请号为无效后,则将上述专利申请号进行校验。参阅图3所示,具体的校验过程为步骤300 :将无效的专利申请号存储至错误列表中。步骤310 :根据错误列表中专利申请号对应的第一相关信息,在专利信息检索页面中进行检索。本发明实施例中,可以根据需要通过勾选方式实时对错误列表中的某些或全部专利申请号在专利检索页面中进行相关检索,以便后期对错误列表中选中的专利申请号进行校验,也可以通过按照预设周期定时对上述错误列表中全部专利申请号在专利信息检索页面中进行检索。步骤320 :确定错误列表中专利申请号对应的第一相关信息中的第一关键字对应的所有字段与专利信息检索页面中的第二相关信息对应的字段达到预设匹配率时,列表显示专利检索页面中达到预设匹配率的所有第二相关信息。进入专利信息检索页面,当数据库中对应于错误列表中某申请号存在与其对应的第一相关信息,则可以对上述专利申请号对应的第一相关信息预设不同的优先级,例如,预设专利申请号对应的发明名称优先级最高,专利申请号对应的申请人优先级最低,即将发明名称项作为第一关键字。在专利信息检索页面中,判断上述错误列表中专利申请号对应的第一相关信息中的第一关键字对应的所有字段与专利信息检索页面中第二相关信息的第一关键字对应的字段是否达到预设匹配率,根据上述匹配率判定结果的不同,执行不同的操作。当针对专利申请号对应的某项相关信息与其检索结果信息完全匹配时,将第二相关信息列表显示,当不完全匹配时,则分别计算上述专利申请号对应的第一相关信息与第二相关信息各个字段的匹配率,对高于预设匹配率值的第二相关信息进行列表显示;删除低于匹配率的第二相关信息列表。
例如,在专利信息检索页面中,当错误列表中专利申请号对应的第一相关信息中的第一关键字为发明名称时,则在专利检索页面中根据发明名称进行检索,得到三条第二相关信息;预设第一相关信息与第二相关信息各个字段的匹配率达到60%时,列表显示上述三条第二相关信息;第一条第二相关信息与第一相关信息对应字段的匹配率为70%,第二条第二相关信息与第一相关信息对应字段的匹配率为50%,第三条第二相关信息与第一相关信息对应字段的匹配率为80% ;则将第一条第二相关信息与第三条第二相关信息列表显不。步骤330 :根据错误列表中第一相关信息中除第一关键字以外的其他关键字对应的所有字段与第二相关信息列表中对应字段的匹配率,逐次校验所述第二相关信息列表中的每一条第二相关信息。上述过程即为根据上述专利申请号对应的其他相关信息进一步对上述第二相关信息列表进行筛选,根据错误列表中专利申请号对应的第一相关信息的不同关键字对检索结果列表进行多次筛选。步骤340 :判断第二相关信息列表中第二相关信息的数目。步骤350 :当第二相关信息列表中第二相关信息的数目大于I条时,将上述错误列表中的专利申请号及其对应的第一相关信息存储至最终错误列表中。当最终第二相关信息列表中包含多条匹配专利信息时,则将专利申请号及其对应的第一相关信息存储至最终错误列表中,以便后期进行人工校验。步骤360 :当第二相关信息列表中仅包含最后一条第二相关信息时,将该最后一条第二相关信息对应的专利申请号作为有效的专利申请号,并将该第二相关信息存储至数据库中。当最终检索结果为一条匹配专利信息时,则根据上述匹配专利信息对错误列表中的专利信息进行更新,将更新后的专利信息存储至数据库中,并将上述更新的日期及更新前和更新后的专利信息等信息存储至日志中,以便后期的查看和校验工作。本发明实施例中,基于上述技术方案,下面针对不同的应用场景具体介绍采用本发明技术方案在企业专利数据库中数据处理的流程。
参阅图4所示,针对企业专利数据库中专利申请号对应的法律状态信息进行更新的详细流程如下步骤400 :读取企业专利数据库中专利申请号对应的第一法律状态信息。步骤410 :根据上述数据库中的专利申请号,在专利信息检索页面中,进行检索。此处,假设上述专利数据库中的专利申请号均为有效状态。并且,上述企业专利数据库中专利申请号对应的法律状态信息可以根据用户需要在专利信息检索页面中即时进行检索,也可以根据预设的周期在专利检索页面中对数据中的所有专利申请号依次进行定期检索。步骤420 :将上述检索结果页面进行存储。在上述检索结果页面中提取页面的HTML信息,并将该HTML信息进行存储。步骤430 :判断检索结果中专利申请号对应的第二法律状态历史记录与第一法律状态历史记录是否相同。若不同,则执行步骤440 ;若相同,执行步骤450。本发明实施例中,为了便于用户查看你专利申请号对应的相关信息中的法律状态项,对专利申请号对应的法律状态项仅设置为以下几种状态,分别为未公开、公开、实审、驳回、视撤、授权、撤销、部分无效、完全无效、期限届满、终止和延长。将上述专利申请号对应的所有法律状态作为特征字。数据库中专利申请号对应的法律状态信息中仅包含上述特征字,第二法律状态信息中可以包含非上述特征字的法律状态信息,如专利转让状态,此时,不对数据库中第一法律状态进行更新,而将上述法律状态的变化作为法律状态历史记录存储至数据库中,以便用户查看。步骤440 :在第二法律状态历史记录中与第一法律状态历史记录中的区别历史记录中提取特征字,根据该特征字更新数据库。在上述过程中,判断该特征字是否有效,若有效,在数据库中将第一法律状态更新为第二法律状态;若无效,在数据库中将第一法律状态历史记录替换为第二法律状态历史记录。此时,专利信息检索页面中无上述特征字,则将专利信息检索页面中的信息作为法律 状态历史记录存储至数据库中,但并不更新数据库中对应的法律状态信息项。步骤450 :若第一法律状态历史记录与第二相关历史记录完全相同,则不进行任何操作。在上述过程中,法律状态历史记录中包含与上述特征字对应的相关信息,如公告日、授权公告日等相关信息,可以通过先判断特征字是否完全相同,当特征字完全相同时,判断该特征字对应的相关信息是否完全相同,若完全相同,则不执行任何操作;若不同,则更新数据库。本发明实施例中,对于数据库中的数据文件标识对应的相关信息进行更新时,用户可以根据需要选择需要更新的相关信息项,例如,仅对法律状态项进行更新。进一步的,法律状态项包含授权公告日,授权公告号等信息,用户可以根据需要,仅对上述法律状态项下的某些或者全部项目进行更新。综上所述,本发明实施例中,将数据文件标识及其对应的第一相关信息批量导入至数据库中;判定上述数据文件标识有效后,在目标检索页面中检索该数据文件标识对应的第二相关信息;判断上述数据文件标识对应的第一相关信息与上述第二相关信息不同时,将上述数据文件标识对应的第一相关信息更新为第二相关信息。采用本发明技术方案,能够批量导入数据文件标识及其对应的相关信息,及时对数据文件标识对应的相关信息进行更新,有效提高了数据输入的效率,避免了对专利相关信息中输入错误项和信息缺失项更新不及时的问题,可操作性强。显然,本领域的技术人员可以对本发明进行各种改动和变型而 不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
权利要求
1.一种对企业专利数据库中数据处理的方法,其特征在于,包括 将数据文件标识及其对应的第一相关信息批量导入至数据库中; 判定所述数据文件标识有效后,在目标检索页面中检索所述数据文件标识对应的第二相关信息; 判定所述数据文件标识对应的第一相关信息与所述第二相关信息不同时,将所述数据文件标识对应的第一相关信息更新为第二相关信息。
2.如权利要求I所述的方法,其特征在于,将数据文件标识及其对应的第一相关信息批量导入至数据库中,包括 在预先整理的数据文件标识及其对应的第一相关信息中提取关键字信息; 将所述数据文件标识及其对应的第一相关信息利用导入函数按照所述关键字批量导入至数据库中与所述关键字对应的位置。
3.如权利要求I所述的方法,其特征在于,判定所述数据文件标识有效,包括 确定数据文件标识的格式符合预设标准时,判定数据文件标识有效;或者 确定所述数据文件标识中包含的一字段与所述第一相关信息中的对应字段匹配时,判定数据文件标识有效。
4.如权利要求I或3所述的方法,其特征在于,还包括 判定所述数据文件标识无效后,将所述数据文件标识存储至错误列表中; 根据所述数据文件标识对应的第一相关信息在目标检索页面中进行信息匹配检索,并根据检索获得的第二相关信息将所述数据文件标识校验为有效状态,以及将有效的数据文件标识及其对应的第二相关信息存储至所述数据库中。
5.如权利要求4所述的方法,其特征在于,根据所述数据文件标识对应的第一相关信息在目标检索页面中进行信息检索,并根据检索获得的第二相关信息将所述数据文件标识校验为有效状态,以及将有效的数据文件标识及其对应的第二相关信息存储至所述数据库中,包括 在目标检索页面中,判定所述数据文件标识对应的第一相关信息中的第一关键字对应的所有字段与第二相关信息对应的字段达到预设匹配率后,将所述第二相关信息列表显示; 根据所述数据文件标识对应的第一相关信息中除第一关键字以外的其他关键字对应的所有字段与所述第二相关信息列表中对应字段的匹配率,逐次校验所述第二相关信息列表中的每一条第二相关信息; 当所述第二相关信息列表中仅包含最后一条第二相关信息时,将所述最后一条第二相关信息对应的数据文件标识作为有效的数据文件标识,并将所述有效的数据文件标识及其对应的第二相关信息存储至数据库中。
6.一种对企业专利数据库中数据处理的装置,其特征在于,包括 导入单元,用于将数据文件标识及其对应的第一相关信息批量导入至数据库中; 检索单元,用于判定所述数据文件标识有效后,在目标检索页面中检索所述数据文件标识对应的第二相关信息; 数据库更新单元,用于判定所述数据文件标识对应的第一相关信息与所述第二相关信息不同时,将所述数据文件标识对应的第一相关信息更新为第二相关信息。
7.如权利要求6所述的装置,其特征在于,所述导入单元,具体用于在预先整理的数据文件标识及其对应的第一相关信息中提取关键字信息;将所述数据文件标识及其对应的第一相关信息利用导入函数按照所述关键字批量导入至数据库中与所述关键字对应的位置。
8.如权利要求6所述的装置,其特征在于,所述检索单元,具体用于确定数据文件标识的格式符合预设标准时,判定数据文件标识有效;或者确定所述数据文件标识中包含的某一字段与所述第一相关信息中的对应字段匹配时,判定数据文件标识有效。
9.如权利要求6或8所述的装置,其特征在于,所述检索单元,还用于判定所述数据文件标识无效后,将所述数据文件标识存储至错误列表中;根据所述数据文件标识对应的第一相关信息在目标检索页面中进行信息匹配检索,并根据检索获得的第二相关信息将所述数据文件标识校验为有效状态,以及将有效的数据文件标识及其对应的第二相关信息存储至所述数据库中。
10.如权利要求9所述的装置,其特征在于,所述检索单元,具体用于在目标检索页面中,判定所述数据文件标识对应的第一相关信息中的第一关键字对应的所有字段与第二相关信息对应的字段达到预设匹配率后,将所述第二相关信息列表显示;根据所述数据文件标识对应的第一相关信息中除第一关键字以外的其他关键字对应的所有字段与所述第二相关信息列表中对应字段的匹配率,逐次校验所述第二相关信息列表中的每一条第二相关信息;当所述第二相关信息列表中仅包含最后一条第二相关信息时,将所述最后一条第二相关信息对应的数据文件标识作为有效的数据文件标识,并将所述有效的数据文件标识及其对应的第二相关信息存储至数据库中。
全文摘要
本发明公开了一种对企业专利数据库中数据处理的方法及装置。用于解决现有技术中对企业专利数据库中数据处理时,存在的采用人工方式逐条输入专利相关信息,效率低下;且仅对上述专利对应的法律状态信息进行更新,并不能对专利相关信息中输入错误项和信息缺失项进行及时更新,可操作性差的问题。本发明实施例中,将数据文件标识及其对应的第一相关信息批量导入至数据库中;判定上述数据文件标识有效后,在目标检索页面中检索该数据文件标识对应的第二相关信息;判断上述数据文件标识对应的第一相关信息与上述第二相关信息不同时,将上述数据文件标识对应的第一相关信息更新为第二相关信息。
文档编号G06F17/30GK102831172SQ20121026296
公开日2012年12月19日 申请日期2012年7月26日 优先权日2012年7月26日
发明者杨芳, 盛兴, 彭珍, 李蔚君, 高升 申请人:国网信息通信有限公司, 保定市大为计算机软件开发有限公司, 国家电网公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1