出版物的词条检查方法、装置、设备及存储介质与流程

文档序号:21781551发布日期:2020-08-07 20:08阅读:184来源:国知局
出版物的词条检查方法、装置、设备及存储介质与流程
本发明涉及数字出版领域,尤其涉及一种出版物的词条检查方法、装置、设备及存储介质。
背景技术
:目前,在出版社工具书编纂过程中,一般都是再版书的编辑、升级,如《xx书籍》第五版升级到第六版、第六版升级到第七版,一般每一版过后都会积累一专有词库,然而,每一版升级和编辑过程中都需要对专有词库中的词条进行检查。传统工具书中的词条检查模式为:编辑人员选择需要检查的词条,点击检查操作后,后台用该词条对全库的库表进行匹配,发现编写有误的词条后,再对词条中错误的地方逐一修改,这个过程漫长且复杂,首先,大型工具书词条一般较多,约十几万个词条,逐个检校的工作量太大,容易遗漏,还有这个过程会频繁请求数据库,会造成数据库的访问压力,另外,每一个词条在专项检查过程中都要逐一与几十万的词库进行比对,导致词条检索过程也比较慢,一旦开始检校后,往往需要等待很久才可以看到结果,即时性较差,上述情况都会严重影响编辑人员的审校效率。技术实现要素:有鉴于此,本发明实施例提供了一种出版物的词条检查方法、装置、设备及存储介质,以解决现有技术中词条检索过程较慢,严重影响编辑人员的审校效率的问题。第一方面,本发明实施例提供了一种出版物的词条检查方法,包括:获取出版物的待检查词条的标识信息;根据所述标识信息在内存数据库中进行匹配;若所述内存数据库中存在所述标识信息,则从所述内存数据库中获取与所述标识信息对应的词条异常信息,所述词条异常信息为所述待检查词条的异常信息;其中,所述内存数据库是由预先对所述出版物的全部词条进行检查得到的异常词条的标识信息及其对应的词条异常信息建立的。在一种可能的实现方式中,在本发明实施例提供的上述方法中,所述词条异常信息包括:量和单位异常数据、历史纪年异常数据、成套词异常数据。在一种可能的实现方式中,在本发明实施例提供的上述方法中,所述获取出版物的待检查词条的标识信息之前,还包括:获取出版物中发生变化的词条,并确定对应的变化类型;根据发生变化的各个词条的变化类型对内存数据库进行数据更新。在一种可能的实现方式中,在本发明实施例提供的上述方法中,所述变化类型包括:内容变化、被删除和被添加。在一种可能的实现方式中,在本发明实施例提供的上述方法中,所述根据发生变化的各个词条的变化类型对内存数据库进行数据更新,具体包括:若单个词条的变化类型为内容变化,则对所述单个词条重新进行检查;若检查结果为存在异常,则删除内存数据库中所述单个词条对应的词条异常信息之后,插入对所述单个词条重新进行检查得到的新的词条异常信息;若检查结果为不存在异常,则直接删除内存数据库中所述单个词条对应的词条异常信息。在一种可能的实现方式中,在本发明实施例提供的上述方法中,所述根据发生变化的各个词条的变化类型对内存数据库进行数据更新,具体包括:若单个词条的变化类型为被删除,则直接删除内存数据库中所述单个词条对应的词条异常信息。在一种可能的实现方式中,在本发明实施例提供的上述方法中,所述根据发生变化的各个词条的变化类型对内存数据库进行数据更新,具体包括:若单个词条的变化类型为被添加,则对所述单个词条进行检查;若检查结果为存在异常,则将对所述单个词条进行检查得到的词条异常信息插入到内存数据库中。在一种可能的实现方式中,在本发明实施例提供的上述方法中,所述方法还包括:将内存数据库中的初始数据分别备份到磁盘的第一数据文件和第二数据文件中之后,定时将所述内存数据库中的数据备份覆盖所述第一数据文件;若备份覆盖所述第一数据文件成功,则将所述内存数据库中的数据备份覆盖所述第二数据文件;若备份覆盖所述第一数据文件不成功,则停止备份覆盖所述第二数据文件。在一种可能的实现方式中,在本发明实施例提供的上述方法中,所述方法还包括:系统每次维护重启后,读取所述第一数据文件,并判断所述第一数据文件是否异常;若否,则将所述第一数据文件写入内存数据库中;若是,则读取所述第二数据文件,并将所述第二数据文件写入内存数据库中。在一种可能的实现方式中,在本发明实施例提供的上述方法中,所述判断所述第一数据文件是否异常,具体包括:判断所述第一数据文件的数据量是否小于预设数据量;若所述第一数据文件的数据量小于预设数据量,则为异常,反之,则为正常。第二方面,本发明实施例提供了一种出版物的词条检查装置,包括:标识获取模块,用于获取出版物的待检查词条的标识信息;匹配模块,用于根据所述标识信息在内存数据库中进行匹配;异常获取模块,用于若所述内存数据库中存在所述标识信息,则从所述内存数据库中获取与所述标识信息对应的词条异常信息,所述词条异常信息为所述待检查词条的异常信息;其中,所述内存数据库是由预先对所述出版物的全部词条进行检查得到的异常词条的标识信息及其对应的词条异常信息建立的。在一种可能的实现方式中,在本发明实施例提供的上述装置中,所述词条异常信息包括:量和单位异常数据、历史纪年异常数据、成套词异常数据。在一种可能的实现方式中,在本发明实施例提供的上述装置中,所述装置还包括:更新模块,用于在所述标识获取模块获取出版物的待检查词条的标识信息之前,获取出版物中发生变化的词条,并确定对应的变化类型;根据发生变化的各个词条的变化类型对内存数据库进行数据更新。在一种可能的实现方式中,在本发明实施例提供的上述装置中,所述变化类型包括:内容变化、被删除和被添加。在一种可能的实现方式中,在本发明实施例提供的上述装置中,所述更新模块,具体用于:若单个词条的变化类型为内容变化,则对所述单个词条重新进行检查;若检查结果为存在异常,则删除内存数据库中所述单个词条对应的词条异常信息之后,插入对所述单个词条重新进行检查得到的新的词条异常信息;若检查结果为不存在异常,则直接删除内存数据库中所述单个词条对应的词条异常信息。在一种可能的实现方式中,在本发明实施例提供的上述装置中,所述更新模块,具体用于:若单个词条的变化类型为被删除,则直接删除内存数据库中所述单个词条对应的词条异常信息。在一种可能的实现方式中,在本发明实施例提供的上述装置中,所述更新模块,具体用于:若单个词条的变化类型为被添加,则对所述单个词条进行检查;若检查结果为存在异常,则将对所述单个词条进行检查得到的词条异常信息插入到内存数据库中。在一种可能的实现方式中,在本发明实施例提供的上述装置中,所述装置还包括:双备份模块,用于将内存数据库中的初始数据分别备份到磁盘的第一数据文件和第二数据文件中之后,定时将所述内存数据库中的数据备份覆盖所述第一数据文件;若备份覆盖所述第一数据文件成功,则将所述内存数据库中的数据备份覆盖所述第二数据文件;若备份覆盖所述第一数据文件不成功,则停止备份覆盖所述第二数据文件。在一种可能的实现方式中,在本发明实施例提供的上述装置中,所述装置还包括:维护模块,用于在系统每次维护重启后,读取所述第一数据文件,并判断所述第一数据文件是否异常;若否,则将所述第一数据文件写入内存数据库中;若是,则读取所述第二数据文件,并将所述第二数据文件写入内存数据库中。在一种可能的实现方式中,在本发明实施例提供的上述装置中,所述维护模块,具体用于:判断所述第一数据文件的数据量是否小于预设数据量;若所述第一数据文件的数据量小于预设数据量,则为异常,反之,则为正常。第三方面,本发明实施例提供了一种电子设备,包括:存储器,处理器以及计算机程序;其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如上述第一方面所述的方法。第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行以实现如上述第一方面所述的方法。基于以上各方面,本发明实施例通过获取出版物的待检查词条的标识信息,根据所述标识信息在内存数据库中进行匹配,若所述内存数据库中存在所述标识信息,则从所述内存数据库中获取与所述标识信息对应的词条异常信息,所述词条异常信息为所述待检查词条的异常信息,其中,所述内存数据库是由预先对所述出版物的全部词条进行检查得到的异常词条的标识信息及其对应的词条异常信息建立的。本方案中,通过预先对出版物的全部词条进行检查,将得到的异常词条的标识信息及其对应的词条异常信息存入内存数据库,编辑人员在对词条进行校对时,可从内存数据库中快速得到词条异常信息或没有异常的结果,可大大提高词条校对的效率,同时也能避免词条遗漏检查,大大提高词条校对的准确性。应当理解,上述
发明内容部分中所描述的内容并非旨在限定本发明的实施例的关键或重要特征,亦非用于限制本发明的范围。本发明的其它特征将通过以下的描述变得容易理解。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。图1为本发明实施例一提供的出版物的词条检查方法的流程示意图;图2为本发明实施例二提供的出版物的词条检查方法的流程示意图;图3为本发明实施例三提供的出版物的词条检查装置的结构示意图;图4为本发明实施例四提供的出版物的词条检查装置的结构示意图;图5为本发明实施例五提供的电子设备的结构示意图。具体实施方式下面将参照附图更详细地描述本发明的实施例。虽然附图中显示了本发明的某些实施例,然而应当理解的是,本发明可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本发明。应当理解的是,本发明的附图及实施例仅用于示例性作用,并非用于限制本发明的保护范围。本发明实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明实施例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。以下将参照附图来具体描述本申请的实施例。实施例一图1为本发明实施例一提供的出版物的词条检查方法的流程示意图,如图1所示,本实施例的执行主体可以为出版物的词条检查装置。在实际应用中,该出版物的词条检查装置可以通过虚拟装置,例如软件代码实现,也可以通过写入有相关执行代码的实体装置,例如,u盘实现,再或者,也可以通过集成有相关执行代码的实体装置实现,例如,电子设备,如计算机,笔记本电脑等。示例性的,下面以执行主体为出版物的词条检查装置进行说明。本实施例提供的出版物的词条检查方法包括以下几个步骤:s101、获取出版物的待检查词条的标识信息。具体地,本实施例中,在用户给定词条后,首先将待出版物的整书词条导入传统关系型数据库中,例如mysql数据库,启动一个线程,逐个检查比对词条的信息,将异常的词条标识信息及其对应的词条异常信息等记录到内存数据库中。当用户需要查询某单个词条的检查结果时,可以从关系型数据库中获取待检查词条的标识信息,例如词条id或词条名称。其中,所述内存数据库是由预先对所述出版物的全部词条进行检查得到的异常词条的标识信息及其对应的词条异常信息建立的。该词条异常信息可以包括量和单位异常数据、历史纪年异常数据、成套词异常数据几个类别,还可以包括其他类别数据,本实施例中对此不作限定。进一步地,可以将各类别词条异常信息及其对应的正常信息进行关联存储,以方便呈现给用户。其中,该内存数据库可以采用h2内存数据库,也可以采用其它种类的内存数据库,本实施例中对此不作限定。s102、根据所述标识信息在内存数据库中进行匹配。具体地,本实施例中,在得到了待检查词条的标识信息后,可以根据标识信息在内存数据库中进行匹配、搜索。s103、若所述内存数据库中存在所述标识信息,则从所述内存数据库中获取与所述标识信息对应的词条异常信息,所述词条异常信息为所述待检查词条的异常信息。具体地,本实施例中,若待检查词条的标识信息在内存数据库中无法得到匹配,则说明该词条不存在异常,若内存数据库中存在待检查词条的标识信息,则说明该词条存在异常,进一步地,根据其标识信息获取对应的各类别词条异常信息,同一呈现给用户,待用户进行下一步操作。本实施例提供的出版物的词条检查方法,通过获取出版物的待检查词条的标识信息,根据标识信息在内存数据库中进行匹配,若内存数据库中存在所述标识信息,则从内存数据库中获取与所述标识信息对应的词条异常信息,所述词条异常信息为所述待检查词条的异常信息,其中,所述内存数据库是由预先对所述出版物的全部词条进行检查得到的异常词条的标识信息及其对应的词条异常信息建立的,可见,该方案通过预先对出版物的全部词条进行检查,将得到的异常词条的标识信息及其对应的词条异常信息存入内存数据库,编辑人员在对词条进行校对时,可从内存数据库中快速得到词条异常信息或没有异常的结果,可大大提高词条校对的效率,同时也能避免词条遗漏检查,大大提高词条校对的准确性。实施例二图2为本发明实施例二提供的出版物的词条检查方法的流程示意图,如图2所示,本实施例提供的出版物的词条检查方法,在本申请方法实施例一的基础上,优选的,在步骤s101之前,还可以包括以下步骤:s201、获取出版物中发生变化的词条,并确定对应的变化类型。具体地,本实施例中,在用户进行词条查询之前,出版物的词条可能会放生各种各样的变化,例如某词条内容经过了修改,或者某词条被删除了,再或者添加了新的词条等,这会导致内存数据库中的数据不准确,因此需要对其进行更新操作,首先要获取出版物中发生变化的词条,并确定对应的变化类型。其中,所述变化类型包括:内容变化、被删除和被添加。s202、根据发生变化的各个词条的变化类型对内存数据库进行数据更新。具体地,本实施例中,发生变化的各个词条的变化类型不同,对内存数据库进行数据更新的方法也不同。例如,若单个词条的变化类型为内容变化,则对所述单个词条重新进行检查,若检查结果为存在异常,则删除内存数据库中所述单个词条对应的词条异常信息之后,插入对所述单个词条重新进行检查得到的新的词条异常信息,若检查结果为不存在异常,则直接删除内存数据库中所述单个词条对应的词条异常信息。若单个词条的变化类型为被删除,则直接删除内存数据库中所述单个词条对应的词条异常信息。若单个词条的变化类型为被添加,则对所述单个词条进行检查,若检查结果为存在异常,则将对所述单个词条进行检查得到的词条异常信息插入到内存数据库中。为了提高数据的稳定性及系统的健壮性,本实施例中还可以包括以下步骤:s203、将内存数据库中的初始数据分别备份到磁盘的第一数据文件和第二数据文件中之后,定时将所述内存数据库中的数据备份覆盖所述第一数据文件。具体地,本实施例中,初次导入词条并检查计算到内存数据库中后,会第一次进行双备份,将内存数据库中的初始数据分别备份到磁盘的第一数据文件和第二数据文件中,之后,随着内存数据库中数据的不断更新,可以定时将内存数据库中的数据备份覆盖所述第一数据文件。优选的,可以依托spring的定时器技术进行定时备份。s204、若备份覆盖所述第一数据文件成功,则将所述内存数据库中的数据备份覆盖所述第二数据文件,若备份覆盖所述第一数据文件不成功,则停止备份覆盖所述第二数据文件。具体地,本实施例中,若备份覆盖所述第一数据文件成功,则将所述内存数据库中的数据备份覆盖所述第二数据文件,以完成双备份,若备份覆盖所述第一数据文件不成功,如在备份过程中出现异常,则停止备份覆盖所述第二数据文件,以便至少保留所述第二数据文件是最后一次成功的备份文件。实际应用中,当系统服务重启导致内存销毁,则可以直接将备份文件的数据加载到内存数据库中,进一步地,本实施例中还可以包括以下步骤:系统每次维护重启后,读取第一数据文件,并判断第一数据文件是否异常,若否,则将第一数据文件写入内存数据库中,若是,则读取第二数据文件,并将第二数据文件写入内存数据库中。其中,判断第一数据文件是否异常,具体可以为:判断第一数据文件的数据量是否小于预设数据量,若第一数据文件的数据量小于预设数据量,则为异常,反之,则为正常。其中,预设数据量可以为2kb,因为内存数据库启动所需内置表及配置信息约2kb,一般文件数据量小于2kb就视为异常。上述方法中,改变了传统词条检查的思路,可以大大提高效率及准确性,表1展示的是《xx书籍》整书中单个词条的平均查询效率,表2展示的是《xx书籍》编纂过程中用新方式检校的完成时间与之前未用该方法的完成时间比对,表3展示的是《xx书籍》出版后,统计的没用该方法优化前存在的词条未更正的异常数及改用本方法后存在的未更正的异常数,具体如下表:单个词条查询模式时间(s)传统查询方式14.38优化后的查询方式0.013表1版次完成时间(人月)第五版53第六版32第七版24表2版次遗留词条个数第五版139第六版32第七版7表3本实施例提供的出版物的词条检查方法,通过不断更新内存数据库以及对内存数据库中的内容进行双备份,提高了数据的稳定性及系统的健壮性,避免了词条遗漏检查,大大提高了词条校对的准确性。下述为本发明装置实施例,可以用于执行本发明方法实施例。对于本发明装置实施例中未披露的细节,请参照本发明方法实施例。实施例三图3为本发明实施例三提供的出版物的词条检查装置的结构示意图,如图3所示,该装置包括:标识获取模块310,用于获取出版物的待检查词条的标识信息;匹配模块320,用于根据所述标识信息在内存数据库中进行匹配;异常获取模块330,用于若所述内存数据库中存在所述标识信息,则从所述内存数据库中获取与所述标识信息对应的词条异常信息,所述词条异常信息为所述待检查词条的异常信息;其中,所述内存数据库是由预先对所述出版物的全部词条进行检查得到的异常词条的标识信息及其对应的词条异常信息建立的。其中,所述词条异常信息包括:量和单位异常数据、历史纪年异常数据、成套词异常数据。本实施例提供的装置可以执行图1所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。实施例四图4为本发明实施例四提供的出版物的词条检查装置的结构示意图,如图4所示,本实施例提供的装置在本申请实施例三提供的装置的基础上,进一步地,所述装置还包括:更新模块410、双备份模块420和维护模块430。更新模块410,用于在所述标识获取模块获取出版物的待检查词条的标识信息之前,获取出版物中发生变化的词条,并确定对应的变化类型。根据发生变化的各个词条的变化类型对内存数据库进行数据更新。其中,所述变化类型包括:内容变化、被删除和被添加。进一步地,所述更新模块410,具体用于:若单个词条的变化类型为内容变化,则对所述单个词条重新进行检查。若检查结果为存在异常,则删除内存数据库中所述单个词条对应的词条异常信息之后,插入对所述单个词条重新进行检查得到的新的词条异常信息。若检查结果为不存在异常,则直接删除内存数据库中所述单个词条对应的词条异常信息。所述更新模块410,还具体用于:若单个词条的变化类型为被删除,则直接删除内存数据库中所述单个词条对应的词条异常信息。所述更新模块410,还具体用于:若单个词条的变化类型为被添加,则对所述单个词条进行检查。若检查结果为存在异常,则将对所述单个词条进行检查得到的词条异常信息插入到内存数据库中。根据本发明的一个实施方式,所述装置还包括:双备份模块420,用于将内存数据库中的初始数据分别备份到磁盘的第一数据文件和第二数据文件中之后,定时将所述内存数据库中的数据备份覆盖所述第一数据文件,若备份覆盖所述第一数据文件成功,则将所述内存数据库中的数据备份覆盖所述第二数据文件,若备份覆盖所述第一数据文件不成功,则停止备份覆盖所述第二数据文件。根据本发明的一个实施方式,所述装置还包括:维护模块430,用于在系统每次维护重启后,读取所述第一数据文件,并判断所述第一数据文件是否异常,若否,则将所述第一数据文件写入内存数据库中,若是,则读取所述第二数据文件,并将所述第二数据文件写入内存数据库中。进一步地,所述维护模块430,具体用于:判断所述第一数据文件的数据量是否小于预设数据量,若所述第一数据文件的数据量小于预设数据量,则为异常,反之,则为正常。本实施例提供的装置可以执行图2所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。实施例五图5为本发明实施例五提供的电子设备的结构示意图,如图5所示,该电子设备,包括:存储器510,处理器520以及计算机程序。其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如本申请实施例一中的出版物的词条检查方法或本申请实施例二中的出版物的词条检查方法。相关说明可以对应参见图1至图2的步骤所对应的相关描述和效果进行理解,此处不做过多赘述。实施例六本发明实施例六提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行以实现如本申请实施例一中的出版物的词条检查方法或本申请实施例二中的出版物的词条检查方法。在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1