用于稿件中的职务信息的检查方法和装置制造方法

文档序号:6488761阅读:176来源:国知局
用于稿件中的职务信息的检查方法和装置制造方法
【专利摘要】本发明提供了一种用于稿件中的职务信息的检查方法,包括:利用人名数据库对稿件进行全文检索,以确定稿件中的人名;以确定的人名检索职务数据库,以确定人名所关联的职务;利用确定的职务判断人名在稿件中的相关信息是否正确。本发明还提供了一种用于稿件中的职务信息的检查装置,包括:人名模块,用于利用人名数据库对稿件进行全文检索,以确定稿件中的人名;职务模块,用于以确定的人名检索职务数据库,以确定人名所关联的职务;判断模块,用于利用确定的职务判断人名在稿件中的相关信息是否正确。本发明提高了稿件质量。
【专利说明】用于稿件中的职务信息的检查方法和装置
【技术领域】
[0001]本发明涉及信息处理领域,具体而言,涉及一种用于稿件中的职务信息的检查方法和装置。
【背景技术】
[0002]稿件中经常出现人名及其职务信息,在稿件的编辑过程中要求该人名的职务信息,并且当多个人名并列出现时,应当按照其职务的排序将这些人名进行排序。
[0003]目前稿件职务校对的工作可以采取人工校对方法,一般包括以下步骤:
[0004](I)从采编系统中打印需要校对的稿件。
[0005](2)人工阅读该纸面稿件,遇到有疑问的领导人职务,手动去查找相关的职务信息,或者咨询经验丰富的校对人员。
[0006](3)对错误的职务进行手工批注修改。
[0007](4)手动把修改的内容录入到采编系统中。
[0008]人工校对的校对过程过多地依赖校对人员的知识经验,容易出现失误,导致报纸出现错误的职务信息,影响出版物的质量。

【发明内容】

[0009]本发明旨在提供一种用于稿件中的职务信息的检查方法和装置,以取代人工校对稿件中的人名信息。
[0010]根据本发明的一个方面,提供了一种用于稿件中的职务信息的检查方法,包括:利用人名数据库对稿件进行全文检索,以确定稿件中的人名;以确定的人名检索职务数据库,以确定人名所关联的职务;利用确定的职务判断人名在稿件中的相关信息是否正确。
[0011]根据本发明的另一方面,提供了一种用于稿件中的职务信息的检查装置,包括:人名模块,用于利用人名数据库对稿件进行全文检索,以确定稿件中的人名;职务模块,用于以确定的人名检索职务数据库,以确定人名所关联的职务;判断模块,用于利用确定的职务判断人名在稿件中的相关息是否正确。
[0012]本发明的用于稿件中的职务信息的检查方法和装置因为采用数据库来检查人名信息,所以克服了人工校对的失误问题,进而提高了稿件质量。
【专利附图】

【附图说明】
[0013]此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0014]图1示出了根据本发明实施例的用于稿件中的职务信息的检查方法的流程图;
[0015]图2示出了根据本发明实施例的用于稿件中的职务信息的检查装置的示意图。
【具体实施方式】[0016]下面将参考附图并结合实施例,来详细说明本发明。
[0017]图1示出了根据本发明实施例的用于稿件中的职务信息的检查方法的流程图,包括:
[0018]步骤S10,利用人名数据库对稿件进行全文检索,以确定稿件中的人名;
[0019]步骤S20,以确定的人名检索职务数据库,以确定人名所关联的职务;
[0020]步骤S30,利用确定的职务判断人名在稿件中的相关/[目息是否正确。
[0021]现有技术中通过人工校对来检查稿件中的人名职务信息,而本实施例中,利用人名数据库和职务数据库来分析稿件中的人名职务信息,从而整个过程实现了软件自动化,所以克服了人工校对的失误问题,进而提高了稿件质量。
[0022]优选地,本检查方法还包括:预先创建人名数据库,其中包括多条记录,各条记录包括用于记载人名的字段;其中,利用人名数据库对稿件进行全文检索包括:将各条记录中记载的人名与稿件的全文进行匹配;如果在稿件中匹配到与记录中记载的人名相同的词,则将匹配到的词确定为稿件中的人名。本实施例的人名数据库方案比较简单,容易实现。通过对人名数据库的维护,还可以实现人名数据库的动态更新。需要说明的是,本文中的词是指一个语言单位,可以是构成单词的一个字符,也可以是构成单词的多个字符,而且字符可以是标点,也可以是文字。
[0023]优选地,本检查方法还包括:预先创建职务数据库,其中包括多条记录,各条记录包括用于记载人名的第一字段和用于记载职务的第二字段;其中,以确定的人名检索职务数据库包括:将确定的人名匹配各条记录;如果在记录的第一字段中匹配到人名,则提取当前记录中的第二字段中的职务;将提取的职务确定为人名所关联的职务。本实施例的职务数据库方案比较简单,容易实现。通过对职务数据库的维护,还可以实现职务数据库的动态更新。例如,校对人员如果发现职务数据库中的职务信息有误,可以手动修改职务数据库中的相关字段。
[0024]优选地,步骤S30包括:
[0025]提取人名在稿件中相邻的词;判断相邻的词是否为职务;
[0026]如果相邻的词是职务,则确定相邻的词是否匹配以职务数据库确定的职务;
[0027]如果不匹配,则标注相邻的词。
[0028]本实施例通过简单的匹配操作,即可自动地判断职务信息是否准确,显著地节省了校对人员的工作量。例如稿件中的文字为“部长张三”,将“部长”与职务数据库进行匹配,发现职务数据库中的“张三”记录的第二字段是“副部长”,即可自动地标注“部长张三”,例如显示为红字,从而提醒校对人员判断稿件是否有误。
[0029]优选地,预先创建职务数据库,其中包括多条记录,各条记录包括:用于记载人名的第一字段、用于记载职务的第二字段;以及用于记载职务的索引的第三字段,索引的大小与职务的级别线性相关;其中,以确定的人名检索职务数据库,在确定人名所关联的职务的同时,还确定所关联的职务的索引。本优选实施例将职务的级别在职务数据库中予以数字化,从而可以对职务自动检查级别信息。
[0030]优选地,步骤S30包括:确定稿件中为并列关系的人名;判断并列的人名的索引在并列关系中的先后排序是否符合人名所关联的职级为从高到低;如果不符合,则标注并列的人名。因为职务的级别在职务数据库中已经数字化,所以通过对索引的排序,即可确定稿件中的人名是否按照职务级别予以排序。例如稿件中的文字为“局长李四、部长张三、科长王五”,在职务数据库中如果部长的索引是1、局长的索引是2、科长的索引是3,则上述文字得到的索引顺序是“2、1、3”,不符合“1、2、3”的顺序,本优选实施例可以自动地蓝字标注“局长李四、部长张三、科长王五”,从而提醒校对人员这段文字的人名是否排序有误。
[0031]优选地,并列关系为以下模式:职务1、职务2......职务ml人名1、职务1、职务
2......职务Hi2人名2........职务1、职务2......职务mn人名n,其中,η为大于等于2
的自然数吨,........mn均为非负整数,职务可有可无。例如,可以有以下几种:
[0032]I)领导人I
[0033]2)领导人I,领导人2
[0034]3)职务I领导人I
[0035]4)职务I,职务2领导人I
[0036]5)职务I,职务2领导人I,领导人2。
[0037]这包括了稿件中常见的人名次序。
[0038]优选地,确定稿件中为并列关系的人名包括:
[0039]Α)判断当前的人名在稿件中上文相邻的词;
[0040]B)如果无词或者词不是职务,则确定当前人名之前无并列的人名,结束当前人名的并列关系的判断;
[0041]C)如果词是标点符号或词是职务,则对在上文相邻的字符循环执行步骤B和C ;
[0042]D)如果词是人名,则将判断得到的人名加入并列关系,并以判断得到的人名作为当前的人名循环执行上述判断并列关系的步骤。
[0043]上述过程是简单的循环过程,很容易通过计算机变成来实现。
[0044]图2示出了根据本发明实施例的用于稿件中的职务信息的检查装置的示意图,包括:
[0045]人名模块10,用于利用人名数据库对稿件进行全文检索,以确定稿件中的人名;
[0046]职务模块20,用于以确定的人名检索职务数据库,以确定人名所关联的职务;
[0047]判断模块30,用于利用确定的职务判断人名在稿件中的相关信息是否正确。
[0048]本装置克服了人名职务人工校对的失误问题,进而提高了稿件质量。
[0049]优选地,判断模块30包括:提取模块,用于提取人名在稿件中相邻的词;职务判断模块,用于判断相邻的词是否为职务;匹配模块,用于如果相邻的词是职务,则确定相邻的词是否匹配以职务数据库确定的职务;标注模块,用于如果不匹配,则标注相邻的词。
[0050]本实施例中,利用人名数据库和职务数据库来分析稿件中的人名职务信息,从而整个过程实现了软件自动化,所以克服了人工校对的失误问题,进而提高了稿件质量。
[0051]优选地,预先创建职务数据库,其中包括多条记录,各条记录包括:用于记载人名的第一字段、用于记载职务的第二字段;以及用于记载职务的索引的第三字段,索引的大小与职务的级别线性相关;其中,职务在确定人名所关联的职务的同时,还确定所关联的职务的索引,判断模块30包括:并列模块,用于确定稿件中为并列关系的人名;排序模块,用于判断并列的人名的索引在并列关系中的先后排序是否符合人名所关联的职级为从高到低;标注模块,用于如果不符合,则标注并列的人名。
[0052]网站、出版物等各种稿件中往往会涉及领导人,通常领导人名字前面会带上领导人的职务。稿件中,领导人的职务错误或者排序混乱,会严重影响稿件的质量。从以上的描述中,可以看出,本发明实现了对稿件的人名职务信息的自动校对,从而提高了稿件质量。
[0053]显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
[0054]以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
【权利要求】
1.一种用于稿件中的职务信息的检查方法,其特征在于,包括: 利用人名数据库对稿件进行全文检索,以确定所述稿件中的人名; 以确定的所述人名检索职务数据库,以确定所述人名所关联的职务; 利用确定的所述职务判断所述人名在所述稿件中的相关信息是否正确。
2.根据权利要求1所述的方法,其特征在于,还包括:预先创建所述人名数据库,其中包括多条记录,所述各条记录包括用于记载人名的字段;其中,利用人名数据库对稿件进行全文检索包括: 将所述各条记录中记载的人名与所述稿件的全文进行匹配; 如果在所述稿件中匹配到与所述记录中记载的人名相同的词,则将所述匹配到的词确定为所述稿件中的人名。
3.根据权利要求1所述的方法,其特征在于,还包括:预先创建所述职务数据库,其中包括多条记录,所述各条记录包括用于记载人名的第一字段和用于记载职务的第二字段;其中,以确定的所述人名检索职务数据库包括: 将确定的所述人名匹配所述各条记录; 如果在所述记录的所述第一字段中匹配到所述人名,则提取当前所述记录中的第二字段中的职务; 将所述提取的职务确定为所述人名所关联的职务。
4.根据权利要求1所述的方法,其特征在于,利用确定的所述职务判断所述人名在所述稿件中的相关信息是否正确包括: 提取所述人名在所述稿件中相邻的词; 判断所述相邻的词是否为职务; 如果所述相邻的词是职务,则确定所述相邻的词是否匹配以所述职务数据库确定的职务; 如果不匹配,则标注所述相邻的词。
5.根据权利要求1所述的方法,其特征在于,预先创建所述职务数据库,其中包括多条记录,所述各条记录包括:用于记载人名的第一字段、用于记载职务的第二字段;以及用于记载所述职务的索引的第三字段,所述索引的大小与所述职务的级别线性相关;其中,以确定的所述人名检索职务数据库,在确定所述人名所关联的职务的同时,还确定所述所关联的职务的索引。
6.根据权利要求5所述的方法,其特征在于,利用确定的所述职务判断所述人名在所述稿件中的相关信息是否正确包括: 确定所述稿件中为并列关系的所述人名; 判断所述并列的人名的所述索引在所述并列关系中的先后排序是否符合所述人名所关联的职级为从高到低; 如果不符合,则标注所述并列的人名。
7.根据权利要求6所述的方法,其特征在于,所述并列关系为以下模式: 职务1、职务2......职务HI1人名1、职务1、职务2......职务m2人名2........职务.1、职务2......职务mn人名n, 其中,n为大于等于2的自然数........mn均为非负整数,职务可有可无。
8.根据权利要求7所述的方法,其特征在于,确定所述稿件中为并列关系的所述人名包括: A)判断当前的所述人名在所述稿件中上文相邻的词; B)如果无词或者词不是职务,则确定所述当前人名之前无并列的人名,结束所述当前人名的并列关系的判断; C)如果词是标点符号或词是职务,则对在上文相邻的字符循环执行步骤B和C; D)如果词是人名,则将所述判断得到的人名加入所述并列关系,并以所述判断得到的人名作为当前的所述人名循环执行上述判断并列关系的步骤。
9.一种用于稿件中的职务信息的检查装置,其特征在于,包括:人名模块,用于利用人名数据库对稿件进行全文检索,以确定所述稿件中的人名; 职务模块,用于以确定的所述人名检索职务数据库,以确定所述人名所关联的职务; 判断模块,用于利用确定的所述职务判断所述人名在所述稿件中的相关信息是否正确。
10.根据权利要求9所述的装置,其特征在于,所述判断模块包括:提取模块,用于提取所述人名在所述稿件中相邻的词; 职务判断模块,用于判断所述相邻的词是否为职务; 匹配模块,用于如果所述相邻的词是职务,则确定所述相邻的词是否匹配以所述职务数据库确定的职务;` 标注模块,用于如果不匹配,则标注所述相邻的词。
11.根据权利要求9所述的装置,其特征在于,预先创建所述职务数据库,其中包括多条记录,所述各条记录包括:用于记载人名的第一字段、用于记载职务的第二字段;以及用于记载所述职务的索引的第三字段,所述索引的大小与所述职务的级别线性相关;其中,所述职务在确定所述人名所关联的职务的同时,还确定所述所关联的职务的索引,所述判断模块包括: 并列模块,用于确定所述稿件中为并列关系的所述人名; 排序模块,用于判断所述并列的人名的所述索引在所述并列关系中的先后排序是否符合所述人名所关联的职级为从高到低; 标注模块,用于如果不符合,则标注所述并列的人名。
【文档编号】G06F17/30GK103678353SQ201210335592
【公开日】2014年3月26日 申请日期:2012年9月11日 优先权日:2012年9月11日
【发明者】周志扬, 朱建波 申请人:北京大学, 北大方正集团有限公司, 北京北大方正电子有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1