一种用于对电子文本进行纠错的方法和装置与流程

文档序号:12719543阅读:224来源:国知局
一种用于对电子文本进行纠错的方法和装置与流程
本发明的实施方式涉及电子书籍领域,更具体地,本发明的实施方式涉及用于对电子文本进行纠错的方法和装置。
背景技术
:本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。目前,市场上出现了各种各样的移动终端,例如,手机、掌上电脑、移动上网终端等,用户使用这些移动终端可以随时随地阅读图书、杂志、动漫、报纸新闻等电子书籍。电子书籍又称为e-book,简单地说,所谓的电子书籍是指通过特殊的阅读软件,以电子文件的形式下载至储存阅读器的移动终端的书籍,是一种传统纸质图书的可选替代品。现有技术中,用户在阅读某本电子书籍时,若在此电子书籍的正文中发现错误内容,通常会长按选中并提交“纠错”信息。具体做法是:用户长按电子书籍的正文,弹出操作菜单项,如图1A所示,正文内容中的“发射”错误,用户选择“发射”,并长按正文内容时,弹出操作菜单项,用户点击图1A中所示的“纠错”选项,弹出“纠错”选项下的具体错误类别,如图1B所示,用户从图1B所示的具体错误类别中选择某个错误类别后提交,如选择“错字漏字”选项,客户端会根据网络提交情况给予用户相关反馈,如提示“提交成功”,如图1C所示。用户提交纠错信息后,客户端会将此类纠错信息传到后台进行汇总,待编辑人员挨个审核后再进行人工修订,最终将修订后的内容重新发布;此后,用户再看到的正文内容就是修订后的正文内容了。技术实现要素:现有技术中,纠错信息汇总到后台后,编辑人员人工进行修订,由于编辑人员需要时间来处理这些纠错信息,因此不能及时地给用户看到修订后的正确内容,存在纠错耗时较长、效率较低的缺陷,这是非常令人烦恼的过程。为此,非常需要一种改进的用于对电子文本进行纠错的方法和装置,以解决现有技术中存在的纠错耗时较长、效率较低的缺陷。在本上下文中,本发明的实施方式提供一种用于对电子文本进行纠错的方法和装置。在本发明实施方式的第一方面中,提供了一种用于对电子文本进行纠错的方法,应用于服务器端,包括:接收客户端对于电子文本提交的纠错信息;统计对于电子文本中相同内容的相同纠错信息;以及响应于对于电子文本中相同内容的相同纠错信息的数量大于预先定义的阈值,利用所述相同纠错信息中的改正文本替换所述相同内容中的相应文本。在一个实施例中,根据本发明的上述实施例所述的方法,其中所述统计对于电子文本中相同内容的相同纠错信息的步骤包括:将从不同标识ID的客户端接收的所针对的内容至少部分重合并且改正文本至少部分重合的纠错信息统计为对于电子文本中相同内容的相同纠错信息。在一些实施例中,根据本发明的上述任一实施例所述的方法,其中利用所述相同纠错信息中的改正文本替换所述相同内容中的相应文本包括:将至少部分重合的纠错信息中的重合纠错信息与电子文本进行对应,获得所述相同内容中的相应文本;以及将所述重合纠错信息作为改正文本替换所述相同内容中的相应文本。在一些实施例中,根据本发明的上述任一实施例所述的方法,其中客户端对于电子文本提交的纠错信息包括:客户端ID、电子文本ID、段落ID、内容在段落中的位置、改正文本中的一项或多项。在一些实施例中,根据本发明的上述任一实施例所述的方法,还包括:将利用所述改正文本进行替换后得到的电子文本发送至客户端。在本发明实施方式的第二方面中,提供了一种用于对电子文本进行纠错的装置,应用于服务器端,包括:接收模块,用于接收客户端对于电子文本提交的纠错信息;统计模块,用于统计对于电子文本中相同内容的相同纠错信息;以及替换模块,用于响应于对于电子文本中相同内容的相同纠错信息的数量大于预先定义的阈值,利用所述相同纠错信息中的改正文本替换所述相同内容中的相应文本。在一个实施例中,根据本发明的上述实施例所述的装置,其中所述统计模块将从不同标识ID的客户端接收的所针对的内容至少部分重合并且改正文本至少部分重合的纠错信息统计为对于电子文本中相同内容的相同纠错信息。在一些实施例中,根据本发明的上述任一实施例所述的装置,其中所述统计模块将至少部分重合的纠错信息中的重合纠错信息与电子文本进行对应,获得所述相同内容中的相应文本;并且所述替换模块将所述重合纠错信息作为改正文本替换所述相同内容中的相应文本。在一些实施例中,根据本发明的上述任一实施例所述的装置,其中客户端对于电子文本提交的纠错信息包括:客户端ID、电子文本ID、段落ID、内容在段落中的位置、改正文本中的一项或多项。在一些实施例中,根据本发明的上述任一实施例所述的装置,还包括发送模块,用于将利用所述改正文本进行替换后得到的电子文本发送至客户端。在本发明实施方式的第三方面中,提供了一种用于对电子文本进行纠错的方法,应用于客户端,包括:接收对于电子文本的纠错信息;将所述纠错信息发送至服务器端;以及接收服务器端在对于电子文本中相同内容的相同纠错信息的数量大于预先定义的阈值的情况下、利用所述相同纠错信息中的改正文本替换所述相同内容中的相应文本后得到的电子文本。在一个实施例中,根据本发明的上述实施例所述的方法,其中所述接收对于电子文本的纠错信息的步骤包括:响应于对于电子文本中的内容和纠错功能的选择,提供输入错误类型和改正文本的界面,并且接收所输入的错误类型和改正文本。在一些实施例中,根据本发明的上述任一实施例所述的方法,其中所述电子文本中相同内容的相同纠错信息为来自不同标识ID的客户端的所针对的内容至少部分重合并且改正文本至少部分重合的纠错信息。在一些实施例中,根据本发明的上述任一实施例所述的的方法,其中所述对于电子文本的纠错信息包括:客户端ID、电子文本ID、段落ID、内容在段落中的位置、改正文本中的一项或多项。在本发明实施方式的第四方面中,提供了一种用于对电子文本进行纠错的装置,应用于客户端,包括:接收模块,用于接收对于电子文本的纠错信息;发送模块,用于将所述纠错信息发送至服务器端;以及所述接收模块还用于,接收服务器端在对于电子文本中相同内容的相同纠错信息的数量大于预先定义的阈值的情况下、利用所述相同纠错信息中的改正文本替换所述相同内容中的相应文本后得到的电子文本。在一个实施例中,根据本发明的上述实施例所述的装置,所述接收模块包括选择操作接收模块、界面呈现模块和错误类型和文本接收模块,其中:所述选择操作接收模块,用于接收对于电子文本中的内容和纠错功能的选择;所述界面呈现模块,用于响应于对于电子文本中的内容和纠错功能的选择,提供输入错误类型和改正文本的界面;所述错误类型和文本接收模块,用于接收所输入的错误类型和改正文本。在一些实施例中,根据本发明的上述任一实施例所述的装置,其中所述电子文本中相同内容的相同纠错信息为来自不同标识ID的客户端的所针对的内容至少部分重合并且改正文本至少部分重合的纠错信息。在一些实施例中,根据本发明的上述任一实施例所述的装置,其中所述对于电子文本的纠错信息包括:客户端ID、电子文本ID、段落ID、内容在段落中的位置、改正文本中的一项或多项。本发明实施例中,提出一种用于对电子文本进行纠错的方法,应用于服务器端,包括:接收客户端对于电子文本提交的纠错信息;统计对于电子文本中相同内容的相同纠错信息;以及响应于对于电子文本中相同内容的相同纠错信息的数量大于预先定义的阈值,利用所述相同纠错信息中的改正文本替换所述相同内容中的相应文本;在该方案中,当相同内容的“相同纠错信息”的数量达到预先定义的阈值后,服务器端自动根据相同纠错信息中的改正文本进行内容更新,具体为利用所述相同纠错信息中的改正文本替换所述相同内容中的相应文本,这样,用户能及时查看到修改后的内容,而不是必须等到编辑人员在后台处理后才能看到,因此,降低记录纠错所耗费的时长,提高了纠错效率。附图说明通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:图1A示意性地示出了现有技术中长按正文内容的示意图;图1B示意性地示出了现有技术中“纠错”选项的示意图;图1C示意性地示出了现有技术中“纠错”提交成功后的示意图;图1D示意性地示出了本发明实施例中改正文本输入界面的示意图;图2A示意性地示出了根据本发明实施例的用于对电子文本进行纠错的一种方法流程图;图2B示意性地示出了根据本发明实施例的发生错误的正文内容的示意图;图3示意性地示出了根据本发明实施例的用于对电子文本进行纠错的另一种方法流程图;图4示意性地示出了根据本发明实施例的用于对电子文本进行纠错的装置的一种示意图;图5示意性地示出了根据本发明实施例的用于对电子文本进行纠错的装置的另一种示意图;图6示意性地示出了根据本发明实施例的用于对电子文本进行纠错的装置的另一种示意图;图7示意性地示出了根据本发明实施例的用于对电子文本进行纠错的装置的另一种示意图;在附图中,相同或对应的标号表示相同或对应的部分。具体实施方式下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。本领域技术人员知道,本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。根据本发明的实施方式,提出了一种用于对电子文本进行纠错的方法和设备。下面对本发明实施例中可能用到的技术术语进行简单描述。APP客户端:可以指基于手机操作系统的应用,例如iPhone版的网易云阅读。用户打开APP客户端中某个界面,承载APP客户端的移动终端发送请求到产品服务器,产品服务器返回数据,并呈现给用户。用户在APP客户端的界面上进行输入操作,承载APP客户端的移动终端发送数据到产品服务器,产品服务器存储数据。正文:可以指纸质书籍的电子版,可由文字、图片、视频等媒体形式组成,在APP客户端或Wap网页呈现给用户,包括网络小说、出版类书籍、杂志、漫画等。篇幅较长的内容,可左右翻页阅读或直接上下滚动阅读。读者:可以指阅读书籍或文章的用户,读者可发表与电子书籍的相关评论。原创类书籍:可以指未经过出版社整合出版,直接通过互联网发布的按章节连载的电子书籍。一般按字数多少定价,读者按照章节付费。出版类书籍:可以指由出版社正式发布的纸质书。纠错,即纠正错误,对于电子阅读类的APP,多用于电子书籍正文中的菜单操作项中,以供用户提交错误内容。下面参考本发明的若干代表性实施方式,详细阐释本发明的原理和精神。在本文中,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。下面参考本发明的若干代表性实施方式,详细阐释本发明的原理和精神。发明概述本发明人发现,用户提交纠错信息后,服务器可以自动统计相同内容被纠正的相同错误的次数,当发现对相同内容的相同纠错信息的数量达到预先定义的阈值时,自动利用相同纠错信息中的改正文本替换出错的文本,用户可以及时看到正确的文本内容,不需要编辑人员在后台对出错的文本内容人工筛选、修订,进而降低纠错所耗费的时长,提高纠错的效率。在介绍了本发明的基本原理之后,下面具体介绍本发明的各种非限制性实施方式。应用场景总览如图1A所示,正文内容中的“发射”用词不当,用户1选择“发射”,并长按正文内容时,弹出操作菜单项,如图1A所示,用户点击图1A中所示的“纠错”选项,弹出“纠错”选项下的具体错误类别,如图1B所示,用户从图1B所示的具体错误类别中选择某个错误类别后,如选择“错字漏字”选项,弹出改正文本输入界面,如图1D所示,用户在改正文本输入界面中输入改正后的文本“发现”并提交,客户端会根据网络提交情况给予用户相关反馈,如提示“提交成功”,如图1C所示。前面描述的是用户1纠错的情况,如果多个用户都针对“发射”提交改正后的文本“发现”的话,服务器统计针对“发射”修改后的“发现”的上传次数大于预先定义的阈值时,主动把该处出现的“发射”替换为“发现”,不需要编辑人员在后台处理,因此,降低了纠错所耗费的时长,提高了纠错的效率。示例性方法下面结合图1A-1D的应用场景,参考图2来描述根据本发明示例性实施方式的用于对电子文本进行纠错的方法。需要注意的是,上述应用场景仅是为了便于理解本发明的精神和原理而示出,本发明的实施方式在此方面不受任何限制。相反,本发明的实施方式可以应用于适用的任何场景。参阅图2A所示,本发明实施例,提出一种用于对电子文本进行纠错的方法20,应用于服务器端,包括:步骤200:接收客户端对于电子文本提交的纠错信息;步骤210:统计对于电子文本中相同内容的相同纠错信息;以及步骤220:响应于对于电子文本中相同内容的相同纠错信息的数量大于预先定义的阈值,利用所述相同纠错信息中的改正文本替换所述相同内容中的相应文本。步骤200-220所描述的方法可以参照应用场景总览中的内容进行说明,在此不再进行详述。本发明实施例中,可选地,其中所述统计对于电子文本中相同内容的相同纠错信息的步骤包括:将从不同ID(Identity,标识)的客户端接收的所针对的内容至少部分重合并且改正文本至少部分重合的纠错信息统计为对于电子文本中相同内容的相同纠错信息。也就是说统计来自不同客户端的相同纠错信息需要满足两个条件,一个条件是:所针对的内容需要至少部分重合;另一个条件是:改正文本需要至少部分重合,两个条件都满足的情况下统计为对于相同内容的相同纠错信息。需要说明的是,在优选的实施例中,一个ID提交的对于相同内容的相同纠错信息只算一次,例如,用户1针对图1A中的“发射”提交了3次改正后的文本“发现”,但是服务器端只统计为1次。本发明实施例中,用户提交纠错信息后,服务器端会存储该纠错信息所对应的正文内容的一些字段,如正文内容所属的书籍ID、正文内容所处的章节ID等,具体可以如表1所示。表1存储的字段字段类型说明书籍ID字符串无章节ID字符串无Note-startindex字符记录某条标注开始的地方Note-endindex字符记录某条标注结束的地方表1中的Note-startindex和Note-endindex可以采用图2B进行说明,图2B中的A1为针对A1-A2这条标注的Note-startindex,图2B中的A2为针对A1-A2这条标注的Note-endindex,图2B中的B1为针对B1-B2这条标注的Note-startindex,图2B中的B2为针对B1-B2这条标注的Note-endindex。本发明实施例中,可选地,其中利用所述相同纠错信息中的改正文本替换所述相同内容中的相应文本包括:将至少部分重合的纠错信息中的重合纠错信息与电子文本进行对应,获得所述相同内容中的相应文本;以及将所述重合纠错信息作为改正文本替换所述相同内容中的相应文本。本发明实施例中,其中客户端对于电子文本提交的纠错信息包括:客户端ID、电子文本ID、段落ID、内容在段落中的位置、改正文本中的一项或多项。服务器端根据客户端ID可以避免重复统计对于电子文本中相同内容的相同纠错信息的数量,根据电子文本ID、段落ID、内容在段落中的位置可以确定出正文中的哪部分内容出现问题,后续可以采用改正文本替换出现问题的部分。例如,如图2B所示,电子文本的重合部分B1-A2为出现问题的部分,即相同内容中的相应文本。在另一个实施例中,统计对于电子文本中相同内容的相同纠错信息也可以为电子文本的内容选择完全相同,以及提交的纠错信息中的改正文本完全相同的情况。在另一个实施例中,统计对于电子文本中相同内容的相同纠错信息中的相同纠错信息也可以为纠错信息中的改正文本被识别为近义词的情况,利用所述相同纠错信息中的改正文本替换所述相同内容中的相应文本可以包括采用近义词中出现次数较多的改正文本替换相同内容中的相应文本。当然,在实际应用中,还有其他方式,在此不再进行详述。由于服务器对发生错误的部分改正的目的是后续用户在查看时可以查看到正确的内容,因此,进一步的,还包括:将利用所述改正文本进行替换后得到的电子文本发送至客户端。这样,用户就可以看到正确的内容了。在该方案中,服务器端自动将错误内容进行修订、替换,无需编辑人员再进行人工查找和替换的操作,大大降低了纠错的时间,提高了纠错的效率,同时,由于这种方式无需依赖于编辑人员的操作,缩短了用户看到正确内容的等待时间,使用户能更快地看到纠错后的正确内容,从而还可以提高用户体验。参阅图3所示,本发明实施例中,还提出一种用于对电子文本进行纠错的方法30,应用于客户端,包括:步骤300:接收对于电子文本的纠错信息;步骤310:将所述纠错信息发送至服务器端;以及步骤320:接收服务器端在对于电子文本中相同内容的相同纠错信息的数量大于预先定义的阈值的情况下、利用所述相同纠错信息中的改正文本替换所述相同内容中的相应文本后得到的电子文本。步骤300-320所描述的方法可以参照应用场景总览中的内容进行说明,在此不再进行详述。本发明实施例中,可选地,其中所述接收对于电子文本的纠错信息的步骤包括:响应于对于电子文本中的内容和纠错功能的选择,提供输入错误类型和改正文本的界面,并且接收所输入的错误类型和改正文本。例如,用户在图1B所示的界面中选择“错字漏字”选项,客户端呈现输入错误类型和改正文本的界面,如图1D所示,用户可以在图1D所示的界面中输入错误类型和改正文本“发现”。本发明实施例中,可选地,其中所述电子文本中相同内容的相同纠错信息为来自不同标识ID的客户端的所针对的内容至少部分重合并且改正文本至少部分重合的纠错信息。也就是说来自不同客户端的相同内容的相同纠错信息需要满足两个条件,一个条件是:所针对的内容需要至少部分重合;另一个条件是:改正文本需要至少部分重合,两个条件都满足的情况下来自不同客户端的纠错信息才是相同内容的相同纠错信息。本发明实施例中,可选地,其中所述对于电子文本的纠错信息包括:客户端ID、电子文本ID、段落ID、内容在段落中的位置、改正文本中的一项或多项。这样,服务器端根据客户端ID可以避免重复统计对于电子文本中相同内容的相同纠错信息的数量,根据电子文本ID、段落ID、内容在段落中的位置可以确定出正文中的哪部分内容出现问题,后续可以采用改正文本替换出现问题的部分。例如,如图2B所示,电子文本的重合部分B1-A2为出现问题的部分,即相同内容中的相应文本。在另一个实施例中,统计对于电子文本中相同内容的相同纠错信息也可以为电子文本的内容选择完全相同,以及提交的纠错信息中的改正文本完全相同的情况。在另一个实施例中,统计对于电子文本中相同内容的相同纠错信息中的相同纠错信息也可以为纠错信息中的改正文本被识别为近义词的情况,利用所述相同纠错信息中的改正文本替换所述相同内容中的相应文本可以包括采用近义词中出现次数较多的改正文本替换相同内容中的相应文本。当然,在实际应用中,还有其他方式,在此不再进行详述。在该方案中,服务器端自动将错误内容进行修订、替换,无需编辑人员再进行人工查找和替换的操作,大大降低了纠错的时间,提高了纠错的效率,同时,由于这种方式无需依赖于编辑人员的操作,缩短了用户看到正确内容的等待时间,使用户能更快地看到纠错后的正确内容,从而还可以提高用户体验。示例性设备在介绍了本发明示例性实施方式的方法之后,接下来,参考图4对本发明示例性实施方式的、用于对电子文本进行纠错的装置40进行描述。参阅图4所示,提出一种用于对电子文本进行纠错的装置40,应用于服务器端,包括:接收模块400,用于接收客户端对于电子文本提交的纠错信息;统计模块410,用于统计对于电子文本中相同内容的相同纠错信息;以及替换模块420,用于响应于对于电子文本中相同内容的相同纠错信息的数量大于预先定义的阈值,利用所述相同纠错信息中的改正文本替换所述相同内容中的相应文本。装置40所描述的方案可以参照应用场景总览中的内容进行说明,在此不再进行详述。本发明实施例中,可选地,其中所述统计模块410将从不同标识ID的客户端接收的所针对的内容至少部分重合并且改正文本至少部分重合的纠错信息统计为对于电子文本中相同内容的相同纠错信息。也就是说统计来自不同客户端的相同纠错信息需要满足两个条件,一个条件是:所针对的内容需要至少部分重合;另一个条件是:改正文本需要至少部分重合,两个条件都满足的情况下统计为对于相同内容的相同纠错信息。需要说明的是一个ID提交的对于相同内容的相同纠错信息只算一次,例如,用户1针对图1A中的“发射”提交了3次改正后的文本“发现”,但是服务器端只统计为1次。本发明实施例中,用户提交纠错信息后,服务器端会存储该纠错信息所对应的正文内容的一些字段,如正文内容所属的书籍ID、正文内容所处的章节ID等,具体可以如表1所示。表1中的Note-startindex和Note-endindex可以采用图2B进行说明,图2B中的A1为针对A1-A2这条标注的Note-startindex,图2B中的A2为针对A1-A2这条标注的Note-endindex,图2B中的B1为针对B1-B2这条标注的Note-startindex,图2B中的B2为针对B1-B2这条标注的Note-endindex。本发明实施例中,可选地,其中所述统计模块410将至少部分重合的纠错信息中的重合纠错信息与电子文本进行对应,获得所述相同内容中的相应文本;并且所述替换模块420将所述重合纠错信息作为改正文本替换所述相同内容中的相应文本。本发明实施例中,可选地,其中客户端对于电子文本提交的纠错信息包括:客户端ID、电子文本ID、段落ID、内容在段落中的位置、改正文本中的一项或多项。服务器端根据客户端ID可以避免重复统计对于电子文本中相同内容的相同纠错信息的数量,根据电子文本ID、段落ID、内容在段落中的位置可以确定出正文中的哪部分内容出现问题,后续可以采用改正文本替换出现问题的部分。例如,如图2B所示,电子文本的重合部分B1-A2为出现问题的部分,即相同内容中的相应文本。在另一个实施例中,统计对于电子文本中相同内容的相同纠错信息也可以为电子文本的内容选择完全相同,以及提交的纠错信息中的改正文本完全相同的情况。在另一个实施例中,统计对于电子文本中相同内容的相同纠错信息中的相同纠错信息也可以为纠错信息中的改正文本被识别为近义词的情况,利用所述相同纠错信息中的改正文本替换所述相同内容中的相应文本可以包括采用近义词中出现次数较多的改正文本替换相同内容中的相应文本。当然,在实际应用中,还有其他方式,在此不再进行详述。由于服务器对发生错误的部分改正的目的是后续用户在查看时可以查看到正确的内容,因此,进一步的,还包括发送模块430,用于将利用所述改正文本进行替换后得到的电子文本发送至客户端。这样,用户就可以看到正确的内容了。在该方案中,服务器端自动将错误内容进行修订、替换,无需编辑人员再进行人工查找和替换的操作,大大降低了纠错的时间,提高了纠错的效率,同时,由于这种方式无需依赖于编辑人员的操作,缩短了用户看到正确内容的等待时间,使用户能更快地看到纠错后的正确内容,从而还可以提高用户体验。参阅图5所示,本发明实施例中,还提出一种用于对电子文本进行纠错的装置50,应用于客户端,包括:接收模块500,用于接收对于电子文本的纠错信息;发送模块510,用于将所述纠错信息发送至服务器端;以及所述接收模块500还用于,接收服务器端在对于电子文本中相同内容的相同纠错信息的数量大于预先定义的阈值的情况下、利用所述相同纠错信息中的改正文本替换所述相同内容中的相应文本后得到的电子文本。装置50所描述的方案可以参照应用场景总览中的内容进行说明,在此不再进行详述。本发明实施例中,可选地,所述接收模块500包括选择操作接收模块500A、界面呈现模块500B和错误类型和文本接收模块500C,其中:所述选择操作接收模块500A,用于接收对于电子文本中的内容和纠错功能的选择;所述界面呈现模块500B,用于响应于对于电子文本中的内容和纠错功能的选择,提供输入错误类型和改正文本的界面;所述错误类型和文本接收模块500C,用于接收所输入的错误类型和改正文本。例如,用户在图1B所示的界面中选择“错字漏字”选项,客户端呈现输入错误类型和改正文本的界面,如图1D所示,用户可以在图1D所示的界面中输入错误类型和改正文本“发现”。本发明实施例中,可选地,其中所述电子文本中相同内容的相同纠错信息为来自不同标识ID的客户端的所针对的内容至少部分重合并且改正文本至少部分重合的纠错信息。也就是说来自不同客户端的相同内容的相同纠错信息需要满足两个条件,一个条件是:所针对的内容需要至少部分重合;另一个条件是:改正文本需要至少部分重合,两个条件都满足的情况下来自不同客户端的纠错信息才是相同内容的相同纠错信息。本发明实施例中,可选地,其中所述对于电子文本的纠错信息包括:客户端ID、电子文本ID、段落ID、内容在段落中的位置、改正文本中的一项或多项。这样,服务器端根据客户端ID可以避免重复统计对于电子文本中相同内容的相同纠错信息的数量,根据电子文本ID、段落ID、内容在段落中的位置可以确定出正文中的哪部分内容出现问题,后续可以采用改正文本替换出现问题的部分。例如,如图2B所示,电子文本的重合部分B1-A2为出现问题的部分,即相同内容中的相应文本。在另一个实施例中,统计对于电子文本中相同内容的相同纠错信息也可以为电子文本的内容选择完全相同,以及提交的纠错信息中的改正文本完全相同的情况。在另一个实施例中,统计对于电子文本中相同内容的相同纠错信息中的相同纠错信息也可以为纠错信息中的改正文本被识别为近义词的情况,利用所述相同纠错信息中的改正文本替换所述相同内容中的相应文本可以包括采用近义词中出现次数较多的改正文本替换相同内容中的相应文本。当然,在实际应用中,还有其他方式,在此不再进行详述。在该方案中,服务器端自动将错误内容进行修订、替换,无需编辑人员再进行人工查找和替换的操作,大大降低了纠错的时间,提高了纠错的效率,同时,由于这种方式无需依赖于编辑人员的操作,缩短了用户看到正确内容的等待时间,使用户能更快地看到纠错后的正确内容,从而还可以提高用户体验。示例性设备在介绍了本发明示例性实施方式的方法和装置之后,接下来,介绍根据本发明的另一示例性实施方式的用于对电子文本进行纠错的设备。所属
技术领域
的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。在一些可能的实施方式中,根据本发明的用于对电子文本进行纠错的设备可以至少包括至少一个处理单元、以及至少一个存储单元。其中,所述存储单元存储有程序代码,当所述程序代码被所述处理单元执行时,使得所述处理单元执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的用于对电子文本进行纠错的方法中的步骤。例如,所述处理单元可以执行如图2A中所示的步骤200:接收客户端对于电子文本提交的纠错信息;步骤210:统计对于电子文本中相同内容的相同纠错信息;以及步骤220:响应于对于电子文本中相同内容的相同纠错信息的数量大于预先定义的阈值,利用所述相同纠错信息中的改正文本替换所述相同内容中的相应文本。又例如,所述处理单元可以执行如图3中所示的步骤300:接收对于电子文本的纠错信息;步骤310:将所述纠错信息发送至服务器端;以及步骤320:接收服务器端在对于电子文本中相同内容的相同纠错信息的数量大于预先定义的阈值的情况下、利用所述相同纠错信息中的改正文本替换所述相同内容中的相应文本后得到的电子文本。下面参照图6来描述根据本发明的这种实施方式的用于对电子文本进行纠错的设备60。图6显示的用于对电子文本进行纠错的设备60仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。如图6所示,用于对电子文本进行纠错的设备60以通用计算设备的形式表现。用于对电子文本进行纠错的设备60的组件可以包括但不限于:上述至少一个处理单元16、上述至少一个存储单元28、连接不同系统组件(包括存储单元28和处理单元16)的总线18。总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器、外围总线、图形加速端口、处理器或者使用多种总线结构中的任意总线结构的局域总线。存储单元28可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)31和/或高速缓存存储器32,还可以进一步只读存储器(ROM)34。存储单元28还可以包括具有一组(至少一个)程序模块42的程序/实用工具41,这样的程序模块42包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。用于对电子文本进行纠错的设备60也可以与一个或多个外部设备14(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该用于对电子文本进行纠错的设备60交互的设备通信,和/或与使得该用于对电子文本进行纠错的设备60能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,用于对电子文本进行纠错的设备60还可以通过网络适配器21与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器21通过总线18与用于对电子文本进行纠错的设备60的其它模块通信。应当明白,尽管图中未示出,可以结合用于对电子文本进行纠错的设备60使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。示例性程序产品在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在设备上运行时,所述程序代码用于使所述设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的用于对电子文本进行纠错的方法中的步骤,例如,所述设备可以执行如图2A中所示的步骤200:接收客户端对于电子文本提交的纠错信息;步骤210:统计对于电子文本中相同内容的相同纠错信息;以及步骤220:响应于对于电子文本中相同内容的相同纠错信息的数量大于预先定义的阈值,利用所述相同纠错信息中的改正文本替换所述相同内容中的相应文本。例如,所述设备可以执行如图3中所示的步骤300:接收对于电子文本的纠错信息;步骤310:将所述纠错信息发送至服务器端;以及步骤320:接收服务器端在对于电子文本中相同内容的相同纠错信息的数量大于预先定义的阈值的情况下、利用所述相同纠错信息中的改正文本替换所述相同内容中的相应文本后得到的电子文本。所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。如图7所示,描述了根据本发明的实施方式的用于对电子文本进行纠错的程序产品70,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆、RF等等,或者上述的任意合适的组合。可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言-诸如Java、C++等,还包括常规的过程式程序设计语言-诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。应当注意,尽管在上文详细描述中提及了用于对电子文本进行纠错的设备的若干装置或子装置,但是这种划分仅仅并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多装置的特征和功能可以在一个装置中具体化。反之,上文描述的一个装置的特征和功能可以进一步划分为由多个装置来具体化。此外,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。虽然已经参考若干具体实施方式描述了本发明的精神和原理,但是应该理解,本发明并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1