一种拼写检查方法及装置与流程

文档序号:12597357阅读:232来源:国知局
一种拼写检查方法及装置与流程

本发明涉及办公软件技术领域,特别涉及一种拼写检查方法及装置。



背景技术:

用户在使用办公软件制作或编辑文档的时候,经常会有针对文档内容进行拼写检查的需求,为满足用户的这种需求,办公软件为用户提供了对文档拼写检查的功能。

现有的一种拼写检查方法,是根据文档内容,确定该文档内容所使用的语言,然后调用所确定语言对应的词库对该文档内容进行拼写检查。

这种方法依赖于确定文档内容所使用的语言的准确度,因为有的语言即使属于不同种类,但其相似度较高,可能会导致确定文档内容所使用的语言时出现偏差,从而导致调用错误的词库,使得拼写检查的准确率低,用户体验较差。比如,西班牙语和英语属于不同种类的语言,但其有些单词很相近,都是由英文字母构成,对于使用西班牙语的文档,如果将其所使用的语言判断为英语,调用英语的词库对该文档内容进行拼写检查,会使得拼写检查的准确率低,用户体验较差。



技术实现要素:

为解决上述问题,本发明实施例公开了一种拼写检查方法及装置。技术方案如下:

一种拼写检查方法,包括:

接收用户针对目标文档的文档内容进行拼写检查的指令;

确定用于检查所述文档内容的至少一种第一语言;

针对确定的用于检查所述文档内容的每种第一语言,确定包含该第一语言的语言集合,所述语言集合中的每种语言均属于同一语系;分别调用所述语言集合中的每种语言对应的词库对所述文档内容中使用该第一语言的相应内容进 行拼写检查。

在本发明的一种具体实施方式中,所述确定用于检查所述文档内容的至少一种第一语言,包括:

接收用户输入的至少一种第一语言;

将接收到的所述至少一种第一语言确定为用于检查所述文档内容的第一语言。

在本发明的一种具体实施方式中,所述确定用于检查所述文档内容的至少一种第一语言,包括:

确定所述文档内容中每个词的字符编码;

根据每个词的字符编码,确定所述文档内容使用的每种第一语言;

将所述文档内容使用的每种第一语言确定为用于检查所述文档内容的第一语言。

在本发明的一种具体实施方式中,所述确定用于检查所述文档内容的至少一种第一语言,包括:

确定所述文档内容中每个词的字符编码;

根据每个词的字符编码,确定所述文档内容使用的每种第一语言;

针对所述文档内容使用的每种第一语言,确定在所述文档内容中使用该第一语言的词的数量与所述文档内容中所有的词的数量的比例;

根据所述文档内容使用的每种第一语言对应的比例,确定用于检查所述文档内容的至少一种第一语言。

在本发明的一种具体实施方式中,所述分别调用所述语言集合中的每种语言对应的词库对所述文档内容中使用该第一语言的相应内容进行拼写检查,包括:

分别调用所述语言集合中的每种语言对应的词库拼写检查所述文档内容中使用该第一语言的词、语句和段落中的至少一种。

在本发明的一种具体实施方式中,还包括:

输出针对所述文档内容的拼写检查结果。

一种拼写检查装置,包括:

指令接收模块,用于接收用户针对目标文档的文档内容进行拼写检查的指令;

语言确定模块,用于确定用于检查所述文档内容的至少一种第一语言;

集合确定模块,用于针对所述语言确定模块确定的用于检查所述文档内容的每种第一语言,确定包含该第一语言的语言集合,所述语言集合中的每种语言均属于同一语系;

拼写检查模块,用于分别调用所述集合确定模块确定的语言集合中的每种语言对应的词库对所述文档内容中使用该第一语言的相应内容进行拼写检查。

在本发明的一种具体实施方式中,所述语言确定模块,具体用于:

接收用户输入的至少一种第一语言;

将接收到的所述至少一种第一语言确定为用于检查所述文档内容的第一语言。

在本发明的一种具体实施方式中,所述语言确定模块,具体用于:

确定所述文档内容中每个词的字符编码;

根据每个词的字符编码,确定所述文档内容使用的每种第一语言;

将所述文档内容使用的每种第一语言确定为用于检查所述文档内容的第一语言。

在本发明的一种具体实施方式中,所述语言确定模块,具体用于:

确定所述文档内容中每个词的字符编码;

根据每个词的字符编码,确定所述文档内容使用的每种第一语言;

针对所述文档内容使用的每种第一语言,确定在所述文档内容中使用该第一语言的词的数量与所述文档内容中所有的词的数量的比例;

根据所述文档内容使用的每种第一语言对应的比例,确定用于检查所述文 档内容的至少一种第一语言。

在本发明的一种具体实施方式中,所述拼写检查模块,具体用于:

分别调用所述语言集合中的每种语言对应的词库拼写检查所述文档内容中使用该第一语言的词、语句和段落中的至少一种。

在本发明的一种具体实施方式中,还包括:

结果输出模块,用于输出针对所述文档内容的拼写检查结果。

应用本发明实施例所提供的技术方案,在针对目标文档的文档内容进行拼写检查时,针对确定的用于检查该文档内容的每种第一语言,确定包含该第一语言的语言集合,该语言集合中的每种语言均属于同一语系,分别调用该语言集合中的每种语言对应的词库对该文档内容中使用该第一语言的相应内容进行拼写检查,同一语系的语言的相似度较高,分别调用第一语言及与第一语言相近的语言的词库对文档内容进行拼写检查,提高了拼写检查的准确率,提升了用户体验。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例中拼写检查方法的一种实施流程图;

图2为本发明实施例中拼写检查装置的一种结构示意图。

具体实施方式

为了使本领域技术人员更好地理解本发明实施例中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

参见图1所示,为本发明实施例所提供的一种拼写检查方法的实施流程图, 该方法可以包括以下步骤:

S110:接收用户针对目标文档的文档内容进行拼写检查的指令。

在实际应用中,用于编辑目标文档的办公软件可以在其菜单中设置拼写检查菜单项,或者设置拼写检查按钮,当用户在该办公软件中打开目标文档,并有针对该目标文档的文档内容进行拼写检查的需求时,可以点击相应的菜单项或者点击相应的按钮,即可发出针对该目标文档的文档内容进行拼写检查的指令。当然,用户可以针对目标文档的全部文档内容进行拼写检查,还可以选择性地针对目标文档的部分文档内容进行拼写检查,具体的可以通过提供相应的设置项由用户进行设定。

接收到用户针对目标文档的文档内容进行拼写检查的指令后,可以继续执行步骤S120的操作。

S120:确定用于检查所述文档内容的至少一种第一语言;

可以理解的是,每个文档的文档内容都是由一种或多种语言构成的,办公软件在执行针对某个文档的拼写检查任务时,可以使用一种或多种语言对该文档的文档内容进行拼写检查。当接收到用户针对目标文档的文档内容进行拼写检查的指令后,可以进一步确定用于检查该文档内容的至少一种第一语言。比如,某个文档的文档内容包含汉语和英语两种语言,但实际需求是,只需要使用汉语对该文档内容进行拼写检查,这种情况下,可以确定用于检查该文档内容的第一语言为汉语。

在本发明的一种具体实施方式中,步骤S120可以包括以下两个步骤:

步骤一:接收用户输入的至少一种第一语言;

步骤二:将接收到的所述至少一种第一语言确定为用于检查所述文档内容的第一语言。

用户在针对目标文档的文档内容发出进行拼写检查的指令后,可以进一步输入用于检查该文档内容的至少一种第一语言。也就是由用户指定使用哪一种或几种第一语言对该文档内容进行拼写检查。

在实际应用中,接收到用户针对目标文档的文档内容进行拼写检查的指令后,可以提供语言输入界面,由用户输入用于检查该文档内容的至少一种第一 语言,当然还可以提供相应的语言选项,由用户选择用于检查该文档内容的至少一种第一语言。

或者,用户在针对目标文档的文档内容发出进行拼写检查的指令的同时,输入用于检查该文档内容的至少一种第一语言。

接收到用户输入的至少一种第一语言后,可以将接收到的第一语言确定为用于检查该文档内容的第一语言。

在实际应用中,用户对于自己所要进行拼写检查的目标文档的文档内容所使用的语言更为清楚,根据用户指定的第一语言对目标文档的文档内容进行拼写检查,更有针对性。

在本发明的另一种具体实施方式中,步骤S120可以包括以下三个步骤:

第一个步骤:确定所述文档内容中每个词的字符编码;

第二个步骤:根据每个词的字符编码,确定所述文档内容使用的每种第一语言;

第三个步骤:将所述文档内容使用的每种第一语言确定为用于检查所述文档内容的第一语言。

为方便理解,将上述三个步骤结合起来进行说明。

可以理解的是,不同的词具有不同的字符编码。字符编码也称为字集码,是把字符集中的字符编码为指定集合中某一对象,以便文本在计算机中存储和通过通信网络的传递。常见的字符编码包括将拉丁字母表编码成摩斯电码和ASCII。对于构成文档内容的每个词,根据该词的字符编码,可以确定该词属于哪种语言。

接收到用户针对目标文档的文档内容进行拼写检查的指令后,可以确定该文档内容中每个词的字符编码。根据每个词的字符编码,可以确定该文档内容使用的每种第一语言。将该文档内容使用的每种第一语言确定为用于检查该文档内容的第一语言。这样,可以对目标文档的文档内容进行更为全面的拼写检查。

在本发明的另一种具体实施方式中,步骤S120可以包括以下四个步骤:

步骤一:确定所述文档内容中每个词的字符编码;

步骤二:根据每个词的字符编码,确定所述文档内容使用的每种第一语言;

步骤三:针对所述文档内容使用的每种第一语言,确定在所述文档内容中使用该第一语言的词的数量与所述文档内容中所有的词的数量的比例;

步骤四:根据所述文档内容使用的每种第一语言对应的比例,确定用于检查所述文档内容的至少一种第一语言。

为方便描述,将上述四个步骤结合起来进行说明。

如前所述,不同的词具有不同的字符编码。字符编码也称为字集码,是把字符集中的字符编码为指定集合中某一对象,以便文本在计算机中存储和通过通信网络的传递。常见的字符编码包括将拉丁字母表编码成摩斯电码和ASCII。对于构成文档内容的每个词,根据该词的字符编码,可以确定该词属于哪种语言。

接收到用户针对目标文档的文档内容进行拼写检查的指令后,可以确定该文档内容中每个词的字符编码。根据每个词的字符编码,可以确定该文档内容使用的每种第一语言。

在实际应用中,目标文档的文档内容可能使用了一种或多种第一语言,但某种第一语言在该文档内容中使用的频率可能并不高,比如,目标文档的文档内容大部分使用汉语,只有小部分内容为英语缩写。

针对确定的该文档内容所使用的每种第一语言,可以确定在该文档内容中使用该第一语言的词的数量与该文档内容中所有的词的数量的比例。比如,上例中,在目标文档的文档内容中使用汉语的词的数量与该文档内容中所有的词的数量的比例为90%,在目标文档的文档内容中使用英语的词的数量与该文档内容中所有的词的数量的比例为10%。需要说明的是,本发明实施例中词为一个语言单位,在汉语中每个字为一个词,在英语中每个单词为一个词。

根据确定的每种第一语言对应的比例,可以确定用于检查该文档内容的至少一种第一语言。具体的,可以设定一个阈值,当某种第一语言对应的比例高于该阈值时,将该第一语言确定为用于检查该文档内容的第一语言,或者,可以根据所确定的每种第一语言对应的比例的高低,按照比例高低顺序对第一语 言进行排序,选择排名在前的一种或多种第一语言作为用于检查该文档内容的第一语言。

S130:针对确定的用于检查所述文档内容的每种第一语言,确定包含该第一语言的语言集合,所述语言集合中的每种语言均属于同一语系;分别调用所述语言集合中的每种语言对应的词库对所述文档内容中使用该第一语言的相应内容进行拼写检查。

有的语言的某些语音、词汇、语法规则之间具有一定的对应关系,可以根据这些对应关系,对各种语言进行归类,对应到相应的语系。比如,目前一种归类结果是,西班牙语和英语属于印欧语系,汉语和藏语属于汉藏语系等。

在步骤S120确定出用于检查该文档内容的至少一种第一语言后,可以进一步针对确定的用于检查该文档内容的每种第一语言,确定包含该第一语言的语言集合,在该语言集合中的每种语言均属于同一语系。

比如,步骤S120确定用于检查目标文档的文档内容的第一语言为汉语和英语,则针对汉语,可以确定包含汉语的语言集合中的语言为汉语和藏语,针对英语,可以确定包含英语的语言集合中的语言为英语和西班牙语。当然,在实际应用中,可以预先配置哪些语言属于同一语系,在确定用于检查文档内容的第一语言后,将该第一语言,及与该第一语言属于同一语系的语言作为一个语言集合。

不同的语言具有不同的词库,针对确定的用于检查该文档内容的每种第一语言,可以分别调用该第一语言对应的语言集合中的每种语言对应的词库对该文档内容中使用该第一语言的相应内容进行拼写检查。

为方便理解,举例说明:

上例中,针对汉语,确定的包含汉语的语言集合中的语言为汉语和藏语,可以分别调用汉语的词库和藏语的词库对该文档内容中使用汉语的相应内容进行拼写检查;

针对英语,确定的包含英语的语言集合中的语言为英语和西班牙语,可以分别调用英语的词库和西班牙语的词库对该文档内容中使用英语的相应内容进行拼写检查。

在实际应用中,针对目标文档的文档内容所使用的每种第一语言,如果该第一语言没有被确定为用于检查该文档内容的第一语言,则针对于该文档内容中使用该第一语言的相应内容进行拼写检查的语言,可以是确定用于检查该文档内容的至少一种第一语言中的任何一种语言,还可以是预先设置的一种默认语言。比如,目标文档的文档内容所使用的第一语言包括:汉语、英语,确定的用于检查该文档内容的第一语言为汉语,则对于该文档内容中使用英语的相应内容可以使用汉语进行拼写检查,还可以使用默认的其他语言对其进行拼写检查。

在本发明的一种具体实施方式中,可以分别调用所述语言集合中的每种语言对应的词库拼写检查所述文档内容中使用该第一语言的词、语句和段落中的至少一种。

在本发明的一个实施例中,步骤S130之后,可以输出针对所述文档内容的拼写检查结果,以方便用户针对拼写检查结果对目标文档的文档内容进行相应的修正。

应用本发明实施例所提供的技术方案,在针对目标文档的文档内容进行拼写检查时,针对确定的用于检查该文档内容的每种第一语言,确定包含该第一语言的语言集合,该语言集合中的每种语言均属于同一语系,分别调用该语言集合中的每种语言对应的词库对该文档内容中使用该第一语言的相应内容进行拼写检查,同一语系的语言的相似度较高,分别调用第一语言及与第一语言相近的语言的词库对文档内容进行拼写检查,提高了拼写检查的准确率,提升了用户体验。

相应于上面的方法实施例,本发明实施例还提供了一种拼写检查装置,参见图2所示,该装置可以包括以下模块:

指令接收模块210,用于接收用户针对目标文档的文档内容进行拼写检查的指令;

语言确定模块220,用于确定用于检查所述文档内容的至少一种第一语言;

集合确定模块230,用于针对所述语言确定模块220确定的用于检查所述文档内容的每种第一语言,确定包含该第一语言的语言集合,所述语言集合中的每种语言均属于同一语系;

拼写检查模块240,用于分别调用所述集合确定模块230确定的语言集合中的每种语言对应的词库对所述文档内容中使用该第一语言的相应内容进行拼写检查。

应用本发明实施例所提供的装置,在针对目标文档的文档内容进行拼写检查时,针对确定的用于检查该文档内容的每种第一语言,确定包含该第一语言的语言集合,该语言集合中的每种语言均属于同一语系,分别调用该语言集合中的每种语言对应的词库对该文档内容中使用该第一语言的相应内容进行拼写检查,同一语系的语言的相似度较高,分别调用第一语言及与第一语言相近的语言的词库对文档内容进行拼写检查,提高了拼写检查的准确率,提升了用户体验。

在本发明的一种具体实施方式中,所述语言确定模块220,具体用于:

接收用户输入的至少一种第一语言;

将接收到的所述至少一种第一语言确定为用于检查所述文档内容的第一语言。

在本发明的一种具体实施方式中,所述语言确定模块220,具体用于:

确定所述文档内容中每个词的字符编码;

根据每个词的字符编码,确定所述文档内容使用的每种第一语言;

将所述文档内容使用的每种第一语言确定为用于检查所述文档内容的第一语言。

在本发明的一种具体实施方式中,所述语言确定模块220,具体用于:

确定所述文档内容中每个词的字符编码;

根据每个词的字符编码,确定所述文档内容使用的每种第一语言;

针对所述文档内容使用的每种第一语言,确定在所述文档内容中使用该第一语言的词的数量与所述文档内容中所有的词的数量的比例;

根据所述文档内容使用的每种第一语言对应的比例,确定用于检查所述文档内容的至少一种第一语言。

在本发明的一种具体实施方式中,所述拼写检查模块240,具体用于:

分别调用所述语言集合中的每种语言对应的词库拼写检查所述文档内容中使用该第一语言的词、语句和段落中的至少一种。

在本发明的一种具体实施方式中,还包括:

结果输出模块,用于输出针对所述文档内容的拼写检查结果。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

本领域普通技术人员可以理解实现上述方法实施方式中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于计算机可读取存储介质中,这里所称得的存储介质,如:ROM/RAM、磁碟、光盘等。

以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1