一种汉字注音方法及装置制造方法

文档序号：6545830阅读：180来源：国知局

一种汉字注音方法及装置制造方法
【专利摘要】本发明实施例公开一种汉字注音方法及装置，其中方法包括如下步骤：当对所输入的文本中的多音字段进行注音时，获取所述多音字段的至少两种读音；对所述至少两种读音中每种读音进行概率预测，并生成预测结果；根据预测结果确定所述多音字段的当前读音。可以实现对多音字词进行准确注音，提升阅读文本的效率及效果。
【专利说明】一种汉字注音方法及装置

【技术领域】
[0001] 本发明涉及计算机【技术领域】，尤其涉及一种汉字注音方法及装置。

【背景技术】
[0002] 随着汉字的广泛运用，对于汉语学习者来说，在阅读汉字文本的过程中经常遇到一些字段不会读，特别是对于一些多音字段，因此往往在阅读中遇到障碍，尽管可以通过查字典来获得多音字段的读音，但需要花费较长的时间，并且由于字典概括的范围较大，用户难以把握多音字段的最准确的读法，降低了阅读文本的效率及效果，进而影响汉语学习的效果。

【发明内容】

[0003] 本发明实施例提供一种汉字注音方法及装置，可以实现对多音字词进行准确注音，提升阅读文本的效率及效果。
[0004] 为了解决上述技术问题，本发明实施例第一方面提供了一种汉字注音方法，可包括：
[0005] 当对所输入的文本中的多音字段进行注音时，获取所述多音字段的至少两种读音；
[0006] 对所述至少两种读音中每种读音进行概率预测，并生成预测结果；
[0007] 根据预测结果确定所述多音字段的当前读音。
[0008] 本发明实施例第二方面提供了一种汉字注音装置，可包括：
[0009] 读音获取模块，用于当对所输入文本中的多音字段进行注音时，获取所述多音字段的至少两种读音；
[0010] 预测模块，用于对所述至少两种读音中每种读音进行概率预测，并生成预测结果；
[0011] 读音确定模块，用于根据预测结果确定所述多音字段的当前读音。
[0012] 在本发明实施例中，当对所输入的文本中的多音字段进行注音时，对多音字段的至少两种读音中每种读音进行概率预测，并根据预测结果确定多音字段的当前读音，实现了对多音字段的准确注音，提升阅读文本的效率及效果，进而提升了汉语学习的效果。

【专利附图】

【附图说明】
[0013] 为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
[0014] 图1是本发明实施例提供的一种汉字注音方法的流程示意图；
[0015] 图2是本发明实施例提供的另一种汉字注音方法的流程示意图；
[0016] 图3是本发明实施例提供的一种汉字注音装置的结构示意图；
[0017] 图4是本发明实施例提供的另一种汉字注音装置的结构示意图；
[0018] 图5是本发明实施例提供的预测模块的结构示意图；
[0019] 图6是本发明实施例提供的结果生成单元的结构示意图；
[0020] 图7是本发明实施例提供的又一种汉字注音装置的结构示意图。

【具体实施方式】
[0021] 下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0022] 本发明实施例提供的汉字注音方法可以应用于对阅读文本中的多音字段进行注音的场景，例如：当汉字注音装置接收到输入的文本，且当对所输入的文本中的多音字段进行注音时，所述汉字注音装置获取所述多音字段的至少两种读音，对所述至少两种读音中每种读音进行概率预测，并生成预测结果，所述汉字注音装置根据预测结果确定所述多音字段的当前读音的场景等。通过对多音字段的至少两种读音中每种读音进行概率预测，实现了对多音字段的准确注音，提升阅读文本的效率及效果。
[0023] 本发明实施例涉及的汉字注音装置可以包括：计算机、平板电脑、智能手机、笔记本电脑、掌上电脑以及移动互联网设备（MID)等终端设备，所述文本可以为一篇文章、一段文字内容、一个句子、一个词语或一个汉字；所述多音字段可以为所述文本中的多音汉字或多音词语。
[0024] 下面将结合附图1和附图2,对本发明实施例提供的汉字注音方法进行详细介绍。
[0025] 请参见图1，为本发明实施例提供了一种汉字注音方法的流程示意图。如图1所示，本发明实施例的所述方法包括以下步骤S101-步骤S103。
[0026] S101，当对所输入的文本中的多音字段进行注音时，获取所述多音字段的至少两种读音；
[0027] 具体的，用户可以将待注音的文本输入至汉字注音装置，输入的方式可以通过复制粘贴该文本，或者通过扫描设备扫描该文本等，所述汉字注音装置获取用户所述文本，当所述汉字注音装置对所述文本中的多音字段进行注音时，所述汉字注音装置获取所述多音字段的至少两种读音。
[0028] 需要说明的是，在对所输入的文本中的多音字段进行注音之前，所述汉字注音装置需要对所述文本进行分词处理，例如：假设所述文本为"可以带你去长长见识"，所述汉字注音装置优选的可以根据词性对所述文本进行分词处理，分词处理后的所述文本为"可以/ 带/你/去/长长/见识"。
[0029] 所述汉字注音装置可以获取分词处理后所述文本中的字段和所述字段的读音属性信息，所述读音属性信息包括读音种数和默认读音。可以理解的是，所述汉字注音装置中预先建立了包含所有字段读音的字典以及常用词语的词典，对于只有一种读音的汉字，直接在字典中建立汉字与读音的对应关系，将该读音作为该汉字的默认读音，而对于多音汉字，则将使用频率最高的读音作为多音汉字的默认读音；而词典的设置与字典的设置相同，对于只有一种读音的词语，在词典中建立词语与读音的对应关系，将该读音作为该词语的默认读音，而对于多音词语，则将使用频率最高的读音作为多音词语的默认读音，例如：多音词语"长长"，其读音有三种，分别是"chang2chang2、zhang3chang2、zhang3zhang3"，其中，拼音后的数字表示声调（以下均统一采用此种格式），由于"chang2chang2"使用的频率最高，因此将"chang2chang2"作为"长长"的默认读音；对于一些固定词语，例如："曝"有两种读音，而在"一曝十寒"中的读音是唯一的，并且"一曝十寒"属于成语，可以被认为是常用词语，因此还可以建立常用词语的词典，并部分确定多音字在常用词语中的读音。
[0030] 因此，依据上述分词处理后的所述文本"可以/带/你/去/长长/见识"为例，则获取所述文本中所述字段的读音属性信息如下（字段/词性/读音种数/默认读音）：
[0031] 可以 /adv/l/ke3yi3 ;
[0032] 带/v/l/dai4;
[0033] 你 /pron/l/ni3 ;
[0034] 去 /v/l/qu4 ;
[0035] 长长/v/3/chang2chang2 ;
[0036] 见识/n/l/jian4shi3 ;
[0037] 其中，所述读音属性信息还可以包括每个字段的词性，通过词性配合字段本身进行读音种数和默认读音的查找，可以进一步提高注音的准确性。需要说明的是，假设词典中没有记载"可以"这个字段，则所述汉字注音装置可以在字典中分别查询"可"和"以"的读音属性信息。
[0038] 进一步的，当所述读音种数大于一时，所述汉字注音装置确定所述字段为多音字段，并获取所述多音字段的至少两种读音；
[0039] 当所述读音种数等于一时，所述汉字注音装置将所述默认读音确定为所述字段的当前读音。
[0040] S102,对所述至少两种读音中每种读音进行概率预测，并生成预测结果；
[0041] 具体的，当所述汉字注音装置获取了所述多音字段的至少两种读音后，所述汉字注音装置分别获取所述至少两种读音中每种读音的概率值，并根据所述每种读音的概率值的数值大小生成预测结果。
[0042] 进一步的，所述汉字注音装置预先存储有包含特定的多音字段的训练语料，采用条件随机场（Conditional Random Fields，CRF)训练算法获取所述特定的多音字段中每一个多音字段的CRF模型，所述CRF模型为所述汉字注音装置通过分析训练语料中的语言特征（例如：前一个词、后一个词、词性、句首、句末以及其他特定的词语或句子结构等），所建立的模型。所述汉字注音装置可以根据预存的训练语料获取所述多音字段的CRF模型，并通过分析所述多音字段在所述文本中的字段特征（例如：前一个词、后一个词、词性、句首、句末以及其他特定的词语或句子结构等），获取所述至少两种读音中每种读音的概率值，并获取所述每种读音的概率值中第一概率值与第二概率值的差值，当所述差值大于预设阈值时，确定所述第一概率值对应的读音为优先级最高的读音；当所述差值小于或等于所述预设阈值时，确定所述默认读音为优先级最高的读音。其中，所述第一概率值为所述每种读音的概率值中数值最大的概率值，所述第二概率值为所述每种读音的概率值中数值次大的概率值，所述预设阈值为根据人为经验所设置。
[0043] 参照上述举例，所述多音字段为"长长"，其读音有三种，分别是"chang2chang2、 zhang3chang2、zhang3zhang3 "，通过分析所获取的对应的概率值为0· 2、0· 1、0· 7，则第一概率值为〇. 7,第二概率值为0. 2,假设预设阈值为0. 1，由于所述第一概率值与所述第二概率值的差值为〇. 5,大于所述预设阈值，因此将所述第一概率值对应的读音，即 "zhang3zhang3"确定为优先级最高的读音。
[0044] S103,根据预测结果确定所述多音字段的当前读音；
[0045] 具体的，所述汉字注音装置将所述优先级最高的读音确定为所述多音字段的当前读音。
[0046] 进一步的，所述汉字注音装置对所述文本及所述文本中的字段对应的当前注音进行输出，参照上述举例，输出的结果为"可以带你去长长见识（ke3yi3dai4ni3qu4zhang3zha ng3jian4shi2) "。并可以将输出的结果转换为语音输出。
[0047] 在本发明实施例中，当对所输入的文本中的多音字段进行注音时，对多音字段的至少两种读音中每种读音进行概率预测，并根据预测结果确定多音字段的当前读音，实现了对多音字段的准确注音；通过词性配合字段本身进行读音种数和默认读音的查找，可以进一步提高注音的准确性，提升阅读文本的效率及效果，进而提升了汉语学习的效果。
[0048] 请参见图2,为本发明实施例提供了另一种汉字注音方法的流程示意图。如图2所示，本发明实施例的所述方法包括以下步骤S201-步骤S207。
[0049] S201，对所输入的文本进行分词处理，并获取分词处理后所述文本中的字段和所述字段的读音属性信息，所述读音属性信息包括读音种数和默认读音；
[0050] 具体的，用户可以将待注音的文本输入至所述汉字注音装置，输入的方式可以通过复制粘贴该文本，或者通过扫描设备扫描该文本等，汉字注音装置需要对所述文本进行分词处理，例如：假设所述文本为"可以带你去长长见识"，所述汉字注音装置优选的可以根据词性对所述文本进行分词处理，分词处理后的所述文本为"可以/带/你/去/长长/见识"。
[0051] 所述汉字注音装置可以获取分词处理后所述文本中的字段和所述字段的读音属性信息，所述读音属性信息包括读音种数和默认读音。可以理解的是，所述汉字注音装置中预先建立了包含所有字段读音的字典以及常用词语的词典，对于只有一种读音的汉字，直接在字典中建立汉字与读音的对应关系，将该读音作为该汉字的默认读音，而对于多音汉字，则将使用频率最高的读音作为多音汉字的默认读音；而词典的设置与字典的设置相同，对于只有一种读音的词语，在词典中建立词语与读音的对应关系，将该读音作为该词语的默认读音，而对于多音词语，则将使用频率最高的读音作为多音词语的默认读音，例如：多音词语"长长"，其读音有三种，分别是" chang2chang2、zhang3chang2、zhang3zhang3 "，其中，拼音后的数字表示声调（以下均统一采用此种格式），由于"chang2chang2"使用的频率最高，因此将"chang2chang2"作为"长长"的默认读音；对于一些固定词语，例如："曝"有两种读音，而在"一曝十寒"中的读音是唯一的，并且"一曝十寒"属于成语，可以被认为是常用词语，因此还可以建立常用词语的词典，并部分确定多音字在常用词语中的读音。
[0052] 因此，依据上述分词处理后的所述文本"可以/带/你/去/长长/见识"为例，则获取所述文本中所述字段的读音属性信息如下（字段/词性/读音种数/默认读音）：
[0053] 可以 /adv/l/ke3yi3 ;
[0054] 带/v/l/dai4;
[0055] 你 /pron/l/ni3 ;
[0056] 去 /v/l/qu4 ;
[0057] 长长/v/3/chang2chang2 ;
[0058] 见识/n/l/jian4shi3 ;
[0059] 其中，所述读音属性信息还可以包括每个字段的词性，通过词性配合字段本身进行读音种数和默认读音的查找，可以进一步提高注音的准确性。需要说明的是，假设词典中没有记载"可以"这个字段，则所述汉字注音装置可以在字典中分别查询"可"和"以"的读音属性信息。
[0060] S202,当所述读音种数等于一时，将所述默认读音确定为所述字段的当前读音；
[0061] 具体的，当所述读音种数等于一时，所述汉字注音装置将所述默认读音确定为所述字段的当前读音。
[0062] S203,当所述读音种数大于一时，确定所述字段为多音字段；
[0063] 具体的，当所述读音种数大于一时，所述汉字注音装置确定所述字段为多音字段，并获取所述多音字段的至少两种读音；
[0064] S204,当对所输入的文本中的多音字段进行注音时，获取所述多音字段的至少两种读音；
[0065] 具体的，所述汉字注音装置获取用户所述文本，当所述汉字注音装置对所述文本中的多音字段进行注音时，所述汉字注音装置获取所述多音字段的至少两种读音。
[0066] S205,获取所述至少两种读音中每种读音的概率值；
[0067] 具体的，当所述汉字注音装置获取了所述多音字段的至少两种读音后，所述汉字注音装置分别获取所述至少两种读音中每种读音的概率值。
[0068] 进一步的，所述汉字注音装置预先存储有包含特定的多音字段的训练语料，采用 CRF训练算法获取所述特定的多音字段中每一个多音字段的CRF模型，所述CRF模型为所述汉字注音装置通过分析训练语料中的语言特征（例如：前一个词、后一个词、词性、句首、句末以及其他特定的词语或句子结构等），所建立的模型。所述汉字注音装置可以根据预存的训练语料获取所述多音字段的CRF模型，并通过分析所述多音字段在所述文本中的字段特征（例如：前一个词、后一个词、词性、句首、句末以及其他特定的词语或句子结构等），获取所述至少两种读音中每种读音的概率值。
[0069] S206,根据所述每种读音的概率值的数值大小生成预测结果；
[0070] 具体的，所述汉字注音装置根据所述每种读音的概率值的数值大小生成预测结果。进一步的，所述汉字注音装置获取所述每种读音的概率值中第一概率值与第二概率值的差值，当所述差值大于预设阈值时，确定所述第一概率值对应的读音为优先级最高的读音；当所述差值小于或等于所述预设阈值时，确定所述默认读音为优先级最高的读音。其中，所述第一概率值为所述每种读音的概率值中数值最大的概率值，所述第二概率值为所述每种读音的概率值中数值次大的概率值，所述预设阈值为根据人为经验所设置。
[0071] 参照上述举例，所述多音字段为"长长"，其读音有三种，分别是"chang2chang2、 zhang3chang2、zhang3zhang3 "，通过分析所获取的对应的概率值为0· 2、0· 1、0· 7，则第一概率值为〇. 7,第二概率值为0. 2,假设预设阈值为0. 1，由于所述第一概率值与所述第二概率值的差值为0. 5,大于所述预设阈值，因此将所述第一概率值对应的读音，即 "zhang3zhang3"确定为优先级最高的读音。
[0072] S207,根据预测结果确定所述多音字段的当前读音。
[0073] 其中，本发明实施例的步骤S207可以参见图1所示实施例的步骤S103,在此不进行赘述。
[0074] 在本发明实施例中，当对所输入的文本中的多音字段进行注音时，对多音字段的至少两种读音中每种读音进行概率预测，并根据预测结果确定多音字段的当前读音，实现了对多音字段的准确注音；通过词性配合字段本身进行读音种数和默认读音的查找，且通过预先建立了包含所有字段读音的字典、常用词语的词典以及预存的训练语料相结合，可以进一步提高注音的准确性，提升阅读文本的效率及效果，进而提升了汉语学习的效果。
[0075] 下面将结合附图3-附图6,对本发明实施例提供的汉字注音装置进行详细介绍。需要说明的是，附图3-附图6所示的汉字注音装置，用于执行本发明图1和图2所示实施例的方法，为了便于说明，仅示出了与本发明实施例相关的部分，具体技术细节未揭示的，请参照本发明图1和图2所示的实施例。
[0076] 请参见图3,为本发明实施例提供了一种汉字注音装置的结构示意图。如图3所示，本发明实施例的所述汉字注音装置1可以包括：读音获取模块11、预测模块12和第一读音确定模块13。
[0077] 读音获取模块11，用于当对所输入的文本中的多音字段进行注音时，获取所述多音字段的至少两种读音；
[0078] 具体实现中，用户可以将待注音的文本输入至所述汉字注音装置1，输入的方式可以通过复制粘贴该文本，或者通过扫描设备扫描该文本等，所述汉字注音装置1获取用户所述文本，当所述汉字注音装置对所述文本中的多音字段进行注音时，所述读音获取模块 11获取所述多音字段的至少两种读音。
[0079] 需要说明的是，在对所输入的文本中的多音字段进行注音之前，所述汉字注音装置1需要对所述文本进行分词处理，例如：假设所述文本为"可以带你去长长见识"，所述汉字注音装置1优选的可以根据词性对所述文本进行分词处理，分词处理后的所述文本为 "可以/带/你/去/长长/见识"。
[0080] 所述汉字注音装置1可以获取分词处理后所述文本中的字段和所述字段的读音属性信息，所述读音属性信息包括读音种数和默认读音。可以理解的是，所述汉字注音装置 1中预先建立了包含所有字段读音的字典以及常用词语的词典，对于只有一种读音的汉字，直接在字典中建立汉字与读音的对应关系，将该读音作为该汉字的默认读音，而对于多音汉字，则将使用频率最高的读音作为多音汉字的默认读音；而词典的设置与字典的设置相同，对于只有一种读音的词语，在词典中建立词语与读音的对应关系，将该读音作为该词语的默认读音，而对于多音词语，则将使用频率最高的读音作为多音词语的默认读音，例如：多音词语"长长"，其读音有三种，分别是中，拼音后的数字表示声调（以下均统一采用此种格式），由于"chang2chang2"使用的频率最高，因此将"chang2chang2"作为"长长"的默认读音；对于一些固定词语，例如："曝"有两种读音，而在"一曝十寒"中的读音是唯一的，并且"一曝十寒"属于成语，可以被认为是常用词语，因此还可以建立常用词语的词典，并部分确定多音字在常用词语中的读音。
[0081] 因此，依据上述分词处理后的所述文本"可以/带/你/去/长长/见识"为例，则获取所述文本中所述字段的读音属性信息如下（字段/词性/读音种数/默认读音）：
[0082] 可以 /adv/l/ke3yi3 ;
[0083] 带/v/l/dai4;
[0084] 你 /pron/l/ni3 ;
[0085] 去 /v/l/qu4 ;
[0086] 长长/v/3/chang2chang2 ;
[0087] 见识/n/l/jian4shi3 ;
[0088] 其中，所述读音属性信息还可以包括每个字段的词性，通过词性配合字段本身进行读音种数和默认读音的查找，可以进一步提高注音的准确性。需要说明的是，假设词典中没有记载"可以"这个字段，则所述汉字注音装置1可以在字典中分别查询"可"和"以"的读音属性信息。
[0089] 进一步的，当所述读音种数大于一时，所述汉字注音装置1确定所述字段为多音字段，并通知所述读音获取模块11获取所述多音字段的至少两种读音；
[0090] 当所述读音种数等于一时，所述汉字注音装置1将所述默认读音确定为所述字段的当前读音。
[0091] 预测模块12,用于对所述至少两种读音中每种读音进行概率预测，并生成预测结果；
[0092] 具体实现中，当所述读音获取模块11获取了所述多音字段的至少两种读音后，所述预测模块12分别获取所述至少两种读音中每种读音的概率值，并根据所述每种读音的概率值的数值大小生成预测结果。
[0093] 进一步的，所述汉字注音装置1预先存储有包含特定的多音字段的训练语料，采用CRF训练算法获取所述特定的多音字段中每一个多音字段的CRF模型，所述CRF模型为所述汉字注音装置1通过分析训练语料中的语言特征（例如：前一个词、后一个词、词性、句首、句末以及其他特定的词语或句子结构等），所建立的模型。所述预测模块12可以根据预存的训练语料获取所述多音字段的CRF模型，并通过分析所述多音字段在所述文本中的字段特征（例如：前一个词、后一个词、词性、句首、句末以及其他特定的词语或句子结构等），获取所述至少两种读音中每种读音的概率值，并获取所述每种读音的概率值中第一概率值与第二概率值的差值，当所述差值大于预设阈值时，确定所述第一概率值对应的读音为优先级最高的读音；当所述差值小于或等于所述预设阈值时，确定所述默认读音为优先级最高的读音。其中，所述第一概率值为所述每种读音的概率值中数值最大的概率值，所述第二概率值为所述每种读音的概率值中数值次大的概率值，所述预设阈值为根据人为经验所设置。
[0094] 参照上述举例，所述多音字段为"长长"，其读音有三种，分别是"chang2chang2、 zhang3chang2、zhang3zhang3 "，通过分析所获取的对应的概率值为0· 2、0· 1、0· 7，则第一概率值为〇. 7,第二概率值为0. 2,假设预设阈值为0. 1，由于所述第一概率值与所述第二概率值的差值为〇. 5,大于所述预设阈值，因此将所述第一概率值对应的读音，即 "zhang3zhang3"确定为优先级最高的读音。
[0095] 第一读音确定模块13,用于根据预测结果确定所述多音字段的当前读音。
[0096] 具体实现中，所述第一读音确定模块13将所述优先级最高的读音确定为所述多音字段的当前读音。
[0097] 进一步的，所述汉字注音装置1对所述文本及所述文本中的字段对应的当前注音进行输出，参照上述举例，输出的结果为"可以带你去长长见识（ke3 yi3dai4 ni3 qu4 zhang3 zhang3 jian4 shi2) "。并可以将输出的结果转换为语音输出。
[0098] 在本发明实施例中，当对所输入的文本中的多音字段进行注音时，对多音字段的至少两种读音中每种读音进行概率预测，并根据预测结果确定多音字段的当前读音，实现了对多音字段的准确注音；通过词性配合字段本身进行读音种数和默认读音的查找，可以进一步提高注音的准确性，提升阅读文本的效率及效果，进而提升了汉语学习的效果。
[0099] 请参见图4,为本发明实施例提供了另一种汉字注音装置的结构示意图。如图4所示，本发明实施例所述的汉字注音装置1可以包括：读音获取模块11、预测模块12、第一读音确定模块13、信息获取模块14、通知模块15和第二读音确定模块16 ;其中，第一读音确定模块13的结构可以参见图3所示实施例的具体描述，在此不进行赘述。
[0100] 信息获取模块14,用于对所输入的文本进行分词处理，并获取分词处理后所述文本中的字段和所述字段的读音属性信息，所述读音属性信息包括读音种数和默认读音； [0101] 具体实现中，用户可以将待注音的文本输入至所述汉字注音装置1，输入的方式可以通过复制粘贴该文本，或者通过扫描设备扫描该文本等，所述信息获取模块14需要对所述文本进行分词处理，例如：假设所述文本为"可以带你去长长见识"，所述信息获取模块 14优选的可以根据词性对所述文本进行分词处理，分词处理后的所述文本为"可以/带/ 你/去/长长/见识"。
[0102] 所述信息获取模块14可以获取分词处理后所述文本中的字段和所述字段的读音属性信息，所述读音属性信息包括读音种数和默认读音。可以理解的是，所述汉字注音装置 1中预先建立了包含所有字段读音的字典以及常用词语的词典，对于只有一种读音的汉字，直接在字典中建立汉字与读音的对应关系，将该读音作为该汉字的默认读音，而对于多音汉字，则将使用频率最高的读音作为多音汉字的默认读音；而词典的设置与字典的设置相同，对于只有一种读音的词语，在词典中建立词语与读音的对应关系，将该读音作为该词语的默认读音，而对于多音词语，则将使用频率最高的读音作为多音词语的默认读音，例如：多音词语"长长"，其读音有三种，分别是" chang2chang2、zhang3chang2、zhang3zhang3 "，其中，拼音后的数字表示声调（以下均统一采用此种格式），由于"chang2chang2"使用的频率最高，因此将"chang2 chang2"作为"长长"的默认读音；对于一些固定词语，例如："曝"有两种读音，而在"一曝十寒"中的读音是唯一的，并且"一曝十寒"属于成语，可以被认为是常用词语，因此还可以建立常用词语的词典，并部分确定多音字在常用词语中的读音。
[0103] 因此，依据上述分词处理后的所述文本"可以/带/你/去/长长/见识"为例，则获取所述文本中所述字段的读音属性信息如下（字段/词性/读音种数/默认读音）：
[0104] 可以 /adv/l/ke3yi3 ;
[0105] 带/v/l/dai4;
[0106] 你 /pron/l/ni3 ;
[0107] 去/v/l/qu4;
[0108] 长长/v/3/chang2chang2 ;
[0109]见识/n/l/jian4shi3 ;
[oho] 其中，所述读音属性信息还可以包括每个字段的词性，通过词性配合字段本身进行读音种数和默认读音的查找，可以进一步提高注音的准确性。需要说明的是，假设词典中没有记载"可以"这个字段，则所述信息获取模块14可以在字典中分别查询"可"和"以"的读音属性信息。
[0111] 通知模块15,用于当所述读音种数大于一时，确定所述字段为多音字段，并通知所述读音获取模块11执行获取所述多音字段的至少两种读音的步骤；
[0112] 具体实现中，当所述读音种数大于一时，所述通知模块15确定所述字段为多音字段，并通知所述读音获取模块11获取所述多音字段的至少两种读音；
[0113] 第二读音确定模块16,用于当所述读音种数等于一时，将所述默认读音确定为所述字段的当前读音；
[0114] 具体实现中，当所述读音种数等于一时，所述第二读音确定模块16将所述默认读音确定为所述字段的当前读音。
[0115] 读音获取模块11，用于当对所输入的文本中的多音字段进行注音时，获取所述多音字段的至少两种读音；
[0116] 具体实现中，所述汉字注音装置1获取用户所述文本，当所述汉字注音装置1对所述文本中的多音字段进行注音时，所述读音获取模块11获取所述多音字段的至少两种读音。
[0117] 预测模块12,用于对所述至少两种读音中每种读音进行概率预测，并生成预测结果；
[0118] 具体实现中，当所述读音获取模块11获取了所述多音字段的至少两种读音后，所述预测模块12分别获取所述至少两种读音中每种读音的概率值，并根据所述每种读音的概率值的数值大小生成预测结果。
[0119] 具体的，请一并参见图5,为本发明实施例提供了预测模块的结构示意图。如图5 所示，所述预测模块12可以包括：
[0120] 概率获取单元121，用于获取所述至少两种读音中每种读音的概率值；
[0121] 具体实现中，当所述读音获取模块11获取了所述多音字段的至少两种读音后，所述概率获取单元121分别获取所述至少两种读音中每种读音的概率值。
[0122] 进一步的，所述汉字注音装置1预先存储有包含特定的多音字段的训练语料，采用CRF训练算法获取所述特定的多音字段中每一个多音字段的CRF模型，所述CRF模型为所述汉字注音装置1通过分析训练语料中的语言特征（例如：前一个词、后一个词、词性、句首、句末以及其他特定的词语或句子结构等），所建立的模型。所述汉字注音装置1可以根据预存的训练语料获取所述多音字段的CRF模型，并通过分析所述多音字段在所述文本中的字段特征（例如：前一个词、后一个词、词性、句首、句末以及其他特定的词语或句子结构等），获取所述至少两种读音中每种读音的概率值。
[0123] 结果生成单元122,用于根据所述每种读音的概率值的数值大小生成预测结果；
[0124] 具体实现中，所述结果生成单元122根据所述每种读音的概率值的数值大小生成预测结果。进一步的，所述结果生成单元122获取所述每种读音的概率值中第一概率值与第二概率值的差值，当所述差值大于预设阈值时，确定所述第一概率值对应的读音为优先级最高的读音；当所述差值小于或等于所述预设阈值时，确定所述默认读音为优先级最高的读音。其中，所述第一概率值为所述每种读音的概率值中数值最大的概率值，所述第二概率值为所述每种读音的概率值中数值次大的概率值，所述预设阈值为根据人为经验所设置。
[0125] 参照上述举例，所述多音字段为"长长"，其读音有三种，分别是"chang2chang2、 zhang3chang2、zhang3zhang3 "，通过分析所获取的对应的概率值为0· 2、0· 1、0· 7，则第一概率值为〇. 7,第二概率值为0. 2,假设预设阈值为0. 1，由于所述第一概率值与所述第二概率值的差值为〇. 5,大于所述预设阈值，因此将所述第一概率值对应的读音，即 "zhang3zhang3"确定为优先级最高的读音。
[0126] 具体的，请一并参见图6,为本发明实施例提供了结果生成单元的结构示意图。如图6所示，所述结果生成单元122可以包括：
[0127] 差值获取子单元1221，用于获取所述每种读音的概率值中第一概率值与第二概率值的差值；
[0128] 第一确定子单元1222,用于当所述差值大于预设阈值时，确定所述第一概率值对应的读音为优先级最高的读音；
[0129] 第二确定子单元1223,用于当所述差值小于或等于所述预设阈值时，确定所述默认读音为优先级最高的读音；
[0130] 具体实现中，所述差值获取子单元1221获取所述每种读音的概率值中第一概率值与第二概率值的差值，当所述差值大于预设阈值时，所述第一确定子单元1222确定所述第一概率值对应的读音为优先级最高的读音；当所述差值小于或等于所述预设阈值时，所述第二确定子单元1223确定所述默认读音为优先级最高的读音。其中，所述第一概率值为所述每种读音的概率值中数值最大的概率值，所述第二概率值为所述每种读音的概率值中数值次大的概率值，所述预设阈值为根据人为经验所设置。
[0131] 参照上述举例，所述多音字段为"长长"，其读音有三种，分别是"chang2chang2、 zhang3chang2、zhang3zhang3 "，通过分析所获取的对应的概率值为0· 2、0· 1、0· 7，则第一概率值为〇. 7,第二概率值为0. 2,假设预设阈值为0. 1，由于所述第一概率值与所述第二概率值的差值为〇. 5,大于所述预设阈值，因此将所述第一概率值对应的读音，即 "zhang3zhang3"确定为优先级最高的读音。
[0132] 在本发明实施例中，当对所输入的文本中的多音字段进行注音时，对多音字段的至少两种读音中每种读音进行概率预测，并根据预测结果确定多音字段的当前读音，实现了对多音字段的准确注音；通过词性配合字段本身进行读音种数和默认读音的查找，且通过预先建立了包含所有字段读音的字典、常用词语的词典以及预存的训练语料相结合，可以进一步提高注音的准确性，提升阅读文本的效率及效果，进而提升了汉语学习的效果。
[0133] 请参见图7,为本发明实施例提供了又一种汉字注音装置的结构示意图。如图7 所示，所述汉字注音装置1000可以包括：至少一个处理器1001，例如CPU，至少一个网络接口 1004,用户接口 1003,存储器1005,至少一个通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。其中，用户接口 1003可以包括显示屏（Display)、键盘 (Keyboard)，可选用户接口 1003还可以包括标准的有线接口、无线接口。网络接口 1004可选的可以包括标准的有线接口、无线接口（如WI-FI接口）。存储器1005可以是高速RAM存储器，也可以是非不稳定的存储器（non-volatile memory),例如至少一个磁盘存储器。存储器1005可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图7所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及汉字注音应用程序。
[0134] 在图7所示的更新发布服务器1000中，用户接口 1003主要用于为用户提供输入的接口，获取用户输出的数据；而处理器1001可以用于调用存储器1005中存储的汉字注音应用程序，并具体执行以下步骤：
[0135] 当对所输入的文本中的多音字段进行注音时，获取所述多音字段的至少两种读音；
[0136] 对所述至少两种读音中每种读音进行概率预测，并生成预测结果；
[0137] 根据预测结果确定所述多音字段的当前读音。
[0138] 在一个实施例中，所述处理器1001在执行当对所输入的文本中的多音字段进行注音之前，还执行以下步骤：
[0139] 对所输入的文本进行分词处理，并获取分词处理后所述文本中的字段和所述字段的读音属性信息，所述读音属性信息包括读音种数和默认读音；
[0140]当所述读音种数大于一时，确定所述字段为多音字段，并执行获取所述多音字段的至少两种读音的步骤；
[0141] 当所述读音种数等于一时，将所述默认读音确定为所述字段的当前读音。
[0142] 在一个实施例中，所述处理器1001在执行对所述至少两种读音中每种读音进行概率预测，并生成预测结果时，具体执行以下步骤：
[0143] 获取所述至少两种读音中每种读音的概率值；
[0144] 根据所述每种读音的概率值的数值大小生成预测结果。
[0145] 在一个实施例中，所述处理器在执行获取所述至少两种读音中每种读音的概率值时，具体执行以下步骤：
[0146] 根据预存的训练语料以及分析所述多音字段在所述文本中的字段特征，获取所述至少两种读音中每种读音的概率值。
[0147] 在一个实施例中，所述处理器1001在执行根据所述每种读音的概率值的数值大小生成预测结果时，具体执行以下步骤：
[0148] 获取所述每种读音的概率值中第一概率值与第二概率值的差值；
[0149] 当所述差值大于预设阈值时，确定所述第一概率值对应的读音为优先级最高的读音；
[0150] 当所述差值小于或等于所述预设阈值时，确定所述默认读音为优先级最高的读音；
[0151] 其中，所述第一概率值为所述每种读音的概率值中数值最大的概率值，所述第二概率值为所述每种读音的概率值中数值次大的概率值。
[0152] 在一个实施例中，所述处理器1001在执行根据预测结果确定所述多音字段的当前读音时，具体执行以下步骤：
[0153] 将所述优先级最高的读音确定为所述多音字段的当前读音。
[0154] 在本发明实施例中，当对所输入的文本中的多音字段进行注音时，对多音字段的至少两种读音中每种读音进行概率预测，并根据预测结果确定多音字段的当前读音，实现了对多音字段的准确注音，提升阅读文本的效率及效果，进而提升了汉语学习的效果。
[0155] 本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体（Read-Only Memory, ROM)或随机存储记忆体（Random Access Memory，RAM)等。
[0156] 以上所揭露的仅为本发明较佳实施例而已，当然不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属本发明所涵盖的范围。
【权利要求】
1. 一种汉字注音方法，其特征在于，包括：当对所输入的文本中的多音字段进行注音时，获取所述多音字段的至少两种读音；对所述至少两种读音中每种读音进行概率预测，并生成预测结果；根据预测结果确定所述多音字段的当前读音。
2. 根据权利要求1所述的方法，其特征在于，所述当对所输入的文本中的多音字段进行注音之前，还包括：对所输入的文本进行分词处理，并获取分词处理后所述文本中的字段和所述字段的读音属性信息，所述读音属性信息包括读音种数和默认读音；当所述读音种数大于一时，确定所述字段为多音字段，并执行获取所述多音字段的至少两种读音的步骤；当所述读音种数等于一时，将所述默认读音确定为所述字段的当前读音。
3. 根据权利要求2所述的方法，其特征在于，所述对所述至少两种读音中每种读音进行概率预测，并生成预测结果，包括：获取所述至少两种读音中每种读音的概率值；根据所述每种读音的概率值的数值大小生成预测结果。
4. 根据权利要求3所述的方法，其特征在于，所述获取所述至少两种读音中每种读音的概率值，包括：根据预存的训练语料以及分析所述多音字段在所述文本中的字段特征，获取所述至少两种读音中每种读音的概率值。
5. 根据权利要求3所述的方法，其特征在于，所述根据所述每种读音的概率值的数值大小生成预测结果，包括：获取所述每种读音的概率值中第一概率值与第二概率值的差值；当所述差值大于预设阈值时，确定所述第一概率值对应的读音为优先级最高的读音；当所述差值小于或等于所述预设阈值时，确定所述默认读音为优先级最高的读音；其中，所述第一概率值为所述每种读音的概率值中数值最大的概率值，所述第二概率值为所述每种读音的概率值中数值次大的概率值。
6. 根据权利要求5所述的方法，其特征在于，所述根据预测结果确定所述多音字段的当前读音，包括：将所述优先级最高的读音确定为所述多音字段的当前读音。
7. -种汉字注音装置，其特征在于，包括：读音获取模块，用于当对所输入的文本中的多音字段进行注音时，获取所述多音字段的至少两种读音；预测模块，用于对所述至少两种读音中每种读音进行概率预测，并生成预测结果；第一读音确定模块，用于根据预测结果确定所述多音字段的当前读音。
8. 根据权利要求7所述的装置，其特征在于，还包括：信息获取模块，用于对所输入的文本进行分词处理，并获取分词处理后所述文本中的字段和所述字段的读音属性信息，所述读音属性信息包括读音种数和默认读音；通知模块，用于当所述读音种数大于一时，确定所述字段为多音字段，并通知所述读音获取模块执行获取所述多音字段的至少两种读音的步骤；第二读音确定模块，用于当所述读音种数等于一时，将所述默认读音确定为所述字段的当前读音。
9. 根据权利要求8所述的装置，其特征在于，所述预测模块包括：概率获取单元，用于获取所述至少两种读音中每种读音的概率值；结果生成单元，用于根据所述每种读音的概率值的数值大小生成预测结果。
10. 根据权利要求9所述的装置，其特征在于，所述概率获取单元具体用于根据预存的训练语料以及分析所述多音字段在所述文本中的字段特征，获取所述至少两种读音中每种读音的概率值。
11. 根据权利要求9所述的装置，其特征在于，所述结果生成单元包括：差值获取子单元，用于获取所述每种读音的概率值中第一概率值与第二概率值的差值；第一确定子单元，用于当所述差值大于预设阈值时，确定所述第一概率值对应的读音为优先级最高的读音；第二确定子单元，用于当所述差值小于或等于所述预设阈值时，确定所述默认读音为优先级最高的读音；其中，所述第一概率值为所述每种读音的概率值中数值最大的概率值，所述第二概率值为所述每种读音的概率值中数值次大的概率值。
12. 根据权利要求11所述的装置，其特征在于，所述第一读音确定模块具体用于将所述优先级最高的读音确定为所述多音字段的当前读音。
【文档编号】G06F17/20GK104142909SQ201410190961
【公开日】2014年11月12日申请日期:2014年5月7日优先权日:2014年5月7日
【发明者】吴小平, 戴强申请人:腾讯科技（深圳）有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吴小平;戴强
技术所有人：腾讯科技（深圳）有限公司
我是此专利的发明人

上一篇：一种柑橘果实优质化采收决策的方法及系统的制作方法
上一篇：一种工作流动态扩展方法及系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。