语音的纠错处理方法和装置、用于语音的纠错处理的装置的制造方法

文档序号:10727054阅读:787来源:国知局
语音的纠错处理方法和装置、用于语音的纠错处理的装置的制造方法
【专利摘要】本发明实施例提供了一种语音的纠错处理方法和装置、用于语音的纠错处理的装置,其中的语音的纠错处理方法具体包括:在检测到用户所输入语音的识别结果中疑似存在错误时,输出所述错误对应的提示信息;获取所述用户的后续操作;依据所述后续操作对所述识别结果进行纠错处理。本发明实施例节省了用户从识别结果中寻找错误的过程,故可以使用户依据该提示信息快速产生对应的后续操作,因此能够提高语音输入的效率。
【专利说明】
语音的纠错处理方法和装置、用于语音的纠错处理的装置
技术领域
[0001] 本发明涉及语音处理技术领域,特别是涉及一种语音的纠错处理方法、一种语音 的纠错处理装置、及一种用于语音的纠错处理的装置。
【背景技术】
[0002] 目前,移动互联网的快速发展带动了诸如智能手机、平板电脑的智能终端的广泛 普及。但是受限于屏幕尺寸以及触屏按键,在智能终端特别是智能手机上打字非常困难,或 者,在用户开车等场景下在智能手机上不方便打字;此时作为人机交互最方便自然的方式, 语音输入法正逐渐被广大用户所接受。
[0003] 现有的语音输入法主要采用依据训练得到的声学模型和语音模型,查找与用户所 输入声学信号最匹配的识别结果。
[0004] 然而,在大词汇量随意说的应用环境下,现有的语音输入法通常不能达到百分百 正确的识别率,也即,在实际应用中上述识别结果中可能会存在错误,这需要用户从上述识 别结果中寻找对应的错误,上述寻找过程需要耗费一定的时间,因此影响了语音输入的效 率。
[0005] 另外,在上述识别结果中存在错误时,用户需要在智能终端上移动光标至错误位 置并通过手动方式进行相应的错误修改。而在屏幕尺寸受限的智能终端上,用户在从文本 形式的识别结果中对某个确定的字符进行定位时,特别是在相邻两字符间插入编辑光标 时,存在定位不便的问题。并且,在错误位置距离修改前的光标位置较远时,上述定位的难 度将增加。因此,现有的基于手动方式的错误修改过程将会耗费较长的时间,这不仅影响了 语音输入的效率,而且影响了错误修改的便利性。

【发明内容】

[0006] 鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地 解决上述问题的语音的纠错处理方法、语音的纠错处理装置及用于语音的纠错处理的装 置,能够提高语音的纠错处理的效率。
[0007] 为了解决上述问题,本发明公开了一种语音的纠错处理方法,包括:
[0008] 在检测到用户所输入语音的识别结果中疑似存在错误时,输出所述错误对应的提 不?目息;
[0009] 获取所述用户的后续操作;
[0010] 依据所述后续操作对所述识别结果进行纠错处理。
[0011]可选地,所述在检测到用户所输入语音的识别结果中疑似存在错误时,输出所述 错误对应的提示信息的步骤,包括:
[0012] 在检测到用户所输入语音的识别结果中疑似存在错误时,展示所述错误对应的标 记信息;和/或
[0013] 在检测到用户所输入语音的识别结果中疑似存在错误时,展示所述错误对应的标 记信息,以及输出对应的语音纠错提示;和/或
[0014] 在检测到用户所输入语音的识别结果中疑似存在错误时,通过语音方式播放所述 错误对应的提示信息。
[0015] 可选地,所述依据所述后续操作对所述识别结果进行纠错处理的步骤,包括:
[0016] 响应于用户对于所述错误的纠错候选结果的选择操作,依据所述选择操作对应的 纠错候选结果对所述识别结果进行纠错处理。
[0017] 可选地,所述方法还包括:
[0018] 响应于用户对于所述错误的触发操作,展示所述错误对应的至少一个纠错候选结 果;或者
[0019] 在输出所述错误对应的提示信息的过程中,展示所述错误对应的至少一个纠错候 选结果。
[0020] 可选地,所述纠错候选结果包括:所述错误对应的替换词和/或所述错误对应的编 辑指令。
[0021] 可选地,所述替换词包括:所述错误的出现位置对应的竞争词。
[0022] 可选地,所述用户的后续操作包括:纠错语音指令;所述依据所述后续操作对所述 识别结果进行纠错处理的步骤,包括:
[0023] 对所述纠错语音指令的识别结果与预置纠错规则进行匹配;
[0024] 在所述纠错语音指令的识别结果与所述预置纠错规则匹配时,将所述预置纠错规 则对应的预置纠错操作作为所述所述纠错语音指令对应的目标纠错操作;
[0025] 依据所述纠错语音指令,针对所述识别结果执行所述目标纠错操作。
[0026] 可选地,所述预置纠错规则的获取方式包括如下方式中的至少一种:
[0027] 收集至少一个用户使用过的纠错规则,作为预置纠错规则;
[0028] 依据用户的历史行为数据,得到符合所述用户对于输入结果的修改逻辑的预置纠 错规则;
[0029] 获取至少一个用户设置的预置纠错规则;
[0030] 依据至少一个用户针对已有预置纠错规则的反馈信息,得到更新的预置纠错规 则。
[0031] 可选地,通过如下步骤检测用户所输入语音的识别结果中疑似存在的错误:
[0032]确定用户所输入语音的识别结果中各词汇的置信度;
[0033]将所述置信度在预置置信度范围内的词汇,作为所述识别结果中疑似存在的错 误。
[0034] 可选地,所述方法还包括:
[0035]响应于用户对于所述提示信息的调整操作,对所述提示信息进行调整。
[0036]另一方面,本发明公开了一种语音的纠错处理装置,包括:
[0037] 提示输出模块,用于在检测到用户所输入语音的识别结果中疑似存在错误时,输 出所述错误对应的提示信息;
[0038] 操作获取模块,用于获取所述用户的后续操作;以及
[0039]纠错处理模块,用于依据所述后续操作对所述识别结果进行纠错处理。
[0040]再一方面,本发明公开了一种用于语音的纠错处理的装置,包括有存储器,以及一 个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个 或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令: [0041]在检测到用户所输入语音的识别结果中疑似存在错误时,输出所述错误对应的提 不?目息;
[0042]获取所述用户的后续操作;
[0043]依据所述后续操作对所述识别结果进行纠错处理。
[0044] 本发明实施例包括以下优点:
[0045] 本发明实施例可以通过提示信息直接向用户提供识别结果中疑似存在的错误,该 提示信息可以明确该错误的位置、和/或该错误对应的词汇和/或或该错误所在句等信息, 由于本发明实施例节省了用户从识别结果中寻找错误的过程,故可以使用户依据该提示信 息快速产生对应的后续操作,因此能够提高语音输入的效率。
[0046] 并且,相对于现有方案中基于手动方式的错误修改过程,本发明实施例可以依据 所述后续操作对所述识别结果进行自动纠错处理,因此能够缩短纠错所需的时间,从而进 一步能够提高语音输入的效率,以及增加错误修改的便利性。
【附图说明】
[0047] 图1是本发明的一种语音的纠错处理方法实施例一的步骤流程图;
[0048] 图2是本发明的一种语音的纠错处理方法实施例二的步骤流程图;
[0049]图3是本发明的一种语音的纠错处理方法实施例三的步骤流程图;
[0050] 图4是本发明的一种语音的纠错处理装置实施例的结构框图;
[0051] 图5是本发明的一种用于语音的纠错处理的装置800的框图;及 [0052]图6是本发明的一种服务器的结构示意图。
【具体实施方式】
[0053]为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实 施方式对本发明作进一步详细的说明。
[0054]本发明实施例在检测到用户所输入语音的识别结果中疑似存在错误时,可以输出 所述错误对应的提示信息或该错误所在句的提示信息。上述提示信息可以直接向用户提供 识别结果中的错误,由于本发明实施例节省了用户从识别结果中寻找错误的过程,故可以 使用户依据该提示信息快速产生对应的后续操作,因此能够提高语音输入的效率。
[0055]并且,本发明实施例可以依据所述后续操作对所述识别结果进行自动纠错处理, 这相对于现有方案中基于手动方式的错误修改过程,本发明实施例将能够缩短纠错所需的 时间,从而进一步能够提高语音输入的效率,以及增加错误修改的便利性。
[0056]方法实施例一
[0057]参照图1,示出了本发明的一种语音的纠错处理方法实施例一的步骤流程图,具体 可以包括如下步骤:
[0058] 步骤101、在检测到用户所输入语音的识别结果中疑似存在错误时,输出所述错误 对应的提示信息;
[0059] 步骤102、获取所述用户的后续操作;
[0060]步骤103、依据所述后续操作对所述识别结果进行纠错处理。
[0061 ] 本发明实施例可以应用于浏览器、输入法APP(应用程序,Application)、搜索APP、 地图APP等任意具有语音交互功能的应用程序中。本发明实施例提供的语音的纠错处理方 法可应用于客户端与服务器对应的应用环境中,其中,客户端与服务器位于有线或无线网 络中,通过该有线或无线网络,客户端与服务器进行数据交互。
[0062] 其中,客户端可以运行在智能终端上,上述智能终端具体包括但不限:智能手机、 平板电脑、电子书阅读器、MP3 (动态影像专家压缩标准音频层面3,Moving Picture Experts Group Audio Layer III)播放器、MP4(动态影像专家压缩标准音频层面4,Moving Picture Experts Group Audio Layer IV)播放器、膝上型便携计算机、车载电脑、台式计 算机、机顶盒、智能电视机、可穿戴设备等等。
[0063] 在本发明的一种可选实施例中,客户端可通过麦克风或其他语音采集器件接收用 户所输入语音,并向例如服务器发送该用户所输入语音,由该服务器对用户所输入语音进 行识别以得到对应的识别结果,并将该服务器发送的该识别结果以文字的方式展示给用 户,例如,输入法程序可以将该识别结果展示在所寄宿的应用程序的输入框中,或者搜索程 序可以将该识别结果展示在搜索框中等。如果将用户所输入语音记作S,对S进行一系列处 理后得到与之相对应的语音特征序列〇,记作〇= {^,(^,…,(^,…,〇τ},其中⑴是第i个语音 特征,T为语音特征总个数。语音信号S对应的句子可看作是由许多词组成的一个词串,记作 W={ W1,W2,…,Wn}。语音识别的过程就是根据已知的语音特征序列0,求出最可能的词串W'。
[0064] 具体来说,语音识别是一个模型匹配的过程,在这个过程中,可以首先根据人的语 音特点建立语音模型,通过对输入的语音信号的分析,抽取所需的特征,来建立语音识别所 需的模板;对用户所输入语音进行识别的过程即是将用户所输入语音的特征与所述模板比 较的过程,最后确定与所述用户所输入语音匹配的最佳模板,从而获得语音识别的结果。具 体的语音识别算法,可采用基于统计的隐含马尔可夫模型的训练和识别算法,也可采用基 于神经网络的训练和识别算法、基于动态时间归整匹配的识别算法等等其他算法,本发明 实施例对于具体的语音识别过程不加以限制。
[0065] 在本发明的另一种可选实施例中,服务器可以检测用户所输入语音的识别结果中 疑似存在的错误,并在检测到用户所输入语音的识别结果中疑似存在错误时,向客户端发 送该错误,以使客户端输出该错误对应的提示信息或该错误所在句的提示信息。由检测用 户所输入语音的识别结果中存在的错误所需的运算工作在服务器中执行,故能够降低客户 端的运算量,也即能够大大降低客户端的资源消耗,从而能够提高客户端的运行时间和运 行效率,且能够提高客户端的实用性;并且,还能够发挥服务器侧计算资源(云服务器中云 资源)丰富的优势,从而能够识别结果中存在的错误的获取精度和获取效率。
[0066] 在本发明的再一种可选实施例中,上述检测用户所输入语音的识别结果中疑似存 在的错误的步骤,具体可以包括:
[0067] 步骤A1、确定用户所输入语音的识别结果中各词汇的置信度;
[0068] 步骤A2、将所述置信度在预置置信度范围内的词汇,作为所述识别结果中疑似存 在的错误。
[0069] 其中,上述置信度可用于表示识别结果中各词汇的可靠程度。在形式上,可以将其 定义为函数C(A),A为事件空间{^,^,..^^..丨中的一个元素^以彡满足:若发生事件心的 可靠性比发生知高,则有(XAdXXAs)。置信度评价可以对语音识别装置的识别结果进行假 设检验,通过事先设定的预置置信度范围对识别结果的可靠性进行评价,定位结果中的错 误,从而提高语音识别系统的识别率和稳健性。
[0070]在本发明的又一种可选实施例中,步骤A1确定用户所输入语音的识别结果中各词 汇的置信度可以具有多种计算方式,该计算方式具体可以包括基于假设检验的置信度、基 于后验概率的置信度、以及基于多种预测特征融合的置信度等等。其中,在基于隐马尔可夫 模型的语音识别系统中,最常用且有效的置信度通常包括:基于后验概率的置信度。传统的 基于声学层信息的后验概率主要有以下两种:
[0071 ] 1)基于帧平均的后验概率
[0072] 2)基于音素累计概率的后验概率
[0073] 前者需要对每一帧语音在整个声学空间(所有的隐马尔可夫状态)上计算观察概 率,后者在计算后验概率的分母的时候需要对一个音素循环网络进行解码。
[0074] 在本发明的另一种可选实施例中,上述预置置信度范围具体可以包括大于置信度 阈值的范围。可以理解,本领域技术人员可以根据实际应用需求,确定合理的置信度阈值。 例如,可以通过实时检测一个或多个参数(例如环境、场景、识别结果对应语句本身),获得 一个或多个检测结果,然后根据这些检测结果中的一个或多个对置信度阈值进行调整,使 得置信度阈值能够从第一值变为第二值,其中,第二值为与第一值相同或不同的值。如此一 来,置信度阈值能够根据不同的环境、场景或者不同的语句变为适应环境、场景或者语句的 置信度阈值,所以使得错误的检测精度更高。
[0075]需要说明的是,上述步骤A2将所述置信度在预置置信度范围内的词汇,作为所述 识别结果中存在的错误,只是作为本发明实施例的错误单元的一种示例,实际上,本发明实 施例的错误单元除了词汇外,还可以包括:短语、句子等。
[0076] 可以理解,上述步骤A1-步骤A2基于置信度检测识别结果存在的错误的方式只是 作为可选实施例,实际上,本领域技术人员可以根据实际应用需求,采用其他检测方式,例 如,依据上述识别结果进行检索(也即,将上述识别结果中的全部或部分作为检索词),并判 断检索结果是否小于预设的检索质量,若是,则判定上述识别结果中疑似存在错误,否则, 判定上述识别结果中不存在错误。具体地,可以采用预设的学习模型对一段时间的检索数 据进行分析,设置了检索质量,其中,检索质量具体包括一些参数信息的数值,比如:检索结 果的数量,和/或,检索结果之间的相关性。这样,判断获知检索结果小于预设的检索质量, 比如,检索结果的数量小于预设的数值;则说明检索结果没有达到预设的标准,因此,由检 索结果反推认为检索对象是疑似有误的,即识别结果是疑似存在错误的。
[0077] 在本发明实施例的一种可选实施例中,客户端可以通过视觉形式输出上述提示信 息,相应地,上述步骤101可以在检测到用户所输入语音的识别结果中疑似存在错误时,展 示所述错误对应的标记信息。
[0078] 上述标记信息可用于标识上述识别结果中疑似存在的错误。可选地,可以通过标 记所述错误或所述错误所在句的字体或者颜色等,得到上述标记信息;例如,可以将错误的 字体加粗、加下划线、倾斜、立体化、设为红色等,这相对于识别结果中非错误或非错误所在 句的正常字体或者正常颜色,能够提高错误的辨识度。为了防止遗漏疑似存在的错误,可以 考虑将当前输入或语音输入的全部内容进行标记,展示该标记信息。在本发明的一种应用 示例1中,用户欲通过语音输入"明天让张伟来找我",本发明给出的识别结果为"明天让章 威来找我吧",假设步骤101检测到的错误为"章威",则可以将识别结果中"章威"进行例如 下划线标记、或将"明天让章威来找我吧"此句话均采用例如下划线标记。或者,可以在上述 错误的上标等周围位置,展示所述错误的标识。其中,上述标识可以包括:图标、数字、文字 等,本发明实施例对于具体的标识不加以限制。可以理解,上述展示所述错误对应的标记信 息的方式只是作为可选实施例,实际上,本发明实施例还可以通过弹窗、浮层等形式展示错 误对应的提示信息或该错误所在句的提示信息,本发明实施例对于提示信息的具体展示方 式方式不加以限制。
[0079] 在本发明实施例的另一种可选实施例中,客户端可以通过语音形式输出上述提示 信息,相应地,上述步骤101可以在检测到用户所输入语音的识别结果中疑似存在错误时, 通过语音方式播放所述错误对应的提示信息。对于上述应用示例1中的识别,通过语音方式 播放的提示信息具体可以包括"章威可能存在错误"。在本发明的其他实施例中,通过语音 方式播放的提示信息还可以与错误的位置相关,如"前第Μ个词可能存在错误"、"后第N个词 可能存在错误"等。或者,通过语音方式播放的提示信息还可以与该错误所在句相关,如"最 后一句可能存在错误"等。
[0080] 本发明实施例中,步骤102获取的后续操作可以为用户依据该提示信息快速产生 对应的后续操作,该后续操作可用于作为步骤103的纠错处理操作的依据。在实际应用中, 在检测到用户所输入语音的识别结果中疑似存在错误时,展示所述错误对应的标记信息, 同时或延后输出语音纠错提示。例如"请尝试说出您要修改的指令,例如删除*字,在*后/前 插入*,是否将*替换为*"等方式的语音纠错提示,通常语音纠错提示包括:删除、插入、替换 的常规或优选表述方式等,以很直观提示用户如何对所述标记信息进行后续纠错处理操 作。
[0081] 上述后续操作可以为通过键盘、鼠标、触控等手动方式产生的触发操作,如在上述 后续操作为用户对于所述标记信息或者修改按钮的触发操作时,可以认为用户具有对该标 记信息对应错误进行纠正的意图(以下简称纠错意图),则步骤103可以对该标记信息进行 纠错处理。或者,上述后续操作可以为纠错语音指令,则步骤103可以依据该纠错语音指令 进行纠错处理,例如,上述应用示例1对应的纠错语音指令可以包括:"不是立早章而是弓长 张,是伟大的伟",则步骤103可以对所述识别结果进行相应的纠错处理。
[0082] 在实际应用中,上述步骤101输出的提示信息可能不符合用户的纠错意图,在本发 明的一种可选实施例中,可以允许用户调整上述提示信息,相应地,本发明实施例的方法还 可以包括:响应于用户对于所述提示信息的调整操作,对所述提示信息进行调整。
[0083]其中,上述调整操作可以与错误的位置或词汇相关,且可以通过语音或者手动方 式产生上述调整操作。假设针对识别结果"明天让章威来找我吧",步骤101将识别结果中 "章威"进行了下划线标记,但用户认为"章威"是正确的,"吧"存在错误,故可以产生相应的 语音调整指令,例如,上述语音调整指令可以为"吧存在错误"或者"最后一个字存在错误 等",则本发明实施例可以对上述提示信息进行调整,例如,可以删除"章威"对应的下划线 标记,并将"吧"进行下划线标记。相应地,上述步骤102和步骤103可以针对调整后的提示信 息进行后续处理。
[0084]需要说明的是,在疑似存在的错误为两处或两处以上时,本发明实施例的步骤101 可以按照从前到后的顺序或者重要度从高到底的顺序,依次输出各错误对应的提示信息, 假设当前输出的为当前错误例如第一处疑似存在的错误对应的提示信息,则可以在步骤 102获取用户依据当前错误产生对应的当前后续操作且步骤103依据当前后续操作进行纠 错处理后,步骤101可以接着输出下一错误误例如第二处疑似存在的错误对应的提示信息, 也即,对于同一识别结果,本发明实施例的步骤101-步骤102和步骤103可以为循环执行的 流程。例如在某一识别结果疑似存在两处错误时,步骤101可以首先输出第一处错误对应的 提示信息,在用户对于步骤102和步骤103所得到第一处错误的纠错处理结果无误后,步骤 101可以接着输出第二处错误对应的提示信息,接着步骤102和步骤103可以执行第二处错 误的纠错处理。
[0085]需要说明的是,在本发明的其他实施例中,用户可能不存在对于上述识别结果的 纠错意图,此种情况下,在输出上述提示信息后,用户可以不响应上述提示信息,例如直接 进行后续的语音输入或者发送等操作;或者,用户可以主动输入上述识别结果的确认信息, 例如,上述确认信息可以为通过语音发出的"此句不存在错误"等确认指令,也即,在此种情 况下本发明实施例可以不执行步骤103对应的纠错处理。
[0086] 在本发明的一种可选实施例中,上述提示信息除了包括:错误对应的位置和词汇 信息外,还可以包括:错误对应的至少一个纠错候选结果在输出所述错误对应的提示信息 的过程中,展示所述错误对应的至少一个纠错候选结果。例如,可以一边通过语音播放所述 错误对应的提示信息,一边在屏幕上展示所述错误对应的至少一个纠错候选结果以供用户 选择。例如,用户语音输入后,输出疑似存在错误所对应的提示信息,该提示信息可以是在 屏幕上展示所述错误对应的至少一个纠错候选结果以供用户选择。其中,用户选择的纠错 候选结果可以作为对所述识别结果进行纠错处理的依据,后续会有详细的介绍。
[0087] 综上,本发明实施例可以通过提示信息直接向用户提供识别结果中疑似存在的错 误,该提示信息可以明确该错误的位置、或者该错误对应的词汇等信息、或者该错误所在 句,或该错误所在的当前输入内容等,由于本发明实施例节省了用户从识别结果中寻找错 误的过程,故可以使用户依据该提示信息快速产生对应的后续操作,因此能够提高语音输 入的效率。
[0088] 另外,本发明实施例还可以在展示所述错误对应的标记信息的同时或延后输出语 音纠错提示;该语音纠错提示可以直观提示用户如何对所述标记信息进行后续纠错处理操 作,因此能够提高语音纠错的便捷度和准确度。
[0089] 并且,相对于现有方案中基于手动方式的错误修改过程,本发明实施例可以依据 所述后续操作对所述识别结果进行自动纠错处理,因此能够缩短纠错所需的时间,从而进 一步能够提高语音输入的效率,以及增加错误修改的便利性。
[0090] 方法实施例二
[0091] 参照图2,示出了本发明的一种语音的纠错处理方法实施例二的步骤流程图,具体 可以包括如下步骤:
[0092]步骤201、在检测到用户所输入语音的识别结果中疑似存在错误时,输出所述错误 对应的提示信息;
[0093]步骤202、获取所述用户的后续操作;
[0094]步骤203、响应于用户对于所述错误的纠错候选结果的选择操作,依据所述选择操 作对应的纠错候选结果对所述识别结果进行纠错处理。
[0095] 相对于图1所示方法实施例一,本实施例的所述用户的后续操作具体可以包括:用 户对于所述错误的纠错候选结果的选择操作,其中,该选择操作可以通过手动或者语音方 式产生;且本实施例还通过步骤203细化了依据所述后续操作对所述识别结果进行纠错处 理的过程,具体地,步骤204可以依据用户的选择操作对应的纠错候选结果对所述识别结果 进行纠错处理。
[0096] 在本发明的一种可选实施例中,所述纠错候选结果具体可以包括:所述错误对应 的替换词和/或所述错误对应的编辑指令。
[0097] 其中,在上述纠错候选结果包括所述错误对应的替换词时,上述步骤203可以依据 用户的选择操作对应的目标替换词,将所述错误替换为上述目标替换词,也即,本发明实施 例可以依据用户对于纠错候选结果的选择操作进行错误的替换;这相对于现有方案中用户 需要在智能终端上移动光标至错误位置并通过手动方式进行相应的错误修改,本发明实施 例中用户通过选择操作选择错误对应的替换词即可实现错误纠正,由于相对于现有方案节 省了用户定位错误和修改错误的操作,因此能够缩短纠错所需的时间,从而进一步能够提 高语音输入的效率,以及增加错误修改的便利性。
[0098] 在本发明的一种可选实施例中,可以将上述错误的出现位置对应的竞争词作为对 应的替换词。可选地,上述竞争词可以包括:上述错误对应语音特征序列的同音词、近音词, 如上述应用示例1中,错误"章威"对应语音特征序列"zhangwei"对应的同音词具体包括: "张伟"、"张薇"等。在本发明的一种应用示例2中,用户所输入语音对应的语音特征序列为 "xianfengjingmei",假设给出的识别结果为"先锋精美",假设检测得到的错误为"先锋 精",则该错误对应语音特征序列"xianf eng jing"对应的同音词对应的同音词具体可以包 括:"西安风景"。可以理解,上述错误对应语音特征序列的同音词、近音词只是作为竞争词 的一种示例,实际上,上述竞争词还可以包括:上述错误及其上下文对应语音特征序列的同 音词、近音词,本发明实施例对于具体的竞争词不加以限制。
[0099] 在本发明的另一种可选实施例中,上述竞争词具体可以包括:所述错误的出现位 置相应对象的词汇。例如识别结果"你明天来找我吧"中"明天"相应对象为"时间","时间" 对应的词汇具体可以包括:"今天"、"后天",其中,"今天"可以进一步包括"今天上午"、"今 天下午"、"今天晚上"等,"今天下午"等可以进一步包括:对应的小时,如"今天下午三点半" 等,则上述识别结果中"明天"对应的词汇具体可以包括:"今天下午三点半"、"今天晚上六 点半"等,这些词汇均可以作为纠错候选结果提供给用户。又如,识别结果"咱们五道口华联 见吧"中"五道□华联"相应对象为"地点","地点"对应的词汇具体可以包括:"五道口电影 院"、"五道口肯德基"、"五道口多乐之日"等,这些词汇均可以作为纠错候选结果提供给用 户。
[0100] 可以看出,在上述竞争词与上述错误对应语音特征序列相关时,本发明实施例可 以修正识别结果本身的错误;而在上述竞争词具体包括所述错误的出现位置相应对象的词 汇时,上述竞争词可以与上述错误对应语音特征序列无关,此种情况下,本发明实施例可以 修正用户的输入意图错误(例如表达错误)。例如,用户在先打算通过语音输入识别结果"你 明天来找我吧",但输入后又想要改变输入意图,将"明天"修改为"今天下午三点半",本发 明实施例可以直接提供契合最新输入意图的纠错候选结果,因此能够提高语音纠错的智能 性。
[0101] 在本发明的再一种可选实施例中,可以采用语言模型,计算上述识别结果的语音 特征序列对应的候选文本的概率,并按照概率从高到低的顺序,从上述候选文本中选择若 干目标候选文本,并依据上述目标候选文本确定上诉错误对应的至少一个纠错候选结果, 其中,可以从上述目标候选文本中选择上述错误的出现位置的对应部分,作为纠错候选结 果。可以理解,本发明实施例对于错误对应的至少一个纠错候选结果的具体获取过程不加 以限制。
[0102] 本发明实施例中,上述编辑指令可用于表示对错误进行编辑,例如,上述编辑指令 具体可以包括:删除词汇的指令、添加词汇的指令、修改词汇的指令等。则上述步骤203可以 通过执行上述编辑指令,实现对于所述识别结果的纠错处理。本发明实施例可以依据用户 的选择操作进行错误对应词汇的编辑;这相对于现有方案中用户需要在智能终端上移动光 标至错误位置并通过手动方式进行相应的错误修改,本发明实施例中用户通过选择操作选 择错误对应的编辑指令即可实现错误纠正,由于相对于现有方案节省了用户定位错误和修 改错误的操作,因此能够缩短纠错所需的时间,从而进一步能够提高语音输入的效率,以及 增加错误修改的便利性。如上述应用示例1中,错误"吧"对应的编辑指令具体可以包括:清 除指令,则在用户选择该清除指令时,可以将识别结果中"吧"删除。
[0103] 可以理解,上述纠错候选结果中可以同时包括:错误对应的替换词和/或所述错误 对应的编辑指令,如上述应用示例1中,错误"吧"对应的纠错候选结果具体可以包括:"把"、 "爸"和清除指令,则在用户选择该清除指令时,可以将识别结果中"吧"删除;或者,在用户 选择"爸"时,可以将识别结果中"吧"修改为"爸"。
[0104] 在本发明的一种可选实施例中,所述方法还可以包括:展示错误对应的至少一个 纠错候选结果的步骤,该步骤具体可以包括:
[0105] 步骤B1、响应于用户对于所述错误的触发操作,展示所述触发操作所对应错误对 应的至少一个纠错候选结果;或者
[0106] 步骤B2、在输出所述错误对应的提示信息的过程中,展示所述错误对应的至少一 个纠错候选结果。
[0107] 步骤B1可以步骤203之前执行,可选地,可以在步骤201或者步骤202之后执行。以 在步骤202执行上述展示错误对应的至少一个纠错候选结果的步骤为例,所述用户的后续 操作可以包括:用户对于所述错误的触发操作;上述触发操作可以为用户对于错误本身产 生的触发操作,例如,在用户选中某错误对应的文字后,可以认为用户对于错误本身产生了 触发操作。或者,上述触发操作可以为用户对于错误的标记信息产生的触发操作,例如,在 步骤201在错误对应的文字的上标位置展示图标后,用户点击了该图标,则可以认为用户对 于错误的标记信息产生了触发操作。可以理解,本发明实施例中用户对于所述错误的触发 操作可用于触发错误的纠错候选结果,而对于具体的触发操作及其触发方式不加以限制。 可以看出,步骤B1在用户产生对于错误的触发操作后、展示对应的纠错候选结果,由于上述 触发操作对应错误为符合纠错意图的错误,故能够避免不符合纠错意图的错误所对应纠错 候选结果对于用户的干扰。
[0108] 步骤B2可以在步骤201输出所述错误对应的提示信息的过程中,展示所述错误对 应的至少一个纠错候选结果。例如,可以一边通过语音播放所述错误对应的提示信息,一边 在屏幕上展示所述错误对应的至少一个纠错候选结果。又如,用户语音输入后,输出疑似存 在错误所对应的提示信息,该提示信息可以是在屏幕上展示所述错误对应的至少一个纠错 候选结果以供用户选择。
[0109] 可以理解,上述步骤B1和步骤B2只是作为展示所述触发操作所对应错误对应的至 少一个纠错候选结果的一种示例,实际上本发明实施例对于纠错候选结果的具体展示方式 不加以限制。
[0110] 在此提供上述应用示例1的一种纠错处理流程,假设本发明给出的识别结果为"明 天让章威来找我吧",则上述纠错处理流程具体可以包括:
[0111] 步骤C1、将上述识别结果中"章威"和"吧"进行下划线标记,或将"明天让章威来找 我吧"此句话均进行下划线标记;在获取到用户对于"章威"的触发操作时,执行步骤C2-步 骤C3,或者,在获取到用户对于"吧"的触发操作时,执行步骤C4-步骤C5;
[0112] 步骤C2、响应于用户对于"章威"的触发操作,可以展示"张伟"、"张玮"、"章威"等 三个纠错候选结果;
[0113]步骤C3、响应于用户对于"张伟"的选择操作,将上述识别结果中"章威"替换为"张 伟";
[0114]步骤C4、响应于用户对于"吧"的触发操作,展示"把"、"爸"和清除指令;
[0115] 步骤C5、响应于用户对于"清除指令"的选择操作,将识别结果中"吧"删除;或者, 响应于用户对于"爸"的选择操作,将识别结果中"吧"修改为"爸"。
[0116] 在此提供上述应用示例3的一种纠错处理流程,假设本发明给出的识别结果为"我 想看小说",则上述纠错处理流程具体可以包括:
[0117] 步骤D1、将上述识别结果中"小说"进行下划线标记、或将"我想看小说"此句话均 采用例如下划线标记;在获取到用户对于"小说"的触发操作时,执行步骤D2-步骤D3;
[0118] 步骤D2、响应于用户对于"小说"的触发操作,展示"晓说"、"小硕"、"笑说"等三个 纠错候选结果;
[0119] 步骤D3、响应于用户对于"晓说"的选择操作,将上述识别结果中"小说"替换为"晓 说"。
[0120] 需要说明的是,上述应用示例1和应用示例3的纠错处理流程中,在执行步骤C1或 步骤D1的同时或延后,还可以输出语音纠错提示。例如"请尝试说出您要修改的指令,例如 删除*字,在*后/前插入*,是否将*替换为*"等方式的语音纠错提示,以很直观提示用户如 何对所述标记信息进行后续纠错处理操作。
[0121] 综上,本发明实施例可以依据用户对于纠错候选结果的选择操作进行错误的纠错 处理;这相对于现有方案中用户需要在智能终端上移动光标至错误位置并通过手动方式进 行相应的错误修改,本发明实施例中用户通过选择操作选择错误对应的替换词即可实现错 误纠正,由于相对于现有方案节省了用户定位错误和修改错误的操作,因此能够缩短纠错 所需的时间,从而进一步能够提高语音输入的效率,以及增加错误修改的便利性。
[0122] 方法实施例三
[0123] 参照图3,示出了本发明的一种语音的纠错处理方法实施例三的步骤流程图,具体 可以包括如下步骤:
[0124] 步骤301、在检测到用户所输入语音的识别结果中疑似存在错误时,输出所述错误 对应的提示信息;
[0125] 步骤302、获取所述用户的后续操作;所述用户的后续操作具体可以包括:纠错语 首指令;
[0126] 步骤303、对所述纠错语音指令的识别结果与预置纠错规则进行匹配;
[0127] 步骤304、在所述纠错语音指令的识别结果与所述预置纠错规则匹配时,将所述预 置纠错规则对应的预置纠错操作作为所述纠错语音指令对应的目标纠错操作;
[0128] 步骤305、依据所述纠错语音指令,针对所述识别结果执行所述目标纠错操作。
[0129] 相对于图1所示方法实施例一,本实施例的所述用户的后续操作具体可以包括:纠 错语音指令,且本实施例还通过步骤303-一步骤305细化了依据所述后续操作对所述识别 结果进行纠错处理的过程,具体地,步骤303-一步骤304可以基于纠错语音指令的识别结 果与预置纠错规则的匹配获取所述纠错语音指令对应的目标纠错操作,步骤305可以针对 所述识别结果执行所述目标纠错操作。
[0130] 本发明实施例中,预置纠错规则可以为预先获取的符合用户的修改行为习惯或者 修改逻辑的纠错规则,故本发明实施例可以准确地获取纠错语音指令对应的目标纠错操 作,从而可以提高纠错处理的准确度。
[0131] 参照表1,示出了本发明的一种预置纠错规则的示意,为便于理解,上述表1通过编 号、描述和示例等方面对预置纠错规则进行描述。
[0132] 表1
[0135]在本发明的一种可选实施例中,为了保证预置纠错规则的覆盖率,所述预置纠错 规则的获取方式具体可以包括如下方式中的至少一种:
[0136] 方式1:收集至少一个用户使用过的纠错规则,作为预置纠错规则;其中,可以通过 不同的客户端或者不同的智能终端区分不同的用户,上述方式1可以收集和汇总至少一个 用户使用过的纠错规则,由此可以尽可能多地获取符合符合用户的修改行为习惯的纠错规 贝1J,作为预置纠错规则。需要说明的是,用户使用过的纠错规则可能是符合其修改逻辑的部 分纠错规则,但对于至少一个用户使用过的纠错规则的汇总,可以提高预置纠错规则的覆 盖率。
[0137] 方式2:依据用户的历史行为数据,得到符合所述用户对于输入结果的修改逻辑的 预置纠错规则;在实际应用中,上述历史行为数据可以为输入法APP、搜索APP等应用程序记 录的历史行为数据,以搜索APP为例,其可以通过搜索日志记录用户对于搜索词等输入结果 的修改行为数据,则对上述修改行为数据进行分析,可以得到符合所述用户对于输入结果 的修改逻辑的预置纠错规则。以输入法APP为例,其可以记录用户在OFFICE、浏览器等各种 应用程序中对于输入结果的修改行为数据,则对上述修改行为数据进行分析,可以得到符 合所述用户对于输入结果的修改逻辑的预置纠错规则。
[0138] 在本发明的一种应用示例中,可以预先设置关键词列表,该列表具体可以包括: "修改"、"删除"、"删掉"、"改成"等关键词,则可以从用户语料中挑选对于输入结果的修改 行为数据并进行分析,以得到符合所述用户对于输入结果的修改逻辑的预置纠错规则。
[0139] 以输入法APP为例,假设用户语料中包含"我觉得可以把后两个字删掉",则预置纠 错规则可以为:将/把前Μ个字删掉/删除;假设用户语料中包含"刚发给你的不对,不是立早 章是弓长张",则预置纠错规则可以为:不是XX,是/而是**。可以理解,本领域技术人员可以 根据实际的用户语料进行相应的分析并得到对应的预置纠错规则,本发明实施例对于具体 的预置纠错规则及其对应用户语料的分析过程不加以限制。
[0140] 方式3:获取至少一个用户设置的预置纠错规则;在实际应用中,可以向用户提供 设置接口,以使用户通过该设置接口进行预置纠错规则的设置。
[0141] 方式4:依据至少一个用户针对已有预置纠错规则的反馈信息,得到更新的预置纠 错规则。在实际应用中,可以向用户提供反馈接口,以使用户通过该反馈接口进行已有预置 纠错规则的更新。
[0142] 在本发明的一种应用示例中,在用户发现自己的当前纠错语音指令无法使用时, 可以触发该反馈接口以提交对应的错误报告。则本发明实施例可以将当前纠错语音指令对 应的已有预置纠错规则提供给用户,如将XX修改成/改成**,则用户可以在该已有预置纠错 规则的基础上添加:将XX改为**这一新的预置纠错规则。
[0143] 在获取上述预置纠错规则的基础上,可以对预置纠错规则进行分析,以得到对应 的预置纠错操作,例如,表1中预置纠错规则1、预置纠错规则2、预置纠错规则3、预置纠错规 则4、预置纠错规则5和预置纠错规则6,对应的预置纠错操作分别为:修改操作、删除操作、 删除操作、插入操作、修改操作和修改操作。可以理解,本发明实施例对预置纠错规则对应 预置纠错操作的具体获取过程不加以限制。
[0144] 在本发明的一种可选实施例中,在获取所述用户的后续操作之前,可以向用户提 供至少一种预置纠错规则,以增加用户对于预置纠错规则的了解,从而可以实现对于预置 纠错规则的灵活运用。例如,可以在识别结果的例如下方等周围区域展示至少一种预置纠 错规则,其中,展示的至少一种预置纠错规则可以为当前用户使用过的预置纠错规则,也可 以为大众用户使用最多的预置纠错规则,本发明实施例对于所展示的具体预置纠错规则不 加以限制。
[0145] 在本发明的另一种可选实施例中,在获取上述纠错语音指令前,还可以获取用户 的纠错触发语音指令(如"芝麻开门"、"我要修改"等),该纠错触发语音指令可以标识之后 的语音指令为用于纠错的纠错语音指令。
[0146] 在此提供上述应用示例1的一种纠错处理流程,假设本发明给出的识别结果为"明 天让章威来找我吧",则上述纠错处理流程具体可以包括:
[0147] 步骤E1、通过语音方式播放上述识别结果的整句或者上述识别结果中"章威"和 "吧"对应的错误;
[0148] 步骤E2、在获取到用户对于"章威"的第一纠错语音指令时,执行步骤E3-步骤E4, 或者,在获取到用户对于"吧"的第二纠错语音指令时,执行步骤E5-步骤E6;
[0149] 步骤E3、将第一纠错语音指令的识别结果"弓长张伟大的伟"与上述预置纠错规则 相匹配,以得到与第一纠错语音指令的识别结果相匹配的预置纠错规则6及其目标纠错操 作(修改操作);
[0150] 步骤E4、将上述识别结果中"张伟"修改为所述第一纠错语音指令的识别结果中的 两个整体字"张伟";
[0151] 步骤E5、将第二纠错语音指令的识别结果"把最后一个字删除"与上述预置纠错规 则相匹配,以得到与第二纠错语音指令的识别结果相匹配的预置纠错规则2及其目标纠错 操作(最后一个字的删除操作);
[0152] 步骤E6、将上述识别结果中"吧"删除。
[0153] 需要说明的是,在执行步骤E1的同时或者延后,还可以输出语音纠错提示。例如 "请尝试说出您要修改的指令,例如删除*字,在*后/前插入*,是否将*替换为*"等方式的语 音纠错提示,通常语音纠错提示包括:删除、插入、替换的常规或优选表述方式等,以很直观 提示用户如何对所述标错误进行后续纠错处理操作。
[0154]综上,本发明实施例中,预置纠错规则可以为预先获取的符合用户的修改行为习 惯或者修改逻辑的纠错规则,故本发明实施例可以准确地获取纠错语音指令对应的目标纠 错操作,从而可以提高纠错处理的准确度。
[0155] 需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组 合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依 据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该 知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施 例所必须的。
[0156] 装置实施例
[0157] 参照图4,示出了本发明的一种语音的纠错处理装置实施例的结构框图,具体可以 包括如下模块:
[0158] 提示输出模块401,用于在检测到用户所输入语音的识别结果中疑似存在错误时, 输出所述错误对应的提示信息;
[0159] 操作获取模块402,用于获取所述用户的后续操作;以及
[0160]纠错处理模块403,用于依据所述后续操作对所述识别结果进行纠错处理。
[0161] 在本发明的一种可选实施例中,所述提示输出模块401,具体可以包括:
[0162] 标记展示子模块,用于在检测到用户所输入语音的识别结果中疑似存在错误时, 展示所述错误对应的标记信息;和/或
[0163] 语音纠错提示子模块,用于在检测到用户所输入语音的识别结果中疑似存在错误 时,展示所述错误对应的标记信息,以及输出对应的语音纠错提示;和/或
[0164] 语音播放子模块,用于在检测到用户所输入语音的识别结果中疑似存在错误时, 通过语音方式播放所述错误对应的提示信息。
[0165] 在本发明的另一种可选实施例中,所述纠错处理模块403,具体可以包括:
[0166] 触发纠错子模块,用于响应于用户对于所述错误的纠错候选结果的选择操作,依 据所述选择操作对应的纠错候选结果对所述识别结果进行纠错处理。
[0167] 在本发明的再一种可选实施例中,所述装置还可以包括:
[0168] 触发展示模块,用于响应于用户对于所述错误的触发操作,展示所述错误对应的 至少一个纠错候选结果;或者
[0169] 提示展示模块,用于在输出所述错误对应的提示信息的过程中,展示所述错误对 应的至少一个纠错候选结果。
[0170] 在本发明的又一种可选实施例中,所述纠错候选结果具体可以包括:所述错误对 应的替换词和/或所述错误对应的编辑指令。
[0171] 在本发明的一种可选实施例中,所述替换词具体可以包括:所述错误的出现位置 对应的竞争词。
[0172] 在本发明的另一种可选实施例中,所述用户的后续操作具体可以包括:纠错语音 指令,所述纠错处理模块403,具体可以包括:
[0173] 规则匹配子模块,用于对所述纠错语音指令的识别结果与预置纠错规则进行匹 配;
[0174] 操作确定子模块,用于在所述纠错语音指令的识别结果与所述预置纠错规则匹配 时,将所述预置纠错规则对应的预置纠错操作作为所述所述纠错语音指令对应的目标纠错 操作;以及
[0175] 操作执行子模块,用于依据所述纠错语音指令,针对所述识别结果执行所述目标 纠错操作。
[0176] 在本发明的再一种可选实施例中,所述装置还可以包括:用于获取预置纠错规则 的规则获取模块;
[0177] 所述规则获取模块具体可以包括如下模块中的至少一种:
[0178] 第一获取子模块,用于收集至少一个用户使用过的纠错规则,作为预置纠错规则;
[0179] 第二获取子模块,用于依据用户的历史行为数据,得到符合所述用户对于输入结 果的修改逻辑的预置纠错规则;
[0180] 第三获取子模块,用于获取至少一个用户设置的预置纠错规则;
[0181] 第四获取子模块,用于依据至少一个用户针对已有预置纠错规则的反馈信息,得 到更新的预置纠错规则。
[0182] 在本发明的又一种可选实施例中,所述装置还可以包括:用于检测用户所输入语 音的识别结果中存在的错误的错误检测模块;
[0183] 所述错误检测模块,具体可以包括:
[0184] 置信度确定子模块,用于确定用户所输入语音的识别结果中各词汇的置信度;以 及
[0185] 错误确定子模块,用于将所述置信度在预置置信度范围内的词汇,作为所述识别 结果中存在的错误。
[0186] 在本发明的一种可选实施例中,所述装置还可以包括:
[0187] 调整模块,用于响应于用户对于所述提示信息的调整操作,对所述提示信息进行 调整。
[0188] 对于装置实施例而言,由于其与方法实施例一一对应,所以描述的比较简单,相关 之处参见方法实施例的部分说明即可。
[0189] 本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与 其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
[0190] 关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法 的实施例中进行了详细描述,此处将不做详细阐述说明。
[0191]图5是根据一示例性实施例示出的一种用于语音的纠错处理的装置800的框图。例 如,装置800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设 备,医疗设备,健身设备,个人数字助理等。
[0192] 参照图5,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源 组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及 通信组件816。
[0193] 处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相 机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指 令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便 于处理组件802和其他组件之间的交互。例如,处理部件802可以包括多媒体模块,以方便多 媒体组件808和处理组件802之间的交互。
[0194] 存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示 例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消 息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组 合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPR0M),可擦除可编 程只读存储器(EPROM),可编程只读存储器(PR0M),只读存储器(ROM),磁存储器,快闪存储 器,磁盘或光盘。
[0195] 电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系 统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
[0196] 多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一 些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏 幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感 器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作 的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒 体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或 视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和 后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
[0197] 音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克 风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配 置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组 件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
[0198] I/O接口 812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可 以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁 定按钮。
[0199] 传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评 估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如所述 组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800-个组件 的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的 温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测 附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或C⑶图像传感器,用于在成 像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感 器,磁传感器,压力传感器或温度传感器。
[0200] 通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置 800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施 例中,通信部件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。 在一个示例性实施例中,所述通信部件816还包括近场通信(NFC)模块,以促进短程通信。例 如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术, 蓝牙(BT)技术和其他技术来实现。
[0201] 在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信 号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列 (FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
[0202] 在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例 如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述方法。例如, 所述非临时性计算机可读存储介质可以是R0M、随机存取存储器(RAM)、CD-R0M、磁带、软盘 和光数据存储设备等。
[0203] -种非临时性计算机可读存储介质,当所述存储介质中的指令由处理器执行时, 使得具有处理器的装置能够执行一种语音的纠错处理方法,所述方法包括:在检测到用户 所输入语音的识别结果中疑似存在错误时,输出所述错误对应的提示信息;获取所述用户 的后续操作;依据所述后续操作对所述识别结果进行纠错处理。
[0204] 图6是本发明实施例中服务器的结构示意图。该服务器1900可因配置或性能不同 而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units, CHJ) 1922(例如,一个或一个以上处理器)和存储器1932, 一个或一个以上存储应用程序 1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932 和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或 一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步 地,中央处理器1922可以设置为与存储介质1930通信,在服务器1900上执行存储介质1930 中的一系列指令操作。
[0205] 服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网 络接口 1950,一个或一个以上输入输出接口 1958,一个或一个以上键盘1956,和/或,一个或 一个以上操作系统 1941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM 等等。
[0206]本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其 它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或 者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识 或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的 权利要求指出。
[0207]应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并 且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制 [0208]以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和 原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
[0209]以上对本发明所提供的一种语音的纠错处理方法、一种语音的纠错处理装置和一 种用于语音的纠错处理的装置,进行了详细介绍,本文中应用了具体个例对本发明的原理 及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思 想;同时,对于本领域的一般技术人员,依据本发明的思想,在【具体实施方式】及应用范围上 均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
【主权项】
1. 一种语音的纠错处理方法,其特征在于,包括: 在检测到用户所输入语音的识别结果中疑似存在错误时,输出所述错误对应的提示信 息; 获取所述用户的后续操作; 依据所述后续操作对所述识别结果进行纠错处理。2. 根据权利要求1所述的方法,其特征在于,所述在检测到用户所输入语音的识别结果 中疑似存在错误时,输出所述错误对应的提示信息的步骤,包括: 在检测到用户所输入语音的识别结果中疑似存在错误时,展示所述错误对应的标记信 息;和/或 在检测到用户所输入语音的识别结果中疑似存在错误时,展示所述错误对应的标记信 息,以及输出对应的语音纠错提示;和/或 在检测到用户所输入语音的识别结果中疑似存在错误时,通过语音方式播放所述错误 对应的提示信息。3. 根据权利要求1所述的方法,其特征在于,所述依据所述后续操作对所述识别结果进 行纠错处理的步骤,包括: 响应于用户对于所述错误的纠错候选结果的选择操作,依据所述选择操作对应的纠错 候选结果对所述识别结果进行纠错处理。4. 根据权利要求3所述的方法,其特征在于,所述方法还包括: 响应于用户对于所述错误的触发操作,展示所述错误对应的至少一个纠错候选结果; 或者 在输出所述错误对应的提示信息的过程中,展示所述错误对应的至少一个纠错候选结 果。5. 根据权利要求3所述的方法,其特征在于,所述纠错候选结果包括:所述错误对应的 替换词和/或所述错误对应的编辑指令。6. 根据权利要求5所述的方法,其特征在于,所述替换词包括:所述错误的出现位置对 应的竞争词。7. 根据权利要求1所述的方法,其特征在于,所述用户的后续操作包括:纠错语音指令; 所述依据所述后续操作对所述识别结果进行纠错处理的步骤,包括: 对所述纠错语音指令的识别结果与预置纠错规则进行匹配; 在所述纠错语音指令的识别结果与所述预置纠错规则匹配时,将所述预置纠错规则对 应的预置纠错操作作为所述所述纠错语音指令对应的目标纠错操作; 依据所述纠错语音指令,针对所述识别结果执行所述目标纠错操作。8. 根据权利要求7所述的方法,其特征在于,所述预置纠错规则的获取方式包括如下方 式中的至少一种: 收集至少一个用户使用过的纠错规则,作为预置纠错规则; 依据用户的历史行为数据,得到符合所述用户对于输入结果的修改逻辑的预置纠错规 则; 获取至少一个用户设置的预置纠错规则; 依据至少一个用户针对已有预置纠错规则的反馈信息,得到更新的预置纠错规则。9. 根据权利要求1至8中任一所述的方法,其特征在于,通过如下步骤检测用户所输入 语音的识别结果中疑似存在的错误: 确定用户所输入语音的识别结果中各词汇的置信度; 将所述置信度在预置置信度范围内的词汇,作为所述识别结果中疑似存在的错误。10. 根据权利要求1至8中任一所述的方法,其特征在于,所述方法还包括: 响应于用户对于所述提示信息的调整操作,对所述提示信息进行调整。11. 一种语音的纠错处理装置,其特征在于,包括: 提示输出模块,用于在检测到用户所输入语音的识别结果中疑似存在错误时,输出所 述错误对应的提示信息; 操作获取模块,用于获取所述用户的后续操作;以及 纠错处理模块,用于依据所述后续操作对所述识别结果进行纠错处理。12. -种用于语音的纠错处理的装置,其特征在于,包括有存储器,以及一个或者一个 以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以 上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令: 在检测到用户所输入语音的识别结果中疑似存在错误时,输出所述错误对应的提示信 息; 获取所述用户的后续操作; 依据所述后续操作对所述识别结果进行纠错处理。
【文档编号】G10L15/14GK106098060SQ201610340673
【公开日】2016年11月9日
【申请日】2016年5月19日
【发明人】陈伟, 王砚峰, 李浩斌
【申请人】北京搜狗科技发展有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1