指令识别的处理方法及装置的制造方法

文档序号:10614118阅读:228来源:国知局
指令识别的处理方法及装置的制造方法
【专利摘要】本发明适用于信息识别技术领域,提供了一种指令识别的处理方法及装置,所述处理方法包括:当获取到待识别的语音信息时,获取所述语音信息对应的待识别文本以及应用情景信息;根据所述待识别文本、应用情景信息,从所述语料库中查找标准指令,以所述标准指令作为所述待识别的语音信息的识别结果;当无法从所述语料库中查找到标准指令时,对所述待识别文本进行纠错,并根据纠错结果从所述语料库中查找标准指令;其中,所述语料库包括文本信息、应用情景信息以及在所述应用情景信息下所述文本信息对应的标准指令。本发明提高了通过语音识别获取到的指令的准确度。
【专利说明】
指令识别的处理方法及装置
技术领域
[0001] 本发明属于信息识别技术领域,尤其涉及一种指令识别的处理方法及装置。
【背景技术】
[0002] 在实现语音控制功能时,现有的智能家居设备在采集到用户输入的语音信息后, 首先将所述语音信息转换为文本信息,然后对所述文本信息进行映射,从而得到对应的设 备指令。然而,语音信息的采集容易受到外部环境、用户口音、方言等因素的影响,文本信息 的转换则容易受到转换算法的影响,从而产生误差,最终导致语音识别出来的指令是错误 的,未能反映用户的真实意图,大大地降低了用户的体验感。

【发明内容】

[0003] 鉴于此,本发明实施例提供一种指令识别的处理方法及装置,以提高通过语音识 别获取的指令的准确度。
[0004] 第一方面,提供了一种指令识别的处理方法,所述处理方法包括:
[0005] 当获取到待识别的语音信息时,获取所述语音信息对应的待识别文本以及应用情 景?目息;
[0006] 根据所述待识别文本、应用情景信息,从所述语料库中查找标准指令,以所述标准 指令作为所述待识别的语音信息的识别结果;
[0007] 当无法从所述语料库中查找到标准指令时,对所述待识别文本进行纠错,并根据 纠错结果从所述语料库中查找标准指令;
[0008] 其中,所述语料库包括文本信息、应用情景信息以及在所述应用情景信息下所述 文本信息对应的标准指令。
[0009] 第二方面,提供了一种指令识别的处理装置,所述处理装置包括:
[0010] 获取模块,用于当获取到待识别的语音信息时,获取所述语音信息对应的待识别 文本以及应用情景信息;
[0011] 查找模块,用于根据所述待识别文本、应用情景信息,从所述语料库中查找标准指 令,以所述标准指令作为所述待识别的语音信息的识别结果;
[0012] 纠错模块,用于当无法从所述语料库中查找到标准指令时,对所述待识别文本进 行纠错,并根据纠错结果从所述语料库中查找标准指令;
[0013] 其中,所述语料库包括文本信息、应用情景信息以及在所述应用情景信息下所述 文本信息对应的标准指令。
[0014] 与现有技术相比,本发明实施例通过构建语料库,所述语料库中包括文本信息、应 用情景信息以及在所述应用情景信息下所述文本信息对应的标准指令;当获取到待识别的 语音信息时,则获取所述语音信息对应的待识别文本以及应用情景信息;根据所述待识别 文本、应用情景信息,从所述语料库中查找标准指令,以所述标准指令作为所述待识别的语 音信息的识别结果;当无法从所述语料库中查找到标准指令时,则对所述待识别文本进行 纠错,再根据纠错结果从所述语料库中查找标准指令;通过结合应用情景信息和纠错,有效 地提高了根据语音信息识别获取的指令的准确度。
【附图说明】
[0015] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以 根据这些附图获得其他附图。
[0016] 图1是本发明实施例提供的指令识别的处理方法的实现流程图;
[0017] 图2是本发明实施例提供的指令识别的处理方法中步骤S103的实现流程图;
[0018]图3是本发明实施例提供的指令识别的处理方法中步骤S103的另一实现流程图; [0019]图4是本发明实施例提供的指令识别的处理方法中步骤S103的另一实现流程图; [0020]图5是本发明实施例提供的指令识别的处理方法中步骤S103的另一实现流程图; [0021 ]图6是本发明实施例提供的指令识别的处理装置的组成结构图。
【具体实施方式】
[0022]为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对 本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并 不用于限定本发明。
[0023] 本发明实施例通过构建语料库,所述语料库中包括文本信息、应用情景信息以及 在所述应用情景信息下所述文本信息对应的标准指令;当获取到待识别的语音信息时,则 获取所述语音信息对应的待识别文本以及应用情景信息;根据所述待识别文本、应用情景 信息,从所述语料库中查找标准指令,以所述标准指令作为所述待识别的语音信息的识别 结果;当无法从所述语料库中查找到标准指令时,则对所述待识别文本进行纠错,再根据纠 错结果从所述语料库中查找标准指令;通过结合应用情景信息和纠错,有效地提高了根据 语音信息识别获取的指令的准确度。本发明实施例还提供了相应的装置,以下分别进行详 细的说明。
[0024] 图1示出了本发明实施例提供的指令识别的处理方法的实现流程。
[0025] 在本发明实施例中,所述指令识别的处理方法应用于计算机设备,包括但不限于 计算机、服务器等。所述计算机设备中构建有语料库,所述语料库包括文本信息、应用情景 信息以及在所述应用情景信息下所述文本信息对应的标准指令。可以通过志愿者采集或者 在语料库的实际运用中不断采集和完善语料库中的数据信息
[0026] 在这里,所述文本信息与用户输入的语音信息对应,为语音信息转换得到的文本 信息。所述应用情景信息是指用户输入语音信息时所述智能家居设备的应用情景信息,包 括但不限于智能家具设备的属性信息、用户地理位置信息、天气信息等。其中,所述智能家 居设备包括但不限于智能电视机、智能空调、智能洗衣机等。示例性地,当所述智能家居设 备为智能电视机时,所述属性信息包括但不限于智能电视机当前的播放页面、当前的播放 音量、当前的背光值(亮度)等。在本发明实施例中,所述应用情景信息用于辅助指令识别, 因此,语料库中所述文本信息、应用情景信息以及在所述应用情景信息下所述文本信息对 应的标准指令是一一对应的。
[0027] 参阅图1,所述指令识别的处理方法的实现流程包括:
[0028] 在步骤S101中,当获取到待识别的语音信息时,获取所述语音信息对应的待识别 文本以及应用情景信息。
[0029] 其中,所述待识别的语音信息为用户当前输入的语音信息,所述应用情景信息为 输入语音信息时智能家居设备当前的应用情景信息,比如属性信息、用户地理位置信息、天 气信息等。示例性地,所述应用情景信息可根据遥控APP的相关使用记录得到。当进行语音 识别指令时,首先将所述语音信息转换为文本信息,得到待识别文本。
[0030] 在步骤S102中,根据所述待识别文本、应用情景信息,从所述语料库中查找标准指 令,以所述标准指令作为所述待识别的语音信息的识别结果。
[0031] 本发明实施例在获取到待识别的语音信息转换后得到的待识别文本和应用情景 信息后,联合所述待识别文本和应用情景信息,从所述语料库中查找在所述应用情景信息 下所述待识别文本对应的标准指令。通过增加考虑智能家居设备的应用情景信息,有效地 提高了语音识别得到的指令的准确度。
[0032] 在步骤S103中,当无法从所述语料库中查找到标准指令时,对所述待识别文本进 行纠错,根据纠错结果从所述语料库中查找标准指令。
[0033] 在这里,由于用户口音、方言等原因可能导致根据语音信息转换得到待识别文本 出错,或者用户输入的语音信息不完整导致待识别文本不完整,从而造成根据待识别文本 和应用情景信息无法从语料库中查找到标准指令。此时,本发明实施例还可对所述待识别 文本进行纠错,以从用户当前输入的待识别文本下推断出用户真实想要输入的文本信息, 即纠错后的文本信息,并根据纠错后的文本信息从语料库中查找标准指令,从而提高了语 音识别得到的指令的准确度。
[0034] 作为本发明的一个优选示例,所述语料库中还包括所述文本信息转换得到的对应 的拼音信息。所述文本信息与拼音信息是一一对应的。所述语料库中还包括所述文本信息 的输入频率,通过次数的形式表示。所述输入频率反映了所述文本信息在语料库中的出现 概率。
[0035] 示例性地,表1示出了本发明实施例提供的语料库的数据库结构示意图。 「00361
[0037]表 1
[0038]因此,上述步骤S103中的纠错包括对待识别文本进行纠错和对待识别文本对应的 待识别拼音进行纠错。本发明实施例优选采用贝叶斯推断来进行纠错。假如当前输入待识 别文本WN的情况下,要推断出用户真实想要输入的文本信息We时,从概论的角度来看,需要 满足:
[0039] ffE = argw maxP(ff|ffN)
[0040] 其中,W表示用户真实想要输入的文本信息We的候选集(即潜在文本),是语料库中 已有的文本信息。
[0041] 根据贝叶斯定理可得:
[0042] P(ff|ffN)=P(ffN|ff)*P(ff)/P(ffN)
[0043] 对于所有的潜在文本W,都对应同一个待识别文本WN,因此,P (WN)是相同的。在实际 实现过程中,仅需求p(wN|w)*p(w)的最大值即可。
[0044] 当考虑用户输入语音信息时的应用情景信息C,则贝叶斯推断可进一步考虑为:
[0045] P(ff|ffN,C)=P(ffN,C|ff)*P(ff)/P(ffN,C)
[0046] 相应的,在实际实现过程中,仅需求P(WN,C|W)*P(W)的最大值即可。其中,本发明 实施例以语料库中以与W N编辑距离小于预设值的文本并综合考虑应用情景确定潜在文本W 的候选集。所述编辑距离,是指两个字符串中,由一个字符串转换成另一个字符串所需的最 少的编辑操作次数。编辑操作包括:1、删除:在字符串中删除一个字符;2、插入:在字符串中 插入一个字符;3、交换:将字符串前后两个字符交换;4、替换:用其他字符替换字符串中的 一个字符。
[0047]例如:当考虑编辑距离时:在具体实施中,在已知用户提交当前指令文本WN的条件 下,用户可能潜在的真实意愿指令文本候选集,是与当前指令文本编辑距离不大于2(即预 设值不大于2)的文本。也即在确定候选集时,剔除掉编辑距离大于预设值2的文本。
[0048] 当考虑应用情景时:如用户当前输入"太大了",用户可能是说"[音量]太大了"、 [窗口]太大了,也可能是照片"[缩放]太大了",这两个指令都是与"太大了"编辑距离为2的 指令。如果进一步考虑用户应用情景,如果用户上一步操作是在调节电视音量且在观看视 频,那么在再此应用情景下,"太大了"以较大概率指"[音量]太大了"、[窗口]太大了,因此 可以进行指令补全,将"太大了"候选集确定为包含[音量]太大了"、"[画面]太大了",而将 不可能出现的"[缩放]太大了"去掉。
[0049] 在这些候选集中,因为潜在文本W与当前指令文本WN的编辑距离较近,且候选集的 潜在文本W所处的应用情景基本相似,因此每一个文本信息对应的P(W N,C|W)的大小非常接 近,故,在实际操作中,通过求候选集中的P(W)的最大值来代替求P(WN,C|W)*P(W)的最大 值。在这里,所述P(W)表示潜在文本W在语料库中的出现概率。
[0050] 基于上述贝叶斯推断对待识别拼音进行拼音的纠错后,可以得到纠错后的第一潜 在文本(即所述语料库中与所述待识别拼音的编辑距离小于第一预设值的拼音信息中P(W) 最大的拼音信息)及第一贝叶斯概率值;进行文字的纠错后,可以得到纠错后的第二潜在文 本(即所述语料库中与所述待识别文本的编辑距离小于第二预设值的文本信息中P(W)最大 的文本信息)及第二贝叶斯概率值。本发明实施例再根据所述第一贝叶斯概率值和第二贝 叶斯概率值的大小,判定所述待识别文本或待识别拼音是否存在于所述语料库中。所述第 一潜在文本以及第二潜在文本均是包含于潜在文本W中。
[0051] 在这里,本发明实施例通过预设阈值与贝叶斯概率值的比较来确定待识别文本或 待识别拼音是否存在于语料库中。
[0052] 在本发明的一个实施示例中,当所述第一贝叶斯概率值大于或等于预设阈值,BP 所述待识别拼音与语料库中已有的拼音信息的相似度高,则判定所述待识别拼音存在于所 述语料库中;同样地,当所述第二贝叶斯概率值大于或等于所述预设阈值,即所述待识别文 本与语料库中已有的文本信息的相似度高,则判定所述待识别文本存在于所述语料库中, 重新以纠错后的文本信息从语料库中查找标准指令。
[0053]参阅图2,图2示出了本发明实施例提供的语音信息的处理方法中步骤S103的具体 实现流程。所述步骤S103包括:
[0054]在步骤S201中,当无法从所述语料库中查找到标准指令时,对所述待识别文本进 行拼音转换,得到所述待识别文本对应的待识别拼音。
[0055]在步骤S202中,结合应用情景信息对所述待识别拼音进行贝叶斯推断,得到第一 潜在文本及其第一贝叶斯概率值。
[0056]其中,所述第一潜在文本为所述语料库中与所述待识别拼音的编辑距离小于第一 预设值的拼音信息中出现概率最大的拼音信息,所述第一贝叶斯概率值为所述第一潜在文 本在语料库中的出现概率。
[0057]在步骤S203中,结合应用情景信息对所述待识别文本进行贝叶斯推断,得到第二 潜在文本及其第二贝叶斯概率值。
[0058]其中,所述第二潜在文本为所述语料库中与所述待识别文本的编辑距离小于第二 预设值的文本信息中出现概率最大的文本信息,所述第二贝叶斯概率值为所述第二潜在文 本在语料库中的出现概率。
[0059]在步骤S204中,当所述第一贝叶斯概率值大于或等于预设阈值且所述第二贝叶斯 概率值小于所述预设阈值时,获取所述第一贝叶斯概率值对应的第一潜在文本。
[0060] 在步骤S205中,根据所述第一潜在文本和应用情景信息,从所述语料库中查找所 述第一潜在文本对应的标准指令,以所述标准指令作为所述待识别的语音信息的识别结 果。
[0061] 图3示出了本发明实施例提供的语音信息的处理方法中步骤S103的另一具体实现 流程。参阅图3,所述步骤S103包括:
[0062] 在步骤S301中,当无法从所述语料库中查找到标准指令时,对所述待识别文本进 行拼音转换,得到所述待识别文本对应的待识别拼音。
[0063] 在步骤S302中,结合应用情景信息对所述待识别拼音进行贝叶斯推断,得到第一 潜在文本及其第一贝叶斯概率值。
[0064] 在步骤S303中,结合应用情景信息对所述待识别文本进行贝叶斯推断,得到第二 潜在文本及其第二贝叶斯概率值。
[0065]在步骤S304中,当所述第二贝叶斯概率值大于或等于预设阈值且所述第一贝叶斯 概率值小于所述预设阈值时,获取所述第二贝叶斯概率值对应的第二潜在文本。
[0066]在步骤S305中,根据所述第二潜在文本和应用情景信息,从所述语料库中查找所 述第二潜在文本对应的标准指令,以所述标准指令作为所述待识别的语音信息的识别结 果。
[0067]图4示出了本发明实施例提供的语音信息的处理方法中步骤S103的另一具体实现 流程。参阅图4,所述步骤S103包括:
[0068]在步骤S401中,当无法从所述语料库中查找到标准指令时,对所述待识别文本进 行拼音转换,得到所述待识别文本对应的待识别拼音。
[0069]在步骤S402中,结合应用情景信息对所述待识别拼音进行贝叶斯推断,得到第一 潜在文本及其第一贝叶斯概率值。
[0070] 在步骤S403中,结合应用情景信息对所述待识别文本进行贝叶斯推断,得到第二 潜在文本及其第二贝叶斯概率值。
[0071] 在步骤S404中,当所述第一贝叶斯概率值和第二贝叶斯概率值均大于或等于预设 阈值时,则随机获取第一潜在文本和所述第二潜在文本中的任一个。
[0072]在步骤S405中,根据所获取的潜在文本和应用情景信息,从所述语料库中查找所 述潜在文本对应的标准指令,以所述标准指令作为所述待识别的语音信息的识别结果。
[0073] 通过上述图2、图3、图4所示实施示例,实现了对用户输入的待识别文本的纠错以 及待识别文本转换后的待识别拼音的纠错,综合考虑纠错结果后再次进行标准指令的获 取,有效地提高了通过语音识别所获取的指令的准确度。
[0074] 在本发明的另一个实施示例中,当所述待识别文本和待识别拼音不存在于语料库 中时,则认为是有新的指令输入,更新所述语料库。图5示出了本发明实施例提供的语音信 息的处理方法中步骤S103的一个具体实现流程。
[0075] 参阅图5,所述步骤S103包括:
[0076] 在步骤S501中,当无法从所述语料库中查找到标准指令时,对所述待识别文本进 行拼音转换,得到所述待识别文本对应的待识别拼音。
[0077] 在步骤S502中,结合应用情景信息对所述待识别拼音进行贝叶斯推断,得到第一 潜在文本及其第一贝叶斯概率值。
[0078] 在步骤S503中,结合应用情景信息对所述待识别文本进行贝叶斯推断,得到第二 潜在文本及其第二贝叶斯概率值。
[0079] 在步骤S504中,当所述第一贝叶斯概率值和第二贝叶斯概率值均小于预设阈值 时,获取用户输入的所述待识别文本对应的标准指令。
[0080] 在本发明实施例中,当且仅当所述第一贝叶斯概率值和第二贝叶斯概率值均小于 预设阈值时(即所述待识别文本与语料库中已有的文本信息的相似度低且所述待识别文本 对应的待识别拼音与所述语料库中已有的拼音信息的相似度低),判定用户输入的待识别 文本或待识别语音不存在于所述语料库中,可能是有新的指令输入。此时,进行人工干预, 获取用户输入的所述待识别文本对应的标准指令。
[0081] 在步骤S505中,将所述待识别文本、应用情景信息以及标准指令添加至所述语料 库中,以更新所述语料库。
[0082] 在这里,可以先关联所述待识别文本、应用情景信息以及标准指令,然后将关联后 的所述待识别文本、应用情景信息以及标准指令一同添加至所述语料库中,以更新所述语 料库,实现对语料库的不断扩充和完善。
[0083] 综上所述,本发明实施例通过构建语料库,所述语料库中包括文本信息、应用情景 信息以及在所述应用情景信息下所述文本信息对应的标准指令;当获取到待识别的语音信 息时,则获取所述语音信息对应的待识别文本以及应用情景信息;根据所述待识别文本、应 用情景信息,从所述语料库中查找标准指令,以所述标准指令作为所述待识别的语音信息 的识别结果;当无法从所述语料库中查找到标准指令时,则对所述待识别文本进行纠错,并 根据纠错结果从所述语料库中查找标准指令或者更新所述语料库;从而有效地提高了根据 语音信息识别获取的指令的准确度。
[0084] 图6示出了本发明实施例提供的指令识别的处理装置的组成结构,为了便于说明, 仅不出了与本发明实施例相关的部分。
[0085] 在本发明实施例中,所述指令识别的处理装置用于实现上述图1至图5实施例所述 的指令识别的处理方法,可以是内置于计算机设备的软件单元、硬件单元或者软硬件结合 的单元,所述计算机设备包括但不限于计算机、服务器等。所述计算机设备中构建有语料 库,所述语料库包括文本信息、应用情景信息以及在所述应用情景信息下所述文本信息对 应的标准指令。可以通过志愿者采集或者在语料库的实际运用中不断采集和完善语料库中 的数据信息。
[0086] 参阅图6,所述处理装置包括:
[0087]获取模块61,用于当获取到待识别的语音信息时,获取所述语音信息对应的待识 别文本以及应用情景信息。
[0088]查找模块62,用于根据所述待识别文本、应用情景信息,从所述语料库中查找标准 指令,以所述标准指令作为所述待识别的语音信息的识别结果。
[0089] 纠错模块63,用于当无法从所述语料库中查找到标准指令时,对所述待识别文本 进行纠错,并根据纠错结果从所述语料库中查找标准指令。
[0090] 进一步地,所述纠错模块63包括:
[0091 ]转换单元631,用于当无法从所述语料库中查找到标准指令时,对所述待识别文本 进行拼音转换,得到所述待识别文本对应的待识别拼音。
[0092]纠错单元632,用于结合所述应用情景信息对所述待识别拼音进行贝叶斯推断,得 到第一潜在文本及其第一贝叶斯概率值,结合所述应用情景信息对所述待识别文本进行贝 叶斯推断,得到第二潜在文本及其第二贝叶斯概率值,其中,所述第一潜在文本为所述语料 库中与所述待识别拼音的编辑距离小于第一预设值的拼音信息中出现概率最大的拼音信 息,所述第一贝叶斯概率值为所述第一潜在文本在语料库中的出现概率,所述第二潜在文 本为所述语料库中与所述待识别文本的编辑距离小于第二预设值的文本信息中出现概率 最大的文本信息,所述第二贝叶斯概率值为所述第二潜在文本在语料库中的出现概率。 [0093]第一获取单元633,用于当所述第一贝叶斯概率值大于或等于预设阈值且所述第 二贝叶斯概率值小于所述预设阈值时,获取所述第一贝叶斯概率值对应的第一潜在文本。 [0094]查找单元634,用于根据所述第一潜在文本和应用情景信息,从所述语料库中查找 所述第一潜在文本对应的标准指令,以所述标准指令作为所述待识别的语音信息的识别结 果。
[0095]在本发明的另一个实施示例中,所述第一获取单元633还用于:
[0096] 当所述第二贝叶斯概率值大于或等于预设阈值且所述第一贝叶斯概率值小于所 述预设阈值时,获取所述第二贝叶斯概率值对应的第二潜在文本;
[0097] 查找单元634还用于:
[0098] 根据所述第二潜在文本和应用情景信息,从所述语料库中查找所述第二潜在文本 对应的标准指令,以所述标准指令作为所述待识别的语音信息的识别结果。
[0099]在本发明的另一个实施示例中,所述第一获取单元633还用于:
[0100]当所述第二贝叶斯概率值大于或等于预设阈值且所述第一贝叶斯概率值小于所 述预设阈值时,获取所述第二贝叶斯概率值对应的第二潜在文本;
[0101] 查找单元634还用于:
[0102] 根据所述第二潜在文本和应用情景信息,从所述语料库中查找所述第二潜在文本 对应的标准指令,以所述标准指令作为所述待识别的语音信息的识别结果。
[0103] 通过上述第一获取单元633和查找单元634,实现了对用户输入的语音信息转换后 的待识别文本的纠错以及待识别拼音的纠错,综合考虑纠错结果后再次进行标准指令的获 取,有效地提高了通过语音识别所获取的指令的准确度。
[0104] 进一步地,所述纠错模块63还包括:
[0105] 第二获取单元635,用于当所述第一贝叶斯概率值和第二贝叶斯概率值均小于预 设阈值时,获取用户输入的所述待识别文本对应的标准指令。
[0106] 更新单元636,用于将所述待识别文本、应用情景信息以及标准指令添加至所述语 料库中,以更新所述语料库。
[0107] 在这里,可以先关联所述待识别文本、应用情景信息以及标准指令,然后将关联后 的所述待识别文本、应用情景信息以及标准指令一同添加至所述语料库中,以更新所述语 料库,实现对语料库的不断扩充和完善。
[0108]需要说明的是,本发明实施例中的装置可以用于实现上述方法实施例中的全部技 术方案,其各个功能模块的功能可以根据上述方法实施例中的方法具体实现,其具体实现 过程可参照上述实例中的相关描述,此处不再赘述。
[0109] 本发明实施例通过构建语料库,所述语料库中包括文本信息、应用情景信息以及 在所述应用情景信息下所述文本信息对应的标准指令;当获取到待识别的语音信息时,则 获取所述语音信息对应的待识别文本以及应用情景信息;根据所述待识别文本、应用情景 信息,从所述语料库中查找标准指令,以所述标准指令作为所述待识别的语音信息的识别 结果;当无法从所述语料库中查找到标准指令时,则对所述待识别文本进行纠错,并根据纠 错结果从所述语料库中查找标准指令或者更新所述语料库;从而有效地提高了根据语音信 息识别获取的指令的准确度。
[0110] 本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单 元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟 以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员 可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出 本发明的范围。
[0111] 所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置 和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0112] 在本申请所提供的几个实施例中,应该理解到,所揭露的指令识别的处理方法及 装置,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所 述模块、单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如 多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另 一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置 或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0113] 所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显 示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个 网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目 的。
[0114] 另外,在本发明各个实施例中的各功能单元、模块可以集成在一个处理单元中,也 可以是各个单元、模块单独物理存在,也可以两个或两个以上单元、模块集成在一个单元 中。
[0115] 所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以 存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说 对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计 算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个 人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。 而前述的存储介质包括:U盘、移动硬盘、只读存储器(R0M,Read-0nly Memory)、随机存取存 储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0116] 以上所述,仅为本发明的【具体实施方式】,但本发明的保护范围并不局限于此,任何 熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵 盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
【主权项】
1. 一种指令识别的处理方法,其特征在于,所述处理方法包括: 当获取到待识别的语音信息时,获取所述语音信息对应的待识别文本以及应用情景信 息; 根据所述待识别文本、应用情景信息,从所述语料库中查找标准指令,以所述标准指令 作为所述待识别的语音信息的识别结果; 当无法从所述语料库中查找到标准指令时,对所述待识别文本进行纠错,并根据纠错 结果从所述语料库中查找标准指令; 其中,所述语料库包括文本信息、应用情景信息以及在所述应用情景信息下所述文本 信息对应的标准指令。2. 如权利要求1所述的指令识别的处理方法,其特征在于,所述当无法从所述语料库中 查找到标准指令时,对所述待识别文本进行纠错,并根据纠错结果从所述语料库中查找标 准指令包括: 当无法从所述语料库中查找到标准指令时,对所述待识别文本进行拼音转换,得到所 述待识别文本对应的待识别拼音; 结合所述应用情景信息对所述待识别拼音进行贝叶斯推断,得到第一潜在文本及其第 一贝叶斯概率值,其中,所述第一潜在文本为所述语料库中与所述待识别拼音的编辑距离 小于第一预设值的拼音信息中出现概率最大的拼音信息,所述第一贝叶斯概率值为所述第 一潜在文本在语料库中的出现概率; 结合所述应用情景信息对所述待识别文本进行贝叶斯推断,得到第二潜在文本及其第 二贝叶斯概率值,其中,所述第二潜在文本为所述语料库中与所述待识别文本的编辑距离 小于第二预设值的文本信息中出现概率最大的文本信息,所述第二贝叶斯概率值为所述第 二潜在文本在语料库中的出现概率; 当所述第一贝叶斯概率值大于或等于预设阈值且所述第二贝叶斯概率值小于所述预 设阈值时,获取所述第一贝叶斯概率值对应的第一潜在文本; 根据所述第一潜在文本和应用情景信息,从所述语料库中查找所述第一潜在文本对应 的标准指令,以所述标准指令作为所述待识别的语音信息的识别结果。3. 如权利要求2所述的指令识别的处理方法,其特征在于,所述当无法从所述语料库中 查找到标准指令时,对所述待识别文本进行纠错,并根据纠错结果从所述语料库中查找标 准指令还包括: 当所述第二贝叶斯概率值大于或等于预设阈值且所述第一贝叶斯概率值小于所述预 设阈值时,获取所述第二贝叶斯概率值对应的第二潜在文本; 根据所述第二潜在文本和应用情景信息,从所述语料库中查找所述第二潜在文本对应 的标准指令,以所述标准指令作为所述待识别的语音信息的识别结果。4. 如权利要求2所述的指令识别的处理方法,其特征在于,所述当无法从所述语料库中 查找到标准指令时,对所述待识别文本进行纠错,并根据纠错结果从所述语料库中查找标 准指令还包括: 当所述第一贝叶斯概率值和第二贝叶斯概率值均大于或等于预设阈值时,则随机获取 第一潜在文本和所述第二潜在文本中的任一个; 根据所获取的潜在文本和应用情景信息,从所述语料库中查找所述潜在文本对应的标 准指令,以所述标准指令作为所述待识别的语音信息的识别结果。5. 如权利要求2所述的指令识别的处理方法,其特征在于,所述处理方法还包括: 当所述第一贝叶斯概率值和第二贝叶斯概率值均小于预设阈值时,获取用户输入的所 述待识别文本对应的标准指令; 将所述待识别文本、应用情景信息以及标准指令添加至所述语料库中,以更新所述语 料库。6. -种指令识别的处理装置,其特征在于,所述处理装置包括: 获取模块,用于当获取到待识别的语音信息时,获取所述语音信息对应的待识别文本 以及应用情景信息; 查找模块,用于根据所述待识别文本、应用情景信息,从所述语料库中查找标准指令, 以所述标准指令作为所述待识别的语音信息的识别结果; 纠错模块,用于当无法从所述语料库中查找到标准指令时,对所述待识别文本进行纠 错,并根据纠错结果从所述语料库中查找标准指令; 其中,所述语料库包括文本信息、应用情景信息以及在所述应用情景信息下所述文本 信息对应的标准指令。7. 如权利要求6所述的指令识别的处理装置,其特征在于,所述纠错模块包括: 转换单元,用于当无法从所述语料库中查找到标准指令时,对所述待识别文本进行拼 音转换,得到所述待识别文本对应的待识别拼音; 纠错单元,用于结合所述应用情景信息对所述待识别拼音进行贝叶斯推断,得到第一 潜在文本及其第一贝叶斯概率值,结合所述应用情景信息对所述待识别文本进行贝叶斯推 断,得到第二潜在文本及其第二贝叶斯概率值,其中,所述第一潜在文本为所述语料库中与 所述待识别拼音的编辑距离小于第一预设值的拼音信息中出现概率最大的拼音信息,所述 第一贝叶斯概率值为所述第一潜在文本在语料库中的出现概率,所述第二潜在文本为所述 语料库中与所述待识别文本的编辑距离小于第二预设值的文本信息中出现概率最大的文 本信息,所述第二贝叶斯概率值为所述第二潜在文本在语料库中的出现概率; 第一获取单元,用于当所述第一贝叶斯概率值大于或等于预设阈值且所述第二贝叶斯 概率值小于所述预设阈值时,获取所述第一贝叶斯概率值对应的第一潜在文本; 查找单元,用于根据所述第一潜在文本和应用情景信息,从所述语料库中查找所述第 一潜在文本对应的标准指令,以所述标准指令作为所述待识别的语音信息的识别结果。8. 如权利要求7所述的指令识别的处理装置,其特征在于,所述第一获取单元还用于: 当所述第二贝叶斯概率值大于或等于预设阈值且所述第一贝叶斯概率值小于所述预 设阈值时,获取所述第二贝叶斯概率值对应的第二潜在文本; 查找单元还用于: 根据所述第二潜在文本和应用情景信息,从所述语料库中查找所述第二潜在文本对应 的标准指令,以所述标准指令作为所述待识别的语音信息的识别结果。9. 如权利要求7所述的指令识别的处理装置,其特征在于,所述第一获取单元还用于: 当所述第一贝叶斯概率值和第二贝叶斯概率值均大于或等于预设阈值时,则随机获取 第一潜在文本和所述第二潜在文本中的任一个; 所述查找单元还用于: 根据所获取的潜在文本和应用情景信息,从所述语料库中查找所述潜在文本对应的标 准指令,以所述标准指令作为所述待识别的语音信息的识别结果。10.如权利要求7所述的指令识别的处理装置,其特征在于,所述纠错模块还包括: 第二获取单元,用于当所述第一贝叶斯概率值和第二贝叶斯概率值均小于预设阈值 时,获取用户输入的所述待识别文本对应的标准指令; 更新单元,用于将所述待识别文本、应用情景信息以及标准指令添加至所述语料库中, 以更新所述语料库。
【文档编号】G10L15/22GK105976818SQ201610270140
【公开日】2016年9月28日
【申请日】2016年4月26日
【发明人】吴成龙, 王巍
【申请人】Tcl集团股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1