语音处理方法及装置的制造方法

文档序号:10595519阅读:202来源:国知局
语音处理方法及装置的制造方法
【专利摘要】本发明是关于一种语音处理方法及装置,其中,方法包括:接收用户输入的语音信息;对语音信息进行识别,以得到预操作条目对应的第一文字和条目内容对应的第二文字;确定第一语音信息对应的第一音量值和第二语音信息对应的第二音量值;确定第一音量值对应的第一能量指标参数和第二音量值对应的第二能量指标参数;当第二能量指标参数大于第一能量指标参数,且第二能量指标参数大于预设能量指标参数时,在待选择条目内容数据库中查找与第二文字匹配的目标条目内容;将目标条目内容填写到对应的条目内容表格中。通过该技术方案,可以在保证语音处理的准确率的基础上,提高语义分析的成功率和准确率,从而提升用户的使用体验。
【专利说明】
语音处理方法及装置
技术领域
[0001 ]本发明设及语音识别技术领域,尤其设及一种语音处理方法及装置。
【背景技术】
[0002] 语音处理的过程中,在通过语义进行理解的时候,依赖于语音识别的效果。如果语 音识别效果较差,则会影响语义分析的效果。例如,针对图1的录入模版,用户想通过口述 "执行科室放射科"进行自动选择的目的,选择控件如图2所示。从语义分析器的角度讲,"执 行科室"是预操作条目,"放射科"是条目内容,语义分析器通过词典模版可W进行区分,然 后转换为执行命令即可。但是在语音识别的过程中,如果对于整条句子中的某个字识别效 果不好的话,就会导致语义分析的失败。例如文本被识别成了"执科室放射科",少了一个 "行"字。运样,整个识别过程就会失败,导致不能够根据用户的语音输入执行对应的操作, 从而影响用户体验。

【发明内容】

[0003] 本发明实施例提供一种语音处理方法及装置,用W实现在保证语音处理的准确率 的基础上,提高语义分析的成功率和准确率,从而提升用户的使用体验。
[0004] 根据本发明实施例的第一方面,提供一种语音处理方法,包括:
[0005] 接收用户输入的语音信息,其中,所述语音信息包括预操作条目对应的第一语音 信息和条目内容对应的第二语音信息;
[0006] 对所述语音信息进行识别,W得到所述预操作条目对应的第一文字和所述条目内 容对应的第二文字;
[0007] 确定所述第一语音信息对应的第一音量值和所述第二语音信息对应的第二音量 值;
[000引确定所述第一音量值对应的第一能量指标参数和所述第二音量值对应的第二能 量指标参数;
[0009]当所述第二能量指标参数大于所述第一能量指标参数,且所述第二能量指标参数 大于预设能量指标参数时,在待选择条目内容数据库中查找与所述第二文字匹配的目标条 目内容;
[0010]将所述目标条目内容填写到对应的条目内容表格中。
[0011]在该实施例中,在对包含预操作条目对应的第一语音信息和条目内容对应的第二 语音信息的语音信息进行识别后,分别确定两个语音信息的音量值,进而根据两个语音信 息的音量值确定能量指标参数,在条目内容对应的第二语音信息的能量指标参数大于第一 语音信息的能量指标参数,且大于预设指标参数时,则将该条目内容对应的文字优先与待 选择条目内容数据库中的待选择条目内容进行匹配,从而将与其匹配的目标条目内容填写 到对应的条目内容表格中。运样,用户可W通过语音输入填写表格,不需要手动选择,并且 允许用户对不同词汇使用不同的音量,从而根据音量的不同来确定不同的能量指标参数, 根据能量指标参数来确定是否执行填写条目内容表格的操作,避免了语音识别出现错误 后,不能进行表格填写的问题发生,在保证语音处理的准确率的基础上,提高了语义分析的 成功率和准确率,也提高用户利用语音输入填写表格的成功率及用户体验度。
[0012] 在一个实施例中,所述确定所述第一音量值对应的第一能量指标参数和所述第二 音量值对应的第二能量指标参数,包括:
[0013] 获取音量值区间和能量指标参数之间的对应关系,其中,所述音量值区间和所述 能量指标参数成正相关;
[0014] 确定所述第一音量值所属的第一音量值区间和所述第二音量值所属的第二音量 值区间;
[0015] 根据音量值区间和能量指标参数之间的对应关系,确定所述第一音量值区间对应 的第一能量指标参数和所述第二音量值区间对应的第二能量指标参数。
[0016] 在该实施例中,可W预置音量值区间和能量指标参数之间的对应关系,从而根据 音量值区间和能量指标参数之间的对应关系确定第一音量值区间对应的第一能量指标参 数和所述第二音量值区间对应的第二能量指标参数。具体地,音量值区间和能量指标参数 可W成正相关,即音量值区间的值越大,能量指标参数越大,音量值区间的值越小,能量指 标参数越小。而能量指标参数大,则条目内容对应的文字被进行优先匹配的概率就越高。运 样,在原有语音识别技术的基础上增加能量指标参数,可W在保证语音处理的准确率的基 础上,提高语义分析的成功率和准确率,也提高用户利用语音输入填写表格的成功率及用 户体验度。
[0017] 在一个实施例中,在待选择条目内容数据库中查找与所述第二文字匹配的目标条 目内谷,包括:
[0018] 计算所述第二文字与所述待选择条目内容数据库中每个待选择条目内容之间的 第一相似度;
[0019] 将第一相似度最高的待选择条目内容确定为所述目标条目内容。
[0020] 在该实施例中,计算第二文字与待选择条目内容数据库中每个待选择条目内容之 间的第一相似度,从而将相似度最高的待选择条目内容确定为目标条目内容,运样,保证了 语音识别的准确率,也避免了由于语音识别结果出现错误而导致不能进行语义分析的问题 发生,提高了语义分析的成功率和准确率。
[0021] 在一个实施例中,所述将所述目标条目内容填写到对应的条目内容表格中,包括:
[0022] 确定所述目标条目内容对应的目标操作条目;
[0023] 计算所述目标操作条目和所述预操作条目对应的所述第一文字之间的第二相似 度;
[0024] 在所述第二相似度大于或者等于预设相似度时,将所述目标条目内容填写到所述 目标操作条目对应的条目内容表格中。
[0025] 在该实施例中,在将目标条目内容填写到对应的条目内容表格之前,还可W先确 定目标条目内容对应的目标操作条目,然后将目标操作条目和预操作条目对应的第一文字 进行相似度计算,如果两者相似度大于预设相似度,则说明两者是匹配的,即用户预操作的 条目就是目标操作条目,运样,进一步保证了语义分析结果的准确性。
[0026] 在一个实施例中,在确定所述第一语音信息对应的第一音量值和所述第二语音信 息对应的第二音量值之前,所述方法还包括:
[0027] 计算所述语音信息的置信度;
[0028] 判断所述置信度是否小于预设置信度;
[0029] 在所述置信度小于预设置信度时,执行所述确定所述第一语音信息对应的第一音 量值和所述第二语音信息对应的第二音量值的步骤。
[0030] 在该实施例中,可W先计算语音信息的置信度,如果语音信息的置信度大于或等 于预设置信度,则说明置信度较高,可W成功进行语义分析,则可W采用现有的相关技术中 的语音分析方案进行语义分析,而如果语音信息的置信度小于预设置信度,则说明置信度 较低,语义分析可能会失败,此时,可W采用本发明的根据音量的不同来进行语义分析的方 案。
[0031] 根据本发明实施例的第二方面,提供一种语音处理装置,包括:
[0032] 接收模块,用于接收用户输入的语音信息,其中,所述语音信息包括预操作条目对 应的第一语音信息和条目内容对应的第二语音信息;
[0033] 识别模块,用于对所述语音信息进行识别,W得到所述预操作条目对应的第一文 字和所述条目内容对应的第二文字;
[0034] 第一确定模块,用于确定所述第一语音信息对应的第一音量值和所述第二语音信 息对应的第二音量值;
[0035] 第二确定模块,用于确定所述第一音量值对应的第一能量指标参数和所述第二音 量值对应的第二能量指标参数;
[0036] 查找模块,用于当所述第二能量指标参数大于所述第一能量指标参数,且所述第 二能量指标参数大于预设能量指标参数时,在待选择条目内容数据库中查找与所述第二文 字匹配的目标条目内容;
[0037] 填写模块,用于将所述目标条目内容填写到对应的条目内容表格中。
[0038] 在一个实施例中,所述第二确定模块包括:
[0039] 获取子模块,用于获取音量值区间和能量指标参数之间的对应关系,其中,所述音 量值区间和所述能量指标参数成正相关;
[0040] 第一确定子模块,用于确定所述第一音量值所属的第一音量值区间和所述第二音 量值所属的第二音量值区间;
[0041] 第二确定子模块,用于根据音量值区间和能量指标参数之间的对应关系,确定所 述第一音量值区间对应的第一能量指标参数和所述第二音量值区间对应的第二能量指标 参数。
[0042] 在一个实施例中,所述查找模块包括:
[0043] 第一计算子模块,用于计算所述第二文字与所述待选择条目内容数据库中每个待 选择条目内容之间的第一相似度;
[0044] 内容确定子模块,用于将第一相似度最高的待选择条目内容确定为所述目标条目 内容。
[0045] 在一个实施例中,所述填写模块包括:
[0046] 条目确定子模块,用于确定所述目标条目内容对应的目标操作条目;
[0047] 第二计算子模块,用于计算所述目标操作条目和所述预操作条目对应的所述第一 文字之间的第二相似度;
[0048] 填写子模块,用于在所述第二相似度大于或者等于预设相似度时,将所述目标条 目内容填写到所述目标操作条目对应的条目内容表格中。
[0049] 在一个实施例中,所述装置还包括:
[0050] 计算模块,用于在确定所述第一语音信息对应的第一音量值和所述第二语音信息 对应的第二音量值之前,计算所述语音信息的置信度;
[0051] 判断模块,用于判断所述置信度是否小于预设置信度;
[0052] 触发模块,用于在所述置信度小于预设置信度时,触发所述第二确定模块确定所 述第一语音信息对应的第一音量值和所述第二语音信息对应的第二音量值。
[0053] 应当理解的是,W上的一般描述和后文的细节描述仅是示例性和解释性的,并不 能限制本发明。
[0054] 本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变 得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明 书、权利要求书、W及附图中所特别指出的结构来实现和获得。
[0055] 下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
【附图说明】
[0056] 此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施 例,并与说明书一起用于解释本发明的原理。
[0057] 图1是相关技术中的录入模板示意图。
[0058] 图2是相关技术中的条目内容选项示意图。
[0059] 图3是根据一示例性实施例示出的一种语音处理方法的流程图。
[0060] 图4是根据一示例性实施例示出的语音处理方法中步骤S304的流程图。
[0061] 图5是根据一示例性实施例示出的语音处理方法中步骤S305的流程图。
[0062] 图6是根据一示例性实施例示出的语音处理方法中步骤S306的流程图。
[0063] 图7是根据一示例性实施例示出的另一种语音处理方法的流程图。
[0064] 图8是根据一示例性实施例示出的一种语音处理装置的框图。
[0065] 图9是根据一示例性实施例示出的一种语音处理装置中第二确定模块的框图。
[0066] 图10是根据一示例性实施例示出的一种语音处理装置中查找模块的框图。
[0067] 图11是根据一示例性实施例示出的一种语音处理装置中填写模块的框图。
[0068] 图12是根据一示例性实施例示出的另一种语音处理装置的框图。
【具体实施方式】
[0069] 运里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述设及 附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。W下示例性实施例 中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附 权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
[0070] 图3是根据一示例性实施例示出的语音处理方法的流程图。该语音唤醒方法应用 于终端设备中,该终端设备可W是移动电话,计算机,数字广播终端,消息收发设备,游戏控 制台,平板设备,医疗设备,健身设备,个人数字助理等任一具有语音控制功能的设备。如图 3所示,该方法包括步骤S301-S306:
[0071] 在步骤S301中,接收用户输入的语音信息,其中,语音信息包括预操作条目对应的 第一语音信息和条目内容对应的第二语音信息;
[0072] 其中,在一些表格中,均存在操作条目和条目内容,如填写成绩单时,包括名字,性 格,成绩等,运些都属于操作条目,而具体的张=,女,90分则为对应的条目内容。又如,图1 中的检查类别、执行科室和执行时间等均属于操作条目,而对应的平片、放射科和2011年3 月8日等均属于条目内容。用户想要对哪个操作条目进行语音操作,就可W语音输入该操作 条目,该操作条目即为预操作条目。
[0073] 在步骤S302中,对语音信息进行识别,W得到预操作条目对应的第一文字和条目 内容对应的第二文字;
[0074] 在步骤S303中,确定第一语音信息对应的第一音量值和第二语音信息对应的第二 音量值;
[0075] 为了便于进行语义分析,用户对不同的词汇,可W使用不同的音量,从而来强调语 义中的含义,例如用户说"执科室放射科",其中"放射科个字的声音比较大,则说明放射 科为语义分析中的重点。
[0076] 在步骤S304中,确定第一音量值对应的第一能量指标参数和第二音量值对应的第 二能量指标参数;
[0077] 不同的音量值对应的能量指标参数会有所不同,从而根据能量指标参数去确定是 否执行表格填写。
[0078] 在步骤S305中,当第二能量指标参数大于第一能量指标参数,且第二能量指标参 数大于预设能量指标参数时,在待选择条目内容数据库中查找与第二文字匹配的目标条目 内容;
[0079] 在步骤S306中,将目标条目内容填写到对应的条目内容表格中。
[0080] 在该实施例中,在对包含预操作条目对应的第一语音信息和条目内容对应的第二 语音信息的语音信息进行识别后,分别确定两个语音信息的音量值,进而根据两个语音信 息的音量值确定能量指标参数,在条目内容对应的第二语音信息的能量指标参数大于第一 语音信息的能量指标参数,且大于预设指标参数时,则将该条目内容对应的文字优先与待 选择条目内容数据库中的待选择条目内容进行匹配,从而将与其匹配的目标条目内容填写 到对应的条目内容表格中。运样,用户可W通过语音输入填写表格,不需要手动选择,并且 允许用户对不同词汇使用不同的音量,从而根据音量的不同来确定不同的能量指标参数, 根据能量指标参数来确定是否执行填写条目内容表格的操作,避免了语音识别出现错误 后,不能进行表格填写的问题发生,在保证语音处理的准确率的基础上,提高了语义分析的 成功率和准确率,也提高用户利用语音输入填写表格的成功率及用户体验度。
[0081 ] 在一个实施例中,如图4所示,上述步骤S304包括步骤S401-S403:
[0082] 在步骤S401中,获取音量值区间和能量指标参数之间的对应关系,其中,音量值区 间和能量指标参数成正相关;
[0083] 其中,可W预置音量值区间和能量指标参数之间的对应关系,从而根据音量值区 间和能量指标参数之间的对应关系确定第一音量值区间对应的第一能量指标参数和第二 音量值区间对应的第二能量指标参数。具体地,音量值区间和能量指标参数可W成正相关, 即音量值区间的值越大,能量指标参数越大,音量值区间的值越小,能量指标参数越小。
[0084] 举例来说,音量值通过分贝值来表征,为提高用户语音填写表格的成功率,可设置 语音的分贝值越高,能量指标参数越大,该例中音量值区间和能量指标参数之间的对应关 系如表1所示。
[0085] 表 1 r00861 LUUB/J 仕巧甲,側足弟一首重但所厲
的弟一首重但K间W弟二首重但所厲的弟二 音量值区间;
[0088] 在步骤S403中,根据音量值区间和能量指标参数之间的对应关系,确定第一音量 值区间对应的第一能量指标参数和第二音量值区间对应的第二能量指标参数。
[0089] 在该实施例中,能量指标参数大,则条目内容对应的文字被进行优先匹配的概率 就越高。运样,在原有语音识别技术的基础上增加能量指标参数,可W在保证语音处理的准 确率的基础上,提高语义分析的成功率和准确率,也提高用户利用语音输入填写表格的成 功率及用户体验度。
[0090] 在一个实施例中,如图5所示,上述步骤S305可W包括步骤S501-S502:
[0091] 在步骤S501中,计算第二文字与待选择条目内容数据库中每个待选择条目内容之 间的第一相似度;
[0092] 在待选择条目内容数据库中,会有很多待选择条目,如对于医疗类数据库,待选择 条目内容可W包括执行科室,如放射科、影响科、普通内科、消化科、内分泌科等还可W包括 医生,如张 S、李四、王二等,而对于其它类数据库,如学生成绩类,则可W包括科目、如政 治、历史、地理等。
[0093] 在步骤S502中,将第一相似度最高的待选择条目内容确定为目标条目内容。
[0094] 在该实施例中,计算第二文字与待选择条目内容数据库中每个待选择条目内容之 间的第一相似度,从而将相似度最高的待选择条目内容确定为目标条目内容,运样,保证了 语音识别的准确率,也避免了由于语音识别结果出现错误而导致不能进行语义分析的问题 发生,提高了语义分析的成功率和准确率。
[00巧]在一个实施例中,如图6所示,上述步骤S306包括步骤S601-S603:
[0096] 在步骤S601中,确定目标条目内容对应的目标操作条目;
[0097] 在待选择条目内容数据库中,待选择条目内容和其所属的操作条目应该是对应存 储的,因此,根据目标条目内容,可W确定目标操作条目。
[0098] 在步骤S602中,计算目标操作条目和预操作条目对应的第一文字之间的第二相似 度;
[0099] 在步骤S603中,在第二相似度大于或者等于预设相似度时,将目标条目内容填写 到目标操作条目对应的条目内容表格中。
[0100] 在该实施例中,在将目标条目内容填写到对应的条目内容表格之前,还可W先确 定目标条目内容对应的目标操作条目,然后将目标操作条目和预操作条目对应的第一文字 进行相似度计算,如果两者相似度大于预设相似度,则说明两者是匹配的,即用户预操作的 条目就是目标操作条目,运样,进一步保证了语义分析结果的准确性。
[0101] 在一个实施例中,如图7所示,在确定第一语音信息对应的第一音量值和第二语音 信息对应的第二音量值之前,方法还包括步骤S701-S703:
[0102] 在步骤S701中,计算语音信息的置信度;
[0103] 其中,置信度的取值位于0~1的范围之间,由于置信度是用来评估语音识别结果 的可靠性的,因此置信度越高,说明语音识别结果越准确。
[0104] 在步骤S702中,判断置信度是否小于预设置信度;预设置信度阔值的取值位于0~ 1的范围之间。
[0105] 在步骤S703中,在置信度小于预设置信度时,执行确定第一语音信息对应的第一 音量值和第二语音信息对应的第二音量值的步骤。
[0106] 在该实施例中,可W先计算语音信息的置信度,如果语音信息的置信度大于或等 于预设置信度,则说明置信度较高,可W成功进行语义分析,则可W采用现有的相关技术中 的语音分析方案进行语义分析,而如果语音信息的置信度小于预设置信度,则说明置信度 较低,语义分析可能会失败,此时,可W采用本发明的根据音量的不同来进行语义分析的方 案。
[0107] 下述为本发明装置实施例,可W用于执行本发明方法实施例。
[0108] 图8是根据一示例性实施例示出的一种语音处理装置的框图,该装置可W通过软 件、硬件或者两者的结合实现成为终端设备的部分或者全部。如图8所示,该语音处理装置 包括:
[0109] 接收模块81,用于接收用户输入的语音信息,其中,所述语音信息包括预操作条目 对应的第一语音信息和条目内容对应的第二语音信息;
[0110] 识别模块82,用于对所述语音信息进行识别,W得到所述预操作条目对应的第一 文字和所述条目内容对应的第二文字;
[0111] 第一确定模块83,用于确定所述第一语音信息对应的第一音量值和所述第二语音 信息对应的第二音量值;
[0112] 第二确定模块84,用于确定所述第一音量值对应的第一能量指标参数和所述第二 音量值对应的第二能量指标参数;
[0113] 查找模块85,用于当所述第二能量指标参数大于所述第一能量指标参数,且所述 第二能量指标参数大于预设能量指标参数时,在待选择条目内容数据库中查找与所述第二 文字匹配的目标条目内容;
[0114] 填写模块86,用于将所述目标条目内容填写到对应的条目内容表格中。
[0115] 在该实施例中,在对包含预操作条目对应的第一语音信息和条目内容对应的第二 语音信息的语音信息进行识别后,分别确定两个语音信息的音量值,进而根据两个语音信 息的音量值确定能量指标参数,在条目内容对应的第二语音信息的能量指标参数大于第一 语音信息的能量指标参数,且大于预设指标参数时,则将该条目内容对应的文字优先与待 选择条目内容数据库中的待选择条目内容进行匹配,从而将与其匹配的目标条目内容填写 到对应的条目内容表格中。运样,用户可W通过语音输入填写表格,不需要手动选择,并且 允许用户对不同词汇使用不同的音量,从而根据音量的不同来确定不同的能量指标参数, 根据能量指标参数来确定是否执行填写条目内容表格的操作,避免了语音识别出现错误 后,不能进行表格填写的问题发生,在保证语音处理的准确率的基础上,提高了语义分析的 成功率和准确率,也提高用户利用语音输入填写表格的成功率及用户体验度。
[0116] 在一个实施例中,如图9所示,所述第二确定模块84包括:
[0117] 获取子模块91,用于获取音量值区间和能量指标参数之间的对应关系,其中,所述 音量值区间和所述能量指标参数成正相关;
[0118] 第一确定子模块92,用于确定所述第一音量值所属的第一音量值区间和所述第二 音量值所属的第二音量值区间;
[0119] 第二确定子模块93,用于根据音量值区间和能量指标参数之间的对应关系,确定 所述第一音量值区间对应的第一能量指标参数和所述第二音量值区间对应的第二能量指 标参数。
[0120] 在该实施例中,能量指标参数大,则条目内容对应的文字被进行优先匹配的概率 就越高。运样,在原有语音识别技术的基础上增加能量指标参数,可W在保证语音处理的准 确率的基础上,提高语义分析的成功率和准确率,也提高用户利用语音输入填写表格的成 功率及用户体验度。
[012。 如图10所示,在一个实施例中,所述查找模块85包括:
[0122] 第一计算子模块101,用于计算所述第二文字与所述待选择条目内容数据库中每 个待选择条目内容之间的第一相似度;
[0123] 内容确定子模块102,用于将第一相似度最高的待选择条目内容确定为所述目标 条目内容。
[0124] 在该实施例中,计算第二文字与待选择条目内容数据库中每个待选择条目内容之 间的第一相似度,从而将相似度最高的待选择条目内容确定为目标条目内容,运样,保证了 语音识别的准确率,也避免了由于语音识别结果出现错误而导致不能进行语义分析的问题 发生,提高了语义分析的成功率和准确率。
[012引如图11所示,在一个实施例中,所述填写模块86包括:
[0126] 条目确定子模块111,用于确定所述目标条目内容对应的目标操作条目;
[0127] 第二计算子模块112,用于计算所述目标操作条目和所述预操作条目对应的所述 第一文字之间的第二相似度;
[0128] 填写子模块113,用于在所述第二相似度大于或者等于预设相似度时,将所述目标 条目内容填写到所述目标操作条目对应的条目内容表格中。
[0129] 在该实施例中,在将目标条目内容填写到对应的条目内容表格之前,还可W先确 定目标条目内容对应的目标操作条目,然后将目标操作条目和预操作条目对应的第一文字 进行相似度计算,如果两者相似度大于预设相似度,则说明两者是匹配的,即用户预操作的 条目就是目标操作条目,运样,进一步保证了语义分析结果的准确性。
[0130] 如图12所示,在一个实施例中,上述装置还包括:
[0131] 计算模块121,用于在确定所述第一语音信息对应的第一音量值和所述第二语音 信息对应的第二音量值之前,计算所述语音信息的置信度;
[0132] 判断模块122,用于判断所述置信度是否小于预设置信度;
[0133] 触发模块123,用于在所述置信度小于预设置信度时,触发所述第二确定模块确定 所述第一语音信息对应的第一音量值和所述第二语音信息对应的第二音量值。
[0134] 在该实施例中,可W先计算语音信息的置信度,如果语音信息的置信度大于或等 于预设置信度,则说明置信度较高,可W成功进行语义分析,则可W采用现有的相关技术中 的语音分析方案进行语义分析,而如果语音信息的置信度小于预设置信度,则说明置信度 较低,语义分析可能会失败,此时,可W采用本发明的根据音量的不同来进行语义分析的方 案。
[0135] 本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序 产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实 施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机 可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形 式。
[0136] 本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程 图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流 程和/或方框、W及流程图和/或方框图中的流程和/或方框的结合。可提供运些计算机程序 指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器W产 生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实 现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0137] 运些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备W特 定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指 令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或 多个方框中指定的功能。
[0138] 运些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计 算机或其他可编程设备上执行一系列操作步骤W产生计算机实现的处理,从而在计算机或 其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一 个方框或多个方框中指定的功能的步骤。
[0139] 显然,本领域的技术人员可W对本发明进行各种改动和变型而不脱离本发明的精 神和范围。运样,倘若本发明的运些修改和变型属于本发明权利要求及其等同技术的范围 之内,则本发明也意图包含运些改动和变型在内。
【主权项】
1. 一种语音处理方法,其特征在于,包括: 接收用户输入的语音信息,其中,所述语音信息包括预操作条目对应的第一语音信息 和条目内容对应的第二语音信息; 对所述语音信息进行识别,以得到所述预操作条目对应的第一文字和所述条目内容对 应的第二文字; 确定所述第一语音信息对应的第一音量值和所述第二语音信息对应的第二音量值; 确定所述第一音量值对应的第一能量指标参数和所述第二音量值对应的第二能量指 标参数; 当所述第二能量指标参数大于所述第一能量指标参数,且所述第二能量指标参数大于 预设能量指标参数时,在待选择条目内容数据库中查找与所述第二文字匹配的目标条目内 容; 将所述目标条目内容填写到对应的条目内容表格中。2. 根据权利要求1所述的方法,其特征在于,所述确定所述第一音量值对应的第一能量 指标参数和所述第二音量值对应的第二能量指标参数,包括: 获取音量值区间和能量指标参数之间的对应关系,其中,所述音量值区间和所述能量 指标参数成正相关; 确定所述第一音量值所属的第一音量值区间和所述第二音量值所属的第二音量值区 间; 根据音量值区间和能量指标参数之间的对应关系,确定所述第一音量值区间对应的第 一能量指标参数和所述第二音量值区间对应的第二能量指标参数。3. 根据权利要求1所述的方法,其特征在于,在待选择条目内容数据库中查找与所述第 二文字匹配的目标条目内容,包括: 计算所述第二文字与所述待选择条目内容数据库中每个待选择条目内容之间的第一 相似度; 将第一相似度最高的待选择条目内容确定为所述目标条目内容。4. 根据权利要求1所述的方法,其特征在于,所述将所述目标条目内容填写到对应的条 目内容表格中,包括: 确定所述目标条目内容对应的目标操作条目; 计算所述目标操作条目和所述预操作条目对应的所述第一文字之间的第二相似度; 在所述第二相似度大于或者等于预设相似度时,将所述目标条目内容填写到所述目标 操作条目对应的条目内容表格中。5. 根据权利要求1至4中任一项所述的方法,其特征在于,在确定所述第一语音信息对 应的第一音量值和所述第二语音信息对应的第二音量值之前,所述方法还包括: 计算所述语音信息的置信度; 判断所述置信度是否小于预设置信度; 在所述置信度小于预设置信度时,执行所述确定所述第一语音信息对应的第一音量值 和所述第二语音信息对应的第二音量值的步骤。6. -种语音处理装置,其特征在于,包括: 接收模块,用于接收用户输入的语音信息,其中,所述语音信息包括预操作条目对应的 第一语音信息和条目内容对应的第二语音信息; 识别模块,用于对所述语音信息进行识别,以得到所述预操作条目对应的第一文字和 所述条目内容对应的第二文字; 第一确定模块,用于确定所述第一语音信息对应的第一音量值和所述第二语音信息对 应的第二音量值; 第二确定模块,用于确定所述第一音量值对应的第一能量指标参数和所述第二音量值 对应的第二能量指标参数; 查找模块,用于当所述第二能量指标参数大于所述第一能量指标参数,且所述第二能 量指标参数大于预设能量指标参数时,在待选择条目内容数据库中查找与所述第二文字匹 配的目标条目内容; 填写模块,用于将所述目标条目内容填写到对应的条目内容表格中。7. 根据权利要求6所述的装置,其特征在于,所述第二确定模块包括: 获取子模块,用于获取音量值区间和能量指标参数之间的对应关系,其中,所述音量值 区间和所述能量指标参数成正相关; 第一确定子模块,用于确定所述第一音量值所属的第一音量值区间和所述第二音量值 所属的第二音量值区间; 第二确定子模块,用于根据音量值区间和能量指标参数之间的对应关系,确定所述第 一音量值区间对应的第一能量指标参数和所述第二音量值区间对应的第二能量指标参数。8. 根据权利要求6所述的装置,其特征在于,所述查找模块包括: 第一计算子模块,用于计算所述第二文字与所述待选择条目内容数据库中每个待选择 条目内容之间的第一相似度; 内容确定子模块,用于将第一相似度最高的待选择条目内容确定为所述目标条目内 容。9. 根据权利要求6所述的装置,其特征在于,所述填写模块包括: 条目确定子模块,用于确定所述目标条目内容对应的目标操作条目; 第二计算子模块,用于计算所述目标操作条目和所述预操作条目对应的所述第一文字 之间的第二相似度; 填写子模块,用于在所述第二相似度大于或者等于预设相似度时,将所述目标条目内 容填写到所述目标操作条目对应的条目内容表格中。10. 根据权利要求6至9中任一项所述的装置,其特征在于,所述装置还包括: 计算模块,用于在确定所述第一语音信息对应的第一音量值和所述第二语音信息对应 的第二音量值之前,计算所述语音信息的置信度; 判断模块,用于判断所述置信度是否小于预设置信度; 触发模块,用于在所述置信度小于预设置信度时,触发所述第二确定模块确定所述第 一语音信息对应的第一音量值和所述第二语音信息对应的第二音量值。
【文档编号】G10L15/22GK105957524SQ201610264283
【公开日】2016年9月21日
【申请日】2016年4月25日
【发明人】李霄寒, 田伟
【申请人】北京云知声信息技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1