智能语音拨号的方法及装置制造方法

文档序号:2827762阅读:250来源:国知局
智能语音拨号的方法及装置制造方法
【专利摘要】本发明提供了一种智能语音拨号的方法及装置,其中,该方法包括:将获取的音频信息文件转换为文本信息文件;获取所述文本信息文件,并对所述文本信息文件进行语义解析,得到语义解析结果;其中,所述语义解析结果至少包括通信姓名信息或通信号码信息;将得到的语义解析结果与预设的通信信息进行匹配,生成通信信息匹配结果;其中,预设的通信信息至少包括通信姓名信息及与其对应的通信号码信息;根据所述通信信息匹配结果,生成拨号提示信息以供用户确认;根据用户确认的信息进行拨号操作。该方法,采用语音-文本转换、语义解析及智能匹配技术,降低了用户的使用成本,提高了语音识别的准确性及易用性。
【专利说明】智能语音拨号的方法及装置

【技术领域】
[0001]本发明涉及通信【技术领域】,尤其涉及一种智能语音拨号的方法及装置。

【背景技术】
[0002]以前进行拨打电话的行为主要出现在手机和固定电话上,随着科技和社会的发展,在汽车上、智能手表、智能手环、或者智能家居中进行通话已经是一个趋势,但这些设备中,有些屏幕特别小,比如智能手表;有些没有屏幕,比如智能手环;有些打电话会比较危险,例如在汽车驾驶中,低头看手机或车载电话,就可能造成极其严重的交通事故,因此迫切需要一种智能语音拨号系统,通过这个系统,人们不需要低头看设备,也不需要进行手动物理按键操作,只需以语音命令的形式,说出要打电话给谁即可。这样可以摆脱传统打电话需要浏览屏幕,点击或触摸屏幕和按键的繁琐操作,将拨号操作以更加方便、快捷、准确和智能的方式实现。
[0003]相关技术中,已出现带有语音拨号系统的智能手机,其实现语音拨号的方式是事先录好一段音频存储到手机上,下次需要拨号的时候,说出相同的话,系统将两段音频参数进行对比,判断是否一致,如果一致,则进行拨号,否则进行其他处理。这样的系统非常不灵活,首先如果用户的联系人非常多,就需要花费较多的时间进行录音存储;另外由于录入的命令非常的单一,无法灵活的更换表述方式,例如,如果录入的音频是“打电话给张三”,语音拨号时表述为“给张三打电话”或“打电话给李四”都是无法识别的命令。因此,这种操作方式用户使用成本很高,准确性和易用性得不到保障,有待进一步改进。


【发明内容】

[0004]本发明的目的在于针对现有技术的不足,提供一种智能语音拨号的方法及装置,降低用户的使用成本,提高语音识别的准确性及易用性。
[0005]为实现上述目的,本发明提供了一种智能语音拨号的方法,包括:
[0006]将获取的音频信息文件转换为文本信息文件;
[0007]获取文本信息文件,并对文本信息文件进行语义解析,得到语义解析结果;其中,语义解析结果至少包括通信姓名信息或通信号码信息;
[0008]将得到的语义解析结果与预设的通信信息进行匹配,生成通信信息匹配结果;其中,预设的通信信息至少包括通信姓名信息及与其对应的通信号码信息;
[0009]根据通信信息匹配结果,生成拨号提示信息以供用户确认;
[0010]根据用户确认的信息进行拨号操作。
[0011]进一步,将获取的音频信息文件转换为文本信息文件之前还包括:
[0012]获取音频信息,并对音频信息进行优化和预处理,得到音频信息文件;其中,对音频信息进行优化包括:对音频信息中的噪音进行过滤,对音频信息进行预处理包括:对音频信息进行解码处理及音频波普析取处理。
[0013]进一步,获取文本信息文件,并对文本信息文件进行语义解析,得到语义解析结果,包括:
[0014]对获取的文本信息文件进行分词、词性标注、句法分析、语义模型归类处理,得到初步的语义解析结果;
[0015]判断初步的语义解析结果是否属于电话域,如果是,提取其中有效的信息,生成最终的语义解析的结果。
[0016]进一步,将得到的语义解析结果与预设的通信信息进行匹配,生成通信信息匹配结果,包括:
[0017]判断语义解析结果所属的信息类型;
[0018]如果属于通信号码信息,直接生成拨号提示信息;
[0019]如果属于通信姓名信息,提取预设的通信姓名信息的信息特征值,将信息特征值与通信姓名信息进行匹配计算,得到每个预设的通信姓名信息与通信姓名信息的相似度,并按照相似度大小进行排列,得到相似度结果;对得到的相似度结果进行筛选处理,得到通信信息匹配结果;其中,信息特征值包括:文字、发音、同音字及词库表。
[0020]进一步,拨号提示信息至少包括语音提示信息及文本提示信息。
[0021]本发明还提供了一种智能语音拨号的装置,其特征在于,包括:
[0022]转换模块,用于将获取的音频信息文件转换为文本信息文件;
[0023]解析模块,用于获取文本信息文件,并对文本信息文件进行语义解析,得到语义解析结果;其中,语义解析结果至少包括通信姓名信息或通信号码信息;
[0024]匹配模块,用于将得到的语义解析结果与预设的通信信息进行匹配,生成通信信息匹配结果;其中,预设的通信信息至少包括通信姓名信息及与其对应的通信号码信息;
[0025]提示模块,用于根据通信信息匹配结果,生成拨号提示信息以供用户确认;
[0026]拨号模块,用于根据用户确认的信息进行拨号操作。
[0027]进一步,该装置还包括:
[0028]获取模块,用于获取音频信息,并对音频信息进行优化和预处理,得到音频信息文件;其中,对音频信息进行优化包括:对所述音频信息中的噪音进行过滤,对音频信息进行预处理包括:对所述音频信息进行解码处理及音频波普析取处理。
[0029]进一步,解析模块具体用于:
[0030]对获取的文本信息文件进行分词、词性标注、句法分析、语义模型归类处理,得到初步的语义解析结果;
[0031]判断初步的语义解析结果是否属于电话域,如果是,提取其中有效的信息,生成最终的语义解析的结果。
[0032]进一步,匹配模块具体用于:
[0033]判断语义解析结果所属的信息类型;
[0034]如果属于通信号码信息,直接生成拨号提示信息;
[0035]如果属于通信姓名信息,提取预设的通信姓名信息的信息特征值,将信息特征值与通信姓名信息进行匹配计算,得到每个预设的通信姓名信息与通信姓名信息的相似度,并按照相似度大小进行排列,得到相似度结果;对得到的相似度结果进行筛选处理,得到通信信息匹配结果;其中,信息特征值包括:文字、发音、同音字及词库表。
[0036]进一步,提示模块包括:
[0037]语音提示模块,用于生成语音提示信息;
[0038]文本提示模块,用于生成文本提示信息。
[0039]与现有技术相比,本发明的有益效果是:通过识别用户的不同语音,并将其转换为文本信息文件后进行语义解析,将语义解析结果与预设的通信信息(通信录)进行匹配计算,得到最佳的匹配结果,并生成拨号提示信息供用户确认后进行拨号操作。该方法无需事先录音,采用语音-文本转换、语义解析及智能匹配技术,降低了用户的使用成本,提高了语音识别的准确性及易用性。

【专利附图】

【附图说明】
[0040]图1为本发明一种智能语音拨号的方法第一实施例的流程图;
[0041]图2为本发明一种智能语音拨号的方法第二实施例的流程图;
[0042]图3为本发明一种智能语音拨号的装置第一实施例的结构框图;
[0043]图4为本发明一种智能语音拨号的装置第二实施例的结构框图;
[0044]图5为本发明一种智能语音拨号的装置提示模块的结构框图。

【具体实施方式】
[0045]下面结合附图所示的各实施方式对本发明进行详细说明,但应当说明的是,这些实施方式并非对本发明的限制,本领域普通技术人员根据这些实施方式所作的功能、方法、或者结构上的等效变换或替代,均属于本发明的保护范围之内。
[0046]参图1所示,图1为本发明一种智能语音拨号的方法第一实施例的流程图。
[0047]在本实施例中,一种智能语音拨号的方法,包括:
[0048]步骤S102,将获取的音频信息文件转换为文本信息文件。
[0049]该过程是对音频信息文件的处理,包括:提取声学特征、进行声学模型匹配,最终转换为相应的文本信息输出。
[0050]步骤S104,获取文本信息文件,并对文本信息文件进行语义解析,得到语义解析结果;其中,语义解析结果至少包括通信姓名信息或通信号码信息。
[0051]具体包括:
[0052]对获取的文本信息文件进行分词、词性标注、句法分析、语义模型归类处理,得到初步的语义解析结果;
[0053]判断初步的语义解析结果是否属于电话域(domain),如果是,提取其中有效的信息,生成最终的语义解析的结果,该结果以特定的命令格式保存。
[0054]步骤S106,将得到的语义解析结果与预设的通信信息进行匹配,生成通信信息匹配结果;其中,预设的通信信息至少包括通信姓名信息及与其对应的通信号码信息。
[0055]具体包括:
[0056]判断语义解析结果所属的信息类型;
[0057]如果属于通信号码信息(纯电话号码),直接生成拨号提示信息;
[0058]如果属于通信姓名信息(联系人姓名),提取预设的通信姓名信息的信息特征值,将信息特征值与通信姓名信息进行匹配计算,得到每个预设的通信姓名信息与通信姓名信息的相似度,并按照相似度大小进行排列(列表形式),得到相似度结果;对得到的相似度结果进行筛选处理,得到通信信息匹配结果;其中,信息特征值包括:文字、发音、同音字及词库表。
[0059]步骤S108,根据通信信息匹配结果,生成拨号提示信息以供用户确认。拨号提示信息可以包括语音提示信息及文本提示信息。
[0060]步骤S110,根据用户确认的信息进行拨号操作。
[0061]系统提示是否打电话给列表中的第一人(匹配度最高的那个),如果用户说是或者点击屏幕,则直接拨号,用户在规定的时候没有说话,或者进行点击确认操作,则再次进行朗读,确认是否要打电话给联系人,一直循环到最后一个人,用户没有确认或者进行触摸操作,则关闭程序,进入待机状态。
[0062]本实施例通过识别用户的不同语音,并将其转换为文本信息文件后进行语义解析,将语义解析结果与预设的通信信息(通信录)进行匹配计算,得到最佳的匹配结果,并生成拨号提示信息供用户确认后进行拨号操作。该方法无需事先录音,采用语音-文本转换、语义解析及智能匹配技术,降低了用户的使用成本,提高了语音识别的准确性及易用性。
[0063]参图2所示,图2为本发明一种智能语音拨号的方法第二实施例的流程图。
[0064]在本实施例中,在步骤S102之前还可以包括:
[0065]步骤S101,获取音频信息,并对音频信息进行优化和预处理,得到音频信息文件;其中,对音频信息进行优化包括:对音频信息中的噪音进行过滤,减少损失,对音频信息进行预处理包括:对音频信息进行解码处理及音频波普析取处理。通过对音频信息进行优化和预处理可以有效提高音频采集的质量,为音频转换提供高质量的音频信息文件,提高识别率及转换率。
[0066]参图3所示,图3为本发明一种智能语音拨号的装置第一实施例的结构框图。
[0067]本发明的实施例还提供了一种智能语音拨号的装置,包括:
[0068]转换模块32,用于将获取的音频信息文件转换为文本信息文件;
[0069]解析模块34,用于获取文本信息文件,并对文本信息文件进行语义解析,得到语义解析结果;其中,语义解析结果至少包括通信姓名信息或通信号码信息;
[0070]匹配模块36,用于将得到的语义解析结果与预设的通信信息进行匹配,生成通信信息匹配结果;其中,预设的通信信息至少包括通信姓名信息及与其对应的通信号码信息;
[0071]提示模块38,用于根据通信信息匹配结果,生成拨号提示信息以供用户确认;
[0072]拨号模块40,用于根据用户确认的信息进行拨号操作。
[0073]参图4所示,图4为本发明一种智能语音拨号的装置第二实施例的结构框图。
[0074]在本实施例中,该装置还可以包括:
[0075]获取模块31,用于获取音频信息,并对音频信息进行优化和预处理,得到音频信息文件;其中,对音频信息进行优化包括:对所述音频信息中的噪音进行过滤,对音频信息进行预处理包括:对所述音频信息进行解码处理及音频波普析取处理。
[0076]另外,本实施例还可以设置初始化模块,用于硬件启动、软件系统运行并初始化相关参数、读取缓存通讯录到内存、装载各个数据分析处理程序和资源,为其他各个模块的运行提供硬件和软件的环境的支持。
[0077]在本实施例中,解析模块34具体用于:
[0078]对获取的文本信息文件进行分词、词性标注、句法分析、语义模型归类处理,得到初步的语义解析结果;
[0079]判断初步的语义解析结果是否属于电话域,如果是,提取其中有效的信息,生成最终的语义解析的结果。
[0080]在本实施例中,匹配模块36具体用于:
[0081]判断语义解析结果所属的信息类型;
[0082]如果属于通信号码信息,直接生成拨号提示信息;
[0083]如果属于通信姓名信息,提取预设的通信姓名信息的信息特征值,将信息特征值与通信姓名信息进行匹配计算,得到每个预设的通信姓名信息与通信姓名信息的相似度,并按照相似度大小进行排列,得到相似度结果;对得到的相似度结果进行筛选处理,得到通信信息匹配结果;其中,信息特征值包括:文字、发音、同音字及词库表。
[0084]参图5所示,图5为本发明一种智能语音拨号的装置提示模块的结构框图。
[0085]在本实施例中,提示模块38包括:
[0086]语音提示模块381,用于生成语音提示信息;
[0087]文本提示模块382,用于生成文本提示信息。
[0088]通过上述实施例,本发明具有以下有益效果:
[0089]I)功能更加强大、准确率更高。本系统可以灵活高效的支持各种精确或模糊的语音指令拨号,通过先进的语音识别技术,可以快速的把语音输入转换为文字结果;通过强大的语义解析系统,可以对用户的各种语音指令进行高效和精准解析处理;通过智能匹配技术,可以从通讯录中完美的匹配出符合用户指令的结果。
[0090]2架构模块更合理,各模块可独立进行优化和改进。
[0091]3耦合度非常低,极易于维护和扩展,能够在本方案上进行各种合理、高效地扩展和提升。
[0092]对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
[0093]此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
【权利要求】
1.一种智能语音拨号的方法,其特征在于,包括: 将获取的音频信息文件转换为文本信息文件; 获取所述文本信息文件,并对所述文本信息文件进行语义解析,得到语义解析结果;其中,所述语义解析结果至少包括通信姓名信息或通信号码信息; 将得到的语义解析结果与预设的通信信息进行匹配,生成通信信息匹配结果;其中,预设的通信信息至少包括通信姓名信息及与其对应的通信号码信息; 根据所述通信信息匹配结果,生成拨号提示信息以供用户确认; 根据用户确认的信息进行拨号操作。
2.根据权利要求1所述的智能语音拨号的方法,其特征在于,将获取的音频信息文件转换为文本信息文件之前还包括: 获取音频信息,并对所述音频信息进行优化和预处理,得到音频信息文件;其中,对所述音频信息进行优化包括:对所述音频信息中的噪音进行过滤,对所述音频信息进行预处理包括:对所述音频信息进行解码处理及音频波普析取处理。
3.根据权利要求1所述的智能语音拨号的方法,其特征在于,获取所述文本信息文件,并对所述文本信息文件进行语义解析,得到语义解析结果,包括: 对获取的文本信息文件进行分词、词性标注、句法分析、语义模型归类处理,得到初步的语义解析结果; 判断所述初步的语义解析结果是否属于电话域,如果是,提取其中有效的信息,生成最终的语义解析的结果。
4.根据权利要求1所述的智能语音拨号的方法,其特征在于,将得到的语义解析结果与预设的通信信息进行匹配,生成通信信息匹配结果,包括: 判断所述语义解析结果所属的信息类型; 如果属于通信号码信息,直接生成拨号提示信息; 如果属于通信姓名信息,提取预设的通信姓名信息的信息特征值,将所述信息特征值与所述通信姓名信息进行匹配计算,得到每个预设的通信姓名信息与所述通信姓名信息的相似度,并按照相似度大小进行排列,得到相似度结果;对得到的相似度结果进行筛选处理,得到通信信息匹配结果;其中,所述信息特征值包括:文字、发音、同音字及词库表。
5.根据权利要求1所述的智能语音拨号的方法,其特征在于,所述拨号提示信息至少包括语音提示信息及文本提示信息。
6.一种智能语音拨号的装置,其特征在于,包括: 转换模块,用于将获取的音频信息文件转换为文本信息文件; 解析模块,用于获取所述文本信息文件,并对所述文本信息文件进行语义解析,得到语义解析结果;其中,所述语义解析结果至少包括通信姓名信息或通信号码信息; 匹配模块,用于将得到的语义解析结果与预设的通信信息进行匹配,生成通信信息匹配结果;其中,预设的通信信息至少包括通信姓名信息及与其对应的通信号码信息; 提示模块,用于根据所述通信信息匹配结果,生成拨号提示信息以供用户确认; 拨号模块,用于根据用户确认的信息进行拨号操作。
7.根据权利要求6所述的智能语音拨号的装置,其特征在于,还包括: 获取模块,用于获取音频信息,并对所述音频信息进行优化和预处理,得到音频信息文件;其中,对所述音频信息进行优化包括:对所述音频信息中的噪音进行过滤,对所述音频信息进行预处理包括:对所述音频信息进行解码处理及音频波普析取处理。
8.根据权利要求6所述的智能语音拨号的装置,其特征在于,所述解析模块具体用于: 对获取的文本信息文件进行分词、词性标注、句法分析、语义模型归类处理,得到初步的语义解析结果; 判断所述初步的语义解析结果是否属于电话域,如果是,提取其中有效的信息,生成最终的语义解析的结果。
9.根据权利要求6所述的智能语音拨号的装置,其特征在于,所述匹配模块具体用于: 判断所述语义解析结果所属的信息类型; 如果属于通信号码信息,直接生成拨号提示信息; 如果属于通信姓名信息,提取预设的通信姓名信息的信息特征值,将所述信息特征值与所述通信姓名信息进行匹配计算,得到每个预设的通信姓名信息与所述通信姓名信息的相似度,并按照相似度大小进行排列,得到相似度结果;对得到的相似度结果进行筛选处理,得到通信信息匹配结果;其中,所述信息特征值包括:文字、发音、同音字及词库表。
10.根据权利要求6所述的智能语音拨号的装置,其特征在于,所述提示模块包括: 语音提示模块,用于生成语音提示信息; 文本提示模块,用于生成文本提示信息。
【文档编号】G10L15/26GK104202455SQ201410439187
【公开日】2014年12月10日 申请日期:2014年8月30日 优先权日:2014年8月30日
【发明者】贾志强, 陈宾 申请人:北京光年无限科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1