蓝牙语音控制方法、装置及智能终端的制作方法

文档序号:6713975阅读:181来源:国知局
蓝牙语音控制方法、装置及智能终端的制作方法
【专利摘要】本发明涉及个人移动以及车载蓝牙【技术领域】,公开了蓝牙语音控制方法、装置及智能终端。该方法包括步骤:与外设进行蓝牙配对连接;向外设发送请求信号,尝试连接外设制定的RFCOMM通道;接收外设返回的确认RFCOMM通道建立信号,建立基于RFCOMM的Socket端口;通过所述Socket端口接收外设传来的VTCP数据包;识别所述数据包中的语音指令,将所述语音指令转换为具体的控制指令来操作智能终端。本发明采用VTCP协议通过RFCOMM信道传送16KHz语音信号,有效提高了语音识别率,进而实现了对智能终端的高效准确的语音控制,最大限度保证了用户操控智能终端时的安全性和便利性。
【专利说明】蓝牙语音控制方法、装置及智能终端

【技术领域】
[0001] 本发明属于个人移动以及车载蓝牙【技术领域】,具体涉及一种蓝牙语音控制方法、 装置及智能终端。

【背景技术】
[0002] 随着智能手机的日益普及,越来越多的移动互联应用可以让人们在行车时获得更 多便利和享受。但是在驾驶汽车的时候操作手机是危害行车安全的行为,所以当前驾驶员 在驾驶时主要依赖蓝牙方式来无线使用手机的一些基本功能。目前的车载蓝牙设备主要是 电话免提、蓝牙耳机等,其工作原理是通过标准蓝牙协议连接手机,无线控制手机接听电话 和播放音乐。但受设备和协议的限制,现有蓝牙方式无法对手机上的其他功能进行控制,t匕 如现有技术很难通过蓝牙实现对手机的语音控制。
[0003] 语音控制的最关键问题是准确识别用户的语音指令,传统使用蓝牙外设进行语 音识别的方式有两种:利用蓝牙外设内置的DSP进行识别;或是利用蓝牙HSP (HeadSet Profile,头戴式设备应用)协议将语音信号回传给手机,由手机端进行语音识别。但是,受 体积、成本及能源的限制,蓝牙外设的DSP处理能力和存储能力十分有限,识别速度和复杂 度都有很大限制,一般只能做简单命令词的识别(比如"yes"、"no"之类),很难实现复杂 的语音控制。而采用第二种方式时,由于HSP协议是专门用来传送双向、低延迟语音的,其 用途主要仅适用于电话通话,受蓝牙信道带宽的限制,其音频采样率只有8KHz ;只有从较 新的HSP1.6起,SIG小组才开始规定了 16KHz的WBS(wide band speech,宽带语音),但目 前大部分手机还未能支持WBS。因而利用HSP协议进行语音识别的缺点主要有两个:第一, 大部分手机只支持8KHz采样,识别的准确率较低;第二,某些手机不支持HSP回传语音,甚 至无法进行语音识别。


【发明内容】

[0004] 针对现有技术中存在的上述缺陷,本发明所要解决的技术问题是如何增强蓝牙设 备的语音识别能力。
[0005] 为解决上述技术问题,本发明提供了一种蓝牙语音控制方法,所述方法包括步 骤:
[0006] 与外设进行蓝牙配对连接;
[0007] 向外设发送请求信号,尝试连接外设制定的RFC0MM通道;
[0008] 接收外设返回的确认RFC0MM通道建立信号,建立基于RFC0MM的Socket端口;
[0009] 通过所述Socket端口接收外设传来的VTCP数据包;
[0010] 识别所述数据包中的语音指令,将所述语音指令转换为具体的控制指令来操作智 能终端。
[0011] 优选地,所述方法中,建立所述Socket端口之后进一步包括步骤:
[0012] 打开外设的麦克风接收用户语音,将ADC转换的音频信号按照16KHz、16bit的格 式打包压缩;
[0013] 通过Socket端口接收外设打包传输的数据包;
[0014] 对所述数据包的完整性和连续性进行检查;
[0015] 对所述数据包中的语音数据进行噪声抑制、回声消除、人声检测的预处理;
[0016] 对预处理后的语音数据进行语音识别和语义理解;
[0017] 将最终的识别结果以命令形式送回至智能终端的处理器,执行相应的处理操作。
[0018] 优选地,所述方法中,在打开外设的麦克风之前还包括步骤:
[0019] 智能终端做好启动准备,向外设发起语音识别请求;
[0020] 外设收到请求后,播放提示音;
[0021 ] 在提示音结束后,外设才打开麦克风。
[0022] 优选地,所述方法中还包括步骤:
[0023] 在执行完所述处理操作准备结束的同时,向外设发送语音识别结束信号,外设根 据所述语音识别结束信号关闭麦克风。
[0024] 优选地,所述方法中,所述智能终端做好启动准备包括步骤:
[0025] 通过无线接口与遥控器建立无线链接,接收遥控器的遥控操作,启动语音控制过 程。
[0026] 优选地,所述外设为车载设备、耳机和/或可穿戴设备;所述智能终端为移动终 端、智能家电、PC设备、嵌入式系统和/或可穿戴智能设备。
[0027] 另一方面,本发明还同时提供一种蓝牙语音控制装置,所述装置包括:
[0028] 蓝牙配对模块,用于与外设进行蓝牙配对连接;
[0029] 请求模块,用于向外设发送请求信号,尝试连接外设制定的RFC0MM通道;
[0030] 通道模块,用于接收外设返回的确认RFC0MM通道建立信号,建立基于RFC0MM的 Socket 端口;
[0031] 接收模块,用于通过所述Socket端口接收外设传来的VTCP数据包;
[0032] 识别处理模块,用于识别所述数据包中的语音指令,将所述语音指令转换为具体 的控制指令来操作智能终端。
[0033] 优选地,所述识别处理模块进一步包括:
[0034] 检查模块,用于对所述数据包的完整性和连续性进行检查;
[0035] 预处理模块,用于对所述数据包中的语音数据进行噪声抑制、回声消除、人声检测 的预处理;
[0036] 语义处理模块,用于对预处理后的语音数据进行语音识别和语义理解;
[0037] 执行模块,用于将最终的识别结果以命令形式送回至智能终端的处理器,执行相 应的处理操作。
[0038] 优选地,所述装置还包括:
[0039] 启动模块,用于在做好启动准备时向外设发起语音识别请求,外设根据请求播放 提示音,在提示音结束后,外设才打开麦克风;
[0040] 结束模块,用于在执行完所述处理操作准备结束的同时,向外设发送语音识别结 束信号,外设根据所述语音识别结束信号关闭麦克风。
[0041] 优选地,所述外设为车载设备、耳机和/或可穿戴设备;所述智能终端为移动终 端、智能家电、PC设备、嵌入式系统和/或可穿戴智能设备。
[0042] 再一方面,本发明还同时一种智能终端,所述智能终端包括:如上所述的装置,以 及接口模块和至少一个功能模块;其中,
[0043] 所述接口模块与遥控器建立无线链接,接收所述遥控器的遥控操作;
[0044] 所述功能模块接收识别处理模块提供的控制指令完成相应的操作功能。
[0045] 优选地,所述接口模块为红外接口或蓝牙接口。
[0046] 本发明通过改进从蓝牙外设回传语音的方式,采用VTCP协议通过RFC0MM信道传 送16KHz语音信号,高采样率的语音数据有效提高了语音识别率,进而实现了对智能终端 的高效准确的语音控制,最大限度保证了驾驶员操控智能终端时的安全性和便利性。

【专利附图】

【附图说明】
[0047] 图1是本发明的一个实施例中蓝牙语音传输私有协议的架构示意图;
[0048] 图2是本发明的一个实施例中蓝牙语音控制方法的流程示意图;
[0049] 图3是本发明的一个优选实施例中利用VTCP协议进行语音识别的流程示意图;
[0050] 图4是本发明的一个实施例中蓝牙语音控制装置的模块结构示意图。

【具体实施方式】
[0051] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述。显然,所描述的实施例为实施本发明的较佳实施方式,所述描述是以说明本发明 的一般原则为目的,并非用以限定本发明的范围。本发明的保护范围应当以权利要求所界 定者为准,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下 所获得的所有其他实施例,都属于本发明保护的范围。
[0052] 现有蓝牙标准协议利用HSP协议回传语音,由于采样率较低,很难实现准确的语 音识别,因而给借助蓝牙设备进行语音控制带来了不便。本发明中改进了从蓝牙外设回传 语音的方式,采用VTCP (虚拟TCP)协议通过RFC0MM(串口仿真协议)信道传送16KHz语音 信号,高采样率的语音数据有效提高了语音识别率。
[0053] 在本发明的一个实施例中,利用VTCP协议建立私有的蓝牙语音传输协议,该私有 协议的整体架构如图1所示。其中,除VTCP之外的同层或下层协议均属于SIG小组制定的 标准蓝牙协议栈中的核心协议,虽然标准蓝牙协议栈可能还包括其他选用协议或经历过变 更,但这些核心协议是所有蓝牙设备都支持的,因而基于这些核心协议的实现方式不会出 现兼容性问题。具体的核心协议包括基带(Base Band)协议、链路管理(LM)协议、逻辑链 路控制和适配协议(L2CAP)、服务发现协议(SDP),而SCO (面向连接的同步链路)属于基带 协议之上的连接方式、RFC0MM属于通用的串行传输协议,其协议规范及相互之间的关系在 SIG小组的标准技术文档中有更详细的描述,在此不再赘述。由于这些标准协议能被现有的 全部蓝牙设备所支持,因此本发明中的底层通信可以在任意蓝牙设备中兼容传输。基于这 些标准协议,本发明进一步通过在智能终端(典型的如手机、平板电脑等)中加载应用来将 数据通过VTCP方式分组传输,实现了高采样率高速的语音传输,进而实现了对智能终端的 语首控制。
[0054] 更进一步地,参见图2,在本发明的一个实施例中,蓝牙语音控制方法包括步骤:
[0055] 与外设进行蓝牙配对连接;
[0056] 向外设发送请求信号,尝试连接外设制定的RFC0MM通道;
[0057] 接收外设返回的确认RFC0MM通道建立信号,建立基于RFC0MM的Socket端口;
[0058] 通过所述Socket端口接收外设传来的VTCP数据包;
[0059] 识别所述数据包中的语音指令,将所述语音指令转换为具体的控制指令来操作智 能终端。
[0060] 在本发明的优选实施例中,VTCP协议的数据包优选用于传输语音数据,但该数据 包中传输的数据不仅限于语音数据,在本发明的其他优选实施方式中,VTCP协议的数据包 可用来传输多种交互数据。比如,通过该VTCP协议同样可以传送控制命令、传感器数据、文 件(包括但不限于文本、图片、音频、视频、软件等)数据、网络数据或上述数据的组合。因 此基于VTCP协议,除可以通过蓝牙外设实现对智能终端的语音控制外,还可借助该外设实 现与智能终端的多种交互方式(包括但不限于传输遥控操作、传感信息、导航信息等),或 是实现智能终端(包括但不限于移动终端、智能家电、PC设备、嵌入式系统和/或可穿戴智 能设备)与多种蓝牙外设(包括但不限于耳机、免提通话器、遥控器、行车记录仪、导航仪、 HUD、各种可穿戴设备或上述外设的结合等)的交互。在此,VTCP协议的数据类型和应用方 式不应视为对本发明的限制。
[0061] 再参见图3,利用VTCP协议进行语音识别的过程如下:
[0062] 打开外设的麦克风输入单元接收用户语音,将ADC转换的音频信号按照16KHz、 16bit的格式打包压缩;
[0063] 通过Socket端口接收外设打包传输的数据包;
[0064] 对数据包的完整性和连续性进行检查;
[0065] 对数据包中的语音数据进行噪声抑制、回声消除、人声检测等预处理;
[0066] 对预处理后的语音数据进行语音识别和语义理解;
[0067] 将最终的识别结果以命令形式送回至智能终端的处理器,执行相应的处理操作。
[0068] 优选地,本发明的方法以移动应用的方式提供给智能终端,因而如图3所示,在智 能终端做好准备(即启动该应用)后,会首先向外设发起语音识别请求;外设收到请求后, 播放提示音;在提示音结束后,外设才打开麦克风输入单元。随后,在执行完语音控制功能 (比如终端关闭该应用)后,智能终端会同时向外设发送语音识别结束信号,外设根据该信 号关闭麦克风。
[0069] 更进一步地,在语音控制生效前,在智能终端中启动应用也需要用户进行一定的 操作,为减少驾驶员的手动操作,本发明中优选通过遥控方式无线启动应用。智能终端通过 无线接口与遥控器建立无线链接,接收遥控器的遥控操作,启动语音控制过程。无线接口优 选为红外接口或蓝牙接口,相应地接收遥控器的红外或蓝牙信号(BR/EDR或BLE方式均可) 来实现启动操作。
[0070] 本领域相关技术人员应能理解,与本发明的方法相对应的,本发明还同时包括一 种蓝牙语音控制装置,与上述方法步骤一一对应地,如图4所示,该装置包括:
[0071] 蓝牙配对模块,用于与外设进行蓝牙配对连接;
[0072] 请求模块,用于向外设发送请求信号,尝试连接外设制定的RFC0MM通道;
[0073] 通道模块,用于接收外设返回的确认RFC0MM通道建立信号,建立基于RFC0MM的 Socket 端口;
[0074] 接收模块,用于通过所述Socket端口接收外设传来的VTCP数据包;
[0075] 识别处理模块,用于识别所述数据包中的语音指令,将所述语音指令转换为具体 的控制指令来操作智能终端。
[0076] 本发明的技术方案主要以移动应用的方式提供给智能终端,典型的智能终端如手 机、平板电脑等。该智能终端除包含上述蓝牙语音控制装置的各模块外,进一步还可包括接 口模块和其他功能模块,接口模块可以接收遥控器设备的输入对智能终端进行操控;其他 功能模块为智能终端提供了更加丰富的应用功能,如第三方导航、摄像头驱动等等。通过本 发明的技术方案,用户可以不借助任何手部操作完成对智能终端的控制,比如设置目的地 并开启导航、拍照、摄像、拔打电话、选择歌曲播放等等。因而本发明的技术方案尤其适用于 车载设备,可以最大限度保证驾驶员操控智能终端时的安全性和便利性。本领域相关技术 人员应能理解,采用蓝牙耳机让驾驶员语音控制手机仅仅是本发明的最优选的实施方式之 一,本发明的技术方案并不仅限于车载环境也并不仅限于耳机与手机的交互,任意可采集 语音的外设及具备一定处理能力的智能终端均可实施本发明的技术方案,在此上述优选实 施方式不应理解为对本发明的限制。
[0077] 此外,相对于现有技术,本发明的技术方案还具有如下优势:
[0078] 1.通过RFC0MM信道传送16KHz语音信号,提高识别率。本发明进一步对300个人 名和地名样本进行了测试,16KHz语音样本的识别率相比8KHz样本的识别错误率(WER)下 降了 15%。
[0079] 2.使用私有协议时,所有手机通过安装的客户端应用与蓝牙外设通讯,从而避免 了某些手机本身不支持HSP语音识别功能的兼容性问题。
[0080] 3.利用智能手机强大的处理能力,对车内噪声进行抑制。通过采集300个在车内 高噪声环境下采集的人名样本进行测试,无预处理的识别率仅为72 %,增加预处理后识别 率上升至95%。
[0081] 虽然以上结合优选实施例对本发明进行了描述,但本领域的技术人员应该理解, 本发明所述的方法和系统并不限于【具体实施方式】中所述的实施例,在不背离由所附权利要 求书限定的本发明精神和范围的情况下,可对本发明作出各种修改、增加、以及替换。
【权利要求】
1. 一种蓝牙语音控制方法,其特征在于,所述方法包括步骤: 与外设进行蓝牙配对连接; 向外设发送请求信号,尝试连接外设制定的RFCOMM通道; 接收外设返回的确认RFCOMM通道建立信号,建立基于RFCOMM的Socket端口; 通过所述Socket端口接收外设传来的VTCP数据包; 识别所述数据包中的语音指令,将所述语音指令转换为具体的控制指令来操作智能终 端。
2. 如权利要求1所述的方法,其特征在于,所述方法中,建立所述Socket端口之后进一 步包括步骤: 打开外设的麦克风接收用户语音,将ADC转换的音频信号按照16KHz、16bit的格式打 包压缩; 通过Socket端口接收外设打包传输的数据包; 对所述数据包的完整性和连续性进行检查; 对所述数据包中的语音数据进行噪声抑制、回声消除、人声检测的预处理; 对预处理后的语音数据进行语音识别和语义理解; 将最终的识别结果以命令形式送回至智能终端的处理器,执行相应的处理操作。
3. 如权利要求2所述的方法,其特征在于,所述方法中,在打开外设的麦克风之前还包 括步骤: 智能终端做好启动准备,向外设发起语音识别请求; 外设收到请求后,播放提示音; 在提示音结束后,外设才打开麦克风。
4. 如权利要求1或2所述的方法,其特征在于,所述方法中还包括步骤: 在执行完所述处理操作准备结束的同时,向外设发送语音识别结束信号,外设根据所 述语音识别结束信号关闭麦克风。
5. 如权利要求3所述的方法,其特征在于,所述方法中,所述智能终端做好启动准备包 括步骤: 通过无线接口与遥控器建立无线链接,接收遥控器的遥控操作,启动语音控制过程。
6. 如权利要求1所述的方法,其特征在于,所述外设为车载设备、耳机和/或可穿戴设 备;所述智能终端为移动终端、智能家电、PC设备、嵌入式系统和/或可穿戴智能设备。
7. -种蓝牙语音控制装置,其特征在于,所述装置包括: 蓝牙配对模块,用于与外设进行蓝牙配对连接; 请求模块,用于向外设发送请求信号,尝试连接外设制定的RFCOMM通道; 通道模块,用于接收外设返回的确认RFCOMM通道建立信号,建立基于RFCOMM的Socket 端口; 接收模块,用于通过所述Socket端口接收外设传来的VTCP数据包; 识别处理模块,用于识别所述数据包中的语音指令,将所述语音指令转换为具体的控 制指令来操作智能终端。
8. 如权利要求7所述的装置,其特征在于,所述识别处理模块进一步包括: 检查模块,用于对所述数据包的完整性和连续性进行检查; 预处理模块,用于对所述数据包中的语音数据进行噪声抑制、回声消除、人声检测的预 处理; 语义处理模块,用于对预处理后的语音数据进行语音识别和语义理解; 执行模块,用于将最终的识别结果以命令形式送回至智能终端的处理器,执行相应的 处理操作。
9. 如权利要求7所述的装置,其特征在于,所述装置还包括: 启动模块,用于在做好启动准备时向外设发起语音识别请求,外设根据请求播放提示 音,在提不音结束后,外设才打开麦克风; 结束模块,用于在执行完所述处理操作准备结束的同时,向外设发送语音识别结束信 号,外设根据所述语音识别结束信号关闭麦克风。
10. 如权利要求7所述的装置,其特征在于,所述外设为车载设备、耳机和/或可穿戴设 备;所述智能终端为移动终端、智能家电、PC设备、嵌入式系统和/或可穿戴智能设备。
11. 一种智能终端,其特征在于,所述智能终端包括:如权利要求7-10中任一项所述的 装置,以及接口模块和至少一个功能模块;其中, 所述接口模块与遥控器建立无线链接,接收所述遥控器的遥控操作; 所述功能模块接收识别处理模块提供的控制指令完成相应的操作功能。
12. 如权利要求11所述的智能终端,其特征在于,所述接口模块为红外接口或蓝牙接 □。
【文档编号】G08C17/02GK104092825SQ201410333229
【公开日】2014年10月8日 申请日期:2014年7月7日 优先权日:2014年7月7日
【发明者】何浪, 王凡, 张玉斌, 黄广文, 严伟军 申请人:深圳市微思客技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1