一种基于智能音响的云固话方法与流程

文档序号:15625343发布日期:2018-10-09 22:50阅读:1306来源:国知局

本发明涉及智能音响相关技术领域,尤其是指一种基于智能音响的云固话方法。



背景技术:

音响指除了人的语言、音乐之外的其他声响,包括自然环境的声响、动物的声音、机器工具的音响、人的动作发出的各种声音等。音响大概包括功放、周边设备(包括压限器、效果器、均衡器、vcd、dvd等)、扬声器(音箱、喇叭)、调音台、麦克风、显示设备等等加起来一套。其中,音箱就是声音输出设备、喇叭、低音炮等等。一个音箱里包括高、低、中三种扬声器,三种但不一定就三个。技术的的发展历史可以分为电子管、晶体管、集成电路、场效应管四个阶段。

固话在现代是重要的通讯手段之一,通过声音的振动利用话机内的话筒调制电话线路上的电流电压,也就是将声音转换为电压信号通过电话线传送到另外一端电话,再利用送话器将电压信号转换为声音信号。因为通常固定在一个位置,所以学术名称为固定电话,也就是平常说的电话座机。这种电话又有好几种,比如:传真电话、母子电话等。

随着智能音响技术的成熟,我们发现在它的基础上叠加固定电话的功能会有比较好的市场。但是,如何将两者有效的结合在一起,从而提升用户的体验一直是亟待解决的问题。



技术实现要素:

本发明是为了克服现有技术中存在上述的不足,提供了一种能够有效提高用户体验的基于智能音响的云固话方法。

为了实现上述目的,本发明采用以下技术方案:

一种基于智能音响的云固话方法,具体包括如下步骤:

(1)用户拿起蓝牙话机,蓝牙话机自行启动供电;

(2)蓝牙话机中的蓝牙模块自行启动对附近的智能音响设备进行自动匹配;

(3)自动匹配成功之后,用户对蓝牙话机进行语音输入,通过定制的语音识别技术将声音转化为文字;

(4)根据定制的语音设别技术输出文字给voip系统拨打电话,与此同时关闭定制的语音识别技术;

(5)用户通过蓝牙话机通话完毕挂机之后,将蓝牙话机放回原始位置,蓝牙话机自动断电并进行充电。

在研发过程中为了提升用户体验,在智能音响和固定电话相结合的基础上叠加了语音识别和无线蓝牙自动匹配技术。通过智能音响、固定电话、语音识别、无线蓝牙自动匹配技术以及voip系统的结合,能够自动识别语音指令并进行自动拨号,使得用户并不需要进行手动拨号即可实现自动拨号通话,这样设计大大提高了用户体验。

受限于成本因素,本发明采用4.2le版本的蓝牙技术标准,传输距离为直线100米,因为受到墙面反射等环境干扰,实际传输距离为10米。

作为优选,在步骤(2)中,自动匹配的方法具体如下;首先,配置智能音响设备的app无需弹出蓝牙对话框;然后,初始化智能音响设备中的蓝牙连接,取得蓝牙缓存连接之后,再清理蓝牙缓存;最后,注册两个广播,第一个为正在搜索时的广播,第二个为搜索完成的广播,并开始搜索,判断蓝牙是否已经连接,如果连接则进入到步骤(3)中,如果并未连接,则结束搜索,在智能音响设备上自动输入蓝牙话机的pin码,然后进入到步骤(3)中。

作为优选,在步骤(3)中,定制的语音识别技术包括如下流程:

(a)输入流程:应用远场识别技术,来识别声音方位以及降低噪声干扰;

(b)编码流程:采用云端深度神经网络,使得不同声音的匹配更加准确;

(c)解码流程:将声音转化为文字,并通过内置的数据库来识别用户意图;

(d)输出方面:采用内耦合的方式输出,即为函数回调的方式进行,进入到步骤(4)中。

作为优选,在流程(a)中,远场识别技术具体包括如下:采用7个麦克风阵列,6个麦克风均匀分布在圆形的pcb板上,1个麦克风分布在中心点,根据7个点收到的信号强弱来识别声音方位;然后屏蔽了人声范围之外频率的声音信号,降低环境噪声的干扰,同时屏蔽了机器发声,避免产生误打电话的情况。

作为优选,在流程(b)中,在云端深度神经网络中建立五个隐马尔科夫模型,具体为:儿童声音模型、女性声音模型、男性声音模型、老年女声模型和老年男声模型,外加常见普通话口音模型,以此来使得匹配更加准确。

作为优选,在流程(c)中,首先根据常用汉字词组使用频率和单字使用频率转换为汉字,经过云端的自然语言处理进行自学习训练,之后长时间的自学习训练之后形成相应的数据库,最后根据数据库的内容并匹配用户的通讯录后识别用户意图。

本发明的有益效果是:能够自动识别语音指令并进行自动拨号,使得用户并不需要进行手动拨号即可实现自动拨号通话,大大提高了用户体验。

具体实施方式

下面结合具体实施方式对本发明做进一步的描述。

一种基于智能音响的云固话方法,具体包括如下步骤:

(1)用户拿起蓝牙话机,蓝牙话机自行启动供电;

(2)蓝牙话机中的蓝牙模块自行启动对附近的智能音响设备进行自动匹配;自动匹配的方法具体如下:首先,配置智能音响设备的app无需弹出蓝牙对话框;然后,初始化智能音响设备中的蓝牙连接,取得蓝牙缓存连接之后,再清理蓝牙缓存;最后,注册两个广播,第一个为正在搜索时的广播,第二个为搜索完成的广播,并开始搜索,判断蓝牙是否已经连接,如果连接则进入到步骤(3)中,如果并未连接,则结束搜索,在智能音响设备上自动输入蓝牙话机的pin码,然后进入到步骤(3)中;

(3)自动匹配成功之后,用户对蓝牙话机进行语音输入,通过定制的语音识别技术将声音转化为文字;定制的语音识别技术包括如下流程:

(a)输入流程:应用远场识别技术,来识别声音方位以及降低噪声干扰;远场识别技术具体包括如下:采用7个麦克风阵列,6个麦克风均匀分布在圆形的pcb板上,1个麦克风分布在中心点,根据7个点收到的信号强弱来识别声音方位;然后屏蔽了人声范围之外频率的声音信号,降低环境噪声的干扰,同时屏蔽了机器发声,避免产生误打电话的情况,比如电视中有演员说:“给太太打个电话”;

(b)编码流程:采用云端深度神经网络,使得不同声音的匹配更加准确;在流程(b)中,在云端深度神经网络中建立五个隐马尔科夫模型,具体为:儿童声音模型、女性声音模型、男性声音模型、老年女声模型和老年男声模型,外加常见普通话口音模型(例如:四川、河南、东北、北京、天津等),以此来使得匹配更加准确;

(c)解码流程:将声音转化为文字,并通过内置的数据库来识别用户意图;首先根据常用汉字词组使用频率和单字使用频率转换为汉字,经过云端的自然语言处理进行自学习训练,之后长时间的自学习训练之后形成相应的数据库,最后根据数据库的内容并匹配用户的通讯录后识别用户意图;比如:用户语音说“给我媳妇打电话”,经过云端的自然语言处理以及匹配用户的通讯录(老婆)后,输出云固话的文字为“老婆电话”;

(d)输出方面:采用内耦合的方式输出,即为函数回调的方式进行,进入到步骤(4)中

(4)根据定制的语音设别技术输出文字给voip系统拨打电话,与此同时关闭定制的语音识别技术;

(5)用户通过蓝牙话机通话完毕挂机之后,将蓝牙话机放回原始位置,蓝牙话机自动断电并进行充电。

在研发过程中为了提升用户体验,在智能音响和固定电话相结合的基础上叠加了语音识别和无线蓝牙自动匹配技术,受限于成本因素,本发明采用4.2le版本的蓝牙技术标准,传输距离为直线100米,因为受到墙面反射等环境干扰,实际传输距离为10米。本发明创新点主要为智能音响+蓝牙的应用,蓝牙技术版本不限,在高级版本中可以实现了高速数据传输和数据加密。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1