基于无线网络的双向音频传输系统及其语音选歌方法与流程

文档序号:17926557发布日期:2019-06-15 00:27阅读:182来源:国知局
基于无线网络的双向音频传输系统及其语音选歌方法与流程

本发明涉及音频传输领域,具体涉及基于无线网络的双向音频传输系统及其语音选歌方法。



背景技术:

无线数据传输目前应用于各个领域,其中音频无线传输与我们关系尤为密切,传统的有日常通话的手机对讲机、用于听歌曲的蓝牙耳机、用于ktv唱歌演唱会的无线麦克风,随着科学水平的发展人们对生活品质要求也越来越高,这就产生了一些新生事物以及对传统事物的升级,有线传输不仅会给安装带来不便且后期维护也有诸多不便,用无线传输取代能解决这两个问题。这就要求无线传输系统具有高速率、延时可控、可组网能力。目前现有技术中主要是wifi、5.8g私有协议传输,它们都有自己的优缺点。

对于wifi来说:

(1)2.4g信号穿墙能力差,对于相对大一些的家庭或者wifi路由器布局不在房屋中央的环境音箱使用范围不能覆盖到整个房屋,通过添加多个路由器或中继虽可以解决但又会增加成本以及产生更多电磁辐射干扰,也要求用户对网络设备有更深程度的了解。

(2)传输延时时间不确定,当家庭环境中有多个wifi设备占用带宽时无线网络中传输延时变长,会造成智能音箱播放音频出现延时,严重时出现断音,另一方面家庭中使用的soho路由理论上可以连接256个wifi设备但是由于资源限制,在多于10个设备时就会因为负载过重导致系统不稳定表现出频繁掉线或重启,更换企业级wifi路由器可以解决这个问题但成本飙升。

(3)目前现有wifi智能音箱普遍存在联网操作繁琐问题,因为成本体积等问题现有智能音箱没有键盘和显示器,用户在联网时要使用厂家指定流程触发再借助手机app输入wifi用户名和密码,本行业技术人员操作也会因为环境因素导致联网失败在几次重试后完成,对于普通用户更为困难。

对于5.8g私有协议来说

5.8g私有协议可以避免延时和联网操作繁琐问题但是穿墙能力较弱只适合在无障碍视线内传输。

但目前的无线网络传输速率较低、延时不可控、且仅为单向传输,用户的体验较差。



技术实现要素:

基于上述技术问题,本发明公开了了一种高速率、可双向传输、传输延时精确可控的基于无线网络的双向音频传输系统,具体采用了如下技术领域:

基于无线网络的双向音频传输系统,包括:

一个主机;

两个及以上分布式布置的从机;

主机和各从机之间通过无线网络连接;

从机包括语音输入单元和播放单元,语音输入模块接收用户的语音命令,将语音命令传输至主机,播放模块播放主机返回的音频数据;

主机与媒体库连接,还包括主控单元,接收并执行从机发送的语音命令;

主机与从机之间通过无线网络进行分时隙传输。

作为一种优选,各从机为智能音箱。

作为一种优选,所述从机包括语音唤醒模块,输入语音唤醒指令,开启语音输入模块的语音命令输入功能,进入语音控制状态,并将语音命令通过无线网络发送给主机的主控单元。

作为一种优选,所述语音命令包括:控制主机和/或各从机的工作状态、调节音频文件的播放进度、播放模式、暂停播放、开始播放、切换音频文件、选择音频文件、增加/降低音量、调节均衡器、静音、从静音状态下恢复的一种或几种。

作为一种优选,主机的主控单元通过无线网络连接网络资源,将语音命令发送到语音识别云服务器转换为文字信息并进行网络搜索,得到音频数据,并将上述音频数据在智能音箱中进行播放。

作为一种优选,主机还包括外接接口,用于连接tf卡、sd卡或u盘,主控单元将语音命令转换为文字,根据歌曲的文字信息在u盘、tf卡或sd卡的歌曲列表中进行模糊检索,从u盘、tf卡或sd卡中选取音频数据进行播放。

作为一种优选,所述文字信息包括以下信息的一种或多种:歌曲名称、演唱者、歌曲类型或歌曲序号。

作为一种优选,主控单元使用adpcm或sbc将音频信号编码后再传输。

一种采用上述基于无线网络的双向音频传输系统的语音选歌方法,其特征在于:包括以下步骤:

(1)从机实时采集用户的语音信息,当语音唤醒模块接收到预设的语音唤醒指令,开启智能音响的语音输入单元接收语音命令,并将语音命令通过无线网络发送给主机;

(2)主机的主控单元接收语音命令,并将该语音命令发送到语音识别云服务器进行语音到文字的转换,并将转换结果返回主机并对文字信息进行搜索,得到搜索结果后,对所选音频文件在从机中进行播放。

作为一种优选,主控单元使用adpcm或sbc将音频信号编码后再传输。

本发明相对于现有技术有益的技术效果为:

(1)本发明中通信协议不依赖特定的transceive,可以在5.8g、2.4g、uhf、vhf频段工作,uhf穿墙能力比较强适合在multiroom场景应用。

(2)自组网,无需用户繁琐操作,使用私有协议,通过出厂预置随机id在用户第一次上电时自动记录相互id完成组网。

(3)延时固定可控制在低至几毫秒,本发明中在主机控制下整个系统传输精确同步,因而延时时间只取决于音频数据包大小,合理设置数据包大小可将延时降到很低。

(4)低成本,相对于wifi协议本发明使用的私有协议简单对处理器要求低,使用cortexm处理器即可胜任,若使用soc作为主控只需外围添加codec、音频pa、mic即可实现智能音箱,而现有方案一般会嵌入android系统,成本较高。

(5)用户通过某一从机可控制主机或从机的工作状态,可选择处于激活状态的从机,用户无需进入特点房间即可随意控制任意从机。

附图说明

图1为无线网络的示意图。

图2为主机框图。

图3为从机框图。

图4为带有数据重传的主从无线组网方式示意图。

图5为数据包结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

实施例一

如图1所示,无线网络的双向传输系统尤其适应于家庭式播放系统,其包括一个主机与n个从机,例如主机设置于客厅,客厅及n-1各房间中均设有从机,作为一种优选,从机为智能音响,客厅的主机通过ethernet(以太网)接口、usb接口、sd卡接口、同轴、光纤、hdmi中一个或多个与媒体库连接或者通过无线网络连接网络资源,媒体库中存储有音频文件,例如tf卡、sd卡、u盘、手机、pc、平板电脑。

各从机通过无线信道与主机连接,形成无线音频网络,用户可以在客厅或各房间中发送语音命令,从机接收语音命令并通过无线网络发送给主机,主机的主控单元根据语音命令选择媒体库中的音频文件并通过从机进行播放。

所述从机包括语音唤醒模块,输入语音唤醒指令,开启语音输入模块的语音命令输入功能,进入语音控制状态,并将语音命令通过无线网络发送给主机的主控单元。

作为一种优选,所述语音命令包括:控制主机和/或各从机的工作状态、调节音频文件的播放进度、播放模式、暂停播放、开始播放、切换音频文件、选择音频文件、增加/降低音量、调节均衡器、静音、从静音状态下恢复的一种或几种。控制主机和/或各从机的工作状态是指,某一从机接收语音命令后传输至主机,选择控制主机主机和/或各从机的工作状态,比如开机、关机等,用户可通过任一从机控制主机和/或各从机的工作状态。在某些房间不适合播放音频文件的时候,比如有人在休息,此时用户可通过其它从机发送语音命令给主机的主控单元,主控单元控制关闭上述从机,而用户无需进入房间进行操作。

作为一种优选,主机通过与无线网络连接网络资源,将从机发送的语音命令发送到语音识别云服务器转换为文字信息并进行网络搜索,得到音频数据,并将上述音频数据通过无线音频网络发送给从机进行播放。文字信息包括以下信息的一种或多种:例如歌曲名称、演唱者、歌曲类型或歌曲序号等。

作为一种优选,主机还包括外接接口,用于连接tf卡、sd卡或u盘,主控单元并将该语音命令转换为文字,根据歌曲的文字信息在u盘、tf卡或sd卡的歌曲列表中进行模糊检索,从u盘、tf卡或sd卡中选取音频数据进行播放。

为了进一步减小数据包体积节省带宽,作为一种优选,主机的主控单元使用adpcm或sbc将音频信号编码后再传输。

结合图1说明,无线组网系统中包含多个通信装置,其中包括一个主机与n个从机,n≥2,主机与从机都具有无线数据发送与接收功能,通信时使用同一个频率的物理信道,数据分时隙传输,即同一时段只有一个主机或从机在发射,但可以有多个装置接收,数据由主机向从机传输为广播模式,在射频带宽充足情况下可以单独给每个从机发送不同数据进而实现多个房间内播放不同音源,工作流程如下:

步骤1通信第一帧时隙1主机处于发送模式,从机1、从机2直到从机n都处于接收模式,主机发送数据包tx1给所有从机;

步骤2通信第一帧时隙2主机发送结束后切换到接收模式,从机1切换为发送模式,其余从机仍然处于接收模式,从机1将数据txs1发送给主机;

步骤3通信第一帧时隙3从机1数据发送结束切回接收模式,从机2切换为发送模式,主机及其余从机仍然处于接收模式,从机2将数据txs2发送给主机;

步骤4重复步骤3直到第n+1时隙,到此完成主从机之间数据交互;

步骤5重复步骤1至4,连续传输第二帧、第三帧数据实现主从机之间数据双向传输。数据分时隙传输的传输延时只是由帧传输周期和帧内数据包大小决定,因此传输延时精确可控。

在实际使用中,由于受到干扰等因素会导致数据传送出现丢包或包内数据出现误码的情况,作为一种优选,在上述双向通信的基础上加入包重传步骤,在每一帧数据传输过程中留有一定裕度用于数据包重新传输,如图4所示,在第一帧数据传输时主机与从机正常传输后又发送重传包rtx1以及重接收包rrx2与从机2再次进行数据交换。

为了实现组网控制将传输的音频数据打包加入包头和包尾,如图5所示,包头内有前导码、地址、包长度等信息用于接收机判断是否为有效数据包。如果为无效包则直接丢弃不进行后续接收,包尾中包含帧包编号、控制字、保留字等,其中包编号和控制字用于控制数据重传和主从机之间控制信息交互,保留字预留给后续协议扩展。

为了进一步减小数据包体积节省带宽使用adpcm或sbc将音频信号编码后再传输。

基于无线网络的双向音频传输系统的语音选歌方法,包括以下步骤:

(1)从机实时采集用户的语音信息,当语音唤醒模块接收到预设的语音唤醒指令,开启智能音响的语音输入单元接收语音命令,并将语音命令通过无线网络发送给主机;

(2)主机的主控单元接收语音命令,并将该语音命令发送到语音识别云服务器进行语音到文字的转换,并将转换结果返回主机并对文字信息进行搜索,得到搜索结果后,对所选音频文件在从机中进行播放。

图2为主机框图,主机包含媒体接口模块、soc模块、人机接口模块,其中媒体接口模块负责将ethernet(以太网)、usb、sd卡、同轴、光纤、hdmi等接口传输进来的音频转换为iis信号,媒体接口模块接收soc模块发送的控制信号用于选择音源,人机接口模块包含显示器、红外接收、按键,显示器用于显示系统当前运行参数,红外接收用于接收红外遥控器发射的控制指令,按键用于用户输入控制命令,soc模块内包含iis接口、transceiver(收发器)、io接口、mpu(微处理单元),iis接口接收媒体接口传输的音频数据通过mpu进行压缩后控制transceiver通过无线信道发送给从机,transceiver接收到从机通过无线信道传输的语音控制命令在mpu中解压缩后传输给媒体接口模块,再通过ethernet在云平台上进行语意解析后控制接口媒体接口模块输出指定音频。

图3为从机框图,从机包含人机接口模块、soc模块、功放模块、喇叭,人机接口模块包含红外接收、按键、显示器,红外接收用于接收红外遥控器发送的控制指令(调节音量、上下区切换、播放暂停等),按键与红外接收作用相同,显示器用于显示从机运行参数,mic用于接收用户发出的语音控制命令通过iis接口传递给soc在进行压缩编码后控制transceiver通过无线信道传递给主机,soc包含transceiver、iis接口、io接口,iis接口输出端接到功放用于将主机传递过来的音乐输入到功放再通过喇叭播放出来。

以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1