一种声控网络话机装置及其控制方法与流程

文档序号:12135596阅读:来源:国知局

技术特征:

1.一种声控网络话机装置,其特征在于:包括主控处理器(1)、显示屏(2)、键盘(3)、通讯外设(4)、电源模块(5)、网络交换模块(6)、语音芯片(7)、网络接口(8)、语音外设(9)、动态随机存储器(10)、快闪型存储器(11);所述的主控处理器(1)包括脉冲编码调制存储器(12)、网络数据接入模块(13)、通用输入输出接口(14)、键盘控制器(15)、显示控制器(16)、快闪型存储器控制器(17)、动态随机存储器控制器(18);网络接口(8)为局域网和广域网接口,语音外设(9)包括扬声器和麦克风;电源模块(5)为网络话机装置提供电源。

2.根据权利要求1所述的一种声控网络话机装置,其特征在于:所述的主控处理器(1)通过网络交换模块(6)连接网络接口(8),语音外设(9)通过语音芯片(7)连接主控处理器(1),所述的显示屏(2)、键盘(3)、通讯外设(4)通过相对应的线缆连接主控处理器(1),所述的动态随机存储器(10)、快闪型存储器(11)连接主控处理器(1)的引脚。

3.根据权利要求1所述的一种声控网络话机装置,其特征在于:所述的脉冲编码调制存储器(12),是脉冲编码调制线性数据的缓冲区,用于缓冲从网络侧获取到的媒体数据并给扬声器放音以及从麦克风采集到的语音数据。

4.根据权利要求1所述的一种声控网络话机装置,其特征在于:所述的麦克风用于采集语音数据,扬声器用于播放从网络侧获取到的媒体数据以及作为声音控制的开关,用于控制当前网络话机是否开启了语音控制功能,通过扬声器按键长按3秒。

5.根据权利要求1所述的一种声控网络话机装置,其特征在于:所述的语音芯片(7),用于对采集到的线性语音数据进行语音识别处理。

6.一种声控网络话机装置的控制方法,其特征在于:包括预处理数据输入、语言特征提取、建立声学模型训练、建立语言模型训练、语音解码处理、输出语音识别结果;

第一、预处理数据输入,对脉冲编码调制存储器(12)输入的语音数据进行处理,过滤掉不相关信息以及背景噪声,并进行语音数据的端点检测,找到语音数据的起始点、语音数据分帧以及预加重;

第二、语言特征提取,提取出反映语音信号特征的关键特征参数形成特征矢量序列;

第三、建立声学模型训练,根据训练语音库的特征参数训练出声学模型参数,在识别时将待识别的语音的特征参数同声学模型进行匹配,得到识别结果;

第四、建立语言模型训练,语言模型用于计算一个句子出现概率的概率模型,它主要用于决定哪个词序列的可能性更大,或者在出现几个词的情况下,预测下一个即将出现的词语的内容,而本发明所采用的是指定特定的语音命令,包括不限于:历史记录、电话簿、免打扰、菜单、摘机、发送、删除、取消、呼叫保持、呼叫恢复、静音、呼叫转移、会议、新建呼叫、呼叫切换、拆分、呼叫拒绝、数字0~9;然后再由这些指令生成语音模型文件,语音识别只识别这些特定的语音命令;

第五、语音解码处理,语音解码为语音技术中的识别过程,针对输入的语音信号,根据己经训练好的声学模型、语言模型及字典建立一个识别网络,根据搜索算法在该网络中寻找最佳的一条路径,这个路径就是能够以最大概率输出该语音信号的词串,确定这个语音样本所包含的文字,为解码端通过搜索技术寻找最优词串的方法;

第六、输出语音识别结果,所述的主控处理器(1),负责对语音识别结果的处理及分发,根据识别的指令类型分配给显示控制器(16)和发出呼叫控制处理命令。

7.根据权利要求6所述的一种声控网络话机装置的控制方法,其特征在于:所述的显示控制器(16)处理主控处理器(1)送递过来的显示相关的指令,包括不限于:历史记录、电话簿、免打扰、菜单、删除、取消。

8.根据权利要求6所述的一种声控网络话机装置的控制方法,其特征在于:所述的呼叫控制处理命令,处理主控处理器(1)送递过来的呼叫相关的指令,包括不限于:呼叫保持、呼叫拒绝、呼叫转移、会议、新建呼叫。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1