一种便携式多路并行智能语音识别一体机的制作方法

文档序号:13173307阅读:304来源:国知局

本实用新型属于计算机技术领域,具体涉及一种便携式多路并行智能语音识别一体机。



背景技术:

随着信息科技的飞速发展,智能语音识别、语音合成、语音编码等技术已经越来越成熟,并且在各行业得到了实际应用,极大的方便了人们的生产和生活,提高了工作效率。而且随着移动互联网技术的发展,手机上网速度越来越快,这也给语音识别技术的发展和应用带来了新的平台。

随着硬件设备越来越廉价以及云计算技术的出现,也大大的推动了语音识别的研究和应用。在技术应用方面,语音识别的应用主要有三种模式:(1)“单机模式”,即一台IT设备安装一套语音识别软件。利用设备本身的运算、存储资源,以软件模块方式实现,这种模式主要应用于工控机、PC机或笔记本电脑、手机上;(2)“嵌入式模式”,属于软硬件一体解决方案,通过以嵌入式语音识别模块芯片(如ARM芯片)为核心的硬件单元实现语音识别功能,采用嵌入式操作系统来实现统一的任务调度和外围设备管理,这种模式主要应用于智能机器人、智能家居和消费电子产品等多个领域;(3)“云模式”,即设备上仅仅保留识别的前端,真正的识别解码放置到云端服务器。这样做的好处是,云端服务器可以随时学习并更新语言及声学模型(深度置信神经网络),同时用户无需保留非常大的各种模型,也获得了实惠和方便,其中最出名的莫过于苹果iPhone手机的Siri语音助手和Google的语音搜索系统。这种模式主要应用于智能手机和车载设备。

以上现有的同类技术存在的问题:(1)“单机模式”主要通过普通麦克风输入语音信号,声卡采集后利用设备本身的运算资源进行处理,这种方法的优点是成本低,操作简单,运算速度和内存容量有一定保障,软件升级方便,但是缺点也很明显:不支持多路同步输入和抗干扰能力差;(2)“嵌入式模式”主要通过普通麦克风输入语音信号,声卡采集后利用设备本身的运算资源进行处理,这种方法的优点是体积小、功耗低、可靠性高、安装灵活、稳定性好,但是缺点也很明显:开发周期较长,研发成本高,不支持多路同步输入,扩展性差,只能使用专用硬件处理芯片,并且不能进行硬件升级;(3)“云模式”主要通过前端设备(如手机)输入语音信号,所有的识别解码都由云端服务 器来处理,这样做的好处是,云端服务器可以随时学习并更新语言及声学模型(通过深度置信神经网络),语音识别准确率高,用户使用方便,但是缺点也很明显:识别速度慢,在单个设备上不支持多路同步输入,设备必须联网。



技术实现要素:

本实用新型的目的在于提供一种便携式多路并行智能语音识别一体机,采用X86和ARM芯片作为核心处理器,采用专业的多路音频采集模块进行语音录入,采用云分布式软件技术实现智能语音识别功能,经过合理的软硬件设计,该系统可以很好地实现对输入语音信号的接收、识别和判断及转换和其他产品相比支持多路同步输入、抗干扰能力强、硬件升级和扩展性强、兼容性强、对网络依赖性弱、便携性超强,具有很高的推广价值。

为了实现上述目的,本实用新型的技术方案如下。

一种便携式多路并行智能语音识别一体机,包括电源管理模块、语音输入输出模块、语音控制模块、语音识别主处理模块、显示模块、键盘模块、数据存储及冗余备份模块、通信模块、系统散热模块,其中,电源管理模块分别与语音输入输出模块、语音识别主处理模块、显示模块连接;语音输入输出模块分别与语音控制模块、电源管理模块连接;语音控制模块分别与语音输入输出模块、语音识别主处理模块连接;语音识别主处理模块分别与电源管理模块、显示模块、键盘模块、数据存储及冗余备份模块、通信模块、系统散热模块连接。

进一步地,电源管理模块包括电源、开关面板、显示屏电源、声卡电源;语音输入输出模块包括音频输入输出接口,输入输出数字接口、声卡;语音控制模块包括控制面板;语音识别主处理模块包括主板、内存、CPU;显示模块包括显示屏;键盘模块包括集成键盘、触摸板;数据存储及冗余备份模块包括硬盘;通信模块包括网卡;系统散热模块包括水冷散热器、风扇。

上述一体机,包括一体机本体,一体机本体顶部安装有可翻折的液晶显示屏;一体机本体正面设有与液晶显示屏固定的扣子用以固定液晶显示屏,正面还设有两个固定模块,分别与便携式把手连接便于携带;液晶显示屏下部、一体机本体顶部设有键盘、触摸板、开关和语音控制面板;一体机本体底部设有安放底座;一体机本体左右两侧各有两个散热孔,利于一体机散热,其中左侧设有两个USB接口用以外接鼠标键盘、两个网络接口用以连接网络;一体机本体后面设有语音输入输出外接口及电源插口;一体机本体内部安装有主板芯片,主板芯片上设有硬件电路,硬件电路包括电源管理模块、语音输入输出模块、语音控制模块、语音识别主处理模块、显示模块、键盘模块、数据存储 及冗余备份模块、通信模块、系统散热模块;语音识别主处理模块与电源管理模块、显示模块、键盘模块、数据存储及冗余备份模块、通信模块、系统散热模块连接,且位于语音输入输出模块底部;电源管理模块供一体机供电;语音输入输出模块采集输入和输出音频信息;语音控制模块控制音频识别效果;语音识别主处理模块处理音频信息;显示模块显示正在接收或已接收的音频信息;键盘模块操作控制显示在显示屏中的音频数据;数据存储及冗余备份模块储存数据;系统散热模块散热作用提高系统稳定性及可持续工作时间。

该一体机工作原理为:语音信息通过语音输入输出模块进行声音的采集,并通过语音控制模块过滤干扰信号,提取人说话的最佳语音特征,控制音频识别效果,然后进入语音主处理模块对语音进行处理,并在显示模块中进行显示,通过键盘模块进行操作,把数据储存在数据存储及冗余备份模块中,当需要时,可从数据存储及冗余备份模块中提取数据,并通过语音输入输出模块进行播放。

上述一体机中,支持多路语音同时识别,最大支持8路模拟输入和10路数字输入,有18进20出音频接口,包含8路XLR/TRS混合输入话放且均带幻相供电,1、2通道可切换为高阻输入连接及10dB衰减开关。24BIT、192kHzAD/DA转换器带来极高的动态范围,另外有一个ADAT数字输入/输出接口可传输8路数字音频,还有S/PDIF输入和输出数字接口,双独立的耳机输出,独立的监听输出带衰减和静音按钮;英特尔至强芯片结合配套的阿里云分布式软件技术,软硬件结合;采用X86和ARM芯片作为核心处理器,性能强大;既可使用联网“云模式”又可使用无网络的“单机模式”,不依赖网络;体积小、便携性超强,可随时随地快速部署,适用更多场景;所有模块可升级扩展性强,维护方便;软件兼容性强,支持主流操作系统如WINDOWS,LINUX、MAC;数据存储及冗余备份,保密性强,数据更安全;散热模块采用水冷散热器和风扇,散热系统强大,可7*24小时持续工作,并且功耗低。

本系统硬件由显示屏、控制面板、音频输入输出接口、通信板、主处理模块、电源、硬盘、散热器等组成。其主要功能是实现语音输入的同时,实现实时观察、控制、存储的作用。软件兼容性强,支持主流操作系统如WINDOWS,LINUX、MAC,方便操作者操作。阵列保护,是数据更安全,保密性强大。

本系统突破了以往单路语音输入的限制,抗干扰能力差的问题,实现了多路同步输出,增强系统抗干扰能力。由于采用了主流操作系统和阵列保护,增加了对数据的保护措施,使得系统工作更加稳定,所得到的数据较为安全,保密性强大,同时能实现对语音数据的实时记录,这有利于对语音数据的研究。使用常用的X86和ARM芯片,大大增 强了系统的兼容性及可扩展性。该系统既可使用联网“云模式”又可使用无网络的“单机模式”。可见该系统具有广大的应用前景。

该系统具有以下功能:(1)可以使用常用的X86和ARM芯片,兼容性强大,限制性小;(2)系统扩展性强,其中所有模块都可以很方便的进行硬件升级;(3)采用专业的多路音频采集模块进行语音输入,抗干扰能力强,极大的提高了语音输入质量,且支持多路同步语音输入采集;(4)增加了数据存储及备份模块,数据安全性高,保密性强;(5)使用X86和ARM芯片,对多路语音信号的同步识别转换处理能力超强;(6)系统可靠性高,可持续7*24工作。(7)便携性强大,集成显示屏和键鼠,体积小,重量轻,方便携带,无需固定安装,只需依据现场需要随时携带,快速部署能力强大,适用于越来越多的移动应用场景;(8)不依赖网络,既可使用联网“云模式”又可使用无网络的“单机模式”。以上功能解决了现有同类技术存在的不支持多路同步输入、抗干扰能力差、硬件升级和扩展性差、兼容性差、开发周期较长,研发成本高、对网络依赖性强、便携性弱等缺点。

该实用新型的有益效果在于:该一体机,采用专业的多路音频采集模块进行语音输入,抗干扰能力强,支持多路同步语音输入转换识别;便携性能强大,优秀的工业结构设计实现了将电源管理模块、语音输入输出模块、语音控制模块、语音识别主处理模块、显示模块、键盘模块、数据存储及冗余备份模块、通信模块、系统散热模块集成到一台体积小巧的一体机上,重量轻,无需固定安装,只需依据现场需要随时携带,快速部署能力强大,适用于越来越多的移动应用场景;主处理模块可采用X86或ARM芯片作为核心处理器,语音转换处理性能强大,而且对软件兼容性强,可支持主流操作系统如WINDOWS,LINUX、MAC;系统扩展性超强,其中所有模块都可以很方便的进行硬件升级,产品生命周期长;增加了数据存储及冗余备份模块,数据安全性高,保密性强;系统可靠性高,散热能力强,系统散热模块可保证系统可持续7*24工作。

附图说明

图1是本实用新型实施例中所使用系统模块框图。

具体实施方式

下面结合附图对本实用新型的具体实施方式进行描述,以便更好的理解本实用新型。

如图1所示的便携式多路并行智能语音识别一体机,包括电源管理模块、语音输入输出模块、语音控制模块、语音识别主处理模块、显示模块、键盘模块、数据存储及冗余备份模块、通信模块、系统散热模块,其中,电源管理模块分别与语音输入输出模块、 语音识别主处理模块、显示模块连接;语音输入输出模块分别与语音控制模块、电源管理模块连接;语音控制模块分别与语音输入输出模块、语音识别主处理模块连接;语音识别主处理模块分别与电源管理模块、显示模块、键盘模块、数据存储及冗余备份模块、通信模块、系统散热模块连接。

电源管理模块包括电源、开关面板、显示屏电源、声卡电源;语音输入输出模块包括音频输入输出接口,输入输出数字接口、声卡;语音控制模块包括控制面板;语音识别主处理模块包括主板、内存、CPU;显示模块包括显示屏;键盘模块包括集成键盘、触摸板;数据存储及冗余备份模块包括硬盘;通信模块包括网卡;系统散热模块包括水冷散热器、风扇。

上述一体机,包括一体机本体,一体机本体顶部安装有可翻折的液晶显示屏;一体机本体正面设有与液晶显示屏固定的扣子用以固定液晶显示屏,正面还设有两个固定模块,分别与便携式把手连接便于携带;液晶显示屏下部、一体机本体顶部设有键盘、触摸板、开关和语音控制面板;一体机本体底部设有安放底座;一体机本体左右两侧各有两个散热孔,利于一体机散热,其中左侧设有两个USB接口用以外接鼠标键盘、两个网络接口用以连接网络;一体机本体后面设有语音输入输出外接口及电源插口;一体机本体内部安装有主板芯片,主板芯片上设有硬件电路,硬件电路包括电源管理模块、语音输入输出模块、语音控制模块、语音识别主处理模块、显示模块、键盘模块、数据存储及冗余备份模块、通信模块、系统散热模块;语音识别主处理模块与电源管理模块、显示模块、键盘模块、数据存储及冗余备份模块、通信模块、系统散热模块连接,且位于语音输入输出模块底部;电源管理模块供一体机供电;语音输入输出模块采集输入和输出音频信息;语音控制模块控制音频识别效果;语音识别主处理模块处理音频信息;显示模块显示正在接收或已接收的音频信息;键盘模块操作控制显示在显示屏中的音频数据;数据存储及冗余备份模块储存数据;系统散热模块散热作用提高系统稳定性及可持续工作时间。

该一体机工作原理为:语音信息通过语音输入输出模块进行声音的采集,并通过语音控制模块过滤干扰信号,提取人说话的最佳语音特征,控制音频识别效果,然后进入语音主处理模块对语音进行处理,并在显示模块中进行显示,通过键盘模块进行操作,把数据储存在数据存储及冗余备份模块中,当需要时,可从数据存储及冗余备份模块中提取数据,并通过语音输入输出模块进行播放。

上述一体机中,支持多路语音同时识别,最大支持8路模拟输入和10路数字输入,有18进20出音频接口,包含8路XLR/TRS混合输入话放且均带幻相供电,1、2通道可 切换为高阻输入连接及10dB衰减开关。24BIT、192kHzAD/DA转换器带来极高的动态范围,另外有一个ADAT数字输入/输出接口可传输8路数字音频,还有S/PDIF输入和输出数字接口,双独立的耳机输出,独立的监听输出带衰减和静音按钮;英特尔至强芯片结合配套的阿里云分布式软件技术,软硬件结合;采用X86和ARM芯片作为核心处理器,性能强大;既可使用联网“云模式”又可使用无网络的“单机模式”,不依赖网络;体积小、便携性超强,可随时随地快速部署,适用更多场景;所有模块可升级扩展性强,维护方便;软件兼容性强,支持主流操作系统如WINDOWS,LINUX、MAC;数据存储及冗余备份,保密性强,数据更安全;散热模块采用水冷散热器和风扇,散热系统强大,可7*24小时持续工作,并且功耗低。

以上所述是本实用新型的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本实用新型原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本实用新型的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1