基于多路数据处理器的语音识别芯片的制作方法

文档序号:21021420发布日期:2020-06-09 19:43阅读:339来源:国知局
基于多路数据处理器的语音识别芯片的制作方法

本发明涉及芯片设计领域,更具体地,涉及一种基于多路数据处理器的语音识别芯片。



背景技术:

语言作为人类最重要最自然的交流工具,是人类获得信息的重要来源之一,让计算机能听懂人类的语言,也是人与计算机之间进行沟通的最方便的形式之一。

语音识别系统必须具备相应的硬件和软件才能正常工作。近几年基于语音识别芯片的嵌入式产品也越来越多。嵌入式语音处理系统在硬件上通常基于lsi、mcu、dsp等芯片方案。

随着语音识别研究从人脑研究以及特征表示的编码和学习、具有长程依赖和条件状态转移的循环网络、多任务和无监督学习、短时/序列信息处理的预测性方法等这些领域的研究中获益,急需构建语音识别系统的强有力工具。

因此,如何应对语音识别系统算法复杂性和语义理解,提供一种基于多路数据处理器的语音识别芯片是本领域技术人员亟待解决的技术问题。



技术实现要素:

有鉴于此,本发明提供了一种基于多路数据处理器的语音识别芯片,包括:模拟转数字信号编码芯片、数字转模拟信号解码芯片、多路数据处理单元、接口单元和片上存储器,其中,

所述接口单元与所述多路数据处理单元相耦接,所述接口单元包括并行的spi接口单元、uart接口单元、gpio接口单元和jtag接口单元,用于与所述多路数据处理单元进行数据交互;

所述多路数据处理单元分别与所述模拟转数字信号编码芯片、所述数字转模拟信号解码芯片、所述接口单元和所述片上存储器相耦接,用于控制和运算,所述多路数据处理单元包括多个数据处理器;

所述模拟转数字信号编码芯片与所述多路数据处理单元相耦接,用于将采集的语音模拟信号转换为数字信号并发送至所述多路数据处理单元;

所述数字转模拟信号解码芯片与所述多路数据处理单元相耦接,用于将所述多路数据处理单元发送的数字信号转换为语音模拟信号;

所述片上存储器与所述多路数据处理单元相耦接,用于存储数据和存储程序。

优选地,所述语音识别芯片采用soc结构。

优选地,所述片上存储器包括并行的ram程序存储器、ram数据存储器和rom程序存储器,其中,

所述ram程序存储器用于存储应用程序和驱动程序;

所述ram数据存储器用于存储运行时所需要的数据;

所述rom程序存储器用于存储语音识别及语音压缩的算法。

优选地,所述接口单元传输到所述多路数据处理器的数据包括稀疏信号。

优选地,所述多路数据处理单元得到的多个第二数据包括结构化数据、半结构化数据和非结构化数据。

优选地,所述多路数据处理单元将所述结构化数据、所述半结构化数据和所述非结构化数据排列成三路阵列;利用高阶奇异值分解,将所述三路阵列分解为二阶张量的矩阵模式;再将所述矩阵模式变换到稀疏域,进行分块浮点量化处理。

优选地,还包括电源管理单元和时钟发生器,其中,

所述电源管理单元与所述多路数据处理单元相耦接,用于管理语音识别芯片的电源;

所述时钟发生器与所述多路数据处理单元相耦接,用于产生时钟信号。

与现有技术相比,本发明提供的基于多路数据处理器的语音识别芯片,至少实现了如下的有益效果:

本发明中的多路数据处理单元包括多个数据处理器,可以同时对多个数据同时处理,提高数据处理能力和数据处理效率;

本发明的多层结构可以对多路数据去耦合化,将数据来源和获取功能与信息交付和数据供应功能分解开来,提升语音识别系统应对算法复杂性和语义理解能力。

当然,实施本发明的任一产品必不特定需要同时达到以上所述的所有技术效果。

通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。

附图说明

被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并且连同其说明一起用于解释本发明的原理。

图1是实施例1提供的基于多路数据处理器的语音识别芯片示意图;

图2是实施例2提供的基于多路数据处理器的语音识别芯片示意图。

具体实施方式

现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。

在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。

实施例1:

参照图1,本实施例提供了一种基于多路数据处理器的语音识别芯片,包括:模拟转数字信号编码芯片adc、数字转模拟信号解码芯片dac、多路数据处理单元2、接口单元1和片上存储器3。

接口单元1与多路数据处理单元2相耦接,参照图1,接口单元1包括并行的spi接口单元11、uart接口单元12、gpio接口单元13和jtag接口单元14,用于与多路数据处理单元2进行数据交互。

spi是串行外设接口(serialperipheralinterface)的缩写,是一种高速的全双工同步的通信总线,并且在芯片的管脚上只占用四根线,节约了芯片的管脚,同时为pcb的布局上节省空间,提供方便,如at91rm9200。

spi由一个主模块和一个或多个从模块组成,主模块选择一个从模块进行同步通信,从而完成数据的交换。spi为环形结构,通信时需要至少4根线。包括miso(主设备数据输入)、mosi(主设备数据输出)、sclk(时钟)、cs(片选):miso–masterinputslaveoutput,主设备数据输入,从设备数据输出;mosi–masteroutputslaveinput,主设备数据输出,从设备数据输入;sclk–serialclock,时钟信号,由主设备产生;cs–chipselect,从设备使能信号,由主设备控制。其中,cs是从芯片是否被主芯片选中的控制信号,也就是说只有片选信号为预先规定的使能信号时(高电位或低电位),主芯片对此从芯片的操作才有效。

spi接口单元11为了和外设进行数据交换,根据外设工作要求,其输出串行同步时钟极性和相位可以进行配置,时钟极性(cpol)对传输协议没有重大的影响。如果cpol=0,串行同步时钟的空闲状态为低电平;spi主模块和与之通信的外设时钟相位和极性应该一致。

uart(universalasynchronousreceiver/transmitter)为通用异步收发传输器。它将要传输的资料在串行通信与并行通信之间加以转换。把并行输入信号转成串行输出信号的芯片。本申请中是rs-232c规格的,与类似maxim的max232之类的标准信号幅度变换芯片进行搭配,为连接外部设备的接口。

uart是一种通用串行数据总线,用于异步通信。该总线双向通信,可以实现全双工传输和接收。uart作为异步串口通信协议的一种,工作原理是将传输数据的每个字符一位接一位地传输。

gpio(general-purposeinput/output)通用型之输入输出,pin脚依现实考量可作为通用输入(gpi)或通用输出(gpo)或通用输入与输出(gpio)。对于输入可以通过读取某个寄存器来确定引脚电位的高低;对于输出可以通过写入某个寄存器使这个引脚输出高电位或者低电位。

jtag是联合测试工作组(jointtestactiongroup)的简称,是在名为标准测试访问端口和边界扫描结构的ieee的标准1149.1的常用名称。此标准用于验证设计与测试生产出的印刷电路板功能。当使用一些调试工具像电路内模拟器用jtag当做信号传输的机制,可以经由jtag去读取集成在cpu上的调试模块。调试模块可以让程序员调试嵌入式系统中的软件。pc控制jtag:用jtag电缆连接pc的打印端口或者usb或者网口。

图1中多路数据处理单元2分别与模拟转数字信号编码芯片adc、数字转模拟信号解码芯片dac、接口单元1和片上存储器3相耦接,用于控制和运算,多路数据处理单元2包括多个数据处理器;

本发明中的多路数据处理单元2包括多个数据处理器,可以同时对多个数据同时处理,提高数据处理能力和数据处理效率。

模拟转数字信号编码芯片adc与多路数据处理单元2相耦接,用于将采集的语音模拟信号转换为数字信号并发送至多路数据处理单元2;

数字转模拟信号解码芯片dac与多路数据处理单元2相耦接,用于将多路数据处理单元2发送的数字信号转换为语音模拟信号;

模拟转数字信号编码芯片adc可以为tlv320adc,数字转模拟信号解码芯片dac可以为es9028,模拟转数字信号编码芯片adc用于录音,而数字转模拟信号解码芯片dac用于解码音频。中间数字信号处理过程交由多路数据处理单元2进行操作。模拟信号从adc输入,经过编码变成数字信号,交由多路数据处理单元2进行运算和处理,最终交给dac将数字信号重新解码为模拟信号后输出。

图1中片上存储器3与多路数据处理单元2相耦接,用于存储数据和存储程序。

需要说明的是本实施例的语音识别芯片采用soc结构。

本发明的多层结构可以对多路数据去耦合化,将数据来源和获取功能与信息交付和数据供应功能分解开来,提升语音识别系统应对算法复杂性和语义理解能力。

实施例2:

结合图2,本发明还提供了一种基于多路数据处理器的语音识别芯片。

图2中语音识别芯片,包括:模拟转数字信号编码芯片adc、数字转模拟信号解码芯片dac、多路数据处理单元2、接口单元1和片上存储器3。

接口单元1与多路数据处理单元2相耦接,参照图1,接口单元1包括并行的spi接口单元11、uart接口单元12、gpio接口单元13和jtag接口单元14,用于与多路数据处理单元2进行数据交互。

图2中多路数据处理单元2分别与模拟转数字信号编码芯片adc、数字转模拟信号解码芯片dac、接口单元1和片上存储器3相耦接,用于控制和运算,多路数据处理单元2包括多个数据处理器;

本发明中的多路数据处理单元2包括多个数据处理器,可以同时对多个数据同时处理,提高数据处理能力和数据处理效率。

模拟转数字信号编码芯片adc与多路数据处理单元2相耦接,用于将采集的语音模拟信号转换为数字信号并发送至多路数据处理单元2;

数字转模拟信号解码芯片dac与多路数据处理单元2相耦接,用于将多路数据处理单元2发送的数字信号转换为语音模拟信号;

模拟转数字信号编码芯片adc可以为tlv320adc,数字转模拟信号解码芯片dac可以为es9028,模拟转数字信号编码芯片adc用于录音,而数字转模拟信号解码芯片dac用于解码音频。中间数字信号处理过程交由多路数据处理单元2进行操作。模拟信号从adc输入,经过编码变成数字信号,交由多路数据处理单元2进行运算和处理,最终交给dac将数字信号重新解码为模拟信号后输出。

图2中片上存储器3与多路数据处理单元2相耦接,用于存储数据和存储程序,片上存储器3包括并行的ram程序存储器31、ram数据存储器32和rom程序存储器33。

ram程序存储器31用于存储应用程序和驱动程序;

ram数据存储器32用于存储运行时所需要的数据;

rom程序存储器33用于存储语音识别及语音压缩的算法。

需要说明的是本实施例的语音识别芯片采用soc结构。

在一些可选的实施例中,接口单元1传输到多路数据处理器的数据包括稀疏信号。

多路数据处理单元2得到的多个第二数据包括结构化数据、半结构化数据和非结构化数据。

多路数据处理单元2将结构化数据、半结构化数据和非结构化数据排列成三路阵列;利用高阶奇异值分解,将三路阵列分解为二阶张量的矩阵模式;再将矩阵模式变换到稀疏域,进行分块浮点量化处理。

稀疏信号是指在大多数采样时刻的取值等于零或近似等于零,只有少数采样时刻的取值明显不等于零的信号。许多自然信号在时域并不是稀疏信号,但是在某个变换域是稀疏的。这些变换工具包括fourier变换、短时fourier变换、小波变换和gabor变换等。

采用块浮点算法是将数据分成组,组内的数据相对彼此按比例缩放,但是不能与其他组的成员按相同的比例缩放,即使诸如乘法这样简单的数学运算。在比较复杂的矩阵求逆情况中,分组之间需要比较复杂的数学运算,就必须采用块浮点处理器。

分块浮点量化算法基于的事实是在一个小的时间间隔上,数据的熵要低于整个数据集的熵。分块浮点量化器是一个接收模数转换器的输出数据流,并将采样数据统一量化为原始数据的一种有效表示形式的设备,在量化过程中只要求比特数小于样本数。

将结构化数据、半结构化数据和非结构化数据排列成三路阵列;使用高阶奇异值分解,将三路阵列分解为二阶张量的矩阵模式;再将矩阵模式变换到稀疏域,进行分块浮点量化处理。

多层结构可以对多路数据去耦合化,将数据来源和获取功能与信息交付和数据供应功能分解开来,以提升语音识别系统应对算法复杂性和语义理解能力。

继续参照图2,图2中语音识别芯片还包括电源管理单元4和时钟发生器5,电源管理单元4与多路数据处理单元2相耦接,用于管理语音识别芯片的电源;时钟发生器5与多路数据处理单元2相耦接,用于产生时钟信号。

电源管理单元4可以为分布式也可以为集中式,分布式pmu方案非常灵活。只需围绕系统布放一根电源轨(电池的连接线),所有外围都把它当作自己唯一的电源连接线,不需要考虑其它的电源连接。每个外围电路中嵌入的pmu负责本地的全部电源管理。而在集中式pmu结构中,必须预先知道哪个外围可能会连接到pmu,还要保证在各种可能的组合情况下,所有电源电压和时序都能正确无误。

时钟发生器5是用来产生时钟信号的器件。常用于数字产品中,产品中所有的组件将随着所产生的时钟信号来同步进行运算动作。数字产品必须有时钟的控制,才能精确处理数字信号。若时钟不稳定,轻则造成数字信号传送上的失误,重则导致数字设备无法正常运作。

时钟发生器5的作用:在主板启动时提供初始化时钟信号,让主板能够启动;在主板正常运行时即时提供各种总线需要的时钟信号,以协调内存芯片的时钟频率。

通过上述实施例可知,本发明提供的基于多路数据处理器的语音识别芯片,至少实现了如下的有益效果:

本发明中的多路数据处理单元包括多个数据处理器,可以同时对多个数据同时处理,提高数据处理能力和数据处理效率;

本发明的多层结构可以对多路数据去耦合化,将数据来源和获取功能与信息交付和数据供应功能分解开来,提升语音识别系统应对算法复杂性和语义理解能力。

虽然已经通过例子对本发明的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上例子仅是为了进行说明,而不是为了限制本发明的范围。本领域的技术人员应该理解,可在不脱离本发明的范围和精神的情况下,对以上实施例进行修改。本发明的范围由所附权利要求来限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1