一种语音数据库创建方法

文档序号：32665834发布日期：2022-12-24 00:54阅读：52来源：国知局

1.本发明涉及语言采集技术领域，更具体的说，尤其涉及一种语音数据库创建方法。

背景技术：

2.地域方言是全民语言在不同地域上的分支，不同汉语方言的词语，用汉字写下来，差别不算大，各方言区的人大体上能看得懂，如果念出来，语音差别很大，相互之间就很难听懂了。
3.东北方言隶属官话方言的分支，地域上的接壤使得东北人的说话腔调接近现代汉语普通话，其他方言区的人大体上能够听明白，这就为近些年来东北方言在全国范围内广泛传播提供了客观上的必要条件。
4.以辽宁南部地区(大连、营口、鞍山、丹东)17个县市区居民常用的胶辽官话为对象，按照发音人选择(性别、年龄段、出生地、居住地)、语料设计、录音规范、数据存储标准、语料库标注规范、语料库评价规范等一系列措施，采集方言语音样本，探索形成方言语音库。
5.有鉴于此，针对现有的问题予以研究改良，提供一种语音数据库创建方法，旨在通过该技术，达到解决问题与提高实用价值性的目的。

技术实现要素：

6.本发明的目的在于提供一种语音数据库创建方法，以解决上述背景技术中提出的问题和不足。
7.为实现上述目的，本发明提供了一种语音数据库创建方法，由以下具体技术手段所达成：
8.一种语音数据库创建方法，基于stm321f103zet6的语音处理系统。
9.a、系统方案创建：
10.系统划分包括三大模块：(1)声音采集、(2)音频处理、(3)声波输出；
11.所述声音采集模块包括声音电波转换、滤波和降噪处理、信号源放大；
12.所述音频处理模块包括模拟-数字转换、信号转存-储存、控制芯片模块；
13.所述声波输出模块包括模拟-数字转换、信号功率放大。
14.b、硬件模块设计：
15.(1)语音采集输入装置、(2)音频放大模块、(3)滤波和降噪处理模块、(4)信号功率放大模块；
16.所述语音采集输入装置包括有音频放大模块，且语音采集输入装置为低输出阻抗麦克风，并且低输出阻抗麦克风具有前置放大器功能。
17.所述滤波和降噪处理模块采用低通滤波和高通滤波电路，且采用的是一阶有源高通滤波电路与二阶有源低通滤波电路。
18.所述信号功率放大模块采用声音幅信号抬高电路，且所述声音幅信号抬高至零参
考电压以上。
19.c、工具软件设计部分：
20.软件部分包括：(1)信号采集及转换、(2)信号转存与储存、(3)存储语音控制；
21.所述信号采集及转换，通过控制器将放大滤波后的模拟信号转换成数字信号；
22.所述信号转存与储存，通过硬件模块的端口将采集到的数字信号存储到静态随机存取存储器中，通过外放音响设备输出播放。
23.所述工具软件设计部分涉及到cpu内部资源的模块，且所述cpu内部资源模块包括：存储\adc\timer\dma\fsmc等模块。
24.1、首先对系统进行初始化：
25.rcc_ahbperiphclockcmd(rcc_ahbperiph_dma1|rcc_ahbperiph_dma2|rcc_ahbperiph_fsmc,enable)；
26.rcc_apb2periphclockcmd(rcc_apb2periph_gpi0f|rcc_apb2periph_gpi0a|rcc_apb2periph_afi0|rcc_apb2periph|rcc_apb2peri0c,enable)；
27.rcc_apb1periphclockcmd(rcc_apb1periph_tim3|rcc_apb2periph_afi0,enable)；
28.}
29.2、通过a/d采集音频频率设置为40khz,并通过定时器输出，定时器计数时间到达设定时间后，终继定时器，由adc采集一次音频数据：
30.void adc_config(void)
31.{
32.rcc_adcclkconfig(rcc_pclk2_div6)；
33.adc_initstructure.adc_mode＝adc_mode_independent；
34.adc_initstructure.adc_scanconvmode＝enable；//打开扫描模式
35.……
36.adc_cmd(adc1,enable)；//开启adc1
37.adc_resetcalibration(adc1)
38.while(adc_getresetcalibrationstatus(adc1))；//等待重新核准完成
39.adc_startcalibration(adc1)；//开始校准
40.while(adc_getresetcalibrationstatus(adc1))；//等待核准完成
41.adc_softwarestartconvcmd(adc1,enable)；
42.}
43.3、定时器控制时间来中断dma将adc采集到的信息数据进行处理，采用定时器tim3，其具有16位编程预分频器的功能，分频系数为1-65536之间的任意数值，同时还具有可向上、下与向上/向下的自行装载功能，计数器向上或向下溢出时就会产生dma请求：
44.void tim3_configuration(void)
45.{
46.tim_timebasestructure.tim_period＝900；//自动重装载的值
47.tim_timebasestructure.tim_prescaler＝0；//预分频系数
48.tim_timebasestructure.tim_clockdivision＝//0x0；//不设置时钟分割
49.tim_timebasestructure.tim_countermode＝tim_countermode_up；
50.tim_timebaseinit(tim3,&tim_timebasestructure)；
51.tim_cmd(tim3,enable)；//定时使能
52.tim_itconfig(tim3,tim_it_update,enable)；//定时中断使能
53.}
54.4、选择dac的tim6转换trco外部事件触发功能，dac接口侦测来自定时器trgo的输出，则将最近存放在数据寄存器dac_dhrx中的数据传送至输出寄存器dac_dorx中：
55.void dac_config(void)
56.{
57.tim_prescalerconfig(tim6,0x0,tim_pscreloadmode_update)；//预分频值为1
58.tim_setautoreload(tim6,900)；//自动重装载值900
59.tim_selectoutputtrigger(tim6,tim_trgosource_update)；//使用更新时间触发
60.dac_initstructure.dac_trigger＝dac_trigger_t6_trgo；//dac触发方式为t6触发
61.dac_initstructure.dac_wavegeneration＝dac_wavegeneration_none；
62.dac_initstructure.dac_outputbuffer＝dac_outputbuffer_disable；//不使用输出缓存
63.dac_init(dac_channel_1,&dac_initstructure)；//初始化dac
64.}
65.5、静态随机存取存储器为flexible static memory controller,又称为可变静态存储控制器，简称为fsmc，是stm32系列的新型存储器的扩展技术，通过设置时序，数据位数等来进行存储。
66.由于上述技术方案的运用，本发明与现有技术相比具有下列优点：
67.本发明通过基于stm321f103zet6的语音处理系统，可以解决对语音信号在不失真情况下的输入与输出功能，可以完成对语言采集的的需要，具有实际的实用价值。
附图说明
68.构成本技术的一部分的附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：
69.图1为本发明的结构示意图.
具体实施方式
70.下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。
71.需要说明的是，在本发明的描述中，除非另有说明，“多个”的含义是两个或两个以上；术语“上”、“下”、“左”、“右”、“内”、“外”、“前端”、“后端”、“头部”、“尾部”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此
不能理解为对本发明的限制。
72.此外，术语“第一”、“第二”、“第三”等仅用于描述目的，而不能理解为指示或暗示相对重要性。
73.同时，在本发明的描述中，除非另有明确的规定和限定，术语“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电性连接；可以是直接相连，也可以通过中间媒介间接相连。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。
74.请参见图1，本发明提供一种语音数据库创建方法的具体技术实施方案：
75.一种语音数据库创建方法，基于stm321f103zet6的语音处理系统。
76.a、系统方案创建：
77.系统划分包括三大模块：(1)声音采集、(2)音频处理、(3)声波输出；
78.所述声音采集模块包括声音电波转换、滤波和降噪处理、信号源放大；
79.所述音频处理模块包括模拟-数字转换、信号转存-储存、控制芯片模块；
80.所述声波输出模块包括模拟-数字转换、信号功率放大。
81.在获取原始语音数据时，所述原始语音数据包括原始用户标识和语音采集时间；对原始语音数据进行预处理，获取有效语音数据；获取所述有效语音数据对应的信噪比；将有效语音数据存储在语音数据库中，并为语音数据库中的有效语音数据建立索引，索引包括原始用户标识、语音采集时间和信噪比。该辅助工具软件通过对原始语音数据的预处理、计算有效语音数据的信噪比以及在创建语音数据库之后建立包括用户标识、语音采集时间和信噪比的索引，提高了数据库数据处理效率。
82.b、硬件模块设计：
83.(1)语音采集输入装置、(2)音频放大模块、(3)滤波和降噪处理模块、(4)信号功率放大模块；
84.所述语音采集输入装置包括有音频放大模块，且语音采集输入装置为低输出阻抗麦克风，并且低输出阻抗麦克风具有前置放大器功能。
85.所述滤波和降噪处理模块采用低通滤波和高通滤波电路，且采用的是一阶有源高通滤波电路与二阶有源低通滤波电路。
86.所述信号功率放大模块采用声音幅信号抬高电路，且所述声音幅信号抬高至零参考电压以上。
87.c、工具软件设计部分：
88.软件部分包括：(1)信号采集及转换、(2)信号转存与储存、(3)存储语音控制；
89.所述信号采集及转换，通过控制器将放大滤波后的模拟信号转换成数字信号；
90.所述信号转存与储存，通过硬件模块的端口将采集到的数字信号存储到静态随机存取存储器中，通过外放音响设备输出播放。
91.所述工具软件设计部分涉及到cpu内部资源的模块，且所述cpu内部资源模块包括：存储\adc\timer\dma\fsmc等模块。
92.1、首先对系统进行初始化。
93.2、通过a/d采集音频频率设置为40khz,并通过定时器输出，定时器计数时间到达设定时间后，终继定时器，由adc采集一次音频数据。
94.3、定时器控制时间来中断dma将adc采集到的信息数据进行处理，采用定时器tim3，其具有16位编程预分频器的功能，分频系数为1-65536之间的任意数值，同时还具有可向上、下与向上/向下的自行装载功能，计数器向上或向下溢出时就会产生dma请求。
95.4、选择dac的tim6转换trco外部事件触发功能，dac接口侦测来自定时器trgo的输出，则将最近存放在数据寄存器dac_dhrx中的数据传送至输出寄存器dac_dorx中。
96.5、静态随机存取存储器为flexible static memory controller,又称为可变静态存储控制器，简称为fsmc，是stm32系列的新型存储器的扩展技术，通过设置时序，数据位数等来进行存储。
97.具体实施步骤：
98.本工具使用sw1、sw2、sw3三组按键控制。
99.按sw1键：开始将语音信号存储到sram中；
100.按sw2键：播放sram中的语音信号；
101.按sw3键：播放实时语音。
102.本系统具有以下几个分支需要进行判断：
103.1、从存储器中读出标志位置1，只进行实时语音播放。
104.2、按sw1时语音依然播放，并通过函数
105.fsmc_sram_writebuffer(escalator8bit,write_read_addr++,1)；//进行存储
106.3、按sm2时，通过函数
107.fsmc_sram_readbuffer(escalator8bit,write_read_addr++,1)；//将存储在sram中的数据读出
108.4、超出存储范围时，将不再进行数据存储。
109.5、播放超出范围时，将继续重首地址进行播放。
110.综上所述：该一种语音数据库创建方法，通过基于stm321f103zet6的语音处理系统，可以解决对语音信号在不失真情况下的输入与输出功能，可以完成对语言采集的的需要，具有实际的实用价值。
111.尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张爽
技术所有人：辽宁警察学院
我是此专利的发明人

上一篇：一种粮库翻仓机的制作方法
上一篇：一种多信号高可靠性继电器状态监测系统