一种基于智能化语音数据识别的分析纠正系统的制作方法

文档序号:36435016发布日期:2023-12-21 09:26阅读:48来源:国知局
一种基于智能化语音数据识别的分析纠正系统的制作方法

本发明属于语音识别领域,涉及数据分析技术,具体是一种基于智能化语音数据识别的分析纠正系统。


背景技术:

1、语音识别是一门交叉学科,近二十年来,语音识别技术取得显著进步,开始从实验室走向市场,语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等。

2、现有语音数据识别的分析纠正系统仅能够通过字符比对的方式对识别文本的精确性进行监控,但是这种方式无法对识别文本中字符组成的语言意义进行分析,导致识别文本出现语义识别错误时的纠正分析效率低下。

3、针对上述技术问题,本技术提出一种解决方案。


技术实现思路

1、本发明的目的在于提供一种基于智能化语音数据识别的分析纠正系统,用于解决现有语音数据识别的分析纠正系统无法对识别文本中字符组成的语言意义进行分析的问题;

2、本发明需要解决的技术问题为:如何提供一种可以对识别文本中字符组成的语言意义进行分析的基于智能化语音数据识别的分析纠正系统。

3、本发明的目的可以通过以下技术方案实现:

4、一种基于智能化语音数据识别的分析纠正系统,包括分析纠正平台,所述分析纠正平台通信连接有识别分析模块、语义分析模块、字符纠正模块以及存储模块;

5、所述分析纠正平台接收到语音数据后将语音数据发送至识别分析模块,所述识别分析模块用于对语音数据进行识别分析:采用n个语音识别软件同时对语音数据进行识别转文字得到n个识别数据组,对识别数据组进行比对分析并得到统一系数,通过统一系数对语音数据的识别精确性是否满足要求进行判定;

6、所述语义分析模块用于对识别数据组的语义准确性进行监测分析:将识别数据组分割为若干个语义字符段,每个语义字符段的字符数量均为m1个,由n个识别数据组中的第一个语义字符段构成语义数据组;将语义数据组标记为异常数据组或正常数据组;然后由n个识别数据组中的第二个语义字符段构成新的语义数据组,并重新对新的语义数据组标记为异常数据组或正常数据组;直至所有语义数据组完成标记;将异常数据组与语义数据组的数量比值标记为异常系数,通过异常系数对识别数据组的语义识别状态是否满足要求进行判定;

7、所述字符纠正模块用于对识别数据组进行字符纠正分析。

8、作为本发明的一种优选实施方式,统一系数的获取过程包括:选取所有识别数据组中的第一个字符组成第一比对数据组,将第一比对数据组中出现次数最多的元素字符标记为识别字符,将识别字符的数量与n的比值标记为识别系数,通过存储模块获取到识别阈值,将识别系数与识别阈值进行比较:若识别系数小于识别阈值,则将对应的识别字符标记为分歧字符;若识别系数大于等于识别阈值,则将对应的识别字符标记为统一字符;然后,选取所有识别数据组中的第二个字符组成第二比对数据组,将第二比对数据组中的识别字符标记为分歧字符或统一字符;以此类推,直至最后一个比对数据组的识别字符完成标记;将统一字符的数量与比对数据组的数量的比值标记为语音数据的统一系数。

9、作为本发明的一种优选实施方式,对语音数据的识别精确性是否满足要求进行判定的具体过程包括:通过存储模块获取到统一阈值,将语音数据的统一系数与统一阈值进行比较:若统一系数小于统一阈值,则判定语音数据的识别精确性不满足要求,将n个识别数据组通过分析纠正平台发送至语义分析模块;若统一系数大于等于统一阈值,则判定语音数据的识别精确性满足要求,将n个识别数据组通过分析纠正平台发送至字符纠正模块。

10、作为本发明的一种优选实施方式,将语义数据组标记为异常数据组或正常数据组的具体过程包括:随机选取语义数据组中的一个字符并判定该字符是否在n个语义字符段中均有出现:若是,则将对应字符标记为规划字符;若否,则将对应字符标记为独立字符;将语义数据组中的所有字符全部标记为规划字符或独立字符之后,将规划字符的字符数量与语义数据组中的字符数量比值标记为规划系数,通过存储模块获取到规划阈值,将规划系数与规划阈值进行比较:若规划系数小于规划阈值,则判定识别数据组存在语义识别异常,将对应的语义数据组标记为异常数据组;若规划系数大于等于规划阈值,则判定识别数据组不存在语义识别异常,将对应的语义数据组标记为正常数据组。

11、作为本发明的一种优选实施方式,对识别数据组的语义识别状态是否满足要求进行判定的具体过程包括:通过存储模块获取到异常阈值,将异常系数与异常阈值进行比较:若异常系数小于异常阈值,则判定识别数据组的语义识别状态满足要求,将n个识别数据组通过分析纠正平台发送至字符纠正模块;若异常系数大于等于异常阈值,则判定识别数据组的语义识别状态不满足要求,生成重新识别信号并将重新识别信号发送至分析纠正平台,分析纠正平台接收到重新识别信号后将重新识别信号发送至识别分析模块。

12、作为本发明的一种优选实施方式,字符纠正模块对识别数据组进行字符纠正分析的具体过程包括:获取识别数据组的分歧数据fq与独立数据dl;分歧数据fq为识别数据组中的字符被标记为分歧字符的次数,独立数据dl为识别数据组中的字符被标记为独立字符的次数;通过分歧数据fq与独立数据dl进行数值计算得到识别数据组的偏差系数pc;将偏差系数pc数值最小的识别数据组标记为基准数据组,将基准数据组中被标记为分歧字符或独立字符的字符标记为纠正字符,将第一个纠正字符的前一个字符标记为前置字符,由n个识别数据组中排序与纠正字符相同的字符和前置字符组成n个前置词组,获取前置词组在n个识别数据组中的出现次数并标记为前置词组的优先值,将优先值最大的前置词组的第二个字符标记为替换字符;直至所有纠正字符全部被替换字符进行替换,将替换后的基准数据组发送至分析纠正平台。

13、作为本发明的一种优选实施方式,该基于智能化语音数据识别的分析纠正系统的工作方法,包括以下步骤:

14、步骤一:分析纠正平台接收到语音数据后,对语音数据进行识别分析:采用n个语音识别软件同时对语音数据进行识别转文字得到n个识别数据组,对识别数据组进行比对分析并通过比对分析结果对语音数据的识别精确性是否满足要求进行判定;

15、步骤二:对识别数据组的语义准确性进行监测分析:将识别数据组分割为若干个语义字符段,由n个识别数据组中的第一个语义字符段构成语义数据组,对语义数据组是否存在语义识别异常进行判定,并通过异常数据组在语义数据组中的数量占比对识别数据组的语义识别状态是否满足要求进行判定;

16、步骤三:对识别数据组进行字符纠正分析:获取识别数据组的分歧数据fq与独立数据dl并进行数值计算得到偏差系数pc,将偏差系数pc数值最小的识别数据组标记为基准数据组,对基准数据组中的纠正字符进行替换。

17、本发明具备下述有益效果:

18、通过识别分析模块可以对语音数据进行识别分析,采用若干个语音识别软件对语音数据进行识别得到若干个识别数据组,对识别数据组进行比对分析然后根据统一系数对语音数据的整体识别精确性进行反馈,然后对识别数据组的语义识别必要性进行监控;

19、通过语义分析模块可以对识别数据组的语义精确性进行监测分析,在进行语义数据组的分割之后,对每一个语义数据组是否存在语义识别异常进行判定,从而根据异常数据组在语义数据组中的数量占比对语音数据的重新识别必要性进行反馈;

20、通过字符纠正模块可以对识别数据组进行字符纠正分析,在识别数据组中通过偏差系数筛选到基准数据组,然后对基准数据组中的纠正字符进行逐一替换,在语义识别错误的情况下进行重新识别,从而保证语义识别正确时的字符纠正效率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1