一种语音搜索列表的实现方法与流程

文档序号:11136021阅读:来源:国知局

技术特征:

1.一种语音搜索列表的实现方法,其特征在于,包括如下步骤:

(1)列表预处理:

一个列表,提取每个列表项C的所有属性的关键字,切词且去除重复,得到词汇样本V(v1,v2,…vn),有n个独立的词;

(2)语音识别

将词汇样本V传送给语音识别器,并加载UNIGRAM语言模型,进行语音识别,得到N-BEST结果R,其中每个结果t为识别出的词,w为该词的权重;

(3)计算似然估计值

对每个列表项C,计算其归一化的似然估计值lik(C);

lik(c)=Пr∈R f(c|r)

f(c|r)=∏t∈R g(t|c)

<mrow> <mi>g</mi> <mrow> <mo>(</mo> <mi>t</mi> <mo>|</mo> <mi>c</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = '{' close = '}'> <mtable> <mtr> <mtd> <mrow> <mi>a</mi> <mo>&CenterDot;</mo> <mi>w</mi> <mo>,</mo> <mi>t</mi> <mo>&Element;</mo> <mi>c</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mi>b</mi> <mo>&CenterDot;</mo> <mi>w</mi> <mo>,</mo> <mi>t</mi> <mo>&NotElement;</mo> <mi>c</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow>

其中,a、b为预设的常数,c为一个列表项,r为一个语音识别结果,t为一个识别的词,w为一个识别的词t的权重;

(4)列表搜索;根据列表项的似然估计值重新排序,选出似然估计值最大的列表项。

2.如权利要求1所述的语音搜索列表的实现方法,其特征在于,步骤(1)中,词汇样本V必须去除重复词汇。

3.如权利要求1所述的语音搜索列表的实现方法,其特征在于,步骤(2)中,语音识别器装载词汇样本V和UNIGRAM语言模型,识别输入语音数据并输出N-BEST结果。

4.如权利要求1所述的语音搜索列表的实现方法,其特征在于,步骤(2)中,语音识别器加载的UNIGRAM语言模型是动态生成的,而UNIGRAM语法是固定的,不依赖于列表而变化,每种语言只需有一个UNIGRAM语法。

5.如权利要求1所述的语音搜索列表的实现方法,其特征在于,步骤(2)中,语音识别器为嵌入式语音识别器或任何支持N-BEST结果的语音识别器。

6.如权利要求1所述的语音搜索列表的实现方法,其特征在于,步骤(2)中,权重为概率或信任值。

7.如权利要求1所述的语音搜索列表的实现方法,其特征在于,步骤(2)中,词汇样本V中可以增加常用连接词和介词。

8.如权利要求1所述的语音搜索列表的实现方法,其特征在于,步骤(3)中,计算似然估计值基于朴素贝叶斯概率模型,并且使用了所有N-BEST结果。

9.如权利要求1所述的语音搜索列表的实现方法,其特征在于,步骤(3)中,a、b为预设的常数,根据试验数据来设置。

10.如权利要求1所述的语音搜索列表的实现方法,其特征在于,步骤(3)中,计算似然估计值方法与语音识别器无关。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1