一种语音搜索列表的实现方法与流程

文档序号：11136021阅读：来源：国知局

技术特征：

1.一种语音搜索列表的实现方法，其特征在于，包括如下步骤：

(1)列表预处理：

一个列表，提取每个列表项C的所有属性的关键字，切词且去除重复，得到词汇样本V(v₁,v₂,…v_n)，有n个独立的词；

(2)语音识别

将词汇样本V传送给语音识别器，并加载UNIGRAM语言模型，进行语音识别，得到N-BEST结果R，其中每个结果t为识别出的词，w为该词的权重；

(3)计算似然估计值

对每个列表项C，计算其归一化的似然估计值lik(C)；

lik(c)＝П_r∈R f(c|r)

f(c|r)＝∏_t∈R g(t|c)

$<mrow> <mi>g</mi> <mrow> <mo>(</mo> <mi>t</mi> <mo>|</mo> <mi>c</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = '{' close = '}'> <mtable> <mtr> <mtd> <mrow> <mi>a</mi> <mo>·</mo> <mi>w</mi> <mo>,</mo> <mi>t</mi> <mo>&Element;</mo> <mi>c</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mi>b</mi> <mo>·</mo> <mi>w</mi> <mo>,</mo> <mi>t</mi> <mo>&NotElement;</mo> <mi>c</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow>$

其中，a、b为预设的常数，c为一个列表项，r为一个语音识别结果，t为一个识别的词，w为一个识别的词t的权重；

(4)列表搜索；根据列表项的似然估计值重新排序，选出似然估计值最大的列表项。

2.如权利要求1所述的语音搜索列表的实现方法，其特征在于，步骤(1)中，词汇样本V必须去除重复词汇。

3.如权利要求1所述的语音搜索列表的实现方法，其特征在于，步骤(2)中，语音识别器装载词汇样本V和UNIGRAM语言模型，识别输入语音数据并输出N-BEST结果。

4.如权利要求1所述的语音搜索列表的实现方法，其特征在于，步骤(2)中，语音识别器加载的UNIGRAM语言模型是动态生成的，而UNIGRAM语法是固定的，不依赖于列表而变化，每种语言只需有一个UNIGRAM语法。

5.如权利要求1所述的语音搜索列表的实现方法，其特征在于，步骤(2)中，语音识别器为嵌入式语音识别器或任何支持N-BEST结果的语音识别器。

6.如权利要求1所述的语音搜索列表的实现方法，其特征在于，步骤(2)中，权重为概率或信任值。

7.如权利要求1所述的语音搜索列表的实现方法，其特征在于，步骤(2)中，词汇样本V中可以增加常用连接词和介词。

8.如权利要求1所述的语音搜索列表的实现方法，其特征在于，步骤(3)中，计算似然估计值基于朴素贝叶斯概率模型，并且使用了所有N-BEST结果。

9.如权利要求1所述的语音搜索列表的实现方法，其特征在于，步骤(3)中，a、b为预设的常数，根据试验数据来设置。

10.如权利要求1所述的语音搜索列表的实现方法，其特征在于，步骤(3)中，计算似然估计值方法与语音识别器无关。

完整全部详细技术资料下载

当前第2页1 2 3