1.一种语音搜索列表的实现方法,其特征在于,包括如下步骤:
(1)列表预处理:
一个列表,提取每个列表项C的所有属性的关键字,切词且去除重复,得到词汇样本V(v1,v2,…vn),有n个独立的词;
(2)语音识别
将词汇样本V传送给语音识别器,并加载UNIGRAM语言模型,进行语音识别,得到N-BEST结果R,其中每个结果t为识别出的词,w为该词的权重;
(3)计算似然估计值
对每个列表项C,计算其归一化的似然估计值lik(C);
lik(c)=Пr∈R f(c|r)
f(c|r)=∏t∈R g(t|c)
其中,a、b为预设的常数,c为一个列表项,r为一个语音识别结果,t为一个识别的词,w为一个识别的词t的权重;
(4)列表搜索;根据列表项的似然估计值重新排序,选出似然估计值最大的列表项。
2.如权利要求1所述的语音搜索列表的实现方法,其特征在于,步骤(1)中,词汇样本V必须去除重复词汇。
3.如权利要求1所述的语音搜索列表的实现方法,其特征在于,步骤(2)中,语音识别器装载词汇样本V和UNIGRAM语言模型,识别输入语音数据并输出N-BEST结果。
4.如权利要求1所述的语音搜索列表的实现方法,其特征在于,步骤(2)中,语音识别器加载的UNIGRAM语言模型是动态生成的,而UNIGRAM语法是固定的,不依赖于列表而变化,每种语言只需有一个UNIGRAM语法。
5.如权利要求1所述的语音搜索列表的实现方法,其特征在于,步骤(2)中,语音识别器为嵌入式语音识别器或任何支持N-BEST结果的语音识别器。
6.如权利要求1所述的语音搜索列表的实现方法,其特征在于,步骤(2)中,权重为概率或信任值。
7.如权利要求1所述的语音搜索列表的实现方法,其特征在于,步骤(2)中,词汇样本V中可以增加常用连接词和介词。
8.如权利要求1所述的语音搜索列表的实现方法,其特征在于,步骤(3)中,计算似然估计值基于朴素贝叶斯概率模型,并且使用了所有N-BEST结果。
9.如权利要求1所述的语音搜索列表的实现方法,其特征在于,步骤(3)中,a、b为预设的常数,根据试验数据来设置。
10.如权利要求1所述的语音搜索列表的实现方法,其特征在于,步骤(3)中,计算似然估计值方法与语音识别器无关。