一种语音识别中的标点添加方法和装置的制作方法

文档序号：6587192阅读：1223来源：国知局

专利名称：一种语音识别中的标点添加方法和装置的制作方法
技术领域：
本发明实施例涉及语音识别技术领域，特别是涉及一种语音识别中的标点添加方法和装置。
背景技术：
在进行语音识别时，只能将接收到的语音内容识别、转化为汉字或英文等文字。当接收到的语音内容为一连串的文字语音时，识别转化的结果只是一连串的汉字或英文等文字。由于标点符号属于不发音信息，一般的语音识别结果只是汉字或英文等文字信息，没有标点信息。标点信息需要用户手动添加到语音识别结果当中。然而在进行连续语音识别时，对于自动添加标点符号的研究并不多，大多是当语音识别时，中间有停顿的地方识别为逗号，结束时自动添加句号，整个句子都被视为陈述语气，缺少实效性。

发明内容
本发明实施例公开一种语音识别中的标点添加方法和装置，以解决进行语音识别得到的识别结果缺少实效性的问题。为了解决上述问题，本发明实施例公开了一种语音识别中的标点添加方法，包括: 对通过语音识别得到的语句中的当前字词进行特征提取；将提取到的当前字词的特征在预先建立的最大熵模型中进行识别，得到当前字词之后的标识字符；根据获取到的标识字符与各标点的关联关系，在已知的标识字符集合中选择与当前字词之后的标识字符对应的标点，添加到当前字词之后。优选的，所述对通过语音识别得到的语句中的当前字词进行特征提取，包括:根据语音识别得到的语句中各字词的顺序依次判定每个字词为当前字词，并确定当前字词的前η个字词和后m个字词,做为当前字词的特征，n、m为正整数；其中，所述当前字词的前η个字词和后m个字词包括空字词。优选的，所述将提取到的当前字词的特征在预先建立的最大熵模型中进行识别，得到当前字词之后的标识字符，包括:在
权利要求
1.一种语音识别中的标点添加方法，其特征在于，包括: 对通过语音识别得到的语句中的当前字词进行特征提取；将提取到的当前字词的特征在预先建立的最大熵模型中进行识别，得到当前字词之后的标识字符；根据获取到的标识字符与各标点的关联关系，在已知的标识字符集合中选择与当前字词之后的标识字符对应的标点，添加到当前字词之后。
2.根据权利要求1所述的方法，其特征在于，所述对通过语音识别得到的语句中的当前字词进行特征提取，包括: 根据语音识别得到的语句中各字词的顺序依次判定每个字词为当前字词，并确定当前字词的前η个字词和后m个字词,做为当前字词的特征，n、m为正整数；其中，所述当前字词的前η个字词和后m个字词包括空字词。
3.根据权利要求1所述的方法，其特征在于，所述将提取到的当前字词的特征在预先建立的最大熵模型中进行识别，得到当前字词之后的标识字符，包括: 在1 x) = z^)exp(^Xifiy-' ^7 根据x 输出 y; 其中，P(y|x)为预先建立的最大熵模型，X为当前字词的特征，为当前字词之后的标识字符，Z (X)为归一化系数，fi (X, y)为特征函数，λ j为特征函数A (X, y)的权重，i为正整数。
4.根据权利要求1所述的方法，其特征在于，所述根据获取到的标识字符与各标点的关联关系，在已知的标识字符集合中选择与当前字词之后的标识字符对应的标点，添加到当前字词之后，包括: 如果当前字词之后的标识字符y=Yn，在已知的标识字符集合Y中选择与Yn具有关联关系的标点，添加到当前字词之后；其中，所述已知的标识字符集合Y={Y1，Y2，Y3，……，Υη，0} ;Υ1、Υ2、Υ3……Υη、0为各标识字符，分别对应关联的标点，O表示标点为空。
5.根据权利要求1所述的方法，其特征在于，还包括: 根据预先获取的数据对所述最大熵模型进行训练；其中，所述数据包括:标点和与标点对应的由当前字词的前η个字词和后m个字词组成的特征。
6.一种语音识别中的标点添加装置，其特征在于，包括: 提取模块，用于对通过语音识别得到的语句中的当前字词进行特征提取；识别模块，用于将提取到的当前字词的特征在预先建立的最大熵模型中进行识别，得到当前字词之后的标识字符；选择模块，用于根据获取到的标识字符与各标点的关联关系，在已知的标识字符集合中选择与当前字词之后的标识字符对应的标点，添加到当前字词之后。
7.根据权利要求6所述的装置，其特征在于，所述提取模块根据语音识别得到的语句中各字词的顺序依次判定每个字词为当前字词，并确定当前字词的前η个字词和后m个字词，做为当前字词的特征，n、m为正整数；其中，所述当前字词的前η个字词和后m个字词包括空字词。
8.根据权利要求6所述的装置，其特征在于，所述识别模块在
9.根据权利要求6所述的装置，其特征在于，如果当前字词之后的标识字符I = Yn，所述选择模块在已知的标识字符集合Y中选择与Yn具有关联关系的标点，添加到当如字词之后；其中，所述已知的标识字符集合Υ={Υ1，Υ2，Υ3，……，Υη，0} ;Υ1、Υ2、Υ3……Υη、0为各标识字符，分别对应关联的标点，O表示标点为空。
10.根据权利要求6所述的装置，其特征在于，还包括: 训练模块，用于根据预先获取的数据对所述最大熵模型进行训练；其中，所述数据包括:标点和与标点对应的由当前字词的前η个字词和后m个字词组成的特征。
全文摘要
本发明实施例公开了一种语音识别中的标点添加方法和装置，以解决进行语音识别得到的识别结果缺少实效性的问题。所述方法包括对通过语音识别得到的语句中的当前字词进行特征提取；将提取到的当前字词的特征在预先建立的最大熵模型中进行识别，得到当前字词之后的标识字符；根据获取到的标识字符与各标点的关联关系，在已知的标识字符集合中选择与当前字词之后的标识字符对应的标点，添加到当前字词之后。本发明实施例根据当前字词与其前后几个字词之间的逻辑关系等，按照预先建立的最大熵模型，预测当前字词后应该添加的标点(标点可以为空)。添加标点后的语音识别结果提高了语音识别结果的实效性。
文档编号G06F17/28GK103164399SQ20131005965
公开日2013年6月19日申请日期2013年2月26日优先权日2013年2月26日
发明者李健, 吴飞, 郑晓明, 张连毅, 武卫东申请人:北京捷通华声语音技术有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李健;吴飞;郑晓明;张连毅;武卫东
技术所有人：北京捷通华声语音技术有限公司
我是此专利的发明人

上一篇：基于局部线性表示的模式分类方法
上一篇：基于多种群萤火虫和投影寻踪回归的岩体可爆性分类方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。