文本语料库的构建方法和装置与流程技术资料下载

技术编号:13514317

提示:您尚未登录,请点 登 陆 后下载,如果您还没有账户请点 注 册 ,登陆完成后,请刷新本页查看技术详细信息。

本申请涉及自然语言技术领域,尤其涉及一种文本语料库的构建方法和装置。背景技术构建文本语料库一般为语音合成或语音识别等应用系统的必要步骤,如语音合成系统需要根据构建好的文本语料库进行录音,利用文本与语音的平行数据训练声学模型,识别系统中可以直接利用构建好的文本语料库训练语言模型。因此,文本语料库的构建直接关系到整个应用系统的使用效果。相关技术中,文本语料库的构建方法一般以句为单位,收集大量句子级的文本语料,提取句子级挑选特征,构建相应文本语料库,所述挑选特征一般仅包含一些常见的韵律特征,如重读、韵...
注意:该技术已申请专利,请尊重研发人员的辛勤研发付出,在未取得专利权人授权前,仅供技术研究参考不得用于商业用途。
该专利适合技术人员进行技术研发参考,增加技术思路,做技术知识储备,不适合论文引用。

详细技术文档下载地址↓↓

提示:您尚未登录,请点 登 陆 后下载,如果您还没有账户请点 注 册 ,登陆完成后,请刷新本页查看技术详细信息。
该分类下的技术专家--如需求助专家,请联系客服(仅向企业会员开放)