技术特征:
技术总结
本申请提出一种文本语料库的构建方法和装置,该文本语料库的构建方法包括:收集文本语料作为收集语料;从篇章角度对所述收集语料进行分析,提取所述收集语料的篇章搜索特征;根据所述篇章搜索特征,在所述收集语料中搜索满足预设条件的以篇章为单位的语料,并将搜索得到的语料加入文本语料库中。该方法能够构建以篇章为单位的文本语料库,从而提高对大段文本的处理能力,提高合成语音的自然度和可懂度。
技术研发人员:周明;江源;胡国平;胡郁;刘庆峰
受保护的技术使用者:科大讯飞股份有限公司
技术研发日:2016.07.11
技术公布日:2018.01.19