一种文字直播方法及平台与流程

文档序号：11097710阅读：来源：国知局

技术特征：

1.一种文字直播方法，其特征在于，所述方法包括：

将直播的语音音频进行语音识别，生成有序文字；

根据预先设置的声纹特征确定所生成的有序文字的归属；

生成有序的包含归属者的文字作为直播文字。

2.根据权利要求1所述的方法，其特征在于，所述将直播的语音音频进行语音识别，生成有序文字包括：将语音音频转换为文字，并根据直播的语音音频中发言者的对话顺序确定转换后的文字顺序，将按对话顺序排序的文字作为有序文字。

3.根据权利要求1或2所述的方法，其特征在于，所述根据预先设置的声纹特征确定所生成的有序文字的归属之前，所述方法还包括：

对直播的语音音频中的各个发言者进行声纹特征提取，所述声纹特征包括：声学特征、词法特征、韵律特征、语种、方言和口音特征。

4.根据权利要求3所述的方法，其特征在于，所述根据预先设置的声纹特征确定所生成有序文字的归属，包括：

将所述提取的声纹特征与语音音频中的发言者形成对应关系，确定直播的语音音频中当前语音音频的归属，确定所述有序文字的归属。

5.一种文字直播平台，其特征在于，所述平台包括：语音识别模块，声纹识别模块，处理模块；其中，

语音识别模块，用于将直播的语音音频进行语音识别，生成有序文字；

声纹识别模块，用于根据预先设置的声纹特征确定所生成的有序文字的归属；

处理模块，用于生成有序的包含归属者的文字作为直播文字。

6.根据权利要求5所述的文字直播平台，其特征在于，所述语音识别模块具体用于：将语音音频转换为文字，并根据直播的语音音频中发言者的对话顺序确定转换后的文字顺序，将按对话顺序排序的文字作为有序文字。

7.根据权利要求5或6所述的文字直播平台，其特征在于，所述声纹识别模块，还用于对直播的语音音频中的各个发言者进行声纹特征提取。

8.根据权利要求7所述的文字直播平台，其特征在于，所述声纹识别模块具体用于：将所述提取的声纹特征与语音音频中的发言者形成对应关系，确定直播的语音音频中语音音频的归属，确定所述有序文字的归属。

完整全部详细技术资料下载

当前第2页1 2 3