一种平行语料数据对的构建方法、装置及存储介质与流程

文档序号:34735313发布日期:2023-07-12 18:56阅读:来源:国知局

技术特征:

1.一种平行语料数据对的构建方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述计算所述第一输出结果和所述第一语料数据对应的平行语料数据之间的第一变化幅度值,包括:

4.根据权利要求2所述的方法,其特征在于,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,所述计算所述第二输出结果和当前的循环计算过程中的所述第一语料数据对应的平行语料数据之间的第二变化幅度值,包括:

6.根据权利要求1所述的方法,其特征在于,所述方法还包括:

7.根据权利要求1所述的方法,其特征在于,所述第一风格转换模型包括第一翻译模型、第二翻译模型、第一风格解码器、第二风格解码器和第一属性分类器,所述方法还包括:

8.根据权利要求1所述的方法,其特征在于,所述第二风格转换模型包括第一风格生成器、第二风格生成器和第二属性分类器,所述方法还包括:

9.一种平行语料数据对的构建装置,其特征在于,所述装置包括:

10.一种平行语料数据对的构建装置,其特征在于,包括:

11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行权利要求1至8任一项所述的方法。


技术总结
本申请实施例公开了一种平行语料数据对的构建方法、装置及存储介质。其中,该方法包括:将具有第一风格特征的第一语料数据输入第一风格转换模型中,得到具有第二风格特征的第二语料数据;第一风格转换模型基于回译训练得到;将第一语料数据输入第二风格转换模型中,得到具有第二风格特征的第三语料数据;第二风格转换模型基于对抗训练得到;计算第二语料数据的第二风格特征对应的第一得分;计算第三语料数据的第二风格特征对应的第二得分;若第一得分大于第二得分,则利用第二语料数据和第一语料数据构建第一平行语料数据对;若第一得分不大于第二得分,则利用第三语料数据和第一语料数据构建第一平行语料数据对,解决平行语料数据对稀缺的问题。

技术研发人员:柳林,杜先杨,张浩宇,吴飞
受保护的技术使用者:合肥讯飞数码科技有限公司
技术研发日:
技术公布日:2024/1/13
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1