一种基于人工智能的商务文本实时翻译方法及系统

文档序号:42296254发布日期:2025-06-27 18:34阅读:38来源:国知局

本发明涉及文本翻译,特别是涉及一种基于人工智能的商务文本实时翻译方法及系统。


背景技术:

1、神经机器翻译简写为nmt。现有的商务文本翻译技术主要基于nmt框架,以transformer模型为核心,通过大规模双语语料库训练实现端到端的文本转换。通用nmt模型通过自注意力机制捕捉上下文依赖关系,在开放领域的翻译任务中表现优异。具体实现中,输入文本经编码器提取语义特征后,由解码器生成目标语言序列,并通过损失函数优化模型参数。部分改进方法通过领域自适应技术,在通用模型基础上注入少量商务领域数据,以提升专业术语的翻译准确性。

2、然而,上述技术在实际商务场景中存在显著缺陷。场景泛化与专业化失衡:单一模型难以兼顾不同场景的差异化需求,导致术语误译和文体失配;静态特征适配不足:传统方法依赖固定术语库和权重分配,无法动态调整翻译策略。效率与实时性瓶颈:深层transformer模型计算复杂度高,平均响应时间超过3秒,难以满足商务谈判等高实时性场景需求;缺少用户反馈机制:翻译结果发生错误时,无法通过用户的反馈进行模型更换和重新生成。


技术实现思路

1、为了克服现有技术的不足,本发明的目的是提供一种基于人工智能的商务文本实时翻译方法及系统,实现特定商务场景下的自适应翻译。

2、为实现上述目的,本发明提供了如下方案:

3、一种基于人工智能的商务文本实时翻译方法,包括:

4、采集不同商务场景下翻译完成的商务文本数据,对每种所述商务场景设计一个网络模型,基于整合整体损失、语义损失、文体损失和文化损失的损失函数利用和所述网络模型的所述商务场景相同的所述商务文本数据对所述网络模型进行训练,得到若干个智能体;

5、实时采集用户和客户沟通过程中的沟通文本或者用户上传的商务文件,得到待翻译文本数据;

6、利用tf-idf算法和bert模型对所述待翻译文本数据词频统计、上下文信息提取以及文体分类,得到词频数据、上文关键字以及文本格式类型,并根据所述词频数据、所述上文关键字以及所述文本格式类型对所述待翻译文本数据进行应用场景匹配,得到场景分类概率数据;

7、根据所述场景分类概率数据和所述智能体进行匹配,确定翻译主体模型;

8、利用所述翻译主体模型对所述待翻译文本数据进行翻译,得到实时翻译结果;

9、采集用户的反馈信息,若所述反馈信息为翻译错误时,则根据所述场景分类概率数据更换所述智能体,将更换后的所述智能体确定为所述翻译主体模型,并返回步骤“利用所述翻译主体模型对所述待翻译文本数据进行翻译,得到实时翻译结果”。

10、优选地,所述智能体的构建过程,包括:

11、构建transformer改进网络;所述transformer改进网络包括:依次连接的输入处理层、编码器层、解码器层以及线性投影层;所述输入处理层包括:依次连接的词嵌入模块、位置编码模块、动态术语库接口模块;所述编码器层包括:依次连接的融合文化感知注意力头和局部注意力窗口的多头自注意力模块、互文性增强模块、前馈网络模块、编码残差连接与层归一化模块;所述解码器层包括:依次连接的融合模板缓存区的输入处理模块、掩码多头自注意力模块、标准跨序列注意力模块、序列标注头模块以及解码残差连接与层归一化模块;

12、分别利用所述词嵌入模块、所述位置编码模块、所述动态术语库接口模块对预收集的标准翻译文本数据进行词向量映射、混合位置编码以及专业术语检索及词嵌入,得到输入向量;

13、利用所述文化感知注意力头载入预注入的外部知识图谱,利用所述局部注意力窗口限定注意力范围,根据所述外部知识图谱和所述注意力范围利用多头自注意力模块对所述输入向量进行加权向量拼接及线性变换融合,得到融合结果;

14、利用所述互文性增强模块对所述融合结果进行跨句关键词提取,得到上下文增强向量;

15、利用所述前馈网络模块对所述上下文增强向量进行非线性激活处理,并利用所述编码残差连接与层归一化模块对所述前馈网络模块的输出进行整合,得到编码输出;

16、利用所述输入处理模块中的所述融合模板缓存区载入高频术语模板;

17、利用所述掩码多头自注意力模块用于对所述编码输出进行后续序列位置屏蔽,得到上下文表征;

18、根据所述高频术语模板利用所述标准跨序列注意力模块对所述上下文表征进行对齐关系提取,得到跨模态表征;

19、利用所述序列标注头模块对所述跨模态表征进行固定格式标签预测,并利用所述解码残差连接与层归一化模块对所述序列标注头模块的输出进行整合,得到解码输出;

20、利用所述线性投影层将所述解码输出映射到目标语言空间,得到模型翻译输出。

21、优选地,实时采集用户和客户沟通过程中的沟通文本或者用户上传的商务文件,得到待翻译文本数据,包括:

22、指导用户将信息获取插件扩展到沟通平台上;

23、当用户选择单句翻译时,提取所述沟通平台上用户选择的目标语句,得到所述待翻译文本数据;

24、当用户选择实时翻译时,基于用户名称标签分类提取所述沟通平台上用户聊天窗口内的全部发言文本,得到所述待翻译文本数据;

25、当用户通过所述沟通平台的语音沟通方式或者视频沟通方式时,利用云端语音识别算法、说话人分离技术以及噪声抑制算法监听用户创建的沟通窗口内的语音信息,并将所述语音信息转换为文本形式,得到所述待翻译文本数据;

26、当所述商务文件为非文本类文件时,利用ocr技术提取所述商务文件的文本信息,并利用bert-corrector模型对提取到的文本信息进行拼写纠错和缺失填充,得到所述待翻译文本数据。

27、优选地,所述场景分类概率数据的计算式为:

28、sq=p1·simtf(f0,f0q)+p2·simkw(k0,k0q)+p3·simfmt(t0,t0q);

29、其中,sq为所述待翻译文本数据对第q类所述商务场景的匹配度;p1、p2、p3分别为第一权重、第二权重以及第三权重;simtf(·)、simkw(·)、simfmt(·)分别表示余弦相似度计算、jaccard相似度计算以及布尔匹配;f0、k0、t0分别表示所述词频数据、所述上文关键字以及所述文本格式类型;f0q、k0q、t0q分别表示第q类所述商务场景的基准词频、关键字集合以及格式类型集合。

30、优选地,所述商务场景包括:广告语、商务信函以及商务合同。

31、优选地,所述动态术语库接口模块的表达式为:

32、d=layernorm(e+σ(wd·[e;t])⊙t);

33、其中,d为所述动态术语库接口模块的输出;layernorm(·)表示层归一化计算;e为词嵌入向量;σ(·)为sigmoid函数;wd为门控权重矩阵;t为动态术语库检索的术语嵌入;⊙表示逐元素乘法;

34、所述文化感知注意力头的表达式为:

35、

36、其中,attentionc(q,k,v)表示所述文化感知注意力头的输出;q、k、v分别为查询矩阵、键矩阵以及值矩阵;softmax(·)为归一化矩阵;dk为注意力维度;kkq为知识图谱键矩阵;t表示转置操作;

37、所述输入处理模块的表达式为:

38、t=concat(h,tembed)·wt;

39、其中,t为所述输入处理模块的输出;concat(·)表示拼接操作;h为输入向量;tembed为高频术语模板嵌入;wt为投影矩阵。

40、优选地,所述文本格式类型包括:信函、合同、报告、技术文档、稿件、提案、报表以及无格式文本。

41、优选地,还包括:

42、根据所述模型翻译输出和所述标准翻译文本数据对损失函数进行计算,得到总损失值;所述损失函数的表达式为:

43、ltotal=αlgobol+βlsemanitc+γlstyle+δlcutre;

44、其中,lgobol=crossentropy(ypred,yrtue);

45、

46、lculture=∑c∈cgat(c,g)·accuracy(c);

47、[α,β,γ,δ]=softmax(fω(s));

48、ltotal为所述总损失值;α、β、γ、δ分别为全局翻译权重、专业术语翻译权重、文体风格权重、文化适配权重;lgobol、lsemanitc、lstyle、lcutre分别为所述整体损失、所述语义损失、所述文体损失、所述文化损失;ypred、yrtue分别为预测概率分布和标准译文分布;crossentropy(·)表示交叉熵计算;t表示动态术语库;n为当前批次的术语数量;wi为第i个目标语言词;i(·)为示性函数,当内部条件满足时输出1,否则输出0;dkl(·)表示相对熵计算;pθ(wi)、pref(wi)分别表示wi的预测概率分布以及wi在所述动态术语库中的标准分布;φs(·)表示所述编码器层;xsrc、ypred分别表示源语言文本和目标语言预测文本;c表示文化负载词集合;c为所述文化负载词集合中的单个元素;g表示文化知识图谱;gat(c,g)为注意力网络输出的文化敏感度权重;accuracy(c)为文化词翻译准确率;fω(s)表示权重分配网络;

49、根据所述总损失值、所述整体损失、所述语义损失、所述文体损失、所述文化损失进行损失梯度计算和梯度裁剪,得到梯度数据,根据所述梯度数据利用梯度反向传播策略对所述transformer改进网络的模型参数进行迭代优化,并在迭代过程中利用adam优化器动态调整所述梯度反向传播策略的学习率,得到训练完成的所述智能体。

50、优选地,所述非文本类文件包括:pdf文件、jpeg图片以及png图片;所述云端语音识别算法为asr模型;所述说话人分离技术包括:门控卷积网络和深度聚类分析算法;所述噪声抑制算法为dccrn模型。

51、优选地,一种基于人工智能的商务文本实时翻译系统,包括:

52、模型构建子系统,用于采集不同所述商务场景下翻译完成的所述商务文本数据,对每种所述商务场景设计一个所述网络模型,基于所述损失函数利用和所述网络模型的所述商务场景相同的所述商务文本数据对所述网络模型进行训练,得到若干个所述智能体;

53、数据获取子系统,用于实时采集用户和客户沟通过程中的所述沟通文本或者用户上传的所述商务文件,得到所述待翻译文本数据;

54、场景分类子系统,用于利用tf-idf算法和bert模型对所述待翻译文本数据词频统计、上下文信息提取以及文体分类,得到所述词频数据、所述上文关键字以及所述文本格式类型,并根据所述词频数据、所述上文关键字以及所述文本格式类型对所述待翻译文本数据进行应用场景匹配,得到所述场景分类概率数据;

55、模型匹配子系统,用于根据所述场景分类概率数据和所述智能体进行匹配,确定所述翻译主体模型;

56、文本翻译子系统,用于利用所述翻译主体模型对所述待翻译文本数据进行翻译,得到实时翻译结果;

57、用户反馈子系统,用于采集用户的所述反馈信息,若所述反馈信息为翻译错误时,则根据所述场景分类概率数据更换所述智能体,将更换后的所述智能体确定为所述翻译主体模型,并返回步骤“利用所述翻译主体模型对所述待翻译文本数据进行翻译,得到实时翻译结果”。

58、本发明公开了以下技术效果:

59、本发明提供了一种基于人工智能的商务文本实时翻译方法及系统,通过多智能体协同架构,解决了现有翻译系统大多采用泛化模型导致的商务文本翻译效果较差的问题,实现了特定场景的翻译任务;通过tf-idf算法和bert模型,解决了不同智能体的调度问题,实现了智能体的动态调度和准确匹配;通过整合整体损失、语义损失、文体损失和文化损失的损失函数,解决了常规翻译模型在语义、文体、文化方面效果较差的问题,实现了模型翻译准确性和对等性的提高;通过采集用户反馈和智能体更换,解决了用户对匹配智能体翻译结果不满意的问题,实现了用户体验的改善和翻译风格的切换。

当前第1页1 2 
当前第1页1 2 
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!
1