用于处理文本的方法、装置、设备和介质与流程

文档序号:37638272发布日期:2024-04-18 17:57阅读:9来源:国知局
用于处理文本的方法、装置、设备和介质与流程

本公开的示例性实现方式总体涉及文本处理,特别地涉及用于基于机器学习模型来处理文本的方法、装置、设备和计算机可读存储介质。


背景技术:

1、机器学习技术已经被广泛地用于文本处理。例如,可以输入具有某个风格的文本,并且利用机器学习模型来将该文本转换至其他风格。然而,在利用机器学习技术构建转换模型的过程中需要大量人工标注工作,这导致难以在短时间内生成具有较高准确度的转换模型。此时,期望可以以更高的效率来构建更为准确的转换模型,进而利用该转换模型来执行转换文本风格任务。


技术实现思路

1、在本公开的第一方面,提供了一种用于处理文本的方法。在该方法中,接收第一文本以及第二文本,第二文本是利用转换模型来基于第一文本生成的。基于第一文本来验证第二文本。响应于确定第二文本包括与第一文本不一致的内容,确定第二文本未通过验证。

2、在本公开的第二方面,提供了一种用于处理文本的装置。该装置包括:接收模块,被配置用于接收第一文本以及第二文本,第二文本是利用转换模型来基于第一文本生成的;验证模块,被配置用于基于第一文本来验证第二文本;以及确定模块,被配置用于响应于确定第二文本包括与第一文本不一致的内容,确定第二文本未通过验证。

3、在本公开的第三方面,提供了一种电子设备。该电子设备包括:至少一个处理单元;以及至少一个存储器,至少一个存储器被耦合到至少一个处理单元并且存储用于由至少一个处理单元执行的指令,指令在由至少一个处理单元执行时使电子设备执行根据本公开第一方面的方法。

4、在本公开的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序在被处理器执行时使处理器实现根据本公开第一方面的方法。

5、应当理解,本内容部分中所描述的内容并非旨在限定本公开的实现方式的关键特征或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的描述而变得容易理解。



技术特征:

1.一种用于处理文本的方法,包括:

2.根据权利要求1所述的方法,其中确定所述第二文本包括与所述第一文本不一致的内容包括:

3.根据权利要求2所述的方法,进一步包括:响应于确定所述第一文本包括对应于所述数字的内容,利用检测模型来确定所述第二文本是否包括与所述第一文本不一致的内容。

4.根据权利要求2所述的方法,进一步包括:响应于确定所述第一文本不包括对应于所述数字的内容,利用所述第一文本中的对应于所述数字的所述内容来更新所述第二文本中的所述数字。

5.根据权利要求2所述的方法,其中所述数字是利用正则表达式来从所述第二文本中识别的。

6.根据权利要求1所述的方法,其中确定所述第二文本包括与所述第一文本不一致的内容进一步包括利用检测模型来确定不一致的内容,所述检测模型是基于以下来确定的:

7.根据权利要求6所述的方法,其中所述提示词进一步用于使得所述机器学习模型输出用于判断所述第二参考文本是否包括所述参考不一致内容的参考理由,以及所述方法进一步包括:利用所述参考理由,更新所述检测模型,使得所述检测模型描述第一参考文本、所述第二参考文本、所述参考理由以及所述参考结论之间的关联关系。

8.根据权利要求7所述的方法,进一步包括:

9.根据权利要求8所述的方法,其中所述第二文本将被呈现在目标应用中,并且所述预定条件指示所述差异包括以下至少任一项:所述目标应用的名称、所述目标应用的界面布局、所述目标应用中的控件、用于在所述目标应用中推广所述第一文本中的目标对象的表述。

10.根据权利要求1所述的方法,其中所述第一文本具有书面风格,所述第二文本具有口语风格,并且所述转换模型用于将具有所述书面风格的文本转换至具有所述口语风格。

11.一种用于处理文本的装置,包括:

12.一种电子设备,包括:

13.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时使所述处理器实现根据权利要求1至10中任一项所述的方法。


技术总结
提供了用于处理文本的方法、装置、设备和介质。在一种方法中,接收第一文本以及第二文本,第二文本是利用转换模型来基于第一文本生成的。基于第一文本来验证第二文本。响应于确定第二文本包括与第一文本不一致的内容,确定第二文本未通过验证。利用本公开的示例性实现方式,可以以更为简单并且有效的方式来验证转换后的第二文本的内容是否匹配于原始的第一文本。

技术研发人员:吴昊,邱鑫,李辰,周高景,郭雨,易沐阳,杨成
受保护的技术使用者:抖音视界有限公司
技术研发日:
技术公布日:2024/4/17
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1