一种数据处理的方法、装置及设备与流程

文档序号:36164994发布日期:2023-11-23 16:13阅读:26来源:国知局
一种数据处理的方法与流程

本文件属于人工智能领域,具体涉及一种数据处理的方法、装置及设备。


背景技术:

1、自然语言处理可分为自然语言理解与自然语言生成两大分支,后者也可简称为文本生成,其主要包括文本到文本生成、数据到文本生成以及图像到文本生成三类。

2、然而,对于数据到文本生成这一文本生成类型来说,由于输入文本生成模型的数据类信息(如表格、键值对列表以及三元组等)蕴含有丰富的内容,可能会出现文本生成模型输出的描述文本不符合预期的现象。例如,随着表格内容的增加,文本生成模型输出的描述文本长度也会增加,这时的描述文本常常会出现前后衔接不当等现象。为此,需要提供一种更优的数据处理方案,来克服上述困难。


技术实现思路

1、本说明书实施例提供一种数据处理的方法、装置及设备,以提供一种符合文本生成预期的数据处理方案。

2、第一方面,本说明书实施例提供了一种数据处理的方法,该方法包括:获取目标结构化数据和所述目标结构化数据对应的提示信息,所述目标结构化数据包括存在预设关联关系的账户群组中各个关联账户的账户标识和所述关联账户的预设特征的特征值,所述提示信息用于表征所述预设关联关系的类型和/或所述关联账户的行为的类型;对所述目标结构化数据中包含的数据内容进行序列化处理,得到所述目标结构化数据对应的内容序列信息;根据所述提示信息,获取所述目标结构化数据中包含的描述逻辑信息,并对所述描述逻辑信息进行序列化处理,得到所述目标结构化数据对应的逻辑序列信息;将所述内容序列信息和所述逻辑序列信息输入到文本生成模型中,得到所述目标结构化数据对应的账户群组描述文本,所述账户群组描述文本用于描述所述关联账户的相关信息。

3、第二方面,本说明书实施例提供了一种数据处理的装置,包括:数据获取模块,用于获取目标结构化数据和所述目标结构化数据对应的提示信息,所述目标结构化数据包括存在预设关联关系的账户群组中各个关联账户的账户标识和所述关联账户的预设特征的特征值,所述提示信息用于表征所述预设关联关系的类型和/或所述关联账户的行为的类型;第一序列化处理模块,用于对所述目标结构化数据中包含的数据内容进行序列化处理,得到所述目标结构化数据对应的内容序列信息;第二序列化处理模块,用于根据所述提示信息,获取所述目标结构化数据中包含的描述逻辑信息,并对所述描述逻辑信息进行序列化处理,得到所述目标结构化数据对应的逻辑序列信息;文本生成模块,用于将所述内容序列信息和所述逻辑序列信息输入到文本生成模型中,得到所述目标结构化数据对应的账户群组描述文本,所述账户群组描述文本用于描述所述关联账户的相关信息。

4、第三方面,本说明书实施例提供了一种电子设备,该电子设备包括:处理器,以及被安排成存储计算机可执行指令的存储器,在所述可执行指令被执行时,能够使得所述处理器:获取目标结构化数据和所述目标结构化数据对应的提示信息,所述目标结构化数据包括存在预设关联关系的账户群组中各个关联账户的账户标识和所述关联账户的预设特征的特征值,所述提示信息用于表征所述预设关联关系的类型和/或所述关联账户的行为的类型;对所述目标结构化数据中包含的数据内容进行序列化处理,得到所述目标结构化数据对应的内容序列信息;根据所述提示信息,获取所述目标结构化数据中包含的描述逻辑信息,并对所述描述逻辑信息进行序列化处理,得到所述目标结构化数据对应的逻辑序列信息;将所述内容序列信息和所述逻辑序列信息输入到文本生成模型中,得到所述目标结构化数据对应的账户群组描述文本,所述账户群组描述文本用于描述所述关联账户的相关信息。

5、再一方面,本说明书实施例提供一种存储介质,用于存储计算机程序,所述计算机程序能够被处理器执行以实现以下流程:获取目标结构化数据和所述目标结构化数据对应的提示信息,所述目标结构化数据包括存在预设关联关系的账户群组中各个关联账户的账户标识和所述关联账户的预设特征的特征值,所述提示信息用于表征所述预设关联关系的类型和/或所述关联账户的行为的类型;对所述目标结构化数据中包含的数据内容进行序列化处理,得到所述目标结构化数据对应的内容序列信息;根据所述提示信息,获取所述目标结构化数据中包含的描述逻辑信息,并对所述描述逻辑信息进行序列化处理,得到所述目标结构化数据对应的逻辑序列信息;将所述内容序列信息和所述逻辑序列信息输入到文本生成模型中,得到所述目标结构化数据对应的账户群组描述文本,所述账户群组描述文本用于描述所述关联账户的相关信息。



技术特征:

1.一种数据处理的方法,包括:

2.根据权利要求1所述的方法,所述根据所述提示信息,获取所述目标结构化数据中包含的描述逻辑信息,包括:

3.根据权利要求2所述的方法,所述根据所述提示信息,获取所述目标结构化数据中包含的描述逻辑信息,包括:

4.根据权利要求3所述的方法,所述逻辑类型包括:同一预设特征中的相同特征值的数量、同一预设特征中大于第一预设阈值的特征值、同一预设特征中小于第二预设阈值的特征值、同一预设特征中的不同特征值的大小关系、使用第一预设数量的预设特征中特征值的联合计算、同一预设特征中大于第二预设数量的特征值的计算、同一预设特征中与其它特征值不同的特征值、同一预设特征中特征值的排序。

5.根据权利要求3所述的方法,所述逻辑框架的构建过程,包括:

6.根据权利要求5所述的方法,所述逻辑框架为树形结构,所述逻辑框架的构建过程,包括:

7.根据权利要求1-6任一项所述的方法,所述方法,包括:

8.根据权利要求1-6任一项所述的方法,所述文本生成模型包括编码器和解码器,所述将所述内容序列信息和所述逻辑序列信息输入到文本生成模型中,得到所述目标结构化数据对应的账户群组描述文本,包括:

9.根据权利要求8所述的方法,所述将所述加强编码值和所述第二编码值拼接后得到的编码值输入到所述解码器中,生成所述账户群组描述文本,包括:

10.一种数据处理的装置,包括:

11.一种电子设备,包括:


技术总结
本说明书实施例公开了一种数据处理的方法、装置及设备。所述方法包括:获取目标结构化数据和目标结构化数据对应的提示信息,目标结构化数据包括存在预设关联关系的账户群组中各个关联账户的账户标识和关联账户的预设特征的特征值,提示信息用于表征预设关联关系的类型和/或关联账户的行为的类型;对目标结构化数据中包含的数据内容进行序列化处理,得到目标结构化数据对应的内容序列信息;根据提示信息,获取目标结构化数据中包含的描述逻辑信息,并对描述逻辑信息进行序列化处理,得到目标结构化数据对应的逻辑序列信息;将内容序列信息和逻辑序列信息输入文本生成模型中,得到目标结构化数据对应的描述关联账户的相关信息的账户群组描述文本。

技术研发人员:陈中奇
受保护的技术使用者:支付宝(杭州)信息技术有限公司
技术研发日:
技术公布日:2024/1/16
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1