本申请涉及计算机,尤其涉及数据处理方法、数据处理装置、计算机设备、计算机可读存储介质及计算机程序产品。
背景技术:
1、随着通信网络技术的发展,节约时间和精力的线上咨询成为当下流行的咨询方式。通过使用联网设备足不出户就可以得到问题的诊断结果和解决方案,为人们的日常生活带来了极大的便利。
2、现有的线上咨询方式是根据咨询过程中的聊天记录通过人工手动填写的方式生成关于咨询问题的报告。这种人工手动生成的方式不仅需要耗费大量的人力财力,而且生成报告的效率低。
技术实现思路
1、本申请实施例提供数据处理方法、装置、设备、存储介质及计算机程序产品,不仅可以提高诊断报告的生成效率,还可以提高生成的诊断报告的准确性。
2、一方面,本申请实施例提供了一种数据处理方法,该方法包括:
3、获取咨询对象和回复对象之间的会话数据,所述会话数据包括所述咨询对象关于诊断对象的介绍内容以及所述回复对象针对所述介绍内容的回复内容,所述回复内容包括关于所述诊断对象的诊断信息;
4、对所述会话数据进行编码处理,确定所述会话数据的向量编码信息;
5、对所述向量编码信息进行处理,确定所述会话数据的特征表示向量和实体关系数据;
6、根据所述特征表示向量和所述实体关系数据,生成所述诊断对象的诊断报告。
7、另一方面,本申请实施例提供了一种数据处理装置,该装置包括:
8、获取单元,用于获取咨询对象和回复对象之间的会话数据,所述会话数据包括所述咨询对象关于诊断对象的介绍内容以及所述回复对象针对所述介绍内容的回复内容,所述回复内容包括关于所述诊断对象的诊断信息;
9、处理单元,用于对所述会话数据进行编码处理,确定所述会话数据的向量编码信息;
10、所述处理单元,还用于对所述向量编码信息进行处理,确定所述会话数据的特征表示向量和实体关系数据;
11、所述处理单元,还用于根据所述特征表示向量和所述实体关系数据,生成所述诊断对象的诊断报告。
12、在一种可能的实施方式中,
13、所述处理单元,还用于对所述会话数据进行分段处理,得到一段或多段内容;其中,每一段内容包括所述咨询对象或者所述回复对象连续输入的一条或多条消息;
14、所述处理单元,还用于为所述每一段内容分别添加起始符号和结束符号,将添加了起始符号和结束符号的所述每一段内容进行连接,得到连接后的会话数据;
15、所述处理单元,还用于对所述连接后的会话数据进行编码处理,确定所述会话数据的向量编码信息。
16、在一种可能的实施方式中,
17、所述处理单元,还用于按照所述每一段内容的输入先后顺序,将添加了起始符号和结束符号的所述每一段内容进行连接,得到连接后的会话数据。
18、在一种可能的实施方式中,
19、所述处理单元,还用于确定所述一个或多个三元组中每一个三元组的关联度,所述关联度用于指示三元组与所述诊断对象之间的相关程度;
20、所述处理单元,还用于从所述一个或多个三元组中确定关联度大于或等于关联度阈值的目标三元组;
21、所述处理单元,还用于根据所述特征表示向量和所述目标三元组,生成所述诊断对象的诊断报告。
22、在一种可能的实施方式中,
23、所述获取单元,还用于获取所述咨询对象和所述回复对象之间的初始会话数据;
24、所述处理单元,还用于对所述初始会话数据进行预处理操作,所述预处理操作包括脱敏操作和去冗余操作中的一种或多种;
25、所述处理单元,还用于将预处理后的初始会话数据确定为所述咨询对象和所述回复对象之间的会话数据。
26、在一种可能的实施方式中,
27、所述处理单元,还用于将所述会话数据输入所述特征提取模型中进行处理,确定所述会话数据的向量编码信息,并根据所述向量编码信息确定所述会话数据的特征表示向量和实体关系数据;
28、所述处理单元,还用于将所述特征表示向量和所述实体关系数据输入所述诊断报告生成模型中进行处理,生成所述诊断对象的诊断报告。
29、在一种可能的实施方式中,
30、所述处理单元,还用于将所述会话数据输入所述编码子模型中进行处理,确定所述会话数据的向量编码信息;
31、所述处理单元,还用于将所述向量编码信息输入所述向量提取子模型中进行处理,确定所述会话数据的特征表示向量;
32、所述处理单元,还用于将所述向量编码信息输入所述实体关系提取子模型中进行处理,确定所述会话数据的实体关系数据。
33、再一方面,本申请实施例提供了一种计算机设备,该计算机设备包括:处理器、存储器以及网络接口;处理器与存储器、网络接口相连,其中,网络接口用于提供网络通信功能,存储器用于存储程序代码,处理器用于调用程序代码,以执行本申请实施例中的数据处理方法。
34、相应地,本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,计算机程序包括程序指令,程序指令当被处理器执行时,执行本申请实施例中的数据处理方法。
35、相应地,本申请实施例还提供了一种计算机程序产品,所述计算机程序产品包括计算机程序或计算机指令,所述计算机程序或计算机指令被处理器执行时实现本申请实施例提供的数据处理方法的步骤。
36、相应地,本申请实施例还提供了一种计算机程序,所述计算机程序包括计算机指令,所述计算机指令存储在计算机可读存储介质中,计算机设备的处理器从所述计算机可读存储介质读取所述计算机指令,处理器执行所述计算机指令,使得所述计算机设备执行本申请实施例提供的数据处理方法。
37、本申请实施例通过获取咨询对象和回复对象之间的会话数据,提取该会话数据的特征表示向量和实体关系数据,并根据提取的特征表示向量和实体关系数据自动生成诊断对象的诊断报告,一方面,可以实现诊断报告生成的自动化,提高诊断报告的生成效率;另一方面,通过结合会话数据的特征表示向量和实体关系数据两者来生成诊断报告,可以提高生成的诊断报告的准确性。
1.一种数据处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述会话数据包括所述咨询对象输入的一条或多条消息,以及包括所述回复对象输入的一条或多条消息,所述方法还包括:
3.根据权利要求2所述的方法,其特征在于,所述每一段内容包括的一条或多条消息是按照输入先后顺序排列的;
4.根据权利要求1所述的方法,其特征在于,所述实体关系数据包括一个或多个三元组,每一个三元组包括主实体、客实体、所述主实体和所述客实体之间的关系;
5.根据权利要求1-4任一项所述的方法,其特征在于,所述获取咨询对象和回复对象之间的会话数据,包括:
6.根据权利要求1所述的方法,其特征在于,所述方法应用于数据处理模型,所述数据处理模型包括特征提取模型和诊断报告生成模型,所述特征提取模型的输出端与所述诊断报告生成模型的输入端连接;
7.根据权利要求6所述的方法,其特征在于,所述特征提取模型包括编码子模型、向量提取子模型、实体关系提取子模型,所述向量提取子模型和所述实体关系提取子模型的输入端分别与所述编码子模型的输出端连接,所述向量提取子模型和所述实体关系提取子模型的输出端分别与所述诊断报告生成模型的输入端连接;
8.一种数据处理装置,其特征在于,所述装置包括:
9.一种计算机设备,其特征在于,包括:处理器、通信接口和存储器,所述处理器、所述通信接口和所述存储器相互连接,其中,所述存储器存储有可执行程序代码,所述处理器用于调用所述可执行程序代码,执行如权利要求1-7中任一项所述的数据处理方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,当其在计算机上运行时,使得计算机执行如权利要求1-7中任一项所述的数据处理方法。
11.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序或计算机指令,所述计算机程序或计算机指令被处理器执行时实现如权利要求1-7中任一项所述的数据处理方法的步骤。