数据操作方法、装置、设备和介质与流程

文档序号:37014224发布日期:2024-02-09 13:04阅读:14来源:国知局
数据操作方法、装置、设备和介质与流程

本公开涉及人工智能,具体地涉及一种数据操作方法、装置、设备和介质。


背景技术:

1、在一个典型的场景中,用户通过平台进行数据处理操作,以实现上层的业务逻辑的处理。目前,在用的部分自主查数平台,由于入口不统一,导致不同系统的数据需要从不同平台获取,不同平台间的业务逻辑和操作语句存在差异,这种差异在一定程度上导致了使用成本较高。同时,繁杂的业务逻辑和操作语句的学习成本也较高,这对用户而言是一笔不小的学习成本。


技术实现思路

1、鉴于上述问题,本公开提供了提高数据操作效率并降低数据操作使用成本的数据操作方法、装置、设备和介质。

2、根据本公开的第一个方面,提供了一种数据操作方法,包括:提取来自用户的提交信息中涉及数据操作的信息,得到实体信息和所述实体信息之间的语义关系;基于所述实体信息和所述语义关系,形成m个可执行的指令,m为正整数;以及执行所述m个可执行的指令,得到返回结果。

3、根据本公开的实施例,其中,所述提取来自用户的提交信息中涉及数据操作的信息,得到实体信息和所述实体信息之间的语义关系,包括:抽取所述提交信息中的实体信息,得到初步实体信息;对所述初步实体信息执行消歧处理,得到标准实体信息;获取所述提交信息中的语义关系。

4、根据本公开的实施例,所述抽取所述提交信息中的实体信息,得到初步实体信息,包括:对所述提交信息执行预处理,得到预处理结果;将所述预处理结果作为预设的第一机器学习模型的输入,得到实体识别结果表;基于所述实体识别结果表和预设的目标业务表,计算相似度,得到相似度结果表;以及去除所述相似度结果表中小于第一相似度阈值的实体信息,得到所述初步实体信息。

5、根据本公开的实施例,其中,所述将所述预处理结果作为预设的机器学习模型的输入,得到实体识别结果表,包括:将所述预处理结果转换为向量形式,得到向量结果;基于所述向量结果输出文本序列;以及基于所述文本序列,生成所述实体识别结果表。

6、根据本公开的实施例,其中,所述对所述初步实体信息执行消歧处理,得到标准实体信息,包括:基于预设的第二机器学习模型对所述实体信息执行消歧处理,得到标准实体信息,其中,所述第二机器学习模型包括聚类模型,所述基于预设的第二机器学习模型对所述实体信息执行消歧处理,得到标准实体信息,包括:获取初步实体信息、所述初步实体信息对应的指标项和标准实体信息;基于所述初步实体信息的指标项,通过所述聚类模型对所述初步实体信息分类,得到实体类别和第一映射关系,所述第一映射关系是所述初步实体信息和所述实体类别之间的映射关系;基于所述实体类别匹配所述标准实体信息,并结合所述第一映射关系生成第二映射关系,所述第二映射关系是所述标准实体信息和所述初步实体信息的映射关系;以及按照所述第二映射关系,将所述初步实体信息转化为所述标准实体信息。

7、根据本公开的实施例,其中,所述指标项包括第一指标项和第二指标项,所述第一指标项是所述初步实体信息自身特征的指标项,所述第二指标项是所述初步实体信息所处上下文特征的指标项。

8、根据本公开的实施例,其中,所述预设的第二机器学习模型还包括自然语言处理模型,所述对所述初步实体信息执行消歧处理,得到标准实体信息,还包括:获取初步实体信息对应的上下文和标准实体信息的上下文;基于所述初步实体信息对应的上下文和所述标准实体信息的上下文,通过所述自然语言处理模型,计算相似度;在所述相似度满足预设规则的情况下,选取所述相似度作为第一相似度;基于所述第一相似度生成第三映射关系,所述第三映射关系是所述初步实体信息和所述标准实体信息的映射关系;以及按照所述第三映射关系,将所述初步实体信息转化为所述标准实体信息。

9、根据本公开的实施例,其中,所述预设规则包括:按照排名选取所述第一相似度;或者按照阈值选取所述第一相似度。

10、根据本公开的实施例,其中,所述获取所述提交信息中的语义关系,包括:获取所述实体信息之间的初步词条;基于所述初步词条匹配预设的标准语义词条;以及在所述初步词条匹配预设的标准语义词条成功的情况下,将所述初步词条替换为所述标准语义词条并标记为语义关系。

11、根据本公开的实施例,其中,所述基于所述初步词条匹配预设的标准语义词条,包括:直接匹配所述初步词条匹配预设的标准语义词条;或者计算所述初步词条和所述预设的标准语义词条之间的相似度;选取相似度大于第二相似度阈值的初步词条。

12、根据本公开的实施例,其中,所述基于所述实体信息和所述语义关系,形成m个可执行的指令,m为正整数,包括:基于预设的关联勾稽关系、所述实体信息和所述语义关系生成指令集合;以及将所述指令集合拆分为所述m个可执行的指令,所述m个可执行的指令中每个指令对应执行顺序。

13、根据本公开的实施例,其中,所述基于预设的关联勾稽关系、所述实体信息和所述语义关系生成指令集合,包括:基于所述实体信息和/或所述语义关系获取指令模板;以及将所述实体信息和/或所述语义关系注入所述指令模板,得到可执行的指令。

14、根据本公开的实施例,其中,所述执行所述m个可执行的指令,得到返回结果,包括:按照所述执行顺序,执行所述m个可执行的指令,得到返回结果。

15、本公开的第二方面提供了一种数据操作装置,包括:字符提取模块,用于提取来自用户的提交信息中涉及数据操作的信息,得到实体信息和所述实体信息之间的语义关系;指令形成模块,用于基于所述实体信息和所述语义关系,形成m个可执行的指令,m为正整数;以及指令执行模块,用于执行所述m个可执行的指令,得到返回结果。

16、根据本公开的实施例,其中,所述字符提取模块,包括:实体抽取子模块、实体消歧子模块、语义抽取子模块以及字符串形成子模块,所述实体抽取子模块,用于抽取所述提交信息中的实体信息,得到初步实体信息;所述实体消歧子模块,用于对所述初步实体信息执行消歧处理,得到标准实体信息;所述语义抽取子模块,用于获取所述提交信息中的语义关系。

17、根据本公开的实施例,所述实体抽取子模块,包括:预处理单元、实体识别结果表生成单元、相似度结果表生成单元以及初步实体信息生成单元,所述预处理单元,用于对所述提交信息执行预处理,得到预处理结果;所述实体识别结果表生成单元,用于将所述预处理结果作为预设的第一机器学习模型的输入,得到实体识别结果表;所述相似度结果表生成单元,用于基于所述实体识别结果表和预设的目标业务表,计算相似度,得到相似度结果表;以及所述初步实体信息生成单元,用于去除所述相似度结果表中小于第一相似度阈值的实体信息,得到所述初步实体信息。

18、根据本公开的实施例,其中,所述实体识别结果表生成单元,还用于将所述预处理结果转换为向量形式,得到向量结果;基于所述向量结果输出文本序列;以及基于所述文本序列,生成所述实体识别结果表。

19、根据本公开的实施例,其中,所述实体消歧子模块,包括:机器学习消歧单元,所述机器学习消歧单元,用于基于预设的第二机器学习模型对所述实体信息执行消歧处理,得到标准实体信息,其中,所述第二机器学习模型包括聚类模型,所述机器学习消歧单元包括:第一获取子单元、聚类子单元、第二映射关系生成子单元以及第一转化子单元,所述第一获取子单元,用于获取初步实体信息、所述初步实体信息对应的指标项和标准实体信息;所述聚类子单元,用于基于所述初步实体信息的指标项,通过所述聚类模型对所述初步实体信息分类,得到实体类别和第一映射关系,所述第一映射关系是所述初步实体信息和所述实体类别之间的映射关系;所述第二映射关系生成子单元,用于基于所述实体类别匹配所述标准实体信息,并结合所述第一映射关系生成第二映射关系,所述第二映射关系是所述标准实体信息和所述初步实体信息的映射关系;以及所述第一转化子单元,用于按照所述第二映射关系,将所述初步实体信息转化为所述标准实体信息。

20、根据本公开的实施例,其中,所述指标项包括第一指标项和第二指标项,所述第一指标项是所述初步实体信息自身特征的指标项,所述第二指标项是所述初步实体信息所处上下文特征的指标项。

21、根据本公开的实施例,其中,所述预设的第二机器学习模型还包括自然语言处理模型,所述机器学习消歧单元还包括:第二获取子单元、自然语言处理子单元、第一相似度选取子单元、第三映射关系生成子单元以及第二转化子单元,所述第二获取子单元,用于获取初步实体信息对应的上下文和标准实体信息的上下文;所述自然语言处理子单元,用于基于所述初步实体信息对应的上下文和所述标准实体信息的上下文,通过所述自然语言处理模型,计算相似度;所述第一相似度选取子单元,用于在所述相似度满足预设规则的情况下,选取所述相似度作为第一相似度;所述第三映射关系生成子单元,用于基于所述第一相似度生成第三映射关系,所述第三映射关系是所述初步实体信息和所述标准实体信息的映射关系;以及所述第二转化子单元,用于按照所述第三映射关系,将所述初步实体信息转化为所述标准实体信息。

22、根据本公开的实施例,其中,所述预设规则包括:按照排名选取所述第一相似度;或者按照阈值选取所述第一相似度。

23、根据本公开的实施例,其中,所述语义抽取子模块包括:初步词条获取单元、标准词条匹配单元以及语义关系标记单元,所述初步词条获取单元,用于获取所述实体信息之间的初步词条;所述标准词条匹配单元,用于基于所述初步词条匹配预设的标准语义词条;以及所述语义关系标记单元,用于在所述初步词条匹配预设的标准语义词条成功的情况下,将所述初步词条替换为所述标准语义词条并标记为语义关系。

24、根据本公开的实施例,其中,所述初步词条获取单元包括:直接匹配子单元和相似度匹配子单元,所述直接匹配子单元,用于直接匹配所述初步词条匹配预设的标准语义词条;或者计算所述初步词条和所述预设的标准语义词条之间的相似度;所述相似度匹配子单元,用于选取相似度大于第二相似度阈值的初步词条。

25、根据本公开的实施例,其中,所述指令形成模块包括指令生成子模块和指令拆分子模块,所述指令生成子模块,用于基于预设的关联勾稽关系、所述实体信息和所述语义关系生成指令集合;以及所述指令拆分子模块,用于将所述指令集合拆分为所述m个可执行的指令,所述m个可执行的指令中每个指令对应执行顺序。

26、根据本公开的实施例,其中,所述指令生成子模块包括指令模板获取单元和注入单元,对于任意字符串片段,基于所述实体信息和/或所述语义关系获取指令模板;以及所述注入单元,用于将所述实体信息和/或所述语义关系注入所述指令模板,得到可执行的指令。

27、根据本公开的实施例,其中,所述指令执行模块包括指令执行子模块,所述指令执行子模块,用于按照所述执行顺序,执行所述m个可执行的指令,得到返回结果。

28、本公开的第三方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得一个或多个处理器执行上述数据操作方法。

29、本公开的第四方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述数据操作方法。

30、在本公开的实施例中,为了解决现有技术中存在的数据操作困难以及数据操作语句学习成本高的技术问题。本公开的实施例通过用户提交涉及数据操作的提交信息,该提交信息为自然语言,通过自然语言处理提炼出提交信息中关键的涉及数据操作信息,得到多个字符串片段,每个字符串片段包含有实体信息和语义关系,进而将这些字符串片段转化为数据库可识别的数据库操作指令,最后,通过执行数据库操作指令对数据执行相应的逻辑操作,使用户无需掌握确切针对不同数据库编写不同的数据操作语句,仅需使用自然语言输入,便可转化为相应的数据操作语句,进而完成数据操作,优化操作体验,打破跨系统查询的壁垒。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1