信息交互方法、装置、电子设备以及存储介质与流程

文档序号:37309806发布日期:2024-03-13 20:57阅读:12来源:国知局
信息交互方法、装置、电子设备以及存储介质与流程

本公开涉及人工智能,具体为计算机视觉、深度学习、大模型等,可应用于人工智能的内容生成、人机交互等场景。


背景技术:

1、随着计算机视觉技术的快速发展,可以通过计算机视觉技术处理照片、视频等图像,例如可以基于如目标检测、图像分类等计算机视觉功能处理图像。计算机视觉技术被广泛地应用于如影视产品制作、智能安防等场景中。


技术实现思路

1、本公开提供了一种信息交互方法、装置、电子设备以及存储介质。

2、根据本公开的一方面,提供了一种信息交互方法,包括:响应于获取到需求描述文本,利用大语言模型处理需求描述文本,得到与需求描述文本表征的图像处理意图相匹配的视觉任务属性,其中,需求描述文本与待处理图像相关联;根据视觉任务属性,确定与待处理图像相关的图像处理结果;根据图像处理结果生成反馈信息;以及在交互界面展示反馈信息。

3、根据本公开的另一方面,提供了一种信息交互装置,包括:视觉任务属性获得模块,用于响应于获取到需求描述文本,利用大语言模型处理需求描述文本,得到与需求描述文本表征的图像处理意图相匹配的视觉任务属性,其中,需求描述文本与待处理图像相关联;图像处理结果确定模块,用于根据视觉任务属性,确定与待处理图像相关的图像处理结果;反馈信息生成模块,用于根据图像处理结果生成反馈信息;以及展示模块,用于在交互界面展示反馈信息。

4、根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行根据本公开实施例提供的方法。

5、根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据本公开实施例提供的方法。

6、根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据本公开实施例提供的方法。

7、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。



技术特征:

1.一种信息交互方法,包括:

2.根据权利要求1所述的方法,其中,所述根据所述视觉任务属性,确定与所述待处理图像相关的图像处理结果包括:

3.根据权利要求2所述的方法,其中,所述视觉任务属性包括多个子任务属性,以及多个所述子任务属性之间的执行依赖关系,所述视觉任务包括与所述子任务属性对应的子视觉任务,所述服务资源与所述子任务属性相关联;

4.根据权利要求3所述的方法,其中,所述根据所述任务执行结果,得到所述图像处理结果包括:

5.根据权利要求3所述的方法,其中,所述子视觉任务包括以下至少一项:

6.根据权利要求1所述的方法,其中,所述根据所述图像处理结果生成反馈信息包括:

7.根据权利要求6所述的方法,其中,所述利用所述大语言模型处理所述图像处理结果,得到处理结果描述文本包括:

8.根据权利要求6所述的方法,其中,所述需求描述丈本是根据目标对象针对所述交互界面的输入操作获取到的;

9.根据权利要求1所述的方法,还包括:

10.根据权利要求1所述的方法,还包括:

11.根据权利要求1所述的方法,其中,所述根据所述视觉任务属性,确定与所述待处理图像相关的图像处理结果包括:

12.根据权利要求11所述的方法,还包括:

13.根据权利要求11所述的方法,还包括:

14.一种信息交互装置,包括:

15.根据权利要求14所述的装置,其中,所述图像处理结果确定模块包括:

16.根据权利要求15所述的装置,其中,所述视觉任务属性包括多个子任务属性,以及多个所述子任务属性之间的执行依赖关系,所述视觉任务包括与所述子任务属性对应的子视觉任务,所述服务资源与所述子任务属性相关联;

17.根据权利要求16所述的装置,其中,所述图像处理结果获得子模块包括:

18.根据权利要求16所述的装置,其中,所述子视觉任务包括以下至少一项:

19.根据权利要求14所述的装置,其中,所述反馈信息生成模块包括:

20.根据权利要求19所述的装置,其中,所述处理结果描述文本获得子模块包括:

21.根据权利要求19所述的装置,其中,所述需求描述文本是根据目标对象针对所述交互界面的输入操作获取到的;

22.根据权利要求14所述的装置,还包括:

23.根据权利要求14所述的装置,其中,所述装置还包括:

24.根据权利要求14所述的装置,其中,所述图像处理结果确定模块包括:

25.根据权利要求24所述的装置,还包括:

26.根据权利要求24所述的装置,还包括:

27.一种电子设备,包括:

28.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1至13中任一项所述的方法。

29.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1至13中任一项所述的方法。


技术总结
本公开提供了信息交互方法、装置、电子设备以及存储介质,涉及人工智能技术领域,具体为计算机视觉、深度学习、大模型等技术领域,可应用于人工智能的内容生成、人机交互等场景。具体实现方案为:响应于获取到需求描述文本,利用大语言模型处理需求描述文本,得到与需求描述文本表征的图像处理意图相匹配的视觉任务属性,其中,需求描述文本与待处理图像相关联;根据视觉任务属性,确定与待处理图像相关的图像处理结果;根据图像处理结果生成反馈信息;以及在交互界面展示反馈信息。

技术研发人员:岳海潇
受保护的技术使用者:北京百度网讯科技有限公司
技术研发日:
技术公布日:2024/3/12
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1