语音信息的处理方法、装置、电子设备和存储介质与流程

文档序号：35145996发布日期：2023-08-18 03:11阅读：35来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本公开涉及人工智能，尤其涉及语音技术、自然语言处理等领域。

背景技术：

1、随着操作系统的发展，用户的输入方式从最早的命令行式操作逐渐发展为鼠标可视化操作，再到触摸屏操作。但是在一些场景下，用户不方便进行触摸屏幕、键盘输入、鼠标输入等操作，比如驾车中、烹饪中等等。所以，所见即可说功能逐渐有了雏形。

2、所见即可说功能是指用户在屏幕上看到文字后，可以直接以自然语言的方式说出对应的语音，所见即可说模块基于语音识别技术、自然语言处理技术确定用户的意图，并找到最匹配的界面控件进行操作。目前，所见即可说功能的稳定性有待提升。

技术实现思路

1、本公开提供了一种语音信息的处理方法、装置、电子设备和存储介质。

2、根据本公开的一方面，提供了一种语音信息的处理方法，包括：

3、显示目标界面，并接收语音信息；其中，目标界面设置有自动隐藏功能区；

4、在语音信息指示对自动隐藏功能区中的目标控件进行操作的情况下，执行预定处理；其中，该预定处理用于切换自动隐藏功能区的显示状态；

5、获取目标界面在切换所述自动隐藏功能区的显示状态后的第一控件树；第一控件树包含所述目标界面上显示的各个控件的相关信息；

6、判断第一控件树是否包含目标控件的相关信息，并基于判断结果，对目标控件进行操作。

7、根据本公开的另一方面，提供了一种语音信息的处理装置，包括：

8、交互模块，用于显示目标界面，并接收语音信息；其中，目标界面设置有自动隐藏功能区；

9、预定处理模块，用于在语音信息指示对自动隐藏功能区中的目标控件进行操作的情况下，执行预定处理；其中，预定处理用于切换自动隐藏功能区的显示状态；

10、第一获取模块，用于获取目标界面在切换所述自动隐藏功能区的显示状态后的第一控件树；第一控件树包含所述目标界面上显示的各个控件的相关信息；

11、操作模块，用于判断第一控件树是否包含目标控件的相关信息，并基于判断结果，对目标控件进行操作。

12、根据本公开的另一方面，提供了一种电子设备，包括：

13、至少一个处理器；以及

14、与该至少一个处理器通信连接的存储器；其中，

15、该存储器存储有可被该至少一个处理器执行的指令，该指令被该至少一个处理器执行，以使该至少一个处理器能够执行本公开实施例中任一的方法。

16、根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，该计算机指令用于使该计算机执行根据本公开实施例中任一的方法。

17、根据本公开的另一方面，提供了一种计算机程序产品，包括计算机程序，该计算机程序在被处理器执行时实现根据本公开实施例中任一的方法。

18、根据本公开实施例的技术方案，可以避免在自动隐藏功能区隐藏的情况下无法操作目标控件的问题，确保能够准确操作目标控件，提升所见即可说功能的稳定性。

19、应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

技术特征：

1.一种语音信息的处理方法，包括：

2.根据权利要求1所述的方法，其中，所述基于判断结果，对所述目标控件进行操作，包括：

3.根据权利要求1或2所述的方法，其中，所述基于判断结果，对所述目标控件进行操作，包括：

4.根据权利要求1-3中任一项所述的方法，还包括：

5.根据权利要求1-4中任一项所述的方法，其中，所述自动隐藏功能区的自动隐藏计时的最大时长大于对所述第一控件树的处理用时。

6.根据权利要求1-5中任一项所述的方法，其中，对所述目标控件进行操作，包括：

7.根据权利要求1-6中任一项所述的方法，其中，所述预定处理包括对所述目标界面中的主体内容区域进行模拟点击。

8.一种语音信息的处理装置，包括：

9.根据权利要求8所述的装置，其中，所述操作模块用于：

10.根据权利要求8或9所述的装置，其中，所述操作模块用于：

11.根据权利要求8-10中任一项所述的装置，还包括：

12.根据权利要求8-11中任一项所述的装置，其中，所述自动隐藏功能区的自动隐藏计时的最大时长大于对所述第一控件树的处理用时。

13.根据权利要求8-12中任一项所述的装置，其中，所述操作模块用于：

14.根据权利要求8-13中任一项所述的装置，其中，所述预定处理包括对所述目标界面中的主体内容区域进行模拟点击。

15.一种电子设备，包括：

16.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-7中任一项所述的方法。

17.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-7中任一项所述的方法。

技术总结
本公开提供了一种语音信息的处理方法、装置、电子设备和存储介质，涉及人工智能领域，尤其涉及语音技术、自然语言处理等领域。具体实现方案为：显示目标界面，并接收语音信息，所述目标界面设置有自动隐藏功能区；在语音信息指示对目标控件进行操作的情况下，执行预定处理，预定处理用于切换自动隐藏功能区的显示状态；获取目标界面在切换自动隐藏功能区的显示状态后的第一控件树；判断所述第一控件树是否包含所述目标控件的相关信息，并基于判断结果，对目标控件进行操作。根据本公开，可以避免在自动隐藏功能区隐藏的情况下无法操作目标控件的问题，确保能够准确操作目标控件，提升所见即可说功能的稳定性。

技术研发人员：华鲸州,欧阳能钧,刘嵘
受保护的技术使用者：阿波罗智联（北京）科技有限公司
技术研发日：
技术公布日：2024/1/14

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：华鲸州欧阳能钧刘嵘
技术所有人：阿波罗智联（北京）科技有限公司
我是此专利的发明人

上一篇：一种用于液压泵的异常磨损监测装置的制作方法
上一篇：一种高润滑性切削液的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。