使用无监督机器学习来定位用于回声定位的空间化声音节点的制作方法

文档序号：26008047发布日期：2021-07-23 21:27阅读：来源：国知局

技术特征：

1.一种用于生成回声定位声音以帮助用户导航三维空间的系统，包括：

处理系统，包括一个或多个处理器和存储器，所述存储器具有存储在其上的计算机可执行指令，所述计算机可执行指令由所述一个或多个处理器执行时，使所述处理系统：

接收来自用户的输入以生成用以导航三维空间的回声定位声音；

至少基于接收到的所述输入：

使用无监督机器学习算法将所述三维空间的数字表示分段为一个或多个深度平面；

针对每个深度平面，确定针对特定深度平面内的每个对象的对象分段；

根据由经确定的所述分段限定的每个对象的深度级别和表面积来确定多个回声声音节点的位置；以及

生成所述回声定位声音，所述回声定位声音包括来自源于经确定的所述位置的每个回声声音节点的空间化声音。

2.根据权利要求1所述的系统，其中所述无监督机器学习算法包括聚类算法，由所述聚类算法标识的每个簇包括深度级别。

3.根据权利要求1所述的系统，所述存储器还具有存储在其上的计算机可执行指令，所述计算机可执行指令当由所述一个或多个处理器执行时使所述处理系统：

捕获所述三维空间的所述数字表示。

4.根据权利要求3所述的系统，其中所述三维空间的所述数字表示使用以下中的至少一个来捕获：数码相机、三维相机或深度相机。

5.根据权利要求1所述的系统，其中所述回声定位声音由虚拟现实耳机、混合现实耳机或增强现实耳机中的至少一个来生成。

6.根据权利要求1所述的系统，其中所述回声定位声音使用基于声道的音频输出、球形声音表示或基于对象的音频输出中的至少一个来生成。

7.根据权利要求1所述的系统，其中所述输入基于所述用户的手势或运动中的至少一个来推断。

8.根据权利要求1所述的系统，其中所述输入基于所述用户的手势。

9.根据权利要求1所述的系统，其中所述三维空间包括计算机生成的游戏体验。

10.根据权利要求1所述的系统，其中所述三维空间包括物理环境。

11.一种生成回声定位声音以帮助用户导航三维空间的方法，包括：

接收来自所述用户的输入以生成用以导航所述三维空间的回声定位声音；

至少基于接收到的所述输入：

使用无监督机器学习算法将所述三维空间的数字表示分段为一个或多个深度平面；

针对每个深度平面，确定针对特定深度平面内的每个对象的对象分段；

根据由经确定的所述分段所限定的每个对象的深度级别和表面积来确定多个回声声音节点的位置；以及

生成所述回声定位声音，所述回声定位声音包括来自源于经确定的所述位置的每个回声声音节点的空间化声音。

12.根据权利要求11所述的方法，其中所述无监督机器学习算法包括采用肘部法则的k均值聚类算法，所述k均值聚类算法检查作为簇数目的函数的方差百分比以确定多个簇。

13.根据权利要求11所述的方法，其中所述三维空间包括计算机生成的游戏体验。

14.一种存储计算机可读指令的计算机存储介质，所述计算机可读指令在被执行时使计算设备：

接收来自用户的输入以生成用以导航三维空间的回声定位声音；

至少基于接收到的所述输入：

使用无监督机器学习算法将所述三维空间的数字表示分段为一个或多个深度平面；

针对每个深度平面，确定针对特定深度平面内的每个对象的对象分段；

根据由经确定的所述分段所限定的每个对象的深度级别和表面积来确定多个回声声音节点的位置；以及

生成所述回声定位声音，所述回声定位声音包括来自源于经确定的所述位置的每个回声声音节点的空间化声音。

15.根据权利要求14所述的计算机存储介质，其中所述三维空间包括计算机生成的游戏体验。

技术总结
本文中所描述的是用于生成回声定位声音以帮助没有视力或视力受限的用户导航三维空间(例如，物理环境、计算机游戏体验和/或虚拟现实体验)的系统。从用户接收输入以生成用以导航三维空间的回声定位声音。至少基于接收到的输入，使用无监督机器学习算法将三维空间的数字表示分段为一个或多个深度平面。针对每个深度平面，针对特定深度平面内的每个对象，确定对象分段；根据由经确定的分段所限定的每个对象的深度级别和表面积来确定多个回声声音节点的位置；以及生成包括来自源于经确定的定位的每个回声声音节点的空间化声音的回声定位声音。

技术研发人员：S·S·阿拉博卢;W·J·德雷维斯;B·M·阿泰加;N·巴拉钱德尔
受保护的技术使用者：微软技术许可有限责任公司
技术研发日：2019.11.07
技术公布日：2021.07.23

完整全部详细技术资料下载

当前第2页1 2