适用于流应用的以双因果和非因果受限自注意力进行序列到序列处理的人工智能系统的制作方法

文档序号：37126227发布日期：2024-02-22 21:38阅读：来源：国知局

技术特征：

1.一种适用于数据流应用的人工智能(ai)系统，该ai系统包括：至少一个处理器；以及存储有指令的存储器，所述指令在由所述至少一个处理器执行时使得所述ai系统：

2.根据权利要求1所述的ai系统，其中，解释当前帧所关注的所述因果帧是前瞻帧，而所关注的其余帧是所述非因果帧。

3.根据权利要求2所述的ai系统，其中，所述双自注意力模块包括输出在没有前瞻的情况下推导的因果输出帧序列和相对于表示当前时间的输入帧以预定大小的前瞻推导的非因果输出帧序列的双自注意力；并且其中，所述输出序列包括所述因果输出帧和所述非因果输出帧之一或组合。

4.根据权利要求3所述的ai系统，其中，所述输出序列仅包括所述非因果输出帧序列。

5.根据权利要求3所述的ai系统，

6.根据权利要求3所述的ai系统，

7.一种包括根据权利要求3所述的ai系统的语音识别系统，该语音识别系统包括：

8.根据权利要求7所述的语音识别系统，该语音识别系统还包括：

9.根据权利要求8所述的语音识别系统，其中，所述语音输入的识别是所述语音输入的转录。

10.一种包括根据权利要求3所述的ai系统的声学事件检测系统，该语音识别系统包括：

11.一种音频处理方法，该音频处理方法包括以下步骤：

12.根据权利要求11所述的音频处理方法，其中，解释当前帧所关注的所述因果帧是前瞻帧，而所关注的其余帧是所述非因果帧。

13.根据权利要求12所述的音频处理方法，其中，所述双自注意力模块包括输出在没有前瞻的情况下推导的因果输出帧序列和相对于表示当前时间的输入帧以预定大小的前瞻推导的非因果输出帧序列的双自注意力；并且其中，所述输出序列包括所述因果输出帧序列和所述非因果输出帧序列之一或组合。

14.根据权利要求13所述的音频处理方法，其中，所述输出序列仅包括所述非因果输出帧序列。

15.根据权利要求13所述的音频处理方法，

16.根据权利要求13所述的音频处理方法，

17.一种具体实现有程序的非暂时性计算机可读存储介质，所述程序能够由处理器执行以用于执行一种方法，该方法包括以下步骤：

技术总结
本公开提供了一种适用于流应用的以注意力进行序列到序列建模的人工智能(AI)系统。该AI系统包括：至少一个处理器；以及存储有指令的存储器，所述指令在由处理器执行时使得AI系统通过深度神经网络(DNN)的层处理输入帧序列中的各个输入帧，以生成输出序列。DNN的至少一些层包括具有关注非因果帧和因果帧的双非因果和因果架构的双自注意力模块。此外，该AI系统渲染输出序列。

技术研发人员：N·莫里茨,堀贵明,J·勒鲁克斯
受保护的技术使用者：三菱电机株式会社
技术研发日：
技术公布日：2024/2/21

完整全部详细技术资料下载

当前第2页1 2