1.一种适用于数据流应用的人工智能(ai)系统,该ai系统包括:至少一个处理器;以及存储有指令的存储器,所述指令在由所述至少一个处理器执行时使得所述ai系统:
2.根据权利要求1所述的ai系统,其中,解释当前帧所关注的所述因果帧是前瞻帧,而所关注的其余帧是所述非因果帧。
3.根据权利要求2所述的ai系统,其中,所述双自注意力模块包括输出在没有前瞻的情况下推导的因果输出帧序列和相对于表示当前时间的输入帧以预定大小的前瞻推导的非因果输出帧序列的双自注意力;并且其中,所述输出序列包括所述因果输出帧和所述非因果输出帧之一或组合。
4.根据权利要求3所述的ai系统,其中,所述输出序列仅包括所述非因果输出帧序列。
5.根据权利要求3所述的ai系统,
6.根据权利要求3所述的ai系统,
7.一种包括根据权利要求3所述的ai系统的语音识别系统,该语音识别系统包括:
8.根据权利要求7所述的语音识别系统,该语音识别系统还包括:
9.根据权利要求8所述的语音识别系统,其中,所述语音输入的识别是所述语音输入的转录。
10.一种包括根据权利要求3所述的ai系统的声学事件检测系统,该语音识别系统包括:
11.一种音频处理方法,该音频处理方法包括以下步骤:
12.根据权利要求11所述的音频处理方法,其中,解释当前帧所关注的所述因果帧是前瞻帧,而所关注的其余帧是所述非因果帧。
13.根据权利要求12所述的音频处理方法,其中,所述双自注意力模块包括输出在没有前瞻的情况下推导的因果输出帧序列和相对于表示当前时间的输入帧以预定大小的前瞻推导的非因果输出帧序列的双自注意力;并且其中,所述输出序列包括所述因果输出帧序列和所述非因果输出帧序列之一或组合。
14.根据权利要求13所述的音频处理方法,其中,所述输出序列仅包括所述非因果输出帧序列。
15.根据权利要求13所述的音频处理方法,
16.根据权利要求13所述的音频处理方法,
17.一种具体实现有程序的非暂时性计算机可读存储介质,所述程序能够由处理器执行以用于执行一种方法,该方法包括以下步骤: