用于神经语言行为识别系统的词法分析器的制作方法

文档序号：26007538发布日期：2021-07-23 21:26阅读：来源：国知局

技术特征：

1.一种方法，包括：

经由处理器从图形处理单元gpu接收第一符号流，所述第一符号流中的每个符号与从标准化数据生成的向量簇相关联，所述标准化数据与包括对象的表示的多个视频帧相关联；

经由所述处理器，基于具有多个级别的分级学习模型，识别统计上显著的多个机器可读单词，所述多个级别中的每个级别与不同的单词长度相关联，所述多个机器可读单词中的每个机器可读单词表示所述第一符号流中重现的符号组合；

经由所述处理器，计算所述多个机器可读单词中的每个机器可读单词的罕见性分数以产生多个罕见性分数，所述计算是基于该机器可读单词的统计显著性的；

经由所述处理器，评估第二符号流中的机器可读单词以从所述多个罕见性分数中识别所述第二符号流中的机器可读单词的罕见性分数；

基于第二符号流中的机器可读单词的罕见性分数，识别所述对象的异常活动；以及

响应于识别所述对象的所述异常活动，向输出设备发送警报数据，所述警报数据包括所述异常活动的指示。

2.如权利要求1所述的方法，还包括：输出所述多个机器可读单词的表示以及与所述多个机器可读单词中的每个机器可读单词相关联的统计信息。

3.如权利要求1所述的方法，其中，对于所述多个机器可读单词中的每个机器可读单词，该机器可读单词的统计显著性是基于在第一符号流中观察到该机器可读单词的频率而识别的。

4.如权利要求1所述的方法，其中，所述多个机器可读单词是第一多个机器可读单词，所述方法还包括：

基于所述分级学习模型，从所述第二符号流中的符号的组合中确定第二多个机器可读单词；以及

经由所述分级学习模型，基于所述第二多个机器可读单词更新与所述第一多个机器可读单词相关联的统计信息。

5.如权利要求1所述的方法，还包括从所述多个机器可读单词生成特征模型，所述特征模型包括统计上显著的所述多个机器可读单词中的机器可读单词的概括结果。

6.如权利要求1所述的方法，还包括通过以下操作基于所述多个机器可读单词生成特征模型：

识别与关联于所述第一符号流中的每个符号的向量簇相关联的特征；以及

基于所述特征对所述多个机器可读单词中的一个或多个机器可读单词进行概括。

7.如权利要求1所述的方法，其中，识别统计上显著的所述多个机器可读单词是基于与多个候选单词中的每个候选单词相关联的统计信息的。

8.一种存储指令的非暂态计算机可读存储介质，所述指令当由处理器执行时，使所述处理器：

从图形处理单元gpu接收第一符号流，每个符号与从标准化数据生成的向量簇相关联，所述标准化数据与包括对象的表示的多个视频帧相关联；

基于具有多个级别的分级学习模型，识别统计上显著的多个机器可读单词，所述多个级别中的每个级别与不同的单词长度相关联，所述多个机器可读单词中的每个机器可读单词表示所述第一符号流中重现的符号组合；

计算所述多个机器可读单词中的每个机器可读单词的罕见性分数以产生多个罕见性分数，所述计算是基于该机器可读单词的统计显著性的；

评估第二符号流中的机器可读单词以从所述多个罕见性分数中识别所述第二符号流中的机器可读单词的罕见性分数；

基于第二符号流中的机器可读单词的罕见性分数，识别所述对象的异常活动；以及

响应于识别所述对象的所述异常活动，向输出设备发送警报数据，所述警报数据包括所述异常活动的指示。

9.如权利要求8所述的计算机可读存储介质，还存储有指令，所述指令当由所述处理器执行时，使所述处理器输出所述多个机器可读单词的表示以及与所述多个机器可读单词中的每个机器可读单词相关联的统计信息。

10.如权利要求8所述的计算机可读存储介质，其中，所述统计显著性是基于在第一符号流中观察到机器可读单词的频率而识别的。

11.如权利要求8所述的计算机可读存储介质，其中，所述多个机器可读单词是第一多个机器可读单词，所述计算机可读存储介质还存储有指令，所述指令当由所述处理器执行时，使所述处理器：

基于所述分级学习模型，从所述第二符号流中的符号的组合中确定第二多个机器可读单词；以及

经由所述分级学习模型，基于所述第二多个机器可读单词更新与所述第一多个机器可读单词相关联的统计信息。

12.如权利要求8所述的计算机可读存储介质，还存储有指令，所述指令当由所述处理器执行时，使所述处理器从所述多个机器可读单词生成特征模型，所述特征模型包括统计上显著的所述多个机器可读单词中的机器可读单词的概括结果。

13.如权利要求8所述的计算机可读存储介质，还存储有指令，所述指令当由所述处理器执行时，使所述处理器通过以下操作基于所述多个机器可读单词生成特征模型：

识别与关联于所述第一符号流中的每个符号的向量簇相关联的特征；以及

基于所述特征对所述第一多个机器可读单词中的一个或多个机器可读单词进行概括。

14.如权利要求8所述的计算机可读存储介质，其中，用于识别统计上显著的所述多个机器可读单词的指令包括用于评估多个候选单词中的每个候选单词的统计信息的指令。

15.一种系统，包括：

处理器；

存储器，所述存储器存储处理器可执行的指令，所述处理器可执行的指令在由所述处理器执行时，使所述处理器：

从图形处理单元gpu接收第一符号流，每个符号与从标准化数据生成的向量簇相关联，所述标准化数据与包括对象的表示的多个视频帧相关联；

计算所述多个机器可读单词中的每个机器可读单词的罕见性分数以产生多个罕见性分数，所述计算是基于该机器可读单词的统计显著性的；

评估第二符号流中的机器可读单词以从所述多个罕见性分数中识别所述第二符号流中的机器可读单词的罕见性分数；

基于第二符号流中的机器可读单词的罕见性分数，识别所述对象的异常活动；以及

响应于识别所述对象的所述异常活动，向输出设备发送警报数据，所述警报数据包括所述异常活动的指示。

16.如权利要求15所述的系统，其中，所述存储器还存储有指令，所述指令当由所述处理器执行时，使所述处理器输出所述多个机器可读单词的表示以及与所述多个机器可读单词中的每个机器可读单词相关联的统计信息。

17.如权利要求15所述的系统，其中，所述多个机器可读单词是第一多个机器可读单词，所述存储器还存储有指令，所述指令当由所述处理器执行时，使所述处理器：

基于所述分级学习模型，从所述第二符号流中的符号的组合中确定第二多个机器可读单词；以及

经由所述分级学习模型，基于所述第二多个机器可读单词更新与所述第一多个机器可读单词相关联的统计信息。

18.如权利要求15所述的系统，其中，所述存储器还存储有指令，所述指令当由所述处理器执行时，使所述处理器从所述多个机器可读单词生成特征模型，所述特征模型包括统计上显著的所述多个机器可读单词中的机器可读单词的概括结果。

19.如权利要求15所述的系统，其中，所述存储器还存储有指令，所述指令当由所述处理器执行时，使所述处理器通过以下操作基于所述多个机器可读单词生成特征模型：

识别与关联于所述第一符号流中的每个符号的向量簇相关联的特征；

基于所述特征对所述第一多个机器可读单词中的一个或多个机器可读单词进行概括。

20.如权利要求15所述的系统，其中，用于识别统计上显著的所述多个机器可读单词的指令包括用于评估多个候选单词中的每个候选单词的统计信息的指令。

技术总结
本公开涉及用于神经语言行为识别系统的词法分析器。具体公开了用于从基于输入数据生成的符号的组合构建单词的词典的技术。神经语言行为识别系统包括生成描述从源输入的数据(例如，视频数据、SCADA数据等)的语言模型的神经语言模块。为了生成用于语言模型的单词，神经语言模块中的词法分析器组件接收符号流，每个符号基于从输入数据生成的标准化向量的有序流而生成。词法分析器组件基于具有一个或多个级别的分级学习模型从符号的组合确定单词。每个级别指示要在该级别处识别的单词的长度。为在每个级别处识别出的单词评估统计信息。词法分析器组件识别单词中具有统计显著性的一个或多个单词。

技术研发人员：徐刚;萧铭俊;杨韬;W·K·科布
受保护的技术使用者：智慧人工智能股份有限公司
技术研发日：2015.12.10
技术公布日：2021.07.23

完整全部详细技术资料下载

当前第2页1 2