本发明涉及短信信息处理,更具体地说,它涉及一种终端信息处理方法。
背景技术:
1、传统的短信内容合法性的监控方法包括:一、对大规模发送端进行监控,通过监控其发送行为或者是人工对其发送内容进行查询判断;由于短信发送的途径多样,通过伪基站或终端转发的形式来进行包含非法内容的短信的传播能够逃避这一方式的监控;二、查询短信内容中是否包含已被标记为非法内容的短信内容;短链接、图像、数字等类型的非法内容没有相关联的上下文语义,在进行内容对比时一般是采用一致性判断,通过对非法内容的简单变换即可逃避这一方式的监控。
技术实现思路
1、本发明提供一种终端信息处理方法,解决相关技术中通过对非法内容的简单变换逃避短信内容合法性监控的技术问题。
2、本发明提供了一种终端信息处理方法,包括以下步骤:步骤101,收集短信的短信信息,短信信息包括短信内容、短信发送端、短信接收端;步骤102,将短信内容按照内容类型进行划分,生成内容块,相邻的内容块的内容类型不同;步骤103,基于短信信息为每个内容块生成发送路径信息;步骤104,基于内容块以及内容块的发送路径信息来生成内容块第一特征;步骤105,将同一短信信息的内容块第一特征合成生成内容块第一矩阵,输入第一神经网络,第一神经网络包括第一隐藏层,多个第一隐藏层串联之后连接第二隐藏层,第一隐藏层的计算包括:,其中、、分别表示第s个第一隐藏层的输出特征、第三变换特征、连接矩阵,的第a行第b列的元素表示为,;是第s个第一隐藏层的第一变换特征的第a个行向量,是第s个第一隐藏层的第二变换特征的第b个行向量,α表示膨胀参数。
3、,,,表示第s个第一隐藏层的输入,s大于1时,表示第s-1个第一隐藏层的输出特征,表示内容块第一矩阵,、、分别表示第一、二、三权重参数。
4、第二隐藏层包括多个串联的lstm(长短期记忆网络)单元,第i个lstm单元输入的第i个行向量,输出第i个内容块的合法性监控向量,为串联的最后一个第一隐藏层的输出。
5、步骤106,将待监控的短信的内容块的合法性监控向量与包含非法内容的内容块的合法性监控向量进行对比判断待监控的短信的内容块是否包含非法内容。
6、进一步地,短信信息是从无线终端收集的。
7、进一步地,将待监控的短信的内容块的合法性监控向量与包含非法内容的内容块的合法性监控向量进行相似度计算,如果相似度大于设定的第一相似度阈值,则判断待监控的短信的内容块包含非法内容,否则判断待监控的短信的内容块不包含非法内容。
8、进一步地,生成内容块第一特征的方法包括:将内容块和内容块的发送路径信息矢量化之后拼接获得内容块第一特征。
9、进一步地,发送路径以无线终端为节点,一个内容块的发送路径上的相邻的两个无线终端中的一个无线终端向另一个无线终端发送了包含该内容块的短信;发送路径信息包括发送路径上的无线终端的id信息。
10、进一步地,发送路径信息矢量化的方法包括:将发送路径信息输入卷积神经网络,通过卷积神经网络输出发送路径信息的矢量
11、发送路径信息输入卷积神经网络时需要先进行矩阵化,矩阵化后生成的路径信息矩阵的行向量对应发送路径信息上的一个无线终端的id信息。
12、卷积神经网络采用膨胀卷积。
13、进一步地,该卷积神经网络训练时其输出连接第一分类器,第一分类器的两个分类标签分别是内容块非法和内容块合法,内容块非法的标签含义表示输入的发送路径信息对应的内容块包含非法内容。
14、进一步地,内容块第一矩阵中的一个行向量对应于一个内容块第一特征;内容块第一矩阵中的行向量的顺序与短信信息中的内容块的顺序相同。
15、进一步地,对连接矩阵的元素值进行归一化处理,具体的,,其中和分别表示归一化处理之前的连接矩阵的第a行第b列和第c列的元素,n表示连接矩阵的列数,表示归一化处理之后的连接矩阵的第a行第b列的元素。
16、本发明提供了一种终端信息处理系统,用于实施上述的一种终端信息处理方法,该终端信息处理系统包括:内容块生成模块,其基于短信信息生成内容块。
17、发送路径信息生成模块,其基于短信信息为每个内容块生成发送路径信息。
18、矢量化模块,其用于对内容块以及内容块的发送路径信息进行矢量化,然后对内容块以及同一内容块的发送路径信息的矢量化的结果进行拼接获得内容块第一特征。
19、合法性监控向量生成模块,其用于生成短信的内容块的合法性监控向量。
20、合法性判断模块,其用于判断短信的内容是否包含非法内容。
21、本发明的有益效果在于:本发明通过内容块的划分以及内容块的路径信息的追索来生成短信内容的特征信息,并结合神经网络生成与短信内部信息以及发送路径信息综合的内容块合法性监控向量,通过与包含非法内容的内容块的合法性监控向量对比判断内容块是否包含非法内容,能够避免通过对非法内容的简单变换以及终端转发来逃避短信内容合法性的监控。能够减少非法短信内容的传播。
1.一种终端信息处理方法,其特征在于,包括以下步骤:步骤101,收集短信的短信信息,短信信息包括短信内容、短信发送端、短信接收端;步骤102,将短信内容按照内容类型进行划分,生成内容块,相邻的内容块的内容类型不同;步骤103,基于短信信息为每个内容块生成发送路径信息;步骤104,基于内容块以及内容块的发送路径信息来生成内容块第一特征;步骤105,将同一短信信息的内容块第一特征合成生成内容块第一矩阵,输入第一神经网络,第一神经网络包括第一隐藏层,多个第一隐藏层串联之后连接第二隐藏层,第一隐藏层的计算包括:,其中、、分别表示第s个第一隐藏层的输出特征、第三变换特征、连接矩阵,的第a行第b列的元素表示为,;是第s个第一隐藏层的第一变换特征的第a个行向量,是第s个第一隐藏层的第二变换特征的第b个行向量,α表示膨胀参数;
2.根据权利要求1所述的一种终端信息处理方法,其特征在于,短信信息是从无线终端收集的。
3.根据权利要求1所述的一种终端信息处理方法,其特征在于,将待监控的短信的内容块的合法性监控向量与包含非法内容的内容块的合法性监控向量进行相似度计算,如果相似度大于设定的第一相似度阈值,则判断待监控的短信的内容块包含非法内容,否则判断待监控的短信的内容块不包含非法内容。
4.根据权利要求1所述的一种终端信息处理方法,其特征在于,生成内容块第一特征的方法包括:将内容块和内容块的发送路径信息矢量化之后拼接获得内容块第一特征。
5.根据权利要求1所述的一种终端信息处理方法,其特征在于,发送路径以无线终端为节点,一个内容块的发送路径上的相邻的两个无线终端中的一个无线终端向另一个无线终端发送了包含该内容块的短信;发送路径信息包括发送路径上的无线终端的id信息。
6.根据权利要求1所述的一种终端信息处理方法,其特征在于,发送路径信息矢量化的方法包括:将发送路径信息输入卷积神经网络,通过卷积神经网络输出发送路径信息的矢量
7.根据权利要求6所述的一种终端信息处理方法,其特征在于,该卷积神经网络训练时其输出连接第一分类器,第一分类器的两个分类标签分别是内容块非法和内容块合法,内容块非法的标签含义表示输入的发送路径信息对应的内容块包含非法内容。
8.根据权利要求1所述的一种终端信息处理方法,其特征在于,内容块第一矩阵中的一个行向量对应于一个内容块第一特征;内容块第一矩阵中的行向量的顺序与短信信息中的内容块的顺序相同。
9.根据权利要求1所述的一种终端信息处理方法,其特征在于,对连接矩阵的元素值进行归一化处理,具体的,,其中和分别表示归一化处理之前的连接矩阵的第a行第b列和第c列的元素,n表示连接矩阵的列数,表示归一化处理之后的连接矩阵的第a行第b列的元素。
10.一种终端信息处理系统,其特征在于,其用于实施如权利要求1-9任一所述的一种终端信息处理方法,一种终端信息处理系统包括: