一种垃圾邮件识别方法及装置与流程

文档序号:12131884阅读:336来源:国知局
一种垃圾邮件识别方法及装置与流程

本发明涉及数据处理领域,具体涉及一种垃圾邮件识别方法及装置。



背景技术:

随着互联网的不断发展,电子邮件的使用越来越普遍,以电子邮件作为载体的商业宣传也得到了广泛的应用,同时也导致了垃圾邮件的泛滥。垃圾邮件往往需要占用大量资源,且具有投递对象不准确、强制投递以及含有大量不实信息等问题。所以,垃圾邮件一直是用户深恶痛绝的互联网产物。

为了阻止垃圾邮件,目前的电子邮件系统中嵌入了各种识别垃圾邮件的技术,例如白名单、黑名单、基于内容的过滤等等。但是现有的识别垃圾邮件方法基本上只是基于关键字或词频对垃圾邮件进行识别,角度单一,忽略了其他影响垃圾邮件识别准确性的原因,导致垃圾邮件的识别准确度不够。



技术实现要素:

本发明提供了一种垃圾邮件识别方法及装置,能够提高垃圾邮件识别的准确度。

本发明提供了一种垃圾邮件识别方法,所述方法包括:

提取待识别邮件中的文本,并将所述文本以词为单位进行分割,得到词序列;

根据预先获取的词与特征向量的对应关系,将所述词序列中的词转换为与所述词具有对应关系的特征向量,得到向量序列,所述向量序列中包括分别与所述词序列中各个词具有对应关系的特征向量;

将所述向量序列中的特征向量以预设标准进行分组后,得到若干向量组;

将所述向量组作为分类器的输入参数,以使所述分类器结合上下文相关性对所述待识别邮件进行分类,得到分类结果,所述分类结果用于确定所述待识别邮件是否属于垃圾邮件。

优选地,所述将所述向量序列中的特征向量以预设标准进行分组后,得到若干向量组,包括:

以句子或段落为标准,对所述向量序列中的特征向量进行分组后,得到若干向量组。

优选地,所述分类器采用卷积神经网络构成;

所述将所述向量组作为分类器的输入参数,以使所述分类器结合上下文相关性对所述待识别邮件进行分类,得到分类结果,所述分类结果用于确定所述待识别邮件是否属于垃圾邮件,包括:

将所述向量组中的特征向量作为所述分类器的第一层卷积神经网络的输入参数,得到所述向量组对应的特征向量,其中,所述向量组对应的特征向量用于表示句子或段落的语义;

将所述向量组对应的特征向量作为所述分类器的第二层卷积神经网络的输入参数,得到所述待识别邮件中的文本的特征向量,其中,所述待识别邮件中的文本的特征向量用于表示结合上下文相关性后的所述文本的语义;

将所述待识别邮件中的文本的特征向量作为所述分类器的全连接层的输入参数,经过所述全连接层的分类处理后,得到分类结果,所述分类结果用于确定所述待识别邮件是否属于垃圾邮件。

优选地,所述分类器的第一层卷积神经网络包括N个卷积核,N为自然数;

将所述向量组中的特征向量作为所述分类器的第一层卷积神经网络的输入参数,得到所述向量组对应的特征向量,其中,所述向量组对应的特征向量用于表示句子或段落的语义,包括:

利用一维卷积运算,得到所述向量组在每个卷积核的卷积层输出结果,所述卷积层输出结果包括依次以所述向量组中各个特征向量作为卷积运算起始值,分别与所述卷积核进行卷积运算的输出结果;

分别获取所述向量组在每个卷积核的卷积层输出结果中的最大值;

将所述向量组在每个卷积核的卷积层输出结果中的最大值进行组合,得到所述向量组对应的特征向量。

优选地,所述根据预先获取的词与特征向量的对应关系,将所述词序列中的词转换为与所述词具有对应关系的特征向量,得到向量序列之前,还包括:

将所述词序列中预设类型的词替换为预设标签;

预先为所述标签构建特征向量,并获取所述标签与所述特征向量的对应关系;

相应的,所述根据预先获取的词与特征向量的对应关系,将所述词序列中的词转换为与所述词具有对应关系的特征向量,得到向量序列,包括:

根据预先获取的词与特征向量的对应关系,将所述词序列中的词转换为与所述词具有对应关系的特征向量;以及,根据所述标签与所述特征向量的对应关系,将所述词序列中的标签转换为与所述标签具有对应关系的特征向量,得到向量序列。

优选地,所述预先为所述标签构建特征向量,包括:

随机生成特征向量,并判断所述特征向量与所述词与特征向量的对应关系中各个特征向量之间的欧式距离是否小于预设常数;

当所述特征向量与所述各个特征向量之间的欧式距离小于预设常数时,将所述特征向量分配给标签。

本发明还提供了一种垃圾邮件识别装置,所述装置包括:

分割模块,用于提取待识别邮件中的文本,并将所述文本以词为单位进行分割,得到词序列;

转换模块,用于根据预先获取的词与特征向量的对应关系,将所述词序列中的词转换为与所述词具有对应关系的特征向量,得到向量序列,所述向量序列中包括分别与所述词序列中各个词具有对应关系的特征向量;

分组模块,用于将所述向量序列中的特征向量以预设标准进行分组后,得到若干向量组;

分类模块,用于将所述向量组作为分类器的输入参数,以使所述分类器结合上下文相关性对所述待识别邮件进行分类,得到分类结果,所述分类结果用于确定所述待识别邮件是否属于垃圾邮件。

优选地,所述分组模块,具体用于:

以句子或段落为标准,对所述向量序列中的特征向量进行分组后,得到若干向量组。

优选地,所述分类器采用卷积神经网络构成;所述分类模块,包括:

第一分类子模块,用于将所述向量组中的特征向量作为所述分类器的第一层卷积神经网络的输入参数,得到所述向量组对应的特征向量,其中,所述向量组对应的特征向量用于表示句子或段落的语义;

第二分类子模块,用于将所述向量组对应的特征向量作为所述分类器的第二层卷积神经网络的输入参数,得到所述待识别邮件中的文本的特征向量,其中,所述待识别邮件中的文本的特征向量用于表示结合上下文相关性后的所述文本的语义;

第三分类子模块,用于将所述待识别邮件中的文本的特征向量作为所述分类器的全连接层的输入参数,经过所述全连接层的分类处理后,得到分类结果,所述分类结果用于确定所述待识别邮件是否属于垃圾邮件。

优选地,所述分类器的第一层卷积神经网络包括N个卷积核,N为自然数;

所述第一分类子模块,包括:

卷积运算子模块,用于利用一维卷积运算,得到所述向量组在每个卷积核的卷积层输出结果,所述卷积层输出结果包括依次以所述向量组中各个特征向量作为卷积运算起始值,分别与所述卷积核进行卷积运算的输出结果;

获取子模块,用于分别获取所述向量组在每个卷积核的卷积层输出结果中的最大值;

组合子模块,用于将所述向量组在每个卷积核的卷积层输出结果中的最大值进行组合,得到所述向量组对应的特征向量。

本发明提供了一种垃圾邮件识别方法,首先提取待识别邮件中的文本,并将所述文本以词为单位进行分割,得到词序列;根据预先获取的词与特征向量的对应关系,将所述词序列中的词转换为与所述词具有对应关系的特征向量,得到向量序列,所述向量序列中包括分别与所述词序列中各个词具有对应关系的特征向量。其次,将所述向量序列中的特征向量以预设标准进行分组后,得到若干向量组。最后,将所述向量组作为分类器的输入参数,以使所述分类器结合上下文相关性对所述待识别邮件进行分类,得到分类结果,所述分类结果用于确定所述待识别邮件是否属于垃圾邮件。与现有技术的垃圾邮件识别方法相比,本发明结合了上下文相关性对邮件识别的影响,提高了垃圾邮件识别的准确性。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种垃圾邮件识别方法流程图;

图2为本发明实施例提供的一种经过分组后的向量序列示意图;

图3为本发明实施例提供的一种分类器的处理方法流程图;

图4为本发明实施例提供的一种分类器结构示意图;

图5为本发明实施例提供的一种垃圾邮件识别装置结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

电子邮件中文本内容的上下文相关性对垃圾邮件的识别具有至关重要的影响,例如“viagra”(伟哥)这个词往往通过规则或者对样本的训练,被赋予较高的垃圾邮件权重。但如果一个朋友发给你一个提到“伟哥”的笑话,或者是一个严肃的医学专业的讨论的电子邮件均会被识别为垃圾邮件。这显然是未结合上下文相关性对垃圾邮件进行识别的后果,通常脱离上下文相关性和语义进行垃圾邮件识别的方法必然在识别准确率上存在很大的缺陷,特别是在区分专业领域的正常邮件和该领域的垃圾邮件时,有着非常高的错误率。

所以,本发明提供的垃圾邮件识别方法结合了上下文相关性的影响,能够更准确的对垃圾邮件进行识别。

以下进行实施例具体内容的介绍。

本发明实施例提供了一种垃圾邮件识别方法,参考图1,为本发明实施例提供的一种垃圾邮件识别方法流程图,所述方法具体包括:

S101:提取待识别邮件中的文本,并将所述文本以词为单位进行分割,得到词序列。

本发明实施例提供的垃圾邮件识别方法可以应用于邮件网关、邮件服务器或者客户端等终端。实际应用中,位于不同终端中的邮件数据都是经过特定编码或协议封装的,本发明实施例可以通过预先将位于不同终端中的邮件数据进行文本的转换,屏蔽了后续的处理过程对来自不同的终端的邮件数据的处理差异性,使得系统具有良好的适应性。

另外,本发明实施例是基于电子邮件中的文本内容实现对垃圾邮件的识别的,不涉及对电子邮件内的图片、附件等内容的识别。

实际应用中,首先提取待识别邮件中的文本,由于本发明是基于文本的语义进行垃圾邮件的识别,所以,本发明实施例在提取到文本后,以词为单位对所述文本进行分割,得到词序列,其中,所述词序列为经过以词为单位分割后的文本。

本发明实施例中,对文本进行以词为单位的分割的方法可以包括基于字符串匹配的方法,如双向最大匹配法,还可以包括基于HMM的方法和基于深度学习的方法等等。其中,本发明实施例不限定使用哪种方法进行文本的分割,优选地,本发明利用基于HMM的方法和基于深度学习的方法较其他方法具有较好的效果。

S102:根据预先获取的词与特征向量的对应关系,将所述词序列中的词转换为与所述词具有对应关系的特征向量,得到向量序列,所述向量序列中包括分别与所述词序列中各个词具有对应关系的特征向量。

本发明实施例中,预先获取词与特征向量的对应关系,并存储于系统中以供调用。具体的,一种实现方式中,可以利用GloVe(英文:Global Vectors for Word Representation)方法对预先获取的样本进行训练,得到词与特征向量的对应关系。其中,GloVe方法中使用的样本可以为从新闻、网页等获取的自然语料。另外,本发明实施例用于获取词与特征向量的对应的关系的方法不限于GloVe方法,也有其他现有的技术能够用于获取词与特征向量的对应关系,在此不再赘述。

值的强调的是,利用GloVe方法得到的词与特征向量的对应关系中的特征向量满足如下条件:首先,每个词对应的特征向量的最近邻居应该是该词的近义词,例如词frog对应的特征向量的最近邻居应该分别是frogs,toad,litoria,leptodactylidae,rana,lizard,eleutherodactylus等等。其次,词对应的特征向量在相关的词间具有线性关系,例如,线性关系v(queen)≈v(king)–v(man)+v(woman),其中v()是对词到特征向量的转换函数,queen,king,man,woman是相关的词。

实际操作中,根据预先存储于系统中的词与特征向量的对应关系,将获取的词序列中的各个词转换为与其具有对应关系的特征向量,得到向量序列。其中,所述向量序列中包括分别所述词序列中的各个词具有对应关系的特征向量。

一种优选的实施方式中,本发明实施例在获取到词序列后,查找到所述词序列中的预设类型的词,如数字、符号等,将这种类型的词替换为预设标签。例如,将日期“2016-6-1”替换为标签“<date>”。

由于预设类型的词一般为与识别垃圾邮件无关的词,本发明实施例利用预设标签统一替换预设类型的词,一方面可以简化垃圾邮件的识别过程,另一方面也可以增加分类器的范化能力,使分类器能够将仅仅改变了一些数字、日期等的电子邮件看成是一类的电子邮件,简化处理过程。

实际应用中,本发明实施例可以利用正则表达式实现预设类型的词的匹配以及预设标签的替换,本发明实施例可以通过维护一个正则表达式库,将匹配上正则表达式表项的词替换成对应的标签。

另外,由于利用GloVe方法得到的词与特征向量的对应关系中不包括标签对应的特征向量,所以,在预先设置标签之后,可以利用GloVe方法为所述标签构建特征向量。具体的,利用GloVe方法随机生成特征向量,并判断所述特征向量与预先获取的词与特征向量的对应的关系中各个词对应的特征向量之间的欧式距离是否小于预设常数。如果所述特征向量与各个词对应的特征向量之间的欧式距离小于预设常数时,将所述特征向量分配给标签。依照上述方式,为各个标签构建对应的特征向量。

实际应用中,根据各个标签与特征向量的对应关系,将词序列中的各个标签也转换为对应的特征向量。

S103:将所述向量序列中的特征向量以预设标准进行分组后,得到若干向量组。

本发明实施例中,所述预设标准可以为以句子或段落为标准,也可以以固定长度或者固定词个数为标准。

实际应用中,以预设标准对所述向量序列进行分组后,得到若干向量组,其中,各个向量组中包括分组后的特征向量。

实际应用中,以句子为标准对所述向量序列进行分组时,可以根据向量序列中的标点符号识别句子,最终以句子为单位对所述特征向量进行分组。如图2所示,图2为一种以句子为标准进行分组后的向量序列示意图。其中,为了让每个句子中的各个词对垃圾邮件识别的贡献均衡,将分组后的每个句子对应的向量组的前后分别增加若干个占位向量。其中,分别增加的占位向量的个数等于分类器中卷积核最大的窗口长度减去1。

S104:将所述向量组作为分类器的输入参数,以使所述分类器结合上下文相关性对所述待识别邮件进行分类,得到分类结果,所述分类结果用于确定所述待识别邮件是否属于垃圾邮件。

本发明实施例中的分类器可以采用卷积神经网络CNN、循环神经网络RNN等深度神经网络构成,利用深度神经网络对上下文的关联能力,对待识别邮件进行分类,能够提高对垃圾邮件的识别精度。

一种优选的实施方式中,采用卷积神经网络CNN构成本发明实施例中的分类器。对于以句子或段落为标准对向量序列进行分组后得到的向量组,所述分类器的处理过程如下,参考图3所示,图3为本发明实施例提供的一种分类器的处理方法流程图:

S301:将所述向量组中的特征向量作为所述分类器的第一层卷积神经网络的输入参数,得到所述向量组对应的特征向量,其中,所述向量组对应的特征向量用于表示句子或段落的语义。

实际应用中,由于本实施例方式中以句子或段落作为分组标准,所以本实施例中采用卷积神经网络进行训练和分类的分类器可以由两层卷积神经网络构成。事实上,根据分组标准的不同,本发明实施例的分类器还可以由三层,甚至更多层卷积神经网络构成。如图4所示,为本发明实施例提供的一种由两层卷积神经网络构成的分类器结构示意图。其中,第一层卷积神经网络由N个卷积核和pooling层1组成,N为自然数。

具体的,将以句子或段落作为标准进行分组后得到的向量组记为S1:n=[X1,X2...Xn],Xn为第n个词对应的特征向量。也就是说,所述向量组S1:n由n个词的特征向量构成。

实际应用中,首先利用一维卷积运算,得到所述向量组在每个卷积核的卷积层输出结果,所述卷积层输出结果包括依次以所述向量组中各个特征向量为卷积运算起始值,分别与所述卷积核进行卷积运算的输出结果。

具体的,依次以所述向量组S1:n中的各个特征向量X1,X2...Xn作为卷积运算起始值,分别与卷积核进行卷积运算,得到所述向量组S1:n在每个卷积核的卷积层输出结果。其中,以所述向量组中第i个特征向量作为卷积运算的起始值,将所述向量组中第i个特征向量到第i+hj-1个特征向量与第j个卷积核Wj进行卷积运算后的得到的输出结果记为:

其中,所述向量组为分组后得到的第m个向量组,hj为第j个卷积核的窗口长度,bj为偏移量,f()是一个非线性函数,如tanh()等。

实际应用中,在以所述向量组S1:n中的各个特征向量X1,X2...Xn作为卷积运算起始值,分别与卷积核进行卷积运算,得到后,将进行组合,最终得到Cm,j即为所述向量组S1:n在第j个卷积核的卷积层输出结果。

其中,所述向量组在所述卷积核的卷积层输出结果包括依次以所述向量组中各个特征向量为卷积运算起始值,分别与所述卷积核进行卷积运算的输出结果。

然后,分别获取所述向量组在每个卷积核的卷积层输出结果中的最大值。具体的,在图4中的pooling层1,采用max-out pooling方法,分别获取所述向量组在每个卷积核的卷积层输出结果中的最大值。将分组后得到的第m个向量组在第j个卷积核的卷积层输出结果中的最大值记为:

最后,将所述向量组在每个卷积核的卷积层输出结果中的最大值进行组合,得到所述向量组对应的特征向量。将分组后得到的第m个向量组对应的特征向量记为:

Ym=[Pm,1,Pm,2...Pm,N];

其中,所述第一层卷积神经网络包括N个卷积核,第m个向量组分别在N个卷积核的卷积层输出结果中最大值组成所述向量组对应的特征向量Ym

S302:将所述向量组对应的特征向量作为所述分类器的第二层卷积神经网络的输入参数,得到所述待识别邮件中的文本的特征向量,其中,所述待识别邮件中的文本的特征向量用于表示结合上下文相关性后的所述文本的语义。

如图4所示,分类器中的第二层卷积神经网络可以由M个卷积核和pooling层2组成,M为自然数,所述第二层卷积神经网络与所述第一层卷积神经网络的算法逻辑相同。具体的,所述第一层卷积神经网络输出的各个向量组对应的特征向量作为所述第二层卷积神经网络的输入参数。经过所述第二层卷积神经网络中M个卷积核和pooling层2的处理后,最终所述第二层卷积神经网络输出的是所述待识别邮件中文本的特征向量。

S303:将所述待识别邮件中的文本的特征向量作为所述分类器的全连接层的输入参数,经过所述全连接层的分类处理后,得到分类结果,所述分类结果用于确定所述待识别邮件是否属于垃圾邮件。

如图4所示,本发明实施例中的分类器还包括全连接层,所述第二层卷积神经网络输出的所述待识别邮件中文本的特征向量作为所述全连接层的输入参数,由所述全连接层通过softmax函数输出在多个分类上的概率,利用所述概率即可确定所述待识别邮件是否属于垃圾邮件。其中,所述全连接层的算法逻辑与传统的神经网络算法逻辑相同,在此不再赘述。

本发明实施例中,再利用分类器进行垃圾邮件的识别之前,首先利用邮件样本对所述分类器进行训练。具体的,利用邮件样本对分类器进行训练的过程与分类器对垃圾邮件进行识别的过程基本相同,区别包括以下两点:第一,利用邮件样本对分类器进行训练阶段中,分类器不仅包括对邮件样本进行处理的正向传播过程,即上述S301-S303,还包括反向传播过程,目的是对所述分类器各层的网络参数(如全连接层的权重和偏移)进行调整,使得最终得到的训练结果更准确。第二,将dropout算法应用于分类器的全连接层,解决邮件样本在训练阶段的过度拟合问题。具体的,在训练阶段的正向传播过程中,随机的将一些隐藏层的输出设置为0,同时这些神经元不参加反向传播的参数调整。这种方法降低了神经元之间的依赖关系,解决了深度神经网络对样本的过度拟合问题。

本发明实施例提供的一种垃圾邮件识别方法中,首先提取待识别邮件中的文本,并将所述文本以词为单位进行分割,得到词序列;根据预先获取的词与特征向量的对应关系,将所述词序列中的词转换为与所述词具有对应关系的特征向量,得到向量序列,所述向量序列中包括分别与所述词序列中各个词具有对应关系的特征向量。其次,将所述向量序列中的特征向量以预设标准进行分组后,得到若干向量组。最后,将所述向量组作为分类器的输入参数,以使所述分类器结合上下文相关性对所述待识别邮件进行分类,得到分类结果,所述分类结果用于确定所述待识别邮件是否属于垃圾邮件。与现有技术的垃圾邮件识别方法相比,本发明实施例结合了上下文相关性对邮件识别的影响,提高了垃圾邮件识别的准确性。

本发明实施例还提供了一种垃圾邮件识别装置,参考图5,为本发明实施例提供的一种垃圾邮件识别装置结构示意图,所述装置包括:

分割模块501,用于提取待识别邮件中的文本,并将所述文本以词为单位进行分割,得到词序列;

转换模块502,用于根据预先获取的词与特征向量的对应关系,将所述词序列中的词转换为与所述词具有对应关系的特征向量,得到向量序列,所述向量序列中包括分别与所述词序列中各个词具有对应关系的特征向量;

分组模块503,用于将所述向量序列中的特征向量以预设标准进行分组后,得到若干向量组;

分类模块504,用于将所述向量组作为分类器的输入参数,以使所述分类器结合上下文相关性对所述待识别邮件进行分类,得到分类结果,所述分类结果用于确定所述待识别邮件是否属于垃圾邮件。

具体的,所述分组模块503,具体用于:

以句子或段落为标准,对所述向量序列中的特征向量进行分组后,得到若干向量组。

一种优选地实施方式中,所述分类器采用卷积神经网络构成;所述分类模块504,包括:

第一分类子模块,用于将所述向量组中的特征向量作为所述分类器的第一层卷积神经网络的输入参数,得到所述向量组对应的特征向量,其中,所述向量组对应的特征向量用于表示句子或段落的语义;

第二分类子模块,用于将所述向量组对应的特征向量作为所述分类器的第二层卷积神经网络的输入参数,得到所述待识别邮件中的文本的特征向量,其中,所述待识别邮件中的文本的特征向量用于表示结合上下文相关性后的所述文本的语义;

第三分类子模块,用于将所述待识别邮件中的文本的特征向量作为所述分类器的全连接层的输入参数,经过所述全连接层的分类处理后,得到分类结果,所述分类结果用于确定所述待识别邮件是否属于垃圾邮件。

一种优选地实施方式中,所述分类器的第一层卷积神经网络包括N个卷积核,N为自然数;

所述第一分类子模块,包括:

卷积运算子模块,用于利用一维卷积运算,得到所述向量组在每个卷积核的卷积层输出结果,所述卷积层输出结果包括依次以所述向量组中各个特征向量作为卷积运算起始值,分别与所述卷积核进行卷积运算的输出结果;

获取子模块,用于分别获取所述向量组在每个卷积核的卷积层输出结果中的最大值;

组合子模块,用于将所述向量组在每个卷积核的卷积层输出结果中的最大值进行组合,得到所述向量组对应的特征向量。

本发明实施例提供的一种垃圾邮件识别装置能够实现以下功能:提取待识别邮件中的文本,并将所述文本以词为单位进行分割,得到词序列;根据预先获取的词与特征向量的对应关系,将所述词序列中的词转换为与所述词具有对应关系的特征向量,得到向量序列,所述向量序列中包括分别与所述词序列中各个词具有对应关系的特征向量。将所述向量序列中的特征向量以预设标准进行分组后,得到若干向量组。将所述向量组作为分类器的输入参数,以使所述分类器结合上下文相关性对所述待识别邮件进行分类,得到分类结果,所述分类结果用于确定所述待识别邮件是否属于垃圾邮件。与现有技术的垃圾邮件识别方法相比,本发明实施例结合了上下文相关性对邮件识别的影响,提高了垃圾邮件识别的准确性。

对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上对本发明实施例所提供的一种垃圾邮件识别方法及装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1