反垃圾的应用存储系统的制作方法

文档序号:7641062阅读:135来源:国知局
专利名称:反垃圾的应用存储系统的制作方法
技术领域
本发明涉及用于长期存储短消息系统(short message system SMS )消息的方案。
背景技术
随着因特网的出现,发送方在几乎没有任何成本的情况下向;[艮大量 的目的地发送消息已经变得越来越容易。这对短消息发送服务(SMS ) 而言情况也是一样。这些消息包括未经请求而主动提供的和不想要的消 息(垃圾spam),这给消息的接收方带来了麻烦,接收方必须清除所述 消息并且确定它是否有任何的重要性。此外,它对用于发送消息的电信 网络载体而言也是一种麻烦,这不仅是因为它相对于被垃圾泛滥的愤怒 客户而言提出了客户关系问题,而且还因为这些通常几乎没有任何收益 的消息使用了网络资源。以下两个统计数据例证了此问题的严重性。在 中国,2003年经由中国电信网络发送了两万亿条短消息服务(SMS)消 息;估计这些消息中有四分之三是垃圾消息。第二个统计数据是,在美 国估计有85 - 90°/。的电子邮件消息是垃圾。这些垃圾消息不只是一种麻烦,而且在许多实例中还是一种用于欺 诈消息接收者的手段,其通过引诱接收者提供他们的信用卡信息或者通 过催促他们为期望收到相当大量的金额而支付适度金额(用于"手续费" 或"税")来进行欺诈。由计算机自动发起的用于欺诈的消息被频繁发送 到非常大量的目的地,希望至少有一些目的地足够笨到去作出响应。该 问题在辱国是严重的,但实际上在中国、日本、韩国也是很严重的,而 在欧洲虽严重但稍好一些。后面的这些国家一般具有庞大数量的SMS 消息。为了识别并告发电信服务的这种欺诈使用,希望能够记录用于实施 这种欺诈的消息。为了用于分析目的,可能有必要把这种消息保存得比 保留期还要长(数月或可能几年)。现有技术的问题在于每个保留期所 产生的消息数目远大于能够在合理成本内存储的消息数目。发明内容依照本发明,与现有技术相比,极大地緩和了以上问题并且作出了改进,其中使用过滤系统来控制把不同的SMS消息记录到存储系统的 多个子文件中;每个子文件包含不同类型的消息,诸如黑名单消息、歧 义(ambiguous)消息、白名单消息、来自高度可ll:源的消息;对于每 个子文件,系统管理员能够控制要存储在所述子文件中的消息的百分比 以及这些消息要被存储的持续时间。有益地是,利用此方案,管理员或 电信系统能够控制所存储消息的数量和类别。依照申请人发明的一个特征,如果对于特定的源而言,消息被分析 为要大量递送,那么仅存储单个拷贝连同这种消息数目的可选计数。依照申请人发明的另 一特征,能够在不同类型的存储器中存储不同 的子目录,以使得必须被频繁检查的那些类别(诸如来自高度可疑来源 的消息)处于能够更好地访问的类型的存储器中。依照申请人发明的另 一特征,能够依照不同的访问特权来访问不同 的子目录。可能会要求特殊访问的子文件示例是对安全敏感的子文件, 对自我训练的子文件的反垃圾的分析。


图l是图示申请人发明的操作的框图;图2是图示申请人发明的操作的流程图;图3是典型的反垃圾的存储文件及其子文件的布局;和图4是图示使用管理系统来控制申请人发明的操作的流程图。
具体实施方式
图1是图示申请人发明的操作的框图。SMS消息到达反垃圾应用 101,所述反垃圾应用101是在适当计算机上运行的软件进程,其目的 在于滤出垃圾消息。反垃圾应用的示例是可从朗讯技术有限公司获得的 MiLife SMS反垃圾应用(MiLife SMS Anti - Spam Application)和Nexus NETVIEW信令调查系统(Nexus NETVIEW Signaling Survey System )。 反垃圾应用101的输出包括非垃圾消息121、歧义消息123和垃圾消息 125,所述歧义消息123在第一级过滤中不能够被识别为是垃圾消息也 不能够被识别为是非垃圾消息,但是能够被转发到第二级(反垃圾应用102),以供深入分析来确定它们是良好消息还是垃圾消息。对于消息 125而言,反垃圾应用101具有强烈指示来表明它是垃圾消息并且该消 息不应当被递送到目的地。例如,消息125包括来自目的地不希望从其 接受消息的来源的黑名单之一的消息。非垃圾消息121的示例是其来源 处于目的地白名单上的消息,所述白名单表示可被消息目的地接受的来 源。歧义消息是其来源既不在白名单上也不在黑名单上的消息,但是对 于它们而言存在表明所述消息并非无疑就是非垃圾消息的其它指示。例 如,当诸如反垃圾应用101之类的反垃圾过滤器引擎进行内容或关键字 分析并且结果表明垃圾严重性指标为中级时,所述消息将接着被转发到 第二级以供进行深入分析;如果第二级分析引擎仍然无法证明它是否为 垃圾,就把这种消息131作为将被递送到目的地的良好消息来对待,或 者把这种消息发送给操作者而手动检查垃圾性,并且可选择把它存储到 存储系统中。
消息121、 125、 127、 129和131被发送到存储控制系统103以便 存储在存储系统300的子文件(302, ..., 368 )之一中。良好消息和垃 圾消息都被存储,但是通常向这些不同的消息分配不同的百分比和不同 的保留时间间隔。
管理系统105被用来向存储控制系统提供控制信息。所述控制信息 可以是诸如应当存储的去往特定子文件的消息的百分比、不同类别消息 (例如,来自去往通用子文件的确定来源的消息)的子文件目的地之类 的信息,以及用于控制每个子文件中消息存储的持续时间的信息。实际 上,管埋系统控制由存储控制系统用来判定应当存储哪些消息以及用来 判定哪个子文件应当用于存储每个这种消息的规则。
图2是图示申请人发明的操作的流程图。反垃圾应用(anti - spam application ASA ) 101和第二级ASA 102接收进入的SMS消息(动作框 201)。所述ASA和第二级ASA依照垃圾类型对这些消息进行分类(动 作框203 )。在图3中示出了消息的主要类别。
所述ASA和第二级ASA把这些所分类的消息传递到存储控制系统 (SCS)(动作框205 )。然后,存储控制系统依照为所述存储控制系 统所存储的规则来根据存储系统中的子文件进一步对消息进行分类(动 作框207)。例如,存储控制系统可以具有用于来自特别可疑来源的消 息的一个类别。这种进一步分类的优点在于当例如只以25%为限保存普通的垃圾消息时,可以100%地保存来自高度可疑来源的这些消息。而
且,它们被保存在独立的子文件中以便允许来自管理系统的特定访问来 检查这些消息。可以为这些可疑来源中的每一个设置特殊子文件。依照
由管理系统所提供的规则来执行由存储控制系统所实施的进一步分类。
存储控制系统判定具体消息是否应当^皮存储(动作框209)。由于 存储所有消息可能会是不切实际的,所以只存储一小部分消息。这一小 部分是要在其中存储消息的特定子文件的函数。通过对于分数N/M存 储每M个消息中N个或者通过某一随机化选择待存储消息的过程来实 施部分分配。 一种随机化过程的示例是检查时钟的后几位数字并且依照 时钟的读数来执行存储或不存储功能。
然后,存储控制系统把包括子文件的身份标识的待存储消息传递到 存储系统(动作框211 )。然后存储系统存储所传递的消息(动作框213 )。
依照本发明的一个优选实施例,对于每个子文件或每组子文件定制 保留时间间隔(动作框215)。
图3是示出典型的完整反垃圾存储文件300的样本数据布局,包括 一组良好短消息服务(SMS)子文件302、 一组垃圾SMS子文件,该组 垃圾SMS子文件包括一组移动发起的垃圾子文件306和一组移动终止 的垃圾SMS子文件308。在良好短消息系统子文件中所包括的是网络内 的良好SMS子文件320、网络间的良好SMS子文件322和用于自我训 练目的以便帮助识别未来的良好SMS子文件的子文件324。
移动发起的垃圾子文件包括网络内的垃圾子文件330、网络间的垃 圾SMS子文件332、漫游移动发起的垃圾子文件334、金融欺诈SMS 子文件336和色情SMS子文件338。这些子文件用来帮助识别垃圾SMS 子文件的发起者。
移动终止的垃圾SMS子文件包括来自所识别的源网络子文件350 的垃圾息、泛滥或大量分送的垃圾子文件352、欺骗的垃圾子文件354、 具有伪造源地址的垃圾子文件356、色情垃圾子文件358、金融欺诈垃 圾子文件360、用于枪支销售的垃圾子文件362、网络内的垃圾子文件 364、潜在犯罪的垃圾子文件366和非法作广告的垃圾子文件368。对于 每个子文件而言,维护消息数目的计数和每个条目的日期和时间。对于 每个子文件而言,已经初始化不确定的空间分配并且维护每个子文件的 百分数填充。对于每个子文件而言,维护要存储在子文件中的适当种类消息的百分比;对于多个子文件而言,特别是对于用于欺诈的垃圾消息 的子文件而言,要存储的消息的百分比常常是100%。对于每个子文件 而言,维护保留期以使得清除较旧的消息以便为新消息腾出空间。
如从该示例所看到的, 一 些子文件只适用于移动终止的或移动发起 的通信业务。在可选布局中,可以为两个方向的通信业务使用相同的子 文件。可以定制子文件系统以满足每个远程通信载体或应用的需要。
不同的子文件可以具有不同的和/或多个阈值,以用于向管理系统通 知子文件充分接近满以便要求删除消息或增加子文件大小的某个动作。
图4是图示用于控制消息存储的管理系统的操作的流程图。管理系 统(administrative system AS )访问存卡者系统中的数据(动作框401 )。 管理系统可以访问此数据以便查明每个或任何子文件的填充和/或获得 子文件中所存储消息的具体数据。
根据所访问的数据,管理系统修改存储控制系统的规则(动作框 403 )。例如,如果管理系统发现非垃圾子文件的填充相对较高,那么 所述管理系统可以修改用于存储去往该子文件的消息的规则以便减少 要被存储的部分。例如,在假日季节期间,可能发送很多非垃圾的问候 消息。保留的那一小部分会被降低以便适应通信业务的这种短时间爆发 (flurry)。
然后管理系统向存储控制系统发送所修改的规则(动作框405), 所述存储控制系统依照所修改的规则来执行其功能。
可以向管理系统的工作人员给予对存储系统的内容进行限制性访 问的权力。例如,可以要求特殊口令来访问金融欺诈子文件,以便防止
内部人员对窃贼进行警告。
以上描述是申请人发明的一个优选实施例。其它实施例对本领域普 通技术人员而言是显而易见的。本发明仅由所附权利要求来限定。
权利要求
1.一种用于短消息服务(SMS)消息的反垃圾过滤和存储的系统,包括用于确定哪些SMS消息是不想要的类型的消息(垃圾),哪些消息被认为是非垃圾消息且能够被递送给目的地,以及哪些消息是歧义的-既不能被分类为是垃圾消息也不能被分类为是非垃圾消息的装置;包括多个子文件的存储系统;和用于分配的装置,用于依照为所述用于分配的装置所存储的规则来向所述SMS消息分配存储系统的子文件。
2. 如权利要求1所述的设备,进一步包括用于产生管理控制消息并 向所述用于分配消息的装置发送所述管理控制消息来建立用于控制要 把哪些类型的消息存储在哪些子文件中的规则的装置。
3. 如权利要求2所述的设备,其中所述用于分配的装置包括用于依 照所述规则来控制对被分配给特定子文件的 一 小部分消息的存储的装 置。
4. 如权利要求2所述的设备,其中所述用于分配的装置进一步包括 用于依照所述规则将每个子文件与所述子文件中的消息要被保留的时 间长度相关联的装置。
5. 如权利要求2所述的设备,进一步包括用于确定哪些电子邮件消 息是不想要类型的消息(垃圾),哪些消息被认为是非垃圾消息并且能 够被递送给目的地,以及哪些消息是歧义的-既不能够被分类为是垃圾 消息也不能够被分类为是非垃圾消息的装置;所述存储系统包括用于存储电子邮件消息的多个附加子文件;和 用于向所述电子邮件消息分配所述多个附加子文件中的子文件的 装置。
6. —种用于短消息服务(SMS)消息的反垃圾过滤和存储的方法, 包括步骤确定哪些SMS消息是不想要的类型的消息(垃圾),哪些消息被 认为是非垃圾消息并且能够被递送给目的地,以及哪些消息是歧义的-既不能够被分类为是垃圾消息也不能够被分类为是非垃圾消息;并且依照为所述存储系统所存储的规则来向所述SMS消息分配存储系 统的子文件。
7. 如权利要求6所述的方法,进一步包括步骤产生管理控制消息并向所述存储系统发送所述管理控制消息,以便 建立用来控制要把哪些类型的消息存储在哪些子文件中的规则。
8. 如权利要求7所述的方法,其中用于分配的步骤包括用于依照所 述规则来控制对被分配给特定子文件的 一 小部分消息的存储的步骤。
9. 如权利要求7所述的方法,其中所述用于分配的步骤进一步包括 用于依照所述规则将每个子文件与在所述子文件中的消息要被保留的 时间长度相关联的步骤。
10. 如权利要求7所述的方法,进一步包括步骤 确定哪些电子邮件消息是不想要的类型的消息(垃圾),哪些消息被认为是非垃圾消息并且能够被递送给目的地,以及哪些消息是歧义的 -既不能够被分类为是垃圾消息也不能够被分类为是非垃圾消息;并且 依照为所述存储系统所存储的规则向所述电子邮件消息分配所述 存储系统的 一 组附加子文件中的子文件。
全文摘要
本发明涉及用于存储短消息服务(SMS)和电子邮件消息以便检测垃圾消息特别是用于欺诈或色情目的的垃圾消息来源的方法和设备。由于可能要求以较长时间间隔存储关键消息,并且由于垃圾消息通信业务量很大,所以按照用于反欺诈目的所要求的最大间隔来存储所有可疑的垃圾消息是不切实际的。据此,在反垃圾消息部门的控制下,把不同类型的实际垃圾、可疑垃圾和非垃圾存储在不同的子文件中;每个子文件可以具有要存储的可疑垃圾消息的不同保留期和百分比;还可以在反垃圾部门的控制下修改任何子文件的存储量和保留期。有益地是,可以依照最优的方式来使用有限量的反垃圾存储来保持反垃圾部门所认为的最优消息混合。
文档编号H04L12/58GK101317409SQ200680044573
公开日2008年12月3日 申请日期2006年11月28日 优先权日2005年11月28日
发明者D·L·麦格里尔, Y·蔡 申请人:卢森特技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1