语音邮件和传真过滤的制作方法

文档序号：6569663阅读：337来源：国知局

专利名称：语音邮件和传真过滤的制作方法
语音邮件和传真过滤
背景
因特网已经产生了许多新的通信介质，这些通信介质继续变得更为流行并
广泛传播。这些新的介质包括但不限于电子邮件(email)和文本消息，它们可以由经两台或多台计算机或可连接网络的基于处理器的设备组成的网络传播。电子邮件允许文本消息单独或者结合图形和可任选附件一起的电子通信。文本或即时消息是更为简单的用以传送短文本消息的通信机制。这些电子通信介质之所以流行是因为它们提供了比传统电话呼叫侵入感更少的便宜、便捷且点对点的通信。它们还有许多其他优点，例如电子邮件很容易进行一对多通信，尤其是不需要同步参与者并且其内容可以被设计得更为简单。不尽如人意的是，这些介质具有会威胁其便捷可靠使用的两大敌手，即兜售信息(spam)和病毒。
兜售信息是相对于传统垃圾邮件的电子垃圾邮件。类似于垃圾邮件，兜售信息是大批发送的主动提供的消息。兜售信息通常本质上是商业性的。例如，直销者、公司和个人会利用兜售信息为产品、快速致富方案以及捐赠请求等做广告。由于兜售信息的本性，即它是多余的纯占空间的消息，因而兜售信息是会给电子通信介质用户带来不便的讨厌的东西。不但用户必需花时间从泛滥的不希望有的通信中进行分拣，而且这些兜售信息还因为要复制这些消息而占据了大量的资源(例如，存储空间、网络带宽)成本(通过服务提供商传递)。此外，大量的兜售信息还具有拒绝服务攻击的效果，因为真正的邮件在海量的其他消息中丢失了。
除了兜售信息，电子通信系统也易受病毒或诸如蠕虫和木马的其他类型的恶意代码的影响。举例来说，诸如电子邮件的消息可以包括病毒作为附件。计算机一旦执行，例如一旦打开该附件，就会受到病毒感染。病毒于是会毁坏硬件、软件和/或文件。之后病毒能够经由电子邮件发送并传播至其他计算机。蠕虫的破坏性与病毒类似，但是它可以在没有帮助的情况下复制自身并传送至其他计算机。例如，蠕虫可以位于用户的地址簿并把它自己发送给每个列出的收件人。木马(Trojan或Trojan horse)有些许不同，因为它利用欺骗引诱用户打开或执行代码，并且不像病毒那样感染文件也不像蠕虫那样自我复制。相反地，木马作为合法的软件片段出现，在被打开时能够删除或破坏文件并且会打开后门，利用该后门就能够访问个人或保密信息和/或劫持电脑。
已经开发并利用各种系统和技术来对抗兜售信息和恶意代码。更具体地，对电子邮件和文本消息进行多次过滤以检测兜售信息和/或恶意代码。一旦被标识，就会采取行动，诸如尤其可以是重定向至指定位置(例如，兜售信息文件夹、隔离区等)和/或删除等。
概述
以下呈现了简化概述，以提供对权利要求主题的某些方面的基本理解。本概述不是广范的纵览。它并非意在标识关键/重要元素，亦非意欲描绘权利要求主题的范围。这一概述的唯一目的是以一种简化的形式来介绍一些概念，作为稍后呈现的更为详细的描述的前序。
为过滤语音、传真和类似的通信提供本发明的简要描述。特别地，可以执行过滤或代理来尤其检测主动提供的大量通信和/或兜售信息和/或恶意代码，诸如病毒、蠕虫和木马。
根据本发明的一个方面，可以利用现有的电子邮件流水线及关联过程来实现对语音和传真通信的过滤。这些通信可以被转换成具体形式的电子邮件或 SMTP消息以便使这些消息适用于标准分析工具。更具体地，可以对语音和传真消息进行分析并且将其内容的至少一部分作为预览与其他指定类型的 MIME数据一起在电子邮件正文中提供。随后就可以利用常规电子邮件过滤器对这些电子邮件进行处理。
根据本发明的另一方面，可以利用针对语音消息的固有或插入的言语至文本算法或机制来生成预览。类似地，可以针对诸如传真的扫描文档利用固有或插入的字符识别技术。
根据本发明的再一个方面，可以将语音、传真或其他通信作为附件添加至电子邮件。特定的滤波器随后能够分析整个消息，而不仅是分析生成的预览。此外，这些过滤器能够提供检测兜售信息感兴趣的附加信息，诸如语音的音调
5或音量。
根据本发明的一个具体方面，分支交换组件可以将电话呼叫转发给转换组件，该转换组件应答该呼叫并生成电子邮件消息。所生成的消息随后被传送至消息服务器(例如，SMTP服务器、电子邮件服务器)，该服务器对生成的消息应用一种或多种滤波以检测特别是兜售信息和/或恶意代码。
为实现上述及相关目的，在此结合下列说明和附图描述所要求保护的主题的特定示例性的方面。这些方面表示了可以实践发明主题的各种方式，它们均落在所要求保护的主题的范围之内。结合附图阅读下面的详细描述则本发明的其他优点和新颖特征将变得很清楚。
附图简述

图1是便于对兜售信息和/或恶意代码的检测的系统的框图。图2是一个示例性检测组件的框图。图3是语音/传真过滤系统的框图。
图4是语音/传真消息系统的框图。图5是一个示例性转换组件的框图。图6是消息过滤系统的框图。图7是一个转换组件的框图。图8是消息过滤系统的框图。
图9a-b描绘了可以结合语音或传真通信发送给收件人的示例性消息内容。
图IO是通信预处理方法的流程图。
图11是消息预处理方法的流程图。
图12是与音频或视频通信相关联的合成方法的流程图。
图B是与传真通信相关联的合成方法的流程图。
图14是消息服务器方法的流程图。
图15是客户端应用程序方法的流程图。
图16是例示了用于本发明各方面的合适操作环境的示意性框图。图17是示例计算环境的示意性框图。详细描述
现在参考附图描述本发明的各个方面，其中始终用相同的附图标记来指代相同的或相应的元素。然而应该了解，附图以及与其相关的详细描述并非旨在把所要求保护的主题局限于所揭示的特定形式。相反，其意图是覆盖落在权利要求书的精神和范围之内的所有修改、等效和替换的方案。
在本应用中使用的术语"组件"和"系统"用于表示计算机相关的实体，它可以是硬件、硬件和软件的结合、软件、或者执行中的软件。例如，组件可以是但不限于是，在处理器上运行的进程、处理器、对象、实例、可执行(程序)、执行的线程、程序和/或计算机。作为例示，运行在计算机上的应用程序和计算机本身都可以是计算机组件。一个或多个组件可以驻留在进程和/或执行
的线程中，而组件可以位于一个计算机内和/或分布在两个或更多的计算机之间。
在此使用词语"示例性的"意指用作例子、实例或例示。在此被描述为"示例性的"的任何方面或设计并不一定被解释为比其他方面或设计优先或有利。
根据将在下文中描述的本发明的一个或多个方面，可结合执行推断和/或概率判断和/或基于统计的判断来使用基于人工智能的系统(例如，显式和/或隐式训练的分类器)。在此处使用时，术语"推断"或"推理"通常指的是经由事件和/或数据捕获的一组观察结果来推出或推断系统、环境、和/或用户状态的过程。例如，推断可用于标识特定的上下文或动作，或可生成状态的概率分布。推断可以是概率性的——即，基于数据和事件的考虑计算感兴趣的状态的概率分布。推断也可以指用于从一组事件和/或数据合成更高级事件的技术。
这类推断导致从一组观察到的事件和/或储存的事件数据构造新的事件或动作，无论事件是否在相邻时间上相关，也无论事件和数据是来自一个还是若干个事件和数据源。可采用各种分类方案和/或系统(例如，支持矢量机、神经网络、专家系统、贝叶斯信任网络、模糊逻辑、数据融合引擎等)来执行关于本发明的自动化和/或推理的动作。
此外，本发明可以使用产生软件、固件、硬件或其任意组合的标准编程和 /或工程技术实现为用于控制基于计算机以实现公开的本发明的方法、装置或制品。在此使用的术语"产品"意指包含可以从任何计算机可读设备、载体或介质访问的计算机程序。例如，计算机可读介质可以包括但不限于磁存储设备(例
如，硬盘、软磁、磁带等)、光盘(例如，光盘(CD)、数字通用盘(DVD)等)、
智能卡和闪速存储器设备(例如，卡、棒)。另外应该明白，载波可以被用于承载计算机可读电子数据，例如那些被用于传送和接收电子邮件方面或被用于
访问网络如因特网或局域网(LAN)的数据。当然，本领域的技术人员将会认识到，在不背离所要求保护的主题的范围或精神的前提下可以对这一配置进行许多修改。
首先转向图1，公开了用以标识主动提供的大批消息和/或恶意代码的语音 /传真消息系统100。系统100包括采集组件110和检测组件120。采集组件110 接收、检索或以其他方式获取或采集语音或传真消息等。采集组件110通信耦合至检测组件120。因此，采集组件110可以将消息传送给检测组件120。作为替换，检测组件120可以从采集组件110检索消息或者在获得消息(例如，实时，流传送等)时对其进行操作。检测组件120可以分析消息并且确定或标识主动提供的大量消息或兜售信息和/或恶意代码，恶意代码包括但不限于病毒、蠕虫和木马。检测可以基于一种或多种规则或算法、优先选择、模式匹配和/或机器学习或人工智能等来完成。例如，可以利用能够检查具体关键字或短语的算法来检测兜售信息。基于算法的结果，可以分配对应于该消息是兜售信息的概率的得分。如果得分大于或等于一具体值(例如，预定义的)，就可以说已经检测到兜售信息。如果得分小于该具体数值，则未找出兜售信息。一旦检测到兜售信息，可以记录各种特性来改善今后对消息的检测机制。作为示例而非限制，可以将起源电话号码或其他标识符记入日志，从而可以预期今后来自这一号码的消息更有可能是兜售信息或者包括恶意消息。也可以应用类似的机制和方法来便于对恶意代码的标识。
图2根据本发明的一个方面更为详尽地示出了检测组件120。检测组件120 包括分析组件122。分析组件122通信耦合至言语至文本组件123、言语组件 124、字符识别组件125和结构组件126。结果，该分析组件122可以利用从通信耦合组件123、 124、 125和126中的一个或多个提供或接收的输入来便于对兜售信息和/或恶意代码和其他事物的检测。
言语至文本组件(在此也称为STT组件)123识别口头通信并将说出或录下的字词转换成文本。因此，STT组件123能够在语音消息被传送时或从其记录版本基本实时地对其进行转换。以此方式，分析组件122能够仔细检査STT 组件123生成的文本以检测兜售信息或恶意代码。
与STT组件123不同，言语组件124能够单独扫描音频，而非从音频生成的文本，以便于对其中的具体关键字、短语和/或模式的标识。因此，分析组件122能够提供例如关键字给言语组件124，并且该组件能够指出该音频中是否出现过这些关键字。另外，言语组件124还能够鉴别可能会感兴趣的附加特性，包括但不限于音调和音量。
分析组件122还能够利用字符识别组件125来帮助标识诸如传真的电子通信中的具体字词。例如，识别组件125能够利用标准和/或新颖的识别算法来创建表示扫描文档内容的结构化文档。作为附加或者替换，结构组件126用于扫描诸如传真的文档的结构，而不是经转换的结构化文档，以便于对兜售信息或恶意代码的检测。
应该认识到分析组件122可以利用一个以上所述组件来便于检测并提高可靠性。作为示例而非限制，分析组件122可以接收来自STT组件123和言语组件124两者的数据以确定具体的字词或短语是否在一语音消息中出现。类似地，字符识别组件125和结构组件126可组合使用以帮助标识在诸如传真的扫描文档中的兜售信息和/或恶意代码。
图3根据所要求保护的本发明的一个方面描绘了消息过滤系统300。过滤系统300包括采集组件110和过滤器组件310。采集组件110接收、检索或以其他方式获取或采集电子语音或传真通信。采集组件IIO通信耦合至过滤器组件310。过滤器组件310滤出、移除或以其他方式对已被确定为兜售信息或者包括恶意代码等的通信进行动作。在标识这些消息时执行的判定和动作可由算法、规则和/或优先选择来指导。过滤器组件310包括检测组件120和动作组件 310。
如前参考图1和2所述，检测组件120用于至少部分地基于语音或传真消息的内容来标识可能是兜售信息或者含有恶意代码的通信。例如，检测组件120 可以通过单独分析音频和/或通过将音频转换为文本并仔细检查该文本来分析语音消息的关键字、短语或模式。类似地，检测组件120能够通过估计文档的结构和/或例如利用字符识别机制和/或方法将文档转换成结构化文档(例如，包括标签、元数据、XML等)来标识诸如传真的扫描文档内的具体关键字或
短语。检测组件120通信耦合至动作组件312。
动作组件312从检测组件120接收一消息是否是兜售信息或者包括恶意代码的指示。一旦接收到这一指示，动作组件312就能够例如基于一种或多种规则和/或优先选择来执行一些动作。举例来说，一旦接收到被标识为兜售信息的消息，动作组件312就能够将消息转发至垃圾邮件箱或者简单地删除该消息。类似地，一旦接收到包括恶意代码的消息，就可以删除或隔离该消息从而不允许该代码完成其预想结果。作为附加或者替换，可以记录消息源的电话号码或其他标识符。由动作组件312采取的动作可由用户应用程序(例如，电子邮件应用程序)执行，或者可由诸如SMTP (简单邮件传输协议)服务器的邮件服务器更为敏感执行以减轻用户应用程序的责任。类似地，检测也可由用户应用程序或邮件服务器执行。
还应认识到过滤器组件310不仅仅需要针对兜售信息和恶意代码使用。另外，过滤器组件310还可以表示某些用户或管理员规则或优先选择。过滤器组件310随后可用于至少基于消息的内容分组或组织具体类型的消息。于是，检测组件120可用于标识具体内容，而动作组件312可根据规则执行分组或组织消息所要求的动作。
参见图4，根据本发明一个方面公开了语音/传真消息系统400。系统400 包括采集组件110和转换组件410。采集组件110如前所述能够接收、检索或以其他方式获取或采集语音或传真通信。采集组件110通信耦合至转换组件 410。转换组件410检索、检索或以其他方式获取来自采集组件110的通信。一旦接收或检索到，转换组件410就能够将语音或传真消息转换成电子消息或电子邮件。例如，语音通信可以被记录并作为附件添加至电子邮件。此外，该消息内容的至少一部分可以在电子邮件正文内提供。
转而关注图5，根据所要求保护的本发明的一个方面示出转换组件410。转换组件410包括预览组件510。预览组件510使得语音或传真消息内容的至少一部分能够在电子邮件正文内提供。预览组件510包括言语至文本(STT)组件123和字符识别组件125。 STT组件123能够识别语音并利用标准和/或新颖算法将字词转换成文本。字符识别组件125能够分析诸如传真的扫描文档，标
识并组织其中的字符。由组件123和125提供的功能可以在接收消息期间或之后对所记录或保存的版本实时执行。由STT组件123或字符识别组件125提供的字词和/或字符可以关联于该消息由预览组件510插入电子邮件正文。
转换组件410还可以包括附件组件520。附件组件520能够记录和/或保存所接收的语音或传真消息。该消息的记录或保存版本随后可以作为附件添加至电子邮件。转换组件410通信耦合至预览组件以便于在详尽消息之前生成消息预览。
除了前述组件，转换组件410还可以包括类型标识(identity)组件530。标识组件530可在电子邮件内提供是否包括语音邮件消息或传真消息的指示。该指示尤其还可以在电子邮件正文中提供。为了帮助确定语音或传真消息，标识符组件通信耦合至预览组件510和附件组件520。标识符组件520能够例如基于附件本身或者是利用STT组件123还是字符识别组件125生成预览和/或预览本身来做出这一判定。
图6示出了消息过滤系统600。过滤系统600包括采集组件110。如前所述，采集组件110能够接收、检索或以其他方式获取或采集语音或传真消息。采集组件110提供消息数据给通信耦合的转换组件410。
转换组件410将语音或传真消息转换成电子邮件消息。例如，语音或传真消息可以被记录或保存并附加至电子邮件，尤其是在正文内提供的内容的至少一部分。转换组件410能够通信耦合至一个或多个非固有的插入组件610，藉此扩展转换组件410的功能。例如，插入组件610能够向转换组件410提供言语至文本功能。
过滤器组件320通信耦合至转换组件410并能够从中接收消息。过滤器组件320能够标识具体电子邮件并对其动作。例如，过滤器组件320针对具体关键字扫描经转换语音或传真消息的文本，并且在找出关键字的情况下执行一些动作。作为附加或者替换，过滤器组件320能够扫描附件，尤其是包括音频或扫描文档的附件。应该认识到过滤器组件320可以与转换组件410相结合。
现转向图7，根据本发明的一个方面示出转换组件410。转换组件410包括预览组件510、附件组件520、类型标识符组件530和过滤器组件320。预览组件510包括言语至文本(STT)组件512和字符识别组件514。预览组件510 在一个场景中能够与附件组件520交互，并且在电子邮件正文中提供其内容的至少一部分。STT组件512能够将言语转换成文本。因此，STT组件512可用于将语音消息转换成文本字符。字符识别组件514能够发现并捕捉文档中的字符。于是，字符识别组件514就可用于捕捉诸如传真的扫描文档的内容。附件组件520从语音或传真通信生成随后作为附件添加至电子邮件的文件。类型标识符组件530生成表示电子邮件消息类型的附加至电子邮件的标识符。例如，标识符可以指示该电子邮件对应于捕捉语音或传真消息的消息。转换组件410 还可以包括过滤器组件320。
过滤器320通信耦合至附件组件520、预览组件510和类型标识符组件 530。过滤器组件320能够认出具体关键字、短语等以尝试检测包括但不限于主动提供的大量消息和恶意代码在内的具体消息内容。动作可由过滤器组件 320基于发现的内容来发起。过滤器组件320可以在经由附件组件520记录期间或其后分析语音消息。作为附加或替换，有预览组件510生成的内容预览可由过滤器组件320分析以检测消息和/或对其进行动作。过滤器组件320还可以提供信息给类型标识符组件530以便于发现电子邮件消息的类型。
图8示出了根据本发明一个方面的示例性消息过滤方法800。过滤系统800 包括分支交换组件810用于采集语音和/或传真通信。分支交换组件810可以包括传统或者互联网协议(IP)分支交换(IPBX)。此外，交换组件810可以是公共的(例如，中心局交换服务)或私人的(PBX)。交换组件810能够接收来自常规电话系统的通信，或者通过电话协议、IP协议(例如，H.323、 SIP等) 或任何其他公共或私有协议经因特网接收通信。一旦接收通信，分支交换组件 810能够将该通信路由至转换组件820。作为示例，分支组件810能够将无应答的呼叫或者被配置为应答传真的电话号码转发给组件410。
转换组件410如前所述能够将接收到的通信转换成电子邮件。转换组件 410能够从分支交换组件810或经由藉此提供的连接接收通信。该通信可以在随后或者同时变换为SMTP (简单邮件传输协议)消息。如上所述，语音或传真消息可以被记录或保存，并作为附件提供。此外，该消息内容的至少一部分例如可以用MIME (多用途因特网邮件扩展协议)格式编码在正文内。正文内还可以捕捉附加信息，包括但不限于消息类型(例如，语音、传真)、呼叫电话号码、语音消息持续时间、语音消息发送者名、附件名和传真页数。此外， MIME消息可被转换成能够用消息分类的内部表示来存储的内部表示。这一分类随后可由客户端访问软件用来显示经优化的UI。
另外，基于来自分支交换组件810和/或消息服务器830的可用消息，转换组件410能够例如利用HTML内容类型来合成可查看消息。作为示例而非限制，提供了图9a-c。本领域普通技术人员将会理解，随后的示例性说明只是向收件人提供信息的多种方式之一。此外，还可以藉此提供附加和/或替换内容。图9a示出了解析呼叫者id时的示例语音邮件消息内容。如图所示，指示了在一具体日期接收自发件人的语音消息。所附消息被保存为名为"425-555-7515" 的历时15秒的WMA (Windows Media Audio,视窗媒体音频)文件。此外，还提供了有关该发件人的信息，包括他的职务、公司、工作号码、移动号码、家庭号码以及他的电子邮件和即时消息地址。图9b提供了在解析呼叫者id时示例的未接呼叫消息内容。在此呈现了类似的信息，但是没有附加文件，这或许是因为发件人决定不留消息。最后，图9c描绘了解析呼叫者id时的示例传真消息内容。在此场景中，提供相同的信息，但却是导向传真消息。
转换组件410是可扩展的。更具体地，转换组件410能够利用第三方和/ 或非固有功能，这例如可由插入组件610提供。作为示例而非限制，插入组件 610可以提供一种或多种算法以便于语音-文本翻译或实现优化字符识别。在此方法中，不是所有的功能都需要由转换组件410单独提供。此外，可以对转换组件410进行更新以使其能够利用与电子邮件生成相关联的最佳技术或机制。
还应该注意到，转换组件410可便于在接收消息之前和/或之后检査期望收件人的邮箱限额。以此方式，组件410能够确保所接受的消息被发送给预期收件人，因为发件人期望这样并且通常无法接收到指示该消息未被递送的报告。例如，系统820可能无法应答指示对邮箱限额已满的收件人的呼叫。
所生成的电子邮件或SMTP消息可以从转换组件410发送到消息服务器 830 (同样是在此定义的一个组件)。消息服务器830尤其能够处理要递送给预期收件人邮箱的消息，使得这些消息可由电子邮件应用程序(例如，查看器 /编辑器以及POP或IMAP客户端)接收或检索。因此，服务器830尤其可对应于邮箱、SMTP和/或桥头服务器。还应认识到转换组件410可以是与SMTP 服务器通信的SMTP客户端。除了将消息转发给收件人的邮箱，消息服务器 830还可过滤这些消息。过滤可以使用针对电子邮件的常规过滤器来进行，这些过滤器包括兜售信息和恶意代码过滤器或代理以及常规电子邮件规则或代理。以此方式，就可利用常规消息递送流水线来执行语音/传真过滤，而无需建立新的流水线。此外，消息服务器830可以利用一个或多个特定代理832 (同样是作为在此定义术语的组件)来扫描音频而非消息的文本预览。这些音频代理832能够尤其基于语音音调、音量和/或脏话检查来进行过滤。类似地，特定的传真代理834 (同样是作为在此定义术语的组件)可被用来扫描与经转换结构化文档或预览分开的电子邮件结构。还应注意到，这些代理832和834尤其可以是由服务器厂商或第三方厂商生成的插入程序或外接件。
应该注意到转换组件410可以从一个以上的消息服务器830中进行选择。组件410可以利用诸如循环(round-robin)法的算法在消息提交期间从服务器列表中选择一服务器。如果组件410未能连接至所选服务器，它会注意该情况并利用下一个服务器。在预定时间段(例如，N秒)内将不会利用标记为停机的服务器。如果服务器都不可用，呼叫将不被应答，或者会做出指示服务器不可用的提示。如果服务器在应答呼叫并记录消息之后停机，则转换组件410以及更具体地与其相关联的假脱机程序就能够确保一服务器变为在线时递送该消息。
己经关于一些组件之间的交互作用描述了上述系统。应该明白，此类系统和组件可以包括在此所指定的那些组件或子组件、所指定组件或子组件中的一部分和/或另外的组件。子组件也可以被实现为在通信上被耦合到其他组件而不是被包括在父组件中的组件。此外，一个或多个组件和/或子组件可以结合成提供总体功能的单个组件。诸组件也可以与出于简要考虑在此未具体描述但本领域的技术人员已知的一个或多个其他组件交互。
此外，应该明白以上公开的系统以及以下方法的不同部分可以包括或包含基于人工智能、机器学习或知识或规则的组件、子组件、进程、装置、方法或机制(例如，支持向量机、神经网络、专家系统、贝叶斯信任网络、模糊逻辑、数据融合引擎、分类器等)。此类组件和其他组件可以自动化地执行特定机制或进程，由此使得系统和方法的诸部分变得更加自适应、高效及智能。作为示
例而非限制，过滤器组件810和/或代理832和834能够利用这些机制或方法来便于对消息内容的分析。组件810或代理832和834能够基于当前的消息内容以及先前的经验或知识来推断(作为在此定义的术语)消息包含兜售信息和/ 或恶意代码。
考虑到以上描述的示例性系统，参考图10-15的流程图将可以更好地理解依照所公开的主题实现的方法。尽管出于简化解释的目的，各方法被显示和描述为一系列的框，但应该理解和明白，所要求保护的主题不受框的顺序所限，因为一些框能够以与在此所叙述和描述所不同的顺序发生和/或与其他框同时发生。而且，实现以下所描述的方法并非需要全部示例的框。
另外还应该明白，下文以及本说明书全文中所揭示的方法可以被存储在产品上，以便于把此类方法传送和传输给计算机。在此使用的术语"产品"意指包含可以从任何计算机可读设备、载体或介质访问的计算机程序。
转向图10，根据本发明一个方面描绘了预处理方法1000。在接受并处理诸如语音消息的通信之前，可以执行若干动作。进行这一预处理是为了符合用户对在语音或传真消息被发送并接收时，这些消息会到达预期收件人的期望。不像电子邮件，这些方法通常不提供接收指示预期收件人未接收到该消息的报告的手段。在参考数字1010处，检测到一连接。例如，呼入的呼叫或通信转发自分支交换或其他采集组件。在1020，做出诸如桥头的服务器可否用来接受该消息的判定。如果否，则在1022，可以应答该通信并提供告知服务器不可用的提示。本方法随后可以终止。然而，还应注意到该通信可能是简单地未被接收。例如，可能会允许电话通信继续响铃而无应答。任一情况下，通信都未被接收，因而就无法递送给预期收件人。如果在1020服务器可用，则方法在其中标识预期收件人的1030继续。例如，基于所拨电话号码来查找或以其他方式标识预期收件人。在参考数字1040，做出预期收件人的预期是否超出限额的判定。限额可关联于管理员对用户能够接收的消息数量限制的邮箱。如果邮箱超出限额，则在1042，通信可被应答并且发出指示该邮箱已满的消息。作为替换，可以简单地不应答通信。应该注意到在此情况下，不应答有一个好处，就是诸如PBX或其他交换组件可以具有用以将该呼叫传递给另一终点的逻辑。如果邮箱没有超出限额，则本方法能够行进至1050，其中通信被应答并处理。随后，本方法终止。应该认识到当通信正被处理时，服务器可以变为不可用。在此情况下，所处理的通信可被放置在队列中并在服务器变得可用时被发送。类似地，预期收件人的邮箱限额在处理期间也可以被填充。在此特定情况下，可以超出限额并递送消息。
图11描绘了根据本发明一个方面的消息处理方法1100。在参考数字1110，
接收语音或传真通信或消息。在1120，基于接收到的通信生成电子邮件或邮件包。该电子邮件或邮件包随后在1130被发送至消息服务器等以便递送至预期收件人的邮箱。例如，可以利用SMTP做出这一传输。
图12示出了与音频或语音消息相关联的合成方法1200。在1210，保存或记录语音通信。在数字1220，可以在记录期间或之后分析语音通信内容。在 1230，生成该通信的预览。预览包括该音频通信的至少一部分的文本。例如，话音-文本机制和/或技术可用来将音频转换成文本以供预览。在1230，生成消
息分组或电子邮件。所保存的音频可以作为附件提供，而预览则能够形成电子邮件正文的一部分。还应注意到还可以填充MIME报头，诸如消息类型、呼叫电话号码、收件人电子邮件地址、语音消息持续时间、语音消息发件人名字、主题和附件名(未接呼叫为空)。还应理解，考虑到个人会使用其他的电话、计算机等，"发件人"MIME报头与标准的"发自(from)"首部不同。还可以指定是否期望适时提供未递送报告，以及呼叫者是否将该消息标记为重要等。还应注意到所合成的电子邮件可以对应于在呼叫者例如未能留下消息的情况下的未接呼叫(例如，参见图9b)。
图13描绘了关联于传真消息处理通信的方法1300。在参考数字1310，保存接收到的传真或类似的扫描文档。在1320，分析传真内容。这一动作可以紧随保存之后或与其同时执行。在1330，创建捕捉了传真内容的至少一部分的结构化文档或预览。这可以对应于向文档应用字符识别技术或机制。在1340，组装电子邮件或其他邮件包。更具体地，可以将保存的传真作为附件添加，并且可以将预览加入电子邮件正文。还应该认识到设置MIME报头，诸如消息类型 (这里是传真)、呼叫电话号码以及传真页数等。
图14示出了根据本发明一个方面的消息服务器方法1100。在参考数字1410，接收针对语音和/或传真消息的电子邮件消息。如前所述，电子邮件可以
包括作为附件的语音或传真消息，以及在电子邮件正文中的预览。在1420，对电子邮件应用一个或多个恶意代码过滤器。该过滤器可以包括那些分析所有电子邮件的标准过滤器。更具体地，这些过滤器可捕捉在正文中提供的预览内的恶意代码，诸如病毒、蠕虫或木马。然而，可以特别地对语音或传真消息应用附加滤波器。在1430,可对电子邮件应用一个或多个兜售信息过滤器。同样地，这些过滤器可以是应用于所有电子邮件的标准过滤器。在此场景中，可以基于在正文中提供的预览来检测兜售信息。作为附加或者替换，可以特别地对语音或传真消息附件应用特定的过滤器。这些过滤器能够启用对检测兜售信息感兴趣的附加特性的检测，包括但不限于电子邮件的语音音调和音量以及传真消息的结构。
转向图15，提供了示出根据本发明一个方面的客户端应用程序方法1500 的流程图。在参考数字1510，接收语音/传真电子邮件消息。这些消息可以是例如利用POP或IMAP协议从消息服务器中接收的。在1520，将指定类型的格式应用于特定消息。例如，解释MIME格式并根据其显示消息。图9a-9b提供了用于语音和传真消息的示例性显示格式。在1530，指定规则是应用于各条消息的用户定义规则。例如，来自一具体发件人或电话号码的消息可被移至选定文件夹或触发一警报。另外，应该认识到能被应用于常规电子邮件或与标准电子邮件程序相关联的任何其他动作也可针对语音/传真消息而加以应用。
为给所揭示的主题的各方面提供上下文，图16和17以及下列讨论旨在提供可以在其中实现所揭示主题的各方面的合适的计算环境的简要、概括的描述。尽管前面己经在运行在一个或多个计算机上的计算机程序的计算机可执行指令的一般上下文中描述了本发明，然而本领域内的技术人员将认识到，本发明也可以和其他程序模块结合实现。一般地，程序模块包括执行特定任务和/ 或实现特定抽象数据类型的例程、程序、对象、数据结构等等。而且，本领域内的技术人员将会理解，本发明的方法可以与其他计算机系统配置一起实施，包括单处理器或多处理器计算机系统、小型计算设备、大型计算机以及个人计算机、手持式计算设备(例如，个人数字助理(PDA)、电话、手表等)、基于微处理器的或可编程的消费性或工业电子产品等等。也可以在分布式计算环境中实践所例示的方面，在分布式计算环境中，任务是由通过通信网络连接的远程处理设备执行的。然而，声明的本发明的一些方面，如果不是全部方面，可以在独立计算机上实施。在分布式计算环境中，程序模块可被置于本地或远程的存储器设备中。
参考图16，为实现在此公开的各方面的示例性环境1610包括计算机1612
(例如，台式计算机、膝上型计算机、服务器、手持式计算机、可编程消费者
或工业电子产品等)。计算机1612包括处理器单元1614，系统存储器1616, 以及系统总线1618。系统总线1618把包括但不限于系统存储器1616的系统部件连接到处理单元1614。处理单元1614可以是各种可用处理器中的任意一种。双微处理器和其它多处理器结构也可用作处理单元1614。
系统总线1618可以是几种类型的总线结构中的任意一种，包括存储器总线或存储器控制器，外围总线或外部总线，和/或利用下述可用总线结构中的任意一种的本地总线，包括但不限于，ll位总线，工业标准结构(ISA)，微通道结构(MCA)，扩展工业标准结构(EISA)，智能化驱动器电子接口 (IDE)， VESA本地总线(VLB)，外围部件互连(PCI)，通用串行总线(USB)，高级图形端口 (AGP)，个人计算机内存卡国际联合会总线(PCMCIA)，以及小型计算机系统接口 (SCSI)。
系统存储器1616包括易失性存储器1620以及非易失性存储器1622。基本输入/输出系统(BIOS)包含诸如在启动期间在计算机1612的元件之间传送信息的基本例程，其存储在非易失性存储器1622中。作为例子而不是限制，非易失性存储器1622可以包括只读存储器(ROM)，可编程ROM (PROM)，电可编程ROM (EPROM)，电可擦除ROM (EEPROM)，或者闪存。易失性存储器1620包括用作外部高速缓存的随机存取存储器(RAM)。作为例子而不是限制，RAM可以是很多形式，诸如同步RAM (SRAM)，动态RAM (DRAM)，同步DRAM (SDRAM)，双速SDRAM (DDR SDRAM)，增强型SDRAM (ESDRAM)，同步链接DRAM (SLDRAM)，以及直接存储器总线RAM (DRRAM)。
计算机1612还包括可移动/不可移动，易失性/非易失性计算机存储介质。例如，图16示出了磁盘存储器1624。磁盘存储器1624包括但不限于诸如磁盘驱动器、软盘驱动器、磁带驱动器、Jaz驱动器、Zip驱动器、LS-100驱动器、闪存卡、或者内存条之类的设备。此外，磁盘存储器1624可以包括独立的或者与其它存储介质结合的存储介质，包括但不限于诸如加密盘ROM驱动器 (CD-ROM)、可记录CD驱动器(CD-R驱动器)、可重写CD驱动器(CD-RW 驱动器)或者数字视频盘ROM驱动器(DVD-ROM)这样的光盘驱动器。为了便于把磁盘存储装置1624连接到系统总线1618，通常把可移动或不可移动的接口用作诸如接口 1626。
应该明白，图16描述了在合适的操作环境1610中描述的基础计算机资源和用户之间起到中介作用的软件。这些软件包括操作系统1628。存储在磁盘存储器1628上的操作系统1624，在运行时控制并分配计算机系统1612的资源。系统应用程序1630通过存储在系统内存1628或磁盘存储器1632中的程序模块1634和程序数据1616，利用操作系统1624对资源进行管理。应该明白，本发明可以用各种操作系统或操作系统的组合来实施。
用户通过输入装置1636把命令或信息输入到计算机1612中。输入装置 1636包括但不限于诸如光标、轨迹球、指示笔、触摸板、键盘、麦克风、操纵杆、游戏手柄、卫星反射器、扫描仪、TV调谐卡、数码相机、数字摄像机、网页照相机等等。这些以及其它输入装置通过系统总线1614经由接口端口 1638连至处理单元1618。接口端口 1638包括，例如串行端口、并行端口、游戏端口、以及通用串行总线(USB)。输出装置1640利用和输入装置1636相同类型的端口。因此，例如，USB端口可以用来向计算机1612提供输入，以及把来自计算机1612的信息输出到输出装置1640。输出适配器1642是用来举例说明存在某些输出装置1640，像显示器(例如，平板、CRT等)、扬声器、以及打印机等需要专用适配器。输出适配器1642包括，作为例子而不是限制，视频和声频卡，其在输出装置1640和系统总线1618之间提供了连接装置。应该注意到，其它装置和/或系统提供了诸如远程计算机1644这样的输入和输出能力。
计算机1612可以利用到诸如远程计算机1644这样的一个或多个远程计算机的逻辑连接在联网的环境中操作。远程计算机1644可以是个人计算机、服务器、路由器、网络PC、工作站、基于电器的微处理器，同等装置或者其它普通网络节点等，通常包括所描述的有关于计算机1612中的很多或者全部元
件。为了简明，只举例说明了远程计算机1646的存储器存储设备1644。远程计算机1644经由网络接口 1648被逻辑地连接到计算机1612然后经由通信连接1650被物理连接。网络接口 1648包括诸如局域网(LAN)和广域网(WAN) 这样的通信网络。LAN技术包括光纤分布式数据接口 (FDDI)、铜线分布式数据接口、以太网/IEEE 802.3、令牌环/IEEE 802.3等。WAN技术包括但不限于，点对点链接，像综合业务数字网(ISDN)和其各种变形的线路交换网，分组交换网，以及数字用户专线(DSL)。
通信连接1650指的是把网络接口 1648连接到总线1618的硬件/软件。虽然为了清楚地举例说明，通信连接1650显示在计算机1616的内部，但其也可以在计算机1612的外部。连接到网络接口 1648所需要的硬件/软件包括(仅为了举例说明)内部和外部技术，诸如调制解调器包括常规电话级别的调制解调器、电缆调制解调器以及DSL调制解调器、ISDN适配器、和以太网卡或组件。
图17是本发明可与其交互的示例计算环境1700的示意框图。系统1700 包括一个或多个客户端1710。(诸)客户端1710可以是硬件和/或软件(例如，线程、进程、计算设备)。系统1700也包括一个或多个服务器1730。因此，系统1300可以对应于两层客户端服务器模型或多层模型(例如，客户端、中间层服务器、数据服务器)以及其他模型。(诸)服务器1730可以是硬件和/ 或软件(例如，线程、进程、计算设备)。服务器1730可以容纳各线程以通过例如利用本发明执行转换。在客户端1710和服务器1730之间的一种可能的通信能够以在两个或多个计算机进程之间传输的数据分组的形式进行。例如，数据分组可对应于尤其与语音或传真通信相关联的电子邮件。
系统1700包括可以用来使(诸)客户端1710 (例如，电子邮件应用程序) 和(诸)服务器1730 (例如，消息、STMP、桥头等)之间通信更容易的通信框架1750。(诸)客户端1710工作时被连接到一个或多个可以用来存储(诸) 客户端1710的本地信息的客户端数据存储1760。同样地，(诸)服务器1730 工作时被连接到一个或多个可以用来存储(诸)服务器1740的本地信息的服务器存储1730。
以上所已经描述的内容包括所要求保护的主题的各方面的例子。当然，出于描绘所要求保护的主题的目的而描述每一个可以想到的组件或方法的组合是不可能的，但本领域内的普通技术人员应该认识到，所要求保护的主题的许多进一步的组合和排列都是可能的。因此，所要求保护的主题被规定为包括所有这些属于所附权利要求书的精神和范围内的改变、修改和变动。此外，在详细描述或权利要求书中用到的术语"包含"、"具有"的范围内，此类术语被规定为以类似于术语"包括"的方式包括在内，此处的"包括"作为过渡词在权利要求书中使用时做出解释。
权利要求
1.一种计算机实现的过滤系统(100、300、400、600、800)包括下列计算机实现组件接收语音或传真通信的采集组件(110)，以及检测主动提供的大量通信的检测组件(120)。
2. 如权利要求1所述的系统，其特征在于，还包括根据规则对检测到的主动提供的大量通信进行动作的动作组件(312)。
3. 如权利要求l所述的系统，其特征在于，所述检测组件(120)检测与所述通信相关联的一个或多个病毒。
4. 如权利要求3所述的系统，其特征在于，所述检测组件(120)包括分析来自一个或多个言语至文本组件(123)的数据的分析组件(122)、言语组件(124)、字符识别组件(125)和结构组件(126)。
5. 如权利要求1所述的系统，其特征在于，还包括生成将所述通信包括为附件的电子邮件的转换组件(410)。
6. 如权利要求5所述的系统，其特征在于，所述转换组件(410)包括在所述电子邮件正文内以文本提供所述通信内容的一部分以便于对主动提供的大量通信的检测的预览组件(510)。
7. 如权利要求5所述的系统，其特征在于，所述转换组件(410)包括将所述消息的类型标识为语音和传真中至少一种的类型标识符组件(530)。
8. 如权利要求5所述的系统，其特征在于，所述转换组件(410)与提供功能给所述检测组件(120)以便于对主动提供的大量通信的检测的插入组件(610)交互。
9. 如权利要求1所述的系统，其特征在于，所述通信是从分支交换(810) 接收的。
10. —种与语音和传真消息交互的方法，包括下列计算机实现动作-接收语音或传真消息的电子传输；以及生成包括作为附件的所述语音或传真消息以及在正文中捕捉的所述消息内容的至少一部分的电子邮件。生成所述电子邮件包括对 -种或多种，以捕捉所述消
11. 如权利要求IO所述的方法，其特征在于，生成所述电子邮件包括捕捉MIME格式的内容。
12. 如权利要求10所述的方法，其特征在于，所述消息利用言语至文本和字符识别机制或方法的-息内容的至少一部分。
13. 如权利要求10所述的方法，其特征在于，还包括将所述电子邮件提供给邮件服务器。
14. 如权利要求10所述的方法，其特征在于，还包括利用插入组件来便于电子邮件的生成。
15. 如权利要求10所述的方法，其特征在于，接收所述电子传输包括接收由分支交换转发的呼叫。
16. 如权利要求10所述的方法，其特征在于，还包括分析所述消息以判定所述消息是否是兜售信息或包括病毒。
17. 如权利要求16所述的方法，其特征在于，分析所述消息包括标识所述电子邮件正文内的一个或多个关键字。
18. —种邮件服务器方法，包括下列计算机可执行动作接收包含作为附件的语音邮件或传真消息以及包括了所述消息内容的至少一部分的正文的电子邮件；以及判定所述电子邮件是否是主动提供的大量通信。
19. 如权利要求18所述的方法，其特征在于，判定所述消息是否是主动提供的大量通信包括对所述电子邮件的正文和附件之一应用兜售信息过滤器。
20. 如权利要求19所述的方法，其特征在于，还包括如果所述电子邮件不是主动提供的大量通信，就将所述电子邮件转发给收件人邮箱。
全文摘要
本发明涉及对语音、传真和类似通信的过滤。对这些消息进行分析以判定它们是否是主动提供的大量通信(即，兜售信息)或包括恶意代码。分析或过滤尤其可通过将消息变换到电子邮件内来实现。该电子邮件包括作为附件的该消息以及提供该消息内容的至少一部分的正文。随后可对该电子邮件应用常规和新颖分析工具以扫描兜售信息和病毒等。
文档编号G06Q10/00GK101310295SQ200680042787
公开日2008年11月19日申请日期2006年10月30日优先权日2005年11月18日
发明者C·N·迪德库克, D·A·豪威尔, R·威廉姆斯, S·R·曼达, S·桑德拉拉曼申请人:微软公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：D.A.豪威尔;S.R.曼达;C.N.迪德库克;S.桑德拉拉曼;R.威廉姆斯
技术所有人：微软公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。