在包括回复或转发电子邮件的操作中,通常在新电子邮件中重复此旧电子邮件的文本内容,以便允许收件人知道旧电子邮件。
当回复或转发操作彼此相继进行时,这在电子邮件的生命周期(可从一天延长到几周,甚至几个月)中经常发生,旧消息(称为召回的消息)会在新电子邮件中累积。
现在,许多用户希望制作他们的电子邮件的数字版本,包括最新的电子邮件(例如,作为iso标准32000-1:2008定义的格式的文档,当前称为pdf(便携式文档格式))或打印输出。
在所生成的文档保留初始文档的形式,具体而言是其分页、字体、任何图像或其他图形对象(例如,消息传递系统最常用于分隔消息主体的分隔线)或超链接这方面,pdf格式的文档版本是相同文档的物理打印输出的电子版本,除非消息是以纯文本格式配置的。
这样,当编辑(或打印)电子邮件时,所产生的文档重复电子邮件的全部内容。当电子邮件包括一系列先前的交换(无论是“回复”还是“转发”类型的电子邮件)时,所产生的文档不必要地长。当文档是电子的时,这导致不必要且不合理地消耗存储空间,更一般地,消耗能量。当文档是物理的时,结果是墨水、纸张和电力的不合理消耗。
因此,用户经常希望在要被编辑(或打印)的文档中删除他们不希望显示的段落。用于表示电子邮件的格式(在
实际上,有必要遵循一系列操作,这些操作通常在大多数
在欧洲专利ep1327192(kentridgedigitallabs)中,已经提出在邮箱的电子邮件中检测冗余内容并直接删除电子邮件文档中的冗余。该解决方案可能适合在个人家庭或家庭邮箱的框架内,但在其中保持消息的可追溯性(以及因此完整性)是重要的专业邮箱的框架内不适合。
因此,第一个目的是提出一种方法,该方法能够以自动方式简化从包含冗余内容的电子邮件中编辑和打印文档。
第二个目的是提出这样一种方法,该方法仍然能够使编辑的电子邮件的召回消息中存在的有意义内容的全部保留在简化文档中。
为此目的,在第一种情况下提出了一种方法,用于从电子消息传递系统编辑基于包括一系列召回的单一消息的电子邮件的简化文档,该方法包括由以下各项组成的操作:
-编辑电子邮件;
-在电子邮件中识别召回的单一消息;
-分析如此识别的每个召回的单一消息;
-在多个召回的单一消息中检测多次出现的元素;
-编辑简化文档,同时保留检测为多次出现的最多单次出现的任何元素。
如此编辑的文档占用减少的存储空间(具有降低的能量消耗),或者,如果是要被打印的文档,则可实现节能(墨水、纸张、电力)。
这些步骤的自动化使用户无需继续手动选择保持编辑或打印输出的目的段落。
根据各种附加特征,单独或组合采用以下操作:
-识别单一消息的步骤之前是确定编辑的电子邮件的it结构的步骤,并且识别所召回的单一消息的步骤包括在电子邮件的it结构中检测以下元素中的至少一者:
o标题字段;
o在消息主体中,签名和/或警告说明(例如,法律警告说明、环境性说明、有关计算机病毒的警告说明)。
-在第一分析的召回的单一消息中检测标题字段、签名或法律警告之后是在字典中存储检测到的元素的步骤,并且在电子邮件的另一召回的消息中检测任何新元素之后是该元素与相同性质的存储元素的比较;
-如果被比较的元素与已存储的元素相同,则从简化文档中删除被比较的元素;
-标题字段的检测包括检测位于一行字符的头部的以下关键字中的至少一者:发件人、收件人、日期、发送、抄送、复制、对象、主题、回复。
-标题字段的检测包括当其后面跟着符号“:”时检测至少一者上述字;
-签名的检测包括在所述消息主体中检测位于字符行的头部的以下关键字中的至少一者:邮件、电子邮件、电邮、网、网站、博客、座机、电话、传真、移动电话、地址、助理(男性和女性)、领导者、部门、主任、经理、顾问、工程师、码头、路、大道、死胡同、车道、项目,多个项目或其他任何语言的等同物。
-签名的检测包括当其后面跟着符号“:”时检测至少一者上述词;
-签名的检测包括检测超链接的至少一者受影响的字符链;
-签名的检测包括检测至少一者图像;
-计划在简化文档中删除在电子邮件中检测到的任何图像;
-签名的检测无视任何潜在图像的存在;
-法律警告说明的检测包括检测以下关键字中的至少一个:警告、免责声明、消息、互联网、信息、错误、病毒、发行人、发件人、诚信、环境、责任、保密、立法、禁止、注意、法律、电邮、披露、收件人、特权、地址、通信、出版物、使用、文档、发送、电子、经理、附件、警告、服务、腐败、内容、循环、客户、立即、发送或可能用于官方语言不是这一语言的国家的其任何其他语言的等同物;
-编辑电子邮件的步骤之后是在电子邮件中检测至少一者分隔条的步骤;
-检测到的条在简化文档中用较细的条替换;
-计划检测电子邮件中任何超链接的操作,编辑后的文档没有任何超链接;
-计划检测电子邮件中的任何突出显示的操作,编辑后的文档没有任何突出显示;
-该方法包括删除所有召回的单一消息。
在第二种情况下,提出了一种用于从包括一系列召回的单一消息的电子邮件打印电子文档的方法,该方法除了如上所述的编辑方法的一系列步骤之外还包括打印所编辑的简化文档的步骤。
根据实施例的描述,本发明的其他目的和优点将显现出来。
电子邮件是由电子消息传递系统生成的文档,并且经由电信网络在发送者和一个或多个接收者之间交换。
电子邮件的特征在于电子结构,其包括:
-信封,其功能是允许传递电子邮件,并以“发件人”一词开头的描述存在,并包含传送(和转发)电子邮件所需的数据,包括发送者的电子地址和接收者的电子地址(包括由字符@分隔的两个字符链),以及由中继电子邮件的服务器插入的时间戳数据;
-信息,由两个元素组成:
o包括标题字段的标题块,由一系列文本行组成,每行包含消息参数的描述,具体包括:
·标识发行人的一行文本,在其开头包含“发件人”一词,后面是发件人的电子地址,可能在别名之前或之后;
·标识收件人的一行文本,并在其开头包含“收件人”一词,后面是收件人(或每个收件人)的地址,可能在别名之前或之后;
·标识电子邮件创建或发送的日期(可能是时间)的一行文本,并以标准日期(分别为时间)格式包含该日期(以及可能是该时间);
o消息主体,其作为包含文本和/或图像的块和/或(如果适用的话)其他电子对象存在,诸如可点击的超链接或几何形状,具体而言是一个或多个分隔条。
电子邮件通常在其主体中包括至少一者其他消息的全部或部分内容,称为“召回消息”,其包含上述电子邮件之前的日期或时间,并且已经被发送、接收或由此电子邮件的发件人或第三方转发。
电子邮件甚至经常包含几个召回的消息,这些消息因此构成了电子邮件跟进(并引用)的序列或讨论链。
下面显示了一个虚构电子邮件的实例(如有雷同,纯属巧合),因为它存在于基于诸如
发件人:johndoe[mailto:johndoe@imastupid.com]
发送时间:2017年3月16日星期四
收件人:mylawyer[mailto:jack@johndoeslawyer.com]
主题:回复:回复:回复:您的订单第20161231号
亲爱的先生,
请查找随附的电子邮件交流。
我想我被骗了。我能做什么?
johndoe
太愚蠢道路1号
巴黎75015
联系电话:01404040
-----------------------------------------------------------
发件人:thethieves[mailto:info@bigthiefs.biz]
发送时间:2017年3月16日星期四
收件人:johndoe[mailto:johndoe@imastupid.com]
主题:回复:回复:回复:回复:您的订单第20161231号
亲爱的先生,
如一般条款和条件所示,对已支付的商品不予退款。
我们很快会向您发送一份满意度调查问卷。
thethieves
dirtytricks大道1号
巴黎75001
联系电话:08000000
www.counterfeiters.com
警告-此电子信息和所有附件均为机密信息,仅供其所针对的人使用。如果您误收到此消息,请立即通知发件人并将其销毁。
-------------------------------------------------------
发件人:johndoe[mailto:johndoe@imastupid.com]
发送时间:2017年3月15日星期三
收件人:thethieves[mailto:info@bigthieves.biz]
主题:回复:回复:回复:您的订单第20161231号
亲爱的先生们,
我还没有收到我的商品。
我希望得到退款。
johndoe
太愚蠢道路1号
巴黎75015
联系电话:01404040
------------------------------------------------------------------
发件人:thethieves[mailto:info@lesvoleurs.biz]
发送时间:2017年1月11日星期三
收件人:johndoe[mailto:johndoe@imastupid.com]
主题:回复:回复:您的订单第20161231号
亲爱的先生,
48小时的截止日期是现场交货。
我被告知您的商品尚未生产。
thethieves
dirtytricks大道1号
巴黎75001
联系电话:08000000
www.counterfeiters.com
警告-此电子信息和所有附件均为机密信息,仅供其所针对的人使用。如果您误收到此消息,请立即通知发件人并将其销毁。
-------------------------------------------------------------
发件人:johndoe[mailto:johndoe@imastupid.com]
发送时间:2017年1月10日星期二
收件人:thethieves[mailto:info@bigthieves.biz]
主题:回复:您的订单第20161231号
亲爱的先生们,
我还没有收到我的商品。
你给了48小时的截止日期。
现在是什么状况?
johndoe
太愚蠢道路1号
巴黎75015
联系电话:01404040
发件人:thethieves[mailto:info@bigthiefs.com]
发送时间:2017年1月1日星期日
收件人:johndoe[mailto:johndoe@imastupid.com]
主题:您的订单第20161231号
亲爱的先生,
我们已收到您的订单。
您的商品将在48小时内送达。
thethieves
dirtytricks大道1号
巴黎75001
联系电话:08000000
www.counterfeiters.com
警告-此电子信息和所有附件均为机密信息,仅供其所针对的人使用。如果您误收到此消息,请立即通知发件人并将其销毁。
可看出,该电子邮件,以下称为“待编辑的电子邮件”,可在电子邮箱jack@johndoeslawyer.com中读取,包括一系列单一消息,即在垂直方向降序:
-在第一例中,主要消息,以下称为msg#0,最新消息,发送到地址jack@johndoeslawyer.com,其内容如下:
msg#0发件人:johndoe[mailto:johndoe@imastupid.com]
发送时间:2017年3月16日星期四
收件人:mylawyer[mailto:jack@johndoeslawyer.com]
主题:回复:回复:回复:您的订单第20161231号
亲爱的先生,
请查找随附的电子邮件交流。
我想我被骗了。我能做什么?
johndoe
太愚蠢道路1号
巴黎75015
联系电话:01404040
-在第二例中,一系列召回的单一消息,下文称为msg#i,其中i是整数,其各自的内容如下(这里是垂直降序,对应于反向时间顺序):
msg#1发件人:thethieves[mailto:info@bigthiefs.biz]
时间:2017年3月16日星期四
收件人johndoe[mailto:johndoe@imastupid.com]
主题:回复:回复:回复:回复:您的订单第20161231号
亲爱的先生,
如一般条款和条件所示,对已支付的商品不予退款。
我们很快会向您发送一份满意度调查问卷。
thethieves
dirtytricks大道1号
巴黎75001
联系电话:08000000
www.counterfeiters.com
警告-此电子信息和所有附件均为机密信息,仅供其所针对的人使用。如果您误收到此消息,请立即通知发件人并将其销毁。
msg#2发件人:johndoe[mailto:johndoe@imastupid.com]
发送时间:2017年3月15日星期三
收件人:thethieves[mailto:info@bigthieves.biz]
主题:回复:回复:回复:您的订单第20161231号
亲爱的先生们,
我还没有收到我的商品。
我希望得到退款。
johndoe
太愚蠢道路1号
巴黎75015
联系电话:01404040
msg#3发件人:thethieves[mailto:info@lesvoleurs.biz]
发送时间:2017年1月11日星期三
收件人:johndoe[mailto:johndoe@imastupid.com]
主题:回复:回复:您的订单第20161231号
亲爱的先生,
48小时的截止日期是现场交货。
我被告知您的商品尚未生产。
thethieves
dirtytricks大道1号
巴黎75001
联系电话:08000000
www.counterfeiters.com
警告-此电子信息和所有附件均为机密信息,仅供其所针对的人使用。如果您误收到此消息,请立即通知发件人并将其销毁。
msg#4发件人:johndoe[mailto:johndoe@imastupid.com]
发送时间:2017年1月10日星期二
收件人:thethieves[mailto:info@bigthiefs.biz]
主题:回复:您的订单第20161231号
亲爱的先生们,
我还没有收到我的商品。
你给了48小时的截止日期。
现在是什么状况?
johndoe
太愚蠢道路1号
巴黎75015
联系电话:01404040
msg#5发件人:thethieves[mailto:info@bigthiefs.com]
发送时间:2017年1月1日星期日
收件人:johndoe[mailto:johndoe@imastupid.com]
主题:您的订单第20161231号
亲爱的先生,
我们已收到您的订单。
您的商品将在48小时内送达。
thethieves
dirtytricks大道1号
巴黎75001
联系电话:08000000
www.counterfeiters.com
警告-此电子信息和所有附件均为机密信息,仅供其所针对的人使用。如果您误收到此消息,请立即通知发件人并将其销毁。
每条消息都有一个普通的结构,并包含一个标题块,后跟消息主体。例如,召回的消息msg#5包括:
-以下标题块:
发件人:thethieves[mailto:info@bigthiefs.com]
发送时间:2017年1月1日星期日
收件人:johndoe[mailto:johndoe@imastupid.com]
主题:您的订单第20161231号
-以下消息主体:
亲爱的先生,
我们已收到您的订单。
您的商品将在48小时内送达。
thethieves
dirtytricks大道1号
巴黎75001
联系电话:08000000
www.counterfeiters.com
警告!thethieves网站对其数据的在线使用不承担任何责任。网站thethieves的责任限制在一般条款和条件中定义。作为付款标的的物品不能退还或退款。
消息主体本身包括:
-有意义的内容,在此作为包含一个或多个句子的文本存在,例如:在召回消息msg#5的情况下:
亲爱的先生,
我们已收到您的订单。
您的商品将在48小时内送达。
-签名,作为包含与身份相关的信息的行块,以及(如果适用)消息发送者的实体细节:例如,在召回的消息msg#5的情况下:
thethieves
dirtytricks大道1号
巴黎75001
联系电话:08000000
www.counterfeiters.com
-如果适用,警告说明(例如法律说明、环境性说明或关于计算机病毒的警告说明),由一系列包含一般信息的行块(或单个段落)组成,不仅涉及收件人,还可涉及第三方读者,并例如涉及处理信息以及发送者、接收者和可能的第三方的相应责任,例如在召回的消息msg#5的情况下!
警告-此电子信息和所有附件均为机密信息,仅供其所针对的人使用。如果您误收到此消息,请立即通知发件人并将其销毁。
虽然作为实例给出了要编辑的电子邮件的内容,但是当用户(这里是要被编辑的电子邮件的收件人)想要编辑该电子邮件时,可能展现用户所面临的问题,作为电子文档(通常为pdf格式)用于存档目的,或作为打印文档。
实际上,用户(这里是邮箱jack@johndoeslawyer.com的用户)可能希望为了他们的业务和/或他们的存档的要求保持交换的内容,也就是说,主消息msg#0的内容,以及召回消息msg#i的内容,同时希望保存某些重复元素,诸如签名。
同样,为了节省内存(在电子文档的情况下)或墨水(在打印文档的情况下),如以下类型的分隔条被删除,或者至少变细可能是明智的:
-----------------------------------------------
或者:
-----------------------------------------------------
可能与名称相关联,例如:
doe,john
---------------------------------------------------
这就是为什么基于电子消息传递系统(诸如
该编辑方法是电子邮件的第一次编辑操作。该操作在电子消息传递系统中以传统方式进行,例如,通过双击所收到元素(或已发送的元素,或者在用户已存档电子邮件或邮件系统自动存档的任何其他文档中)的历史记录中显示的消息行。
从用户的角度,编辑电子邮件导致窗口打开,在该窗口中显示消息的内容,如上面的实例中所示。
与该显示并行地,系统将电子邮件的it结构加载到存储器中,该it结构作为数据文档存在,其格式符合系统提供的对象模型。对于
<[%$topic/bb643865_en-us_office_15_1_0_0_0_0%]("00063034-0000-0000-c000-000000000046")>_
<[%$topic/bb643865_en-us_office_15_1_0_0_0_1%](gettype([%$topic/bb643865_en-us_office_15_1_0_0_0_2%]))>_
publicinterfacemailitem_
inherits[%$topic/bb643865_en-us_office_15_1_0_0_0_3%],[%$topic/bb643865_en-us_office_15_1_0_0_0_4%]
diminstanceasmailitem
[[%$topic/bb643865_en-us_office_15_1_0_2_0_0%]("00063034-0000-0000-c000-000000000046")][[%$topic/bb643865_en-us_office_15_1_0_2_0_1%](typeof([%$topic/bb643865_en-us_office_15_1_0_2_0_2%]))]publicinterfacemailitem:[%$topic/bb643865_en-us_office_15_1_0_2_0_3%],
[%$topic/bb643865_en-us_office_15_1_0_2_0_4%]
电子邮件的it结构包含所有信息(根据上面在
第二步包括在电子邮件中识别召回的单一消息msg#i。这些召回的消息msg#i(其中i严格大于1)将有效(除了主消息msg#0)为了编辑简化文档而需要修剪。
该识别通过检测包括一个或多个标题字段的分隔条或标题块自动发生。
根据一个实施例,标题字段的检测包括检测位于一行字符的头部的至少一者关键字,并且从预定义的关键字列表中选择。根据具体实施例,该列表包括例如以下词:发件人、收件人、日期、发送时间、抄送、复制、对象、主题。该列表是非详尽的并且作为简单的说明性实例提供,包括通常在本申请的语言中在标题字段中找到的词。但是,关键字列表可包括以任何其他语言或多种语言选择的词。实际上,召回的消息的元素(标题块、主体)不会被消息传递系统翻译,并且会像其在电子邮件中一样重复。因此,建议编译包含多种语言的词的关键词列表,通常是英语、法语、西班牙语、德语。
用于检测标题块的多语言关键字列表的实例包括以下单词:from、de、von、to、à、a、nach、date、fecha、datum、sent、envoyé、espedido、geschickt、cc、copy、copie、copia、kopie、object、objet、objekt、objeto、subject、sujet、tema。
应注意,不一定建议从简化文档中省略包含在标题块中的信息。
然而,以缩略形式呈现它们可能是有利的。
以下标题栏:
发件人:thethieves[mailto:info@bigthiefs.com]
发送时间:2017年1月1日星期日
收件人:johndoe[mailto:johndoe@imastupid.com]
主题:您的订单第20161231号
因此,可按如下方式重新格式化,省略某些字段并删除某些信息(例如,当别名可用时的电子地址),通过连接它们和/或更改它们的结构(例如,长日期可以以缩写格式重新格式化,诸如日/月/年或月/日/年):
发件人:thethieves,01/01/2017
在任何情况下,每个消息的标题块的检测可伴随着在数据库中对标题字段中包含的数据的备份操作。因此,在当前情况下,包括别名“thethieves”和地址“info@bigthiefs.com”的标题字段“发件人”的内容可存储在数据库中,优选地存储在两个不同的互连输入中,别名的第一输入和地址的第二输入。
第三步包括分析以这种方式识别的每个召回的单一消息。该步骤的目的是在每个召回的消息中检测消息主体,该消息主体可包括冗余元素或信息,可建议在简化文档中省略该冗余元素或信息。
为了检测召回消息的主体,在内存中具有预定义关键字列表(不论其语言如何)并不是必不可少的。实际上,召回消息的主体在以下内容之间延伸:
-上限,必须是一个标题栏(通过上述方法检测,并可能在分隔条之前);
-下限,可能是:
o电子邮件页面的底部,
o或分隔条,
o或另一个标题块(通过上述方法检测)。
该分析步骤有利地包括检测以下元素中的至少一者:
-签名;
-警告说明(例如法律警告说明、环境性说明、有关计算机病毒的警告说明)。
分析步骤可潜在地包括在消息主体中检测有意义的内容,也就是说,由消息发送者生成或集成的内容,而不是签名和警告说明。
签名和/或警告说明的检测优先于有意义内容的检测,因为它是可被简化而无需语言分析的元素问题。
通过检测关键字的出现可检测签名或警告说明,因为大多数签名和警告说明通常是格式化的。
因此,签名通常包括在没有行间隔的一系列行上包含以下信息,该信息包含至少邮政地址和/或电话号码。邮政地址可通过邮政编码(邮编)或指定一种通道的词来检测;电话号码可通过一系列数字来检测,这些数字可能由空格分隔,并且通常包含字符“+”作为前缀。
实际上,签名的检测包括例如在消息主体中检测位于一行字符的头部的以下关键字中的至少一者:邮件、电子邮件、电邮、网、网站、博客、座机、电话、传真、移动电话、地址、助理(男性和女性)、领导者、部门、主任、经理、顾问、工程师、码头、道路、大道、死胡同、车道或其一中或多种其他语言的等同物。签名的检测还可包括检测一系列相邻(或邻近)数字,其表征电话号码的制定。签名的检测还可包括检测与超链接相关联的字符链(其可表征邮箱地址的制定或到互联网站的链接)。
作为一个实例,召回消息msg#5的主体中存在的签名可通过在一系列没有行间距的行中存在上面列表中存在的两个关键字(“大道”和“电话”)来检测,以及表征电话号码的一系列数字(08000000)来检测:
thethieves
dirtytricks大道1号
巴黎75001
电话:08000000
www.counterfeiters.com
同样地,警告说明通常包括在一系列没有行间距(甚至在单个块中)的行的信息,其通常在法律说明的情况下包含合法保留和/或由消息的发送者或他们的组织做出的推荐的特征的关键字。
在实践中,警告注释的检测包括例如在消息主体中检测以下关键字中的至少一者:警告、免责声明、消息、互联网、信息、错误、病毒、发行者、发送者、完整性、环境、责任、保密、立法、禁止、注意、法律、电子邮件、披露、收件人、特权、地址、通信、出版物、使用、文档、发送、电子、经理、附件、警告、服务、腐败、内容、循环、客户、立即、发送或其一种或多种其他语言的等同物。
签名和警告说明通常位于消息主体的末尾。因此,为了加速分析,最好通过从消息主体的底部开始然后向上移动来继续检测签名和/或法律说明。这种方法可省去对有意义内容的分析,因为在消息体主体中存在签名和/或法律说明的假设中,在探索有意义内容的最后一行之前检测这些元素。
分析步骤还可包括检测以下内容的(有利地系统的)存在:
-任何超链接(内存资源消耗者);
-和/或任何突出显示(能源消耗者,在打印输出的情况下,则为彩色墨水的消耗者)。
该分析步骤之后是在字典数据库中存储检测到的元素(签名和/或警告说明)的步骤。
可充分细化签名的分析以区分姓和/或名(如果适用的话,相关联的名字)、邮政地址、电话号码、电子地址。这些信息通常放在不同的行上。因此,可在数据库中将其存储在若干相应的不同输入中:用于姓的第一输入,用于地址的第二输入,用于电话号码的第三输入,如果适用的话用于电子地址的第四输入。
考虑到签名的结构,可在与该消息相关联的“签名”输入中以下面的方式实现在召回的消息msg#5中检测到的签名的数据库中存储:
thethieves>姓名
dirtytricks大道1号,巴黎75001>地址
08000000>电话
应注意,签名的检测可包括检测图像。通过以通常对应于图像(例如.gif、.pdf、.bmp)的格式检测与消息主体集成的电子对象,可以以常规方式进行该检测。该图像可与签名数据相关联的存储在数据库的输入中。
相反,为了简化(并因此缩短)该过程,签名的检测可系统地忽略潜在图像的存在。
与签名一样,法律说明有利地存储在数据库的专用输入中。
因此,针对召回的消息msg#5,可在与该消息相关联的“法律说明”输入中以下列方式实现法律说明的存储:
警告-此电子信息和所有附件均为机密信息,仅供其所针对的人使用。如果您误收到此消息,请立即通知发件人并将其销毁。>法律说明
对于i=1到n的所有召回的消息msg#i,重复这些分析步骤(更确切地说是标题块的检测和签名和/或法律说明的检测),其中n是召回的消息的数量。
将注意到,指数i的递增可对应于从顶部到底部的电子邮件的扫描(因此i=1对应于主体消息msg#0下面的第一个召回的消息,并且i=n对应于最后召回的消息,按降序排列)或者相反,从底部到顶部(i=1因此对应于电子邮件中最后一个召回的消息,i=n对应于主体消息msg#0下面的第一个召回的消息)。
对以下每个召回的消息msg#i的分析有利地随后是将每个检测到的元素(标题块或字段,签名或法律说明)与已经存储的已经分析的召回消息的相同性质的元素(签名或各自地法律说明)进行比较的操作。
该比较旨在检测在几个召回的单一消息中多次出现的元素,以便在简化文档中保持最多一次出现。
为了执行该比较,将每个检测到的元素与数据库中相同性质的对应元素进行比较。
例如,假设在递增的增加方向上执行对召回消息的分析,则在召回的消息msg#4中检测到以下签名:
johndoe
太愚蠢道路1号
巴黎75015
联系电话:01404040
与召回的消息msg#2中已经检测到(并存储在数据库中)的签名相同。
同样,在召回的消息msg#3中检测到以下警告说明(此处为法律声明):
警告-此电子信息和所有附件均为机密信息,仅供其所针对的人使用。如果您误收到此消息,请立即通知发件人并将其销毁。
…与已在召回的消息msg#1中检测到(并存储在数据库中)的警告说明相同。
上面给出的警告说明实例是一份法律说明;它可能是一个环境说明,诸如:
为了可持续发展,让我们展望未来。仅在必要时才打印此电子邮件。
…或与病毒防护有关的警告:
此电子邮件不包含病毒或恶意软件,因为防病毒保护在发送时处于激活状态。
在这样检测到多次出现之后,可编辑简化的文档,保持检测到多次出现的任何元素的最多一次出现。
根据具体实施例,如果比较元素与已经保存的元素相同,则从简化文档中删除比较元素。作为变型,比较的元素本身可简化。因此,在多次出现的签名中,可想象,在简化文档中,保持完整签名的第一次(或最后一次)出现,并且对于每次新出现,仅保留所标识的姓名,其足以从数据库的相应输入中提取。
任何在电子邮件中或者更准确地说,在任何一个召回的消息中检测到的图像(如果适用的话)有利地从简化文档中省略(也就是说从其中删除)。
同样,简化文档有利地没有任何超链接。然而,可保留与分析的电子邮件中的超链接相关联的字符链。
与超链接一样,有利地从简化文档中删除在电子邮件中检测到的突出显示。
还可在电子邮件中规划特定步骤,用于检测两个召回消息之间的至少一者分隔条。
电子通信中分隔条的存在旨在使其更易于阅读,因为它们允许在视觉上识别所召回的消息的边界。但是,在简化的消息中,不必保持分隔条的初始大小和字体。
因此,根据有利实施例,在简化文档中,每个检测到的分隔条被更细的分隔条替换。
因此,检测到的分隔条,例如在电子邮件中显示如下:
-----------------------------------------------------------
…在简化文档中被更细的分隔条替换,例如,如下所示:
因此,很好,简化文档(也就是说,电子邮件的简化版本)可像这样呈现:
jack
------------------------------------------------------------
发件人:johndoe,16/03/2017
主题:回复:回复:回复:您的订单第20161231号
亲爱的先生,
请查找随附的电子邮件交流。
我想我被骗了。我能做什么?
johndoe
太愚蠢道路1号
巴黎75015
联系电话:01404040
-----------------------------------------------------------
发件人:thethieves,16/03/2017
收件人johndoe
亲爱的先生,
如一般条款和条件所示,对已支付的商品不予退款。
我们很快会向您发送一份满意度调查问卷。
thethieves
dirtytricks大道1号
巴黎75001
联系电话:08000000
www.counterfeiters.com
警告!thethieves网站对其数据的在线使用不承担任何责任。网站thethieves的责任限制在一般条款和条件中定义。作为付款标的的物品不能退还或退款。
-----------------------------------------------------
发件人:johndoe,15/03/2017
收件人:thethieves
亲爱的先生们,
我还没有收到我的商品。
我希望得到退款。
发件人:thethieves,11/01/2017
收件人:johndoe
亲爱的先生,
48小时的截止日期是现场交货。
我被告知您的商品尚未生产。
---------------------------------------------------
发件人:johndoe,10/01/2017
收件人:thethieves
亲爱的先生们,
我还没有收到我的商品。
你给了48小时的截止日期。
----------------------------------------------------
发件人:thethieves,01/01/2017
收件人:johndoe
亲爱的先生,
我们已收到您的订单。
您的商品将在48小时内送达。
由于删除了多次出现的全部或部分,因此编辑的简化文档占用了减少的存储空间并且消耗更少的能量。从形式的角度来看,它看起来更紧凑,更清晰。如果简化文档用于打印,则这种简化使得可节省能量和消耗品(墨水、纸张、电力)。
不言而喻,刚刚描述的内容是自动化的并且由在集成在办公室计算机或服务器(物理或虚拟),打印机中的it处理单元(处理器)上实现的计算机程序执行。
根据具体实施例,甚至可从简化文档中删除所有单一消息,仅保留主消息。有利地,可经由控制台上的专用控件以可选的方式访问该删除,以控制简化消息的编辑。
不同步骤的实现可在实际的电子消息传递系统内进行。为此目的,下面提到的程序有利地作为插件或外接程序存在,在消息传递系统中本地提供或随后添加。作为变型,程序作为与消息传递系统分开的应用程序存在。
不同的步骤由在集成在计算机或服务器(物理或虚拟)中的it控制单元上实现的计算机程序的适当指令控制。
应当注意,可想到计算(并且可能显示)从简化文档中删除的电子邮件的内容的比例(或者相反地保留的内容的比例)。
为了使简化文档尽可能紧凑,还可想到删除任何空行或多余空间。
但是,最好保留某些具有特殊格式的数据,例如,表格。保持图像(签名图像除外)也是优选的。