电子邮件聚合分类方法和装置与流程

文档序号:11829960阅读:431来源:国知局
电子邮件聚合分类方法和装置与流程

本申请涉及计算机技术领域,尤其涉及一种电子邮件聚合分类方法和装置。



背景技术:

在企业内部,每天都会有大量内部邮件以个人对个人、或者个人对小团队的方式发送,而邮件内容很多是针对某个技术处理方案或者技术内容的讨论和总结,其中不乏重要信息以及含金量很高的内容。

但是,大多数邮件都是淹没在邮箱中或者只是某个人看过后就忘记了,如果下次用到了就回到邮箱里搜一下;并且很多邮件都是为了避免邮件干扰以点对点的发送,团队中很多人遇到类似的情况就很难获得到解决方案,很难做到相应的知识沉淀和分类整理。

现有技术中,个人邮箱和企业邮箱没有类似内容自动整合分类的方案,就目前处理方式来看,很多有价值的内部邮件都会永久保留在邮箱服务器上,另外,邮件内容多为单收件人或者邮件组可见,其他人很难同步获得到相应的内容信息,因此现有个人邮箱和企业邮箱多数只有工作交流和通知的功能,很少有知识沉淀及分享的作用。



技术实现要素:

本申请的主要目的在于提供一种电子邮件聚合分类方法和装置,以克服现有技术中的无法分享邮件内容以及对邮件进行分类整理的问题。

为解决上述问题,根据本申请实施例提供了一种电子邮件聚合分类装置,其包括:邮件获取模块,用于获取邮件服务器存储的邮件;关键字提取模块,用于获取所述邮件的内容信息,采用预设的分词方式对邮件内容信息进行分 词处理,提取出邮件内容信息的关键字;聚合分类模块,用于根据邮件内容信息的关键字对邮件内容进行聚合分类处理形成类目树。

其中,所述聚合分类模块还用于,将邮件内容信息的关键字作为该邮件内容信息的标签,并根据标签将邮件内容信息匹配至预设的类目中。

其中,还包括:类目树索引服务模块,用于根据所述邮件内容信息的标签建立所述邮件内容信息的索引文件,并提供所述邮件内容信息的搜索服务。

其中,还包括:内容中心提取模块,用于对接收到的邮件内容信息进行中心内容提取,得到邮件内容信息的中心内容;所述关键字提取模块还用于,对所述邮件内容信息的中心内容进行关键字提取处理。

其中,所述关键字提取模块还用于,对于提取出的关键字进行词频计算,提取出词频大于预设值的关键字。

其中,还包括:垃圾邮件过滤处理模块,用于删除所述邮件获取模块自邮件服务器获取到的邮件中的垃圾邮件和/或重复邮件。

其中,还包括:内容整理模块,用于删除邮件内容信息中的重复内容和/或邮件格式内容。

其中,所述邮件内容信息包括以下之一或其组合:邮件正文、主题、摘要、发件人信息、收件人信息。

根据本申请实施例还提供一种电子邮件聚合分类装置,其包括:邮件获取模块,用于获取邮件服务器存储的邮件;内容中心提取模块,用于获取所述邮件的内容信息,对邮件内容信息进行中心内容提取得到邮件内容信息的中心内容;搜索服务模块,用于根据所述邮件内容信息的中心内容建立所述邮件内容信息的索引文件,并提供所述邮件内容信息的搜索服务。

其中,还包括:垃圾邮件过滤处理模块,用于删除所述邮件获取模块自邮件服务器获取到的邮件中的垃圾邮件和/或重复邮件。

其中,还包括:内容整理模块,用于删除邮件内容信息中的重复内容和/或邮件格式内容。

其中,所述邮件内容信息包括以下之一或其组合:邮件正文、主题、摘 要、发件人信息、收件人信息。

根据本申请实施例还提供一种电子邮件聚合分类方法,其包括:获取邮件服务器存储的邮件;获取所述邮件的内容信息,采用预设的分词方式对邮件内容信息进行分词处理,提取出邮件内容信息的关键字;根据邮件内容信息的关键字对邮件内容进行聚合分类处理形成类目树。

其中,所述根据邮件内容信息的关键字对邮件内容进行聚合分类处理形成类目树,还包括:将邮件内容信息的关键字作为该邮件内容信息的标签,并根据标签将邮件内容信息匹配至预设的类目中。

其中,还包括:根据所述邮件内容信息的标签建立所述邮件内容信息的索引文件,并提供所述邮件内容信息的搜索服务。

其中,还包括:对接收到的邮件内容信息进行中心内容提取,得到邮件内容信息的中心内容;所述提取出邮件内容信息的关键字还包括:对所述邮件内容信息的中心内容进行关键字提取处理。

其中,所述提取出邮件内容信息的关键字还包括:对于提取出的关键字进行词频计算,提取出词频大于预设值的关键字。

其中,还包括:删除自邮件服务器获取到的邮件中的垃圾邮件和/或重复邮件。

其中,还包括:删除邮件内容信息中的重复内容和/或邮件格式内容。

其中,所述邮件内容信息包括以下之一或其组合:邮件正文、主题、摘要、发件人信息、收件人信息。

根据本申请实施例还提供一种电子邮件聚合分类方法,其包括:获取邮件服务器存储的邮件;获取所述邮件的内容信息,对邮件内容信息进行中心内容提取得到邮件内容信息的中心内容;根据所述邮件内容信息的中心内容建立所述邮件内容信息的索引文件,并提供所述邮件内容信息的搜索服务。

其中,还包括:删除自邮件服务器获取到的的邮件中垃圾邮件和/或重复邮件。

其中,还包括:删除邮件内容信息中的重复内容和/或邮件格式内容。

其中,所述邮件内容信息包括以下之一或其组合:邮件正文、主题、摘要、发件人信息、收件人信息。

与现有技术相比,根据本申请的技术方案,通过对邮件内容进行分析以提取关键字,并根据关键字对邮件内容进行聚合分类处理形成类目树,能够方便地分类查看邮件内容。

附图说明

此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1示出根据本申请一个实施例的电子邮件聚合分类装置100的结构框图;

图2示出根据本申请另一实施例的电子邮件聚合分类装置200的结构框图;

图3示出根据本申请另一实施例的电子邮件聚合分类装置300的结构框图;

图4示出根据本申请另一实施例的电子邮件聚合分类装置400的结构框图;

图5示出根据本申请一个实施例的电子邮件聚合分类方法的流程图;

图6示出根据本申请另一实施例的电子邮件聚合分类方法的流程图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

根据本申请实施例提供一种电子邮件聚合分类装置。参考图1,图1示出根据本申请一个实施例的电子邮件聚合分类装置100的结构框图,该电子邮件聚合分类装置100包括:

邮件获取模块110,用于获取邮件服务器存储的邮件,其中邮件获取模块110可以被动的接收来自邮件服务器转发的邮件或者也可以主动采集邮件服务器存储的邮件;

在本申请的一个实施例中,一封被多人回复和讨论的重要邮件或者一封普通的邮件需要被分享或需要整合邮件的内容时,将指定的邮件发送到电子邮件聚合分类装置100,这样邮件获取模块110就能够接收到指定的邮件。例如,在实际应用中,将指定的邮件发送到预定地址的邮箱中,该邮箱实时或定时地将邮件发送至所述电子邮件聚合分类装置100;或者,在个人邮箱或企业邮箱的操作菜单中提供转发邮件的转发功能,当用户点击该转发功能按钮时,则指定邮件就发送至所述电子邮件聚合分类装置100。

关键字提取模块120,用于获取所述邮件的内容信息,采用预设的分词方式对邮件内容信息进行分词处理,提取出邮件内容信息的关键字;

其中,所述邮件内容信息包括但不限于以下维度信息之一或其组合:邮件正文、主题、摘要、发件人信息、收件人信息。关键字提取模块120对邮件正文、主题、摘要、发件人信息和/或收件人信息等信息进行分词处理,提取出邮件内容信息的关键字。

在本申请的一个实施例中,关键字提取模块120还用于对提取出的关键字进行词频计算,将词频大于预设值的关键字提取出来,词频小于预设值的关键字舍弃,不进行提取;或者,直接提取最大词频的关键字;或者,预先设置一词频表,该词频表中设置有多个字或词,将与词频表中的字词相同的关键字提取出来。此外,还可以采用其他方式提取出邮件内容信息的关键字,本申请不进行限制。

聚合分类模块130,用于根据邮件内容信息的关键字对邮件内容进行聚合分类处理形成类目树。进一步地,所述聚合分类模块130还用于,将邮件内容信息的关键字作为该邮件内容信息的标签,并根据标签将邮件内容信息匹配至预设的类目中。

例如,一种类目树包括“人事”、“行政”和“技术”等多个类目,“技术”类目下包括A标签和B标签,正文关键字或其他邮件内容信息中有A标签的邮件内容会被聚合到这个类目下,该类目可以是多级结构,又例如,“人事”类目下包括“部门”标签,根据发件人/收件人的所属部门对邮件内容进行多维度分类和展示。本申请通过类目树可以方便地分类查看邮件内容。

参考图2,图2示出根据本申请另一实施例的电子邮件聚合分类装置200的结构框图,该电子邮件聚合分类装置200包括:

邮件获取模块210,用于获取邮件服务器存储的邮件;

垃圾邮件过滤处理模块220,其与邮件获取模块210耦接,用于删除所述邮件获取模块210自邮件服务器获取到的邮件中的垃圾邮件和/或重复邮件;

内容整理模块230,其与垃圾邮件过滤处理模块220耦接,用于删除邮件内容信息中的重复内容和/或邮件格式内容,处理后的邮件发送至内容中心提取模块240;

通过上述处理,邮件获取模块210获取得到的邮件依次经过垃圾邮件过滤处理模块220和内容整理模块230的处理后,提供了安全保障并能够提高处理速度,删除掉非中心内容的操作也增加了关键字的准确性。

内容中心提取模块240,其与内容整理模块230耦接,用于对接收到的邮件内容信息进行中心内容提取,得到邮件内容信息的中心内容,处理后的邮件发送至关键字提取模块250;

关键字提取模块250,其与内容中心提取模块240耦接,用于获取所述邮件内容信息的中心内容,采用预设的分词方式对邮件内容信息的中心内容进行分词处理,提取出邮件内容信息的中心内容的关键字。进一步地,所述关键字提取模块250还用于,对于提取出的关键字进行词频计算,提取出词频大于预设值的关键字。

聚合分类模块260,其与关键字提取模块250耦接,用于根据邮件内容信息(中心内容)的关键字对邮件内容(中心内容)进行聚合分类处理形成 类目树。具体地,将邮件内容信息的关键字作为该邮件内容信息的标签,并根据标签将邮件内容信息匹配至预设的类目中。

类目树索引服务模块270,其与聚合分类模块260耦接,用于根据邮件内容信息的标签建立所述邮件内容信息的索引文件,并提供所述邮件内容信息的搜索服务。

通过本申请的实施例,自动对邮件的内容进行整理和分类等聚合处理,,并提供分享邮件内容及知识沉淀的作用,并且通过邮件内容的类目树提供了邮件分类的功能,用户可以方便地查找邮件内容信息。

参考图3,图3示出根据本申请另一实施例的电子邮件聚合分类装置300的结构框图,该电子邮件聚合分类装置300包括:

邮件获取模块310,用于获取邮件服务器存储的邮件,其中,邮件获取模块110可以被动的接收来自邮件服务器转发的邮件或者也可以主动采集邮件服务器存储的邮件;

在本申请的一个实施例中,一封被多人回复和讨论的重要邮件或者一封普通的邮件需要被分享或需要整合邮件的内容时,将指定的邮件发送到电子邮件聚合分类装置300,这样邮件获取模块310就能够接收到指定的邮件。例如,在实际应用中,将指定的邮件发送到预定地址的邮箱中,该邮箱实时或定时地将邮件发送至所述电子邮件聚合分类装置300;或者,在个人邮箱或企业邮箱的操作菜单中提供转发邮件的转发功能,当用户点击该转发功能按钮时,则指定邮件就发送至所述电子邮件聚合分类装置300。

内容中心提取模块320,用于获取所述邮件的内容信息,对邮件内容信息进行中心内容提取得到邮件内容信息的中心内容;

其中,所述邮件内容信息包括但不限于以下维度信息之一或其组合:邮件正文、主题、摘要、发件人信息、收件人信息。通过上述的邮件内容信息进行中心内容提取得到邮件内容信息的中心内容。

搜索服务模块330,用于根据所述邮件内容信息的中心内容建立所述邮件内容信息的索引文件,并提供所述邮件内容信息的搜索服务。

参考图4,图4示出根据本申请另一实施例的电子邮件聚合分类装置400的结构框图,该电子邮件聚合分类装置400包括:

邮件获取模块410,用于获取邮件服务器存储的邮件;

垃圾邮件过滤处理模块420,其与邮件获取模块410耦接,用于删除所述邮件获取模块410自邮件服务器获取到的邮件中的垃圾邮件和/或重复邮件;

内容整理模块430,其与垃圾邮件过滤处理模块420耦接,用于删除邮件内容信息中的重复内容和/或邮件格式内容;

通过上述处理,邮件获取模块410获取到的邮件依次经过垃圾邮件过滤处理模块420和内容整理模块430的处理后,提供了安全保障并能够提高处理速度,删除掉非中心内容的操作也增加了关键字的准确性。

内容中心提取模块440,其与内容整理模块430耦接,用于获取所述邮件的内容信息,对邮件内容信息进行中心内容提取得到邮件内容信息的中心内容;其中,所述邮件内容信息包括但不限于以下之一或其组合:邮件正文、主题、摘要、发件人信息、收件人信息。

搜索服务模块450,其与内容中心提取模块440耦接,用于根据所述邮件内容信息的中心内容建立所述邮件内容信息的索引文件,并提供所述邮件内容信息的搜索服务。

通过本申请的实施例,自动对邮件的内容进行整理和分类等聚合处理,并提供了邮件内容信息的索引服务,用户可以方便地搜索所需的邮件内容信息。

根据本申请实施例还提供一种电子邮件聚合分类方法,图5示出根据本申请一个实施例的电子邮件聚合分类方法的流程图,参考图5,所述方法包括步骤:

步骤S502,获取邮件服务器存储的邮件,其中,可以被动的接收来自邮件服务器转发的邮件或者也可以主动采集邮件服务器存储的邮件;

步骤S504,获取所述邮件的内容信息,采用预设的分词方式对邮件内容 信息进行分词处理,提取出邮件内容信息的关键字;

其中,所述邮件内容信息包括但不限于以下维度信息之一或其组合:邮件正文、主题、摘要、发件人信息、收件人信息,分别对邮件正文、主题、摘要、发件人信息和/或收件人信息等信息进行分词处理,提取出邮件内容信息的关键字。

进一步地,在步骤S504之前还包括:

删除自邮件服务器获取到的邮件中的垃圾邮件和/或重复邮件;

删除邮件内容信息中的重复内容和/或邮件格式内容。

通过上述处理后的邮件提供了安全保障并能够提高处理速度,删除掉非中心内容的操作也增加了关键字的准确性。

接着,对接收到的邮件内容信息进行中心内容提取,得到邮件内容信息的中心内容,对所述邮件内容信息的中心内容进行关键字提取处理。

并且,所述提取出邮件内容信息的关键字还包括:对于提取出的关键字进行词频计算,提取出词频大于预设值的关键字,将词频小于预设值的关键字舍弃,不进行提取;或者,直接提取最大词频的关键字;或者,预先设置一词频表,该词频表中设置有多个字或词,将与词频表中的字词相同的关键字提取出来。此外,还可以采用其他方式提取出邮件内容信息的关键字,本申请不进行限制。。

步骤S506,根据邮件内容信息的关键字对邮件内容进行聚合分类处理形成类目树。进一步地,将邮件内容信息的关键字作为该邮件内容信息的标签,并根据标签将邮件内容信息匹配至预设的类目中。

并且,所述方法还包括:根据所述邮件内容信息的标签建立所述邮件内容信息的索引文件,并提供所述邮件内容信息的搜索服务,方便用户查找邮件内容信息。

图6示出根据本申请另一实施例的电子邮件聚合分类方法的流程图,参考图6,所述方法包括步骤:

步骤S602,获取邮件服务器存储的邮件,其中,可以被动的接收来自邮 件服务器转发的邮件或者也可以主动采集邮件服务器存储的邮件;

步骤S604,获取所述邮件的内容信息,对邮件内容信息进行中心内容提取得到邮件内容信息的中心内容;

其中,所述邮件内容信息包括但不限于以下维度信息之一或其组合:邮件正文、主题、摘要、发件人信息、收件人信息,分别对邮件正文、主题、摘要、发件人信息和/或收件人信息等信息进行中心内容提取得到邮件内容信息的中心内容。

进一步地,在步骤S604之前还包括:

删除自邮件服务器获取到的邮件中的垃圾邮件和/或重复邮件;

删除邮件内容信息中的重复内容和/或邮件格式内容。

通过上述处理后的邮件提供了安全保障并能够提高处理速度,删除掉非中心内容的操作也增加了关键字的准确性。

步骤S606,根据所述邮件内容信息的中心内容建立所述邮件内容信息的索引文件,并提供所述邮件内容信息的搜索服务。

综上所述,根据本申请的技术方案,通过对邮件内容进行分析以提取关键字,并根据关键字对邮件内容进行聚合分类处理形成类目树,能够方便地分类查看邮件内容。

本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1