本发明属于电子邮件信息提取领域,具体涉及一种自动提取邮件模版的方法和装置。
背景技术:
1、随着互联网技术的发展,邮件在日常社交中有着非常重要的地位,已经成为人们日常生活中最广泛的沟通方式之一。目前,在编写格式较为规范统一类型的邮件,类似于工资单、通知类等邮件有两种方式:一种是用户在邮箱中为每个人编写邮件,并根据收件人的信息以及相应数据填充完整并发送,另一种是邮件厂商开发一套模版系统,使用人员按需选择模版,然后上传数据进行编写邮件。前者主要依赖用户人工编写邮件,非常容易填错数据,后者则需要邮件厂商支持并且需要实时的对模版库进行迭代更新,整个软件的后期维护成本非常高同时对使用人员要求较高。因此提供一种能够方便用户发送邮件,邮箱系统能够自动对现有场景的邮件进行识别并抽取邮件模版,解决邮件模版需要迭代更新的问题,能够对通用性邮件统一的规范以及样式,是邮箱领域迫切需要的。
2、(一)现有技术一的技术方案:
3、模版邮件:邮件客户端中创建邮件模版,上传数据信息,由软件对数据进行分析格式化,对模版进行填充:
4、上传模版:在专门的邮件客户端中创建邮件模版,并使用占位符进行占位。占位符将代表稍后上传的数据中的具体信息;
5、上传数据:根据在模版中设置的占位符,构建相应的表格数据,并将其上传到邮箱客户端。并进行填充模版;
6、渲染模版生成邮件:上传了模版和数据后,软件将自动对模版中的占位符进行渲染,并将模版数据填充到相应的位置。这样,每封邮件都将包含个性化的信息,以满足需求。
7、现有技术一的缺点:
8、1.邮件模板和自动化软件可能受到技术限制,无法应对复杂或多样化的邮件需求。某些特殊格式或复杂的模板可能无法准确呈现,从而限制了邮件的灵活性和创造力。
9、2.在一些情况下,邮件的内容可能需要根据收件人的反馈或其他因素进行调整和修改。使用静态模板和自动化软件可能限制了对邮件内容的灵活调整和个性化。
10、(二)现有技术二的技术方案
11、通过拖拽html组件的方式组装邮件模板正文,并对拖拽到正文中的html组件进行样式和数据源的设置,在完成所有需求的html组件拖拽及其样式和数据源设置之后,生成待发送邮件模板,最后根据用户选择的发送方式发送待发送邮件模板至指定收件人和抄送人。
12、现有技术二的缺点:
13、缺点1:学习曲线和复杂性:实现一个功能完备的拖拽式邮件模板编辑器需要涉及到前端开发、拖拽功能、样式设置、数据源集成等多个技术领域。对于非技术用户来说,学习和使用这样的编辑器可能需要一定的学习曲线,增加了复杂性。
14、缺点2:限制性和定制性:拖拽式邮件模板编辑器的灵活性和定制性可能受到一定限制。尽管提供了一些预定义的组件和设置选项,但用户可能会遇到某些特定需求无法满足的情况。这可能需要进一步的定制开发或寻找其他解决方案。
15、缺点3:兼容性和浏览器支持:由于不同的浏览器对拖拽功能的支持程度有所不同,可能会存在兼容性问题。确保邮件模板编辑器能够在各种主流浏览器上正常运行,并提供良好的用户体验,需要进行充分的测试和优化。
技术实现思路
1、本发明意在提供一种自动提取邮件模版的方法及装置,以解决现有技术中存在的不足,本发明要解决的技术问题通过以下技术方案来实现。
2、本发明的一个方面,一种自动提取邮件模版的方法,包括如下步骤:
3、s1使用训练好的transformer模型和输入向量生成邮件模版;
4、s2将输入向量输入到transformer模型中,经过编码器和解码器的处理,生成目标字段的概率分布;
5、s3从目标字段的概率分布中采样一个目标字段,并将其添加到生成的邮件模版中;重复上述步骤,直到生成整个邮件模版或满足停止条件。
6、进一步地,在所述s1之前还包括:
7、s11文本向量化,将用户提供的基本信息和数据进行文本向量化,将每个单词或字符转换为向量表示;
8、s12位置编码,为了保留输入序列中单词的顺序,为每个位置的单词添加位置编码。
9、进一步地,在所述s12位置编码后还包括:
10、s13输入嵌入:将文本向量和位置编码相加,得到输入嵌入矩阵;
11、s14输入编码:将输入嵌入矩阵输入到transformer模型的编码器中进行编码;
12、s15编码器输出:经过编码器的处理,得到编码器的输出向量。
13、进一步地,在得到所述输出向量后,将用户提供的基本信息和数据转换为transformer模型可以处理的输入向量;
14、使用训练样本,通过前向传播和反向传播算法更新模型的权重参数,以最小化生成邮件内容与目标邮件内容之间的差异。
15、进一步地,所述s1中使用训练好的t ransformer模型,具体实现方法为:
16、收集训练数据,并进行数据预处理,对预处理后的数据使用transformer模型进行训练,在训练过程中,模型将学习提取邮件模板的模式和生成与输人数据相匹配的邮件内容。
17、进一步地,所述在对预处理后的数据使用transformer模型进行训练后,
18、使用验证数据集对训练的模型进行评估,并根据评估结果进行优化和调整。
19、进一步地,所述根据评估结果进行优化和调整包括:
20、人工评分打标:基于模型输出的模版,人工介入对模版进行评分,并根据实际场景进行打标;用户评分:基于用户对模版使用的后续评价,对模版进行评分。
21、进一步地,根据用户反馈和运营人员评分,进行模型的持续改进和迭代训练。
22、进一步地,所述编码器由多个编码器层堆叠而成,每个编码器层包含自注意力机制和前馈神经网络。
23、本发明的另一方面,一种自动提取邮件模版的装置,包括如下模块:
24、邮件模版生成模块,用于使用训练好的transformer模型和输入向量生成邮件模版;
25、概率分布模块,用于将输入向量输入到transformer模型中,经过编码器和解码器的处理,生成目标字段的概率分布;
26、邮件提取模块,用于从目标字段的概率分布中采样一个目标字段,并将其添加到生成的邮件模版中;重复上述步骤,直到生成整个邮件模版或满足停止条件。
27、本发明实施例包括以下优点:
28、通过这种方式模型可以实时对邮件进行分析,实时更新邮箱系统的模版库,整体提高邮箱系统对模版邮件的支持。这样当用户使用邮箱系统时,可以根据根据用户需求通过关键字来检索模版,并通过邮件系统上传对应的数据即可完成邮件的渲染。此模型可以在许多场景中发挥作用,比如在工资单生成、通知发送、客户服务回复等方面。可以帮助用户节省时间和精力,并确保生成的邮件内容准确、专业并符合邮件的规范要求。
1.一种自动提取邮件模版的方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的自动提取邮件模版的方法,其特征在于,
3.根据权利要求2所述的自动提取邮件模版的方法,其特征在于,
4.根据权利要求3所述的自动提取邮件模版的方法,其特征在于,
5.根据权利要求1所述的自动提取邮件模版的方法,其特征在于,
6.根据权利要求1所述的自动提取邮件模版的方法,其特征在于,所述在对预处理后的数据使用transformer模型进行训练后,
7.根据权利要求6所述的自动提取邮件模版的方法,其特征在于,所述根据评估结果进行优化和调整包括:
8.根据权利要求7所述的自动提取邮件模版的方法,其特征在于,
9.根据权利要求3所述的自动提取邮件模版的方法,其特征在于,
10.一种自动提取邮件模版的装置,其特征在于,包括如下模块: