基于RPA技术的邮件附件数据自动提取的方法及系统与流程

文档序号:33374700发布日期:2023-03-08 03:34阅读:30来源:国知局
基于rpa技术的邮件附件数据自动提取的方法及系统
技术领域
:1.本发明涉及机器人自动化
技术领域
:,具体地,涉及一种基于rpa技术的邮件附件数据自动提取的方法及系统,尤其涉及一种基于rpa技术的邮件电子表格附件零散信息周期性自动提取的方法。
背景技术
::2.rpa(roboticprocessautomation)是指在各行业中使用软件自动化来实现原本由人类操作的计算机完成的操作。它允许软件机器人自动处理大量重复的、基于规则的工作流程任务。例如,在银行的业务流程中,通常有纸质文件输入、文件票据验证、从电子邮件和文件中提取数据、跨系统数据迁移、自动化it应用操作等。这些工作可以由软件机器人准确快速地完成,可以减少人为错误,确保零错误,提高效率,并大大降低运营成本。rpa依靠先进的软件自动化技术,rpa依靠先进的软件自动化技术,大大降低开发成本和开发周期,实现银行内部跨系统和工作流程的自动化,提高生产力,降低成本。3.专利文献cn113177474a公开了一种基于rpa技术的数据自动读取录入的方法及系统,该方法利用数据处理机器人执行以下步骤:对excel文件定位,确定待处理的excel表的位置;自动打开所述excel表,根据数据录入进度,确定所述excel表中当前读取的行的位置;采用单次整行读取法读取所述行中的excel数据,得到行向量数据集;对所述行向量数据集中的行向量数据进行定位,并对所述行向量数据进行数据清洗处理;将清洗后的所述行向量数据逐行录入至所述浏览器form表中;所述数据处理机器人是基于rpa技术建立的。4.但是,现有的技术中,存在只能实现数据无差别的批量操作或解决针对单一固定地址目标数据提取的问题,影响实现数据提取稳定性及工作效率。技术实现要素:5.针对现有技术中的缺陷,本发明的目的是提供一种基于rpa技术的邮件附件数据自动提取的方法及系统。6.根据本发明提供的一种基于rpa技术的邮件附件数据自动提取的方法,包括:7.步骤s1:建立邮件系统地址和附件数据关键信息的位置参数之间的映射关系表;8.步骤s2:获取rpa机器人任务列表中的待办任务,生成当前目标任务并在rpa机器人中分配目标任务参数;9.步骤s3:根据所述目标任务参数和所述映射关系表查询是否存在映射关系,若存在,则提取关键信息至关键信息数据列表中,并将所述关键信息数据列表保存在运行结果台账中;若不存在,则记录至异常台账中;10.重复步骤s2至s3,直至所述rpa机器人任务列表中的待办任务全部处理完毕;11.步骤s4:将所述运行结果台账和所述异常台账的数据发送给相关人员。12.优选地,在建立所述映射关系表之前初始化rpa机器人所处环境;13.所述初始化rpa机器人所处环境包括清理运行环境、根据系统参数配置建立rpa机器人运行所需全局变量;14.所述全局变量包括:初始化参数字典、邮件任务字典、关键信息数据、模板地址参数字典。15.优选地,所述模板地址参数字典中存储的是邮件系统地址和附件数据关键信息的位置参数之间的映射关系表;16.所述模板地址参数字典中地址参数的赋值数据包括发件人邮件系统地址、附件数据关键信息的位置参数。17.优选地,所述步骤s2包括:18.步骤s2.1:rpa机器人登录邮箱并读取邮箱中收件箱信息,生成rpa机器人任务列表并存储至邮件任务字典中;19.步骤s2.2:保存所述邮件任务字典中对应邮件的附件数据;所述附件数据包括电子表格;20.步骤s2.3:rpa机器人将全部邮件移出指定收件箱文件夹。21.优选地,步骤s3包括:22.步骤s3.1:查询rpa机器人任务列表中当前目标任务的发件人邮件系统地址;23.步骤s3.2:根据所述模板地址参数字典,得到所述目标任务的邮件电子表格附件包含的关键信息;24.步骤s3.3:对所述关键信息进行校验,校验通过,则将所述关键信息添加至关键信息数据列表中,并将所述关键信息数据列表保存在运行结果台账中;若校验不通过,则记录至异常台账中。25.根据本发明提供的一种基于rpa技术的邮件附件数据自动提取的系统,包括:26.模块m1:建立邮件系统地址和附件数据关键信息的位置参数之间的映射关系表;27.模块m2:获取rpa机器人任务列表中的待办任务,生成当前目标任务并在rpa机器人中分配目标任务参数;28.模块m3:根据所述目标任务参数和所述映射关系表查询是否存在映射关系,若存在,则提取关键信息至关键信息数据列表中,并将所述关键信息数据列表保存在运行结果台账中;若不存在,则记录至异常台账中;29.重复触发模块m2至s3,直至所述rpa机器人任务列表中的待办任务全部处理完毕;30.模块m4:将所述运行结果台账和所述异常台账的数据发送给相关人员。31.优选地,在建立所述映射关系表之前初始化rpa机器人所处环境;32.所述初始化rpa机器人所处环境包括清理运行环境、根据系统参数配置建立rpa机器人运行所需全局变量;33.所述全局变量包括:初始化参数字典、邮件任务字典、关键信息数据、模板地址参数字典。34.优选地,所述模板地址参数字典中存储的是邮件系统地址和附件数据关键信息的位置参数之间的映射关系表;35.所述模板地址参数字典中地址参数的赋值数据包括发件人邮件系统地址、附件数据关键信息的位置参数。36.优选地,模块m2包括:37.模块m2.1:rpa机器人登录邮箱并读取邮箱中收件箱信息,生成rpa机器人任务列表并存储至邮件任务字典中;38.模块m2.2:保存所述邮件任务字典中对应邮件的附件数据;所述附件数据包括电子表格;39.模块m2.3:rpa机器人将全部邮件移出指定收件箱文件夹。40.优选地,模块m3包括:41.模块m3.1:查询rpa机器人任务列表中当前目标任务的发件人邮件系统地址;42.模块m3.2:根据所述模板地址参数字典,得到所述目标任务的邮件电子表格附件包含的关键信息;43.模块m3.3:对所述关键信息进行校验,校验通过,则将所述关键信息添加至关键信息数据列表中,并将所述关键信息数据列表保存在运行结果台账中;若校验不通过,则记录至异常台账中。44.与现有技术相比,本发明具有如下的有益效果:45.1、本发明通过采用将邮件系统地址与电子表格附件有效信息出现位置参数建立映射,进而基于rpa机器人,实现了邮件电子表格附件零散信息周期性自动提取,提高了工作效率。46.2、本发明通过建立发件人邮件系统地址与电子表格附件关键信息位置参数信息映射关系,使得rpa机器人屏蔽了不同发件人邮件系统地址关键有效信息的差异,进而能够精准的提取邮件附件中零散有效信息。47.3、本发明基于rpa技术,低代码模式对实施人员的要求不高,通过无接口模式方便的衔接了excel、邮箱等日常办公工具,日常业务运维、业务参数录入无需加载其他特殊工具环境,建设成本不高、运维简单。附图说明48.通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:49.图1为本发明的工作流程示意图。具体实施方式50.下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。51.本发明基于邮件系统地址唯一性,将邮件系统地址与电子表格附件有效信息出现位置参数建立映射,业务相关的全部邮件系统地址与上述地址映射的电子表格附件有效信息出现位置参数建成映射关系表,通过映射关系表对电子表格附件有效零散信息精准提取。基于rpa技术低代码操作,对收件邮箱定时扫描、操作邮箱邮件、制作邮件处理台账、登记异常信息、通知处理结果,实现邮件电子表格附件零散信息周期性自动提取。52.实施例一53.根据本发明提供的一种基于rpa技术的邮件附件数据自动提取的方法,如图1所示,包括:54.步骤s1:建立邮件系统地址和附件数据关键信息的位置参数之间的映射关系表;55.步骤s2:获取rpa机器人任务列表中的待办任务,生成当前目标任务并在rpa机器人中分配目标任务参数;步骤s2包括:56.步骤s2.1:rpa机器人登录邮箱并读取邮箱中收件箱信息,生成rpa机器人任务列表并存储至邮件任务字典中;57.步骤s2.2:保存所述邮件任务字典中对应邮件的附件数据;所述附件数据包括电子表格;58.步骤s2.3:rpa机器人将全部邮件移出指定收件箱文件夹。59.步骤s3:根据所述目标任务参数和所述映射关系表查询是否存在映射关系,若存在,则提取关键信息至关键信息数据列表中,并将所述关键信息数据列表保存在运行结果台账中;若不存在,则记录至异常台账中;步骤s3包括:60.步骤s3.1:查询rpa机器人任务列表中当前目标任务的发件人邮件系统地址;61.步骤s3.2:根据所述模板地址参数字典,得到所述目标任务的邮件电子表格附件包含的关键信息;62.步骤s3.3:对所述关键信息进行校验,校验通过,则将所述关键信息添加至关键信息数据列表中,并将所述关键信息数据列表保存在运行结果台账中;若校验不通过,则记录至异常台账中。63.重复步骤s2至s3,直至所述rpa机器人任务列表中的待办任务全部处理完毕;64.步骤s4:将所述运行结果台账和所述异常台账的数据发送给相关人员。65.在建立所述映射关系表之前初始化rpa机器人所处环境;所述初始化rpa机器人所处环境包括清理运行环境、根据系统参数配置建立rpa机器人运行所需全局变量;所述全局变量包括:初始化参数字典、邮件任务字典、关键信息数据、模板地址参数字典。所述模板地址参数字典中存储的是邮件系统地址和附件数据关键信息的位置参数之间的映射关系表;所述模板地址参数字典中地址参数的赋值数据包括发件人邮件系统地址、附件数据关键信息的位置参数。66.具体地,结合附图对本发明的工作流程进一步描述:67.本发明中需要初始化的rpa机器人系统参数配置,如表1所示,包括:本地参数存放目录、邮箱账号、邮箱密码凭证、机器人运行结果台账保存地址、指定邮件主题关键字;68.表1[0069][0070]首先,初始化机器人所处场景环境包括结束浏览器、excel进程等,建立rpa机器人运行所需全局变量,全局变量及对应的参数类型,如表2所示,机器人获取初始化参数,例如,读取需要初始化的rpa机器人系统参数配置文件生成初始化参数字典:[0071]表2[0072]序号名称变量参数类型1初始化参数字典dic_configdictionanry《string,object》2邮件任务字典dic_mail_taskdictionanry《string,object》3关键信息数据dt_mail_key_messagedatatable4模板地址参数字典dic_model_dir_messagedictionanry《string,object》[0073]然后,赋值模板地址参数字典,模板地址参数字典中地址参数的赋值数据来源为存放在本地参数存放目录下的邮件模板地址参数电子表格,获取结果存放在模板地址参数字典dic_model_dir_message中,参数类型为dictionanry《string,object》。其中,邮件模板地址参数电子表格包括:发件人邮件系统地址mail_address_from、关键信息位置address_key_message,发件人邮件系统地址为必需列,关键信息位置至少包含1列,邮件模板地址参数电子表格样式如表3所示,其中关键信息位置中字母代表该关键信息在电子表格附件中的列数,数字代表该关键信息在电子表格附件中的行数:[0074]表3[0075][0076]模板地址参数字典为发件人邮件系统地址与电子表格附件关键信息位置参数信息映射关系字典,健为发件人邮件系统地址mail_address_from,值为关键有效信息与其在电子表格位置参数形成的表格对象datatable。通过增改邮件模板地址参数电子表格邮件系统地址与关键信息位置对应参数,对发件人邮件电子表格关键有效信息的位置变动进行记录和修改。[0077]上述基础工作做完后,机器人通过页面或者客户端登录邮箱,定时扫描指定收件箱,并获取邮箱内全部邮件的收件箱信息,收件箱信息及对应的参数类型如表4所示:[0078]表4[0079]序号名称变量参数类型1发件人地址mail_address_fromstring2邮件发件时间mail_time_arrivedstring3邮件抄送人mail_ccstring4邮件主题mail_subjectstring[0080]同时,保存全部邮件的电子表格附件,其中电子表格附件命名方式为拼接发件人、主题、发件时间的字符串,例如:mail_address_from+mail_subject+mail_time_arrived+‘.xlsx’,生成rpa机器人任务列表dic_mail_task,例如:[(mail_address_from1:[mail_subject1,mail_time_arrived1],[mail_address_from2:[mail_subject2,mail_time_arrived2],...],获取上述信息后机器人将全部邮件移出指定收件箱文件夹。[0081]接着,遍历rpa机器人任务列表中dic_mail_task发件人邮件系统地址集合。在遍历的循环内部,通过上述获取的模板地址参数字典中,获取全部邮件电子表格附件包含的关键有效信息,具体地,机器人根据关键信息所在位置列表,逐一抓取保存在本地的电子表格附件中的关键信息并保存在邮件列表list_mail_message中,例如:[mail_message1,mail_message2,...],基于所述获取的模板地址参数字典rpa机器人屏蔽了不同发件人邮件系统地址关键有效信息的差异,实现零散有效信息的精准提取。[0082]再接着,对获取的邮件列表list_mail_message信息按照正则校验规则regex进行校验。验证不通过的将校验不符的结果登记在异常台账真难搞,验证通过的将通过正则校验规则regex的结果进行保存并将list_mail_message信息添加到模板地址参数字典dt_mail_key_message中。[0083]最后,将rpa机器人任务列表中所有任务遍历结束后,保存机器人生成的结果并邮件通知运行结果给相关人员。具体地,模板地址参数字典dt_mail_key_message保存在机器人运行结果台账保存地址str_dir_record_got,命名格式,例如:“‘运行结果’+now.tostring(yyyymmdd).xlsx”,如果同名文件已存在则选择将本次运行结果添加到最后。机器人将运行结果通过邮件发送给业务相关人员,将异常台账通过邮件发送给流程运维人员。[0084]实施例二[0085]本发明还提供了一种基于rpa技术的邮件附件数据自动提取的系统,本领域技术人员可以通过执行所述基于rpa技术的邮件附件数据自动提取的方法的步骤流程实现所述基于rpa技术的邮件附件数据自动提取的系统,即可以将所述基于rpa技术的邮件附件数据自动提取的方法理解为所述基于rpa技术的邮件附件数据自动提取的系统的优选实施方式。[0086]根据本发明提供的一种基于rpa技术的邮件附件数据自动提取的系统,先初始化rpa机器人所处环境;所述初始化rpa机器人所处环境包括清理运行环境、根据系统参数配置建立rpa机器人运行所需全局变量;所述全局变量包括:初始化参数字典、邮件任务字典、关键信息数据、模板地址参数字典。所述模板地址参数字典中存储的是邮件系统地址和附件数据关键信息的位置参数之间的映射关系表;所述模板地址参数字典中地址参数的赋值数据包括发件人邮件系统地址、附件数据关键信息的位置参数。[0087]然后包括如下模块:[0088]模块m1:建立邮件系统地址和附件数据关键信息的位置参数之间的映射关系表;[0089]模块m2:获取rpa机器人任务列表中的待办任务,生成当前目标任务并在rpa机器人中分配目标任务参数;[0090]具体地,模块m2包括:模块m2.1:rpa机器人登录邮箱并读取邮箱中收件箱信息,生成rpa机器人任务列表并存储至邮件任务字典中;模块m2.2:保存所述邮件任务字典中对应邮件的附件数据;所述附件数据包括电子表格;模块m2.3:rpa机器人将全部邮件移出指定收件箱文件夹。[0091]模块m3:根据所述目标任务参数和所述映射关系表查询是否存在映射关系,若存在,则提取关键信息至关键信息数据列表中,并将所述关键信息数据列表保存在运行结果台账中;若不存在,则记录至异常台账中;[0092]具体地,模块m3包括:模块m3.1:查询rpa机器人任务列表中当前目标任务的发件人邮件系统地址;模块m3.2:根据所述模板地址参数字典,得到所述目标任务的邮件电子表格附件包含的关键信息;模块m3.3:对所述关键信息进行校验,校验通过,则将所述关键信息添加至关键信息数据列表中,并将所述关键信息数据列表保存在运行结果台账中;若校验不通过,则记录至异常台账中。[0093]重复触发模块m2至s3,直至所述rpa机器人任务列表中的待办任务全部处理完毕;[0094]模块m4:将所述运行结果台账和所述异常台账的数据发送给相关人员。[0095]本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统、装置及其各个模块以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以,本发明提供的系统、装置及其各个模块可以被认为是一种硬件部件,而对其内包括的用于实现各种程序的模块也可以视为硬件部件内的结构;也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以是硬件部件内的结构。[0096]以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本技术的实施例和实施例中的特征可以任意相互组合。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1