纸质信件快速采集分拣阅信系统的制作方法

文档序号:31604687发布日期:2022-09-21 10:10阅读:57来源:国知局
纸质信件快速采集分拣阅信系统的制作方法

1.本发明涉及信件内容处理技术领域,具体为纸质信件快速采集分拣阅信系统。


背景技术:

2.通过“信件”的形式进行意见传递表述的方式是必要的,能够直观的体现投递者的重视程度;然而,对于处理信件的管理人员而言,投递的信件材料往往数量多,且类别繁杂;因工作人员有限的时间和精力,以及信件处理业务一贯以来的高谨慎标准决定了当投递者递交了信件材料后,得到信件反馈的时间可能会比较长;且传统的信件材料处理方式需要人工采集信息并且手动录入,过程繁琐且容易出错;时间成本高,相关工作需要工作人员手动完成,耗时费力;
3.而对于信件处理业务而言,实现在面对相同时间段内接收到的大量信件材料时,快速并高效精准的识别出广泛投递者的共同诉求,并尽快尽可能多的将其向有关负责人员递交,决定了信件处理业务工作质量是否高效的关键。


技术实现要素:

4.本发明的目的在于提供纸质信件快速采集分拣阅信系统,以解决上述背景技术中提出的问题。
5.为了解决上述技术问题,本发明提供如下技术方案:纸质信件快速采集分拣阅信系统,包括纸质信件扫描处理模块、内容处理模块、关注指数计算模块、重要指数计算模块、推送模块;
6.纸质信件扫描处理模块,用于分别对每份信件材料利用采用快速扫描仪单独分开扫描识别,将扫描识别后得到的信件内容自动转入系统录入界面,生成对应每份信件材料的信件清单;信件材料包括若干纸质信件;其中,纸质信件的类别包括申诉书、身份证明、委托代理证明;纸质信件的形式包括手写体、印刷体;对各份信件材料的来源信息进行登记;将来源信息和扫描识别得到的材料内容汇总显示在信件清单中;信件清单包含清单二维码,清单二维码中存有清单编号;
7.内容处理模块,用于将每次扫描后得到的信件内容与对应的材料原件进行对比审阅,将对比审阅无误后的信件内容设置自动进入系统待办理界面,进行要素提取;设置办理周期,分别对在办理周期内,概况信息要素分栏中呈现的各概况信息部分进行语义分解,得到对应各份信件材料的诉求部分和申述事实部分;基于各份信件材料对应的诉求部分和申述事实部分的语义文字特征,对各份信件材料进行所属民生舆情热点类别的识别;
8.关注指数计算模块,用于提取在办理周期内,于待办理界面中呈现的各份信件材料内容,基于在各份信件材料内容内诉求部分中的特征文字分布情况,对各份信件材料计算关注指数;
9.重要指数计算模块,用于提取在办理周期内,于待办理界面中呈现的各份信件材料内容,基于在各份信件材料内容内申述事实部分中的特征文字分布情况,对各份信件材
料计算重要指数;
10.推送模块,用于根据各份信件材料对应的关注指数和重要指数,以及各份信件材料对应的清单二维码生成时间,得到各份信件材料的综合推送关注度;基于各份信件材料的综合推送关注度,将待办理界面中的所有信件材料进行整理,得到向工作人员推送的待办理信件清单。
11.进一步的,内容处理模块包括要素提取处理单元、语义分解单元、热点识别单元;
12.要素提取处理单元,用于分别对自动转入系统录入界面的信件内容进行要素提取,并将对应提取到的各要素内容自动填充至对应的要素栏目内;其中,要素栏目对应的要素分栏包括信件撰写人信息、概况信息、问题属地、问题所属系统部门;分别将各要素栏目内的内容与原件一一进行比对审阅,将比对审阅无误后的信件内容设置自动进入系统待办理界面;
13.语义分解单元,用于实时对来自互联网端包括主流新闻网站、新媒体网站的民生新闻舆情数据进行抓取,对民生新闻舆情数据进行语义分解,分别提取得到对应若干类民生舆情热点的关键词集{(x1),(x2),

,(xn)};其中,(x1),(x2),

,(xn)分别表示对应第1、2、

、n类民生舆情热点的关键词集;分别对在办理周期内,概况信息要素分栏中呈现的各概况信息部分进行语义分解,得到对应各份信件材料的诉求部分和申述事实部分;对各份信件材料的诉求部分和申述事实部分进行关键词提取,得到对应各份信件材料的关键词集 {(y1),(y2),

,(ym)};其中,(y1)、(y2)、

、(ym)分别表示提取得到的对应第1、2、

、m份信件材料的关键词集;
14.热点识别单元,用于分别将各份信件材料的关键词集逐次与若干类民生舆情热点的关键词集计算相似度,设置相似度阈值,分别对各材料选取重合度大于重合度阈值的民生舆情热点类别进行类别标记处理,得到各份信件材料对应分属的民生舆情热点类别,分别对各份信件材料累计类别标记数;
15.分别对各份信件材料进行民生舆情热点类别的识别,是为了实现让工作人员快速掌握在一定时期内,信件递交者所反应的诉求主要涉及哪些热点,有利于工作人员在后续掌握广泛递交者所共有的诉求上提供必要的技术铺垫,同时为后续计算各递交者提供材料的相关关注度时提供必要的技术铺垫。
16.进一步的,关注指数计算模块包括标注区域识别处理单元、第一关注指数计算单元、第二关注指数计算单元、第三关注指数计算单元;
17.标注区域识别处理单元,用于对各份信件材料对应的扫描信件内容进行区域标注,并基于各标注区域的分布特征完成标注区域的整合处理;
18.第一关注指数计算单元,用于接收标注区域识别处理单元中的数据,对各份信件材料计算第一关注指数;
19.第二关注指数计算单元,用于接收标注区域识别处理单元中的数据,对各份信件材料计算第二关注指数
20.第三关注指数计算单元,用于接收标注区域识别处理单元中的数据,对各份信件材料计算第三关注指数。
21.进一步的,标注区域识别处理单元包括:
22.预先在大数据中抓取所有扬言性特征词或者短语、敏感性特征词或者短语,同时
将所有扬言性特征词或者短语、敏感性特征词或者短语,汇成特征词库;分别对特征词库内各特征词或者短语设置程度等级数;
23.分别获取对各份信件材料扫描后得到的诉求部分文字内容排版,分别对分属于各类别民生舆情热点的材料进行内容排查,基于特征词库,将在各材料诉求部分中出现的扬言性特征词或者短语、敏感性特征词或者短语标注显示在诉求部分文字内容排版上;一个标注词或者短语对应一个第一标注区域;
24.捕捉各第一标注区域之间的行间隔字数c,设置间隔字数阈值,若相邻两个第一标注区域之间的行间隔字数c小于间隔字数阈值,将相邻两个第一标注区域之间的非标注词部分进行标注,生成由两个相邻第一标注区域与间隔非标注区域汇成的第二标注区域;
25.上述对各信件材料扫描后得到的诉求部分进行区域标注处理的过程,是识别递交者在陈述相关请求和申诉时的心理急迫程度,也就是通过捕捉一些敏感词和扬言词在整体篇幅中的占比定义信件递交者的情绪不稳定指数,有利于工作人员对此情况进行掌握,提醒工作人员对这些材料进行反馈处理时,可在不影响其他信件材料处理的情况下,予以重点关注或者优先处理。
26.进一步的,第一关注指数计算单元包括:
27.接收标注区域识别处理单元中的第一标注区域信息、第二标注区域信息;
28.分别对各份信件材料计算第一关注指数attention1:
[0029][0030]
其中,yai表示在各份信件材料诉求部分中第i个第一标注区域的文本字符长度;yaj表示在各份信件材料诉求部分中第j个第二标注区域的文本字符长度;a表示在各份信件材料诉求部分中的文本总长度。
[0031]
进一步的,第二关注指数计算单元包括:
[0032]
接收标注区域识别处理单元中的第一标注区域信息、第二标注区域信息;
[0033]
分别对各份信件材料计算第二关注指数attention2:
[0034]
attention2=∑dgreee(ai)+∑avdgreee(aj)
[0035]
其中,dgreee(ai)表示在各份信件材料诉求部分中第i个第一标注区域对应的程度等级数;avdgreee(aj)表示在各份信件材料诉求部分中第j个第二标注区域对应的平均程度等级数。
[0036]
进一步的,第三关注指数计算单元包括:
[0037]
获取各份信件材料在扫描识别前的文本排版,对在文本排版中对应诉求部分捕捉出现在各第一标注区域、各第二标注区域的前面、内部、后面的特征符号格式;并将出现各特征符号格式的部分逐一标注凸显在扫描识别后得到的诉求部分内容中;其中,特征符号格式包括感叹号、问号、异于相邻文本字的字体、异于相邻文本字的字号、异于相邻文本字的字体颜色、下划线、加粗体、高亮显示;
[0038]
分别对各材料计算第三关注指数attention3:
[0039]
attention3=σr1ai*r2ai+σr1aj*r2aj[0040]
其中,r1ai表示在各份信件材料诉求部分中,出现在第i个第一标注区域前面、内部、后面的特征符号格式种类数;r2ai表示在各份信件材料诉求部分中,出现在第i个第一标
注区域前面、内部、后面的特征符号格式总个数;r1aj表示在各份信件材料诉求部分中,出现在第j个第二标注区域前面、内部、后面的特征符号格式种类数;r2aj表示在各材料诉求部分中,出现在第j个第二标注区域前面、内部、后面的特征符号格式总个数。
[0041]
进一步的,重要指数计算模块包括:
[0042]
分别对同一类别信件材料中,各份信件材料的申述事实内容部分进行提取;分别对各申述事实内容部分进行语义要素的识别和拆解提取;语义要素包括事件发生时间、事件涉及人物、事件发生地点、事件主要矛盾、事件背景、事件经过;得到各份信件材料对应的语义要素集合;
[0043]
分别获取在同一类别材料中,两两语义要素集合之间的相似度,设置相似度阈值,将大于相似度阈值的语义要素集进行汇集,分别得到若干个语义要素集中心,一个语义要素集中心内包含若干个相似度大于相似度阈值的语义要素集;
[0044]
分别将同一类别材料中各份信件材料基于各自对应的语义要素集中心进行归类;分别对各材料归属的各语义要素集中心计算重要指数:
[0045][0046]
其中,importe表示第e个语义要素集中心的重要指数;表示第e个语义要素集中心内各语义要素集之间的平均相似度值;ke表示第e个语义要素集中心内语义要素集的总个数值;
[0047]
分别将各语义要素集附上对应的语义要素集中心的重要指数值import;
[0048]
上述过程,通过对语义要素集中心归类的过程,掌握在同一类别材料中,信件递交者基于相同的诉求或者相同的投诉事实进行申诉递交的数量多少,若一个语义要素集对应的重要指数值import越大说明,工作人员在后续处理的过程中,若对这类材料优先审查,可照顾到的递交者范围越多,另一次层面上,也反应了在对应的申诉内容问题上,关注的人较多。
[0049]
进一步的,推送模块包括:
[0050]
获取分属于不同民生舆情热点类别向中,各份信件材料对应的第一关注指数 attention1、第二关注指数attention2、第三关注指数attention3、重要指数import;将分属于不同民生舆情热点类别向中,各份信件材料按照各自对应的清单二维码生成时间进行排序,得到各材料对应的时间排序序号;
[0051]
对各材料计算综合推送关注度:
[0052]
f=[(attention1+attention2+attention3)*import]
st
[0053]
其中,f表示综合推送关注度,st表示各材料对应的时间排序序号;
[0054]
在分属于不同民生舆情热点类别的各份信件材料中,将各份信件材料按照综合推送关注度从大到小进行排序,得到分属于不同民生舆情热点类别的清单编号序列集;按照清单编号序列集内的清单编号排序向工作人员推送待办理的材料。
[0055]
与现有技术相比,本发明所达到的有益效果是:本发明借助人工智能,充分发挥现代科技精准性、预见性优势,进一步提高工作质量;科学运用现代科技实现人工替代,进一步提高工作效率;以图像识别、自然语言处理等技术为基础,定制化开展语音识别、ocr 识别、关键要素提取、事项概况自动生成等人工智能核心能力和模型算法,深化人工智能在辅
助事项办理和信件递交处理服务两个层面的应用,进一步缩短办理周期,提高办理的精准程度和规范化水平;本发明在对信件材料进行处理的过程中,对各信件递交者提供的信件材料进行相关指数的运算,为工作人员提供了业务处理上的辅助,全面提高信件处理工作质量。
附图说明
[0056]
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
[0057]
图1是本发明纸质信件快速采集分拣阅信系统的结构示意图;
[0058]
图2是本发明纸质信件快速采集分拣阅信系统中的方法流程示意图。
具体实施方式
[0059]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0060]
请参阅图1-图2,本发明提供技术方案:纸质信件快速采集分拣阅信系统,包括纸质信件扫描处理模块、内容处理模块、关注指数计算模块、重要指数计算模块、推送模块;
[0061]
纸质信件扫描处理模块,用于分别对每份信件材料利用采用快速扫描仪单独分开扫描识别,将扫描识别后得到的信件内容自动转入系统录入界面,生成对应每份信件材料的信件清单;信件材料包括若干纸质信件;其中,纸质信件的类别包括申诉书、身份证明、委托代理证明;纸质信件的形式包括手写体、印刷体;对各份信件材料的来源信息进行登记;将来源信息和扫描识别得到的材料内容汇总显示在信件清单中;信件清单包含清单二维码,清单二维码中存有清单编号;
[0062]
内容处理模块,用于将每次扫描后得到的信件内容与对应的材料原件进行对比审阅,将对比审阅无误后的信件内容设置自动进入系统待办理界面,进行要素提取;设置办理周期,分别对在办理周期内,概况信息要素分栏中呈现的各概况信息部分进行语义分解,得到对应各份信件材料的诉求部分和申述事实部分;基于各份信件材料对应的诉求部分和申述事实部分的语义文字特征,对各份信件材料进行所属民生舆情热点类别的识别;
[0063]
其中,内容处理模块包括要素提取处理单元、语义分解单元、热点识别单元;
[0064]
要素提取处理单元,用于分别对自动转入系统录入界面的信件内容进行要素提取,并将对应提取到的各要素内容自动填充至对应的要素栏目内;其中,要素栏目对应的要素分栏包括信件撰写人信息、概况信息、问题属地、问题所属系统部门;分别将各要素栏目内的内容与原件一一进行比对审阅,将比对审阅无误后的信件内容设置自动进入系统待办理界面;
[0065]
语义分解单元,用于实时对来自互联网端包括主流新闻网站、新媒体网站的民生新闻舆情数据进行抓取,对民生新闻舆情数据进行语义分解,分别提取得到对应若干类民生舆情热点的关键词集{(x1),(x2),

,(xn)};其中,(x1),(x2),

,(xn)分别表示对应第1、2、

、n类民生舆情热点的关键词集;分别对在办理周期内,概况信息要素分栏中呈现的各
概况信息部分进行语义分解,得到对应各份信件材料的诉求部分和申述事实部分;对各份信件材料的诉求部分和申述事实部分进行关键词提取,得到对应各份信件材料的关键词集{(y1),(y2),

,(ym)};其中,(y1)、(y2)、

、(ym)分别表示提取得到的对应第1、2、

、m份信件材料的关键词集;
[0066]
热点识别单元,用于分别将各份信件材料的关键词集逐次与若干类民生舆情热点的关键词集计算相似度,设置相似度阈值,分别对各材料选取重合度大于重合度阈值的民生舆情热点类别进行类别标记处理,得到各份信件材料对应分属的民生舆情热点类别,分别对各份信件材料累计类别标记数;
[0067]
关注指数计算模块,用于提取在办理周期内,于待办理界面中呈现的各份信件材料内容,基于在各份信件材料内容内诉求部分中的特征文字分布情况,对各份信件材料计算关注指数;
[0068]
其中,关注指数计算模块包括标注区域识别处理单元、第一关注指数计算单元、第二关注指数计算单元、第三关注指数计算单元;
[0069]
标注区域识别处理单元,用于对各份信件材料对应的扫描信件内容进行区域标注,并基于各标注区域的分布特征完成标注区域的整合处理;
[0070]
其中,标注区域识别处理单元包括:
[0071]
预先在大数据中抓取所有扬言性特征词或者短语、敏感性特征词或者短语,同时将所有扬言性特征词或者短语、敏感性特征词或者短语,汇成特征词库;分别对特征词库内各特征词或者短语设置程度等级数;
[0072]
分别获取对各份信件材料扫描后得到的诉求部分文字内容排版,分别对分属于各类别民生舆情热点的材料进行内容排查,基于特征词库,将在各材料诉求部分中出现的扬言性特征词或者短语、敏感性特征词或者短语标注显示在诉求部分文字内容排版上;一个标注词或者短语对应一个第一标注区域;
[0073]
捕捉各第一标注区域之间的行间隔字数c,设置间隔字数阈值,若相邻两个第一标注区域之间的行间隔字数c小于间隔字数阈值,将相邻两个第一标注区域之间的非标注词部分进行标注,生成由两个相邻第一标注区域与间隔非标注区域汇成的第二标注区域;
[0074]
第一关注指数计算单元,用于接收标注区域识别处理单元中的数据,对各份信件材料计算第一关注指数;
[0075]
其中,第一关注指数计算单元包括:
[0076]
接收标注区域识别处理单元中的第一标注区域信息、第二标注区域信息;
[0077]
分别对各份信件材料计算第一关注指数attention1:
[0078][0079]
其中,yai表示在各份信件材料诉求部分中第i个第一标注区域的文本字符长度;yaj表示在各份信件材料诉求部分中第j个第二标注区域的文本字符长度;a表示在各份信件材料诉求部分中的文本总长度;
[0080]
第二关注指数计算单元,用于接收标注区域识别处理单元中的数据,对各份信件材料计算第二关注指数;
[0081]
其中,第二关注指数计算单元包括:
[0082]
接收标注区域识别处理单元中的第一标注区域信息、第二标注区域信息;
[0083]
分别对各份信件材料计算第二关注指数attention2:
[0084]
attention2=∑dgreee(ai)+∑avdgreee(aj)
[0085]
其中,dgreee(ai)表示在各份信件材料诉求部分中第i个第一标注区域对应的程度等级数;avdgreee(aj)表示在各份信件材料诉求部分中第j个第二标注区域对应的平均程度等级数;
[0086]
第三关注指数计算单元,用于接收标注区域识别处理单元中的数据,对各份信件材料计算第三关注指数;
[0087]
其中,第三关注指数计算单元包括:
[0088]
获取各份信件材料在扫描识别前的文本排版,对在文本排版中对应诉求部分捕捉出现在各第一标注区域、各第二标注区域的前面、内部、后面的特征符号格式;并将出现各特征符号格式的部分逐一标注凸显在扫描识别后得到的诉求部分内容中;其中,特征符号格式包括感叹号、问号、异于相邻文本字的字体、异于相邻文本字的字号、异于相邻文本字的字体颜色、下划线、加粗体、高亮显示;
[0089]
分别对各材料计算第三关注指数attention3:
[0090]
attention3=σr1ai*r2ai+σr1aj*r2aj[0091]
其中,r1ai表示在各份信件材料诉求部分中,出现在第i个第一标注区域前面、内部、后面的特征符号格式种类数;r2ai表示在各份信件材料诉求部分中,出现在第i个第一标注区域前面、内部、后面的特征符号格式总个数;r1aj表示在各份信件材料诉求部分中,出现在第j个第二标注区域前面、内部、后面的特征符号格式种类数;r2aj表示在各材料诉求部分中,出现在第j个第二标注区域前面、内部、后面的特征符号格式总个数;
[0092]
重要指数计算模块,用于提取在办理周期内,于待办理界面中呈现的各份信件材料内容,基于在各份信件材料内容内申述事实部分中的特征文字分布情况,对各份信件材料计算重要指数;
[0093]
其中,重要指数计算模块包括:
[0094]
分别对同一类别信件材料中,各份信件材料的申述事实内容部分进行提取;分别对各申述事实内容部分进行语义要素的识别和拆解提取;语义要素包括事件发生时间、事件涉及人物、事件发生地点、事件主要矛盾、事件背景、事件经过;得到各份信件材料对应的语义要素集合;
[0095]
分别获取在同一类别材料中,两两语义要素集合之间的相似度,设置相似度阈值,将大于相似度阈值的语义要素集进行汇集,分别得到若干个语义要素集中心,一个语义要素集中心内包含若干个相似度大于相似度阈值的语义要素集;
[0096]
分别将同一类别材料中各份信件材料基于各自对应的语义要素集中心进行归类;分别对各材料归属的各语义要素集中心计算重要指数:
[0097][0098]
其中,importe表示第e个语义要素集中心的重要指数;表示第e个语义要素集中心内各语义要素集之间的平均相似度值;ke表示第e个语义要素集中心内语义要素集的总个数值;
[0099]
分别将各语义要素集附上对应的语义要素集中心的重要指数值import;
[0100]
推送模块,用于根据各份信件材料对应的关注指数和重要指数,以及各份信件材料对应的清单二维码生成时间,得到各份信件材料的综合推送关注度;基于各份信件材料的综合推送关注度,将待办理界面中的所有信件材料进行整理,得到向工作人员推送的待办理信件清单;
[0101]
其中,推送模块包括:
[0102]
获取分属于不同民生舆情热点类别向中,各份信件材料对应的第一关注指数 attention1、第二关注指数attention2、第三关注指数attention3、重要指数import;将分属于不同民生舆情热点类别向中,各份信件材料按照各自对应的清单二维码生成时间进行排序,得到各材料对应的时间排序序号;
[0103]
对各材料计算综合推送关注度:
[0104]
f=[(attention1+attention2+attention3)*import]
st
[0105]
其中,f表示综合推送关注度,st表示各材料对应的时间排序序号;
[0106]
在分属于不同民生舆情热点类别的各份信件材料中,将各份信件材料按照综合推送关注度从大到小进行排序,得到分属于不同民生舆情热点类别的清单编号序列集;按照清单编号序列集内的清单编号排序向工作人员推送待办理的材料。
[0107]
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
[0108]
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1