基于大数据的表单处理方法、装置及存储介质与流程

文档序号:23003605发布日期:2020-11-20 11:52阅读:123来源:国知局
基于大数据的表单处理方法、装置及存储介质与流程

本申请涉及大数据技术领域,具体涉及一种基于大数据的表单处理方法、装置及存储介质。



背景技术:

现有统计行业中,各种应用程序或者业务系统中存在表单多,风格迥异以及采集数据过程中需求变更频繁等问题,导致表单配置与修改需要重新编码、测试及发布等工作,造成交付慢,成本高,风险高等问题。此外,应用程序或者业务系统中存在会被重复访问、浏览或者调用的表单,在大数据领域,数据表单的数量较为庞大,则会消耗较多内存。



技术实现要素:

本申请实施例提供一种基于大数据的表单处理方法、装置及存储介质,能够在第一表单页面的存储时长达到第一存储时长时,通过较为简化表单结构来渲染表单页面,降低表单页面内存。

本申请实施例的第一方面提供了一种基于大数据的表单处理方法,所述方法包括:

获取第一表单数据,根据第一表单结构将所述第一表单数据生成第一表单页面,所述第一表单页面包括第一表单属性信息,所述第一表单属性信息包括第一存储时长;

备份所述第一表单页面,将所述第一表单页面存储至大数据库;

在所述第一表单页面的存储时长达到所述第一存储时长时,从所述第一表单数据中筛选部分表单数据,得到第二表单数据;

根据第二表单结构将所述第二表单数据生成第二表单页面,所述第一表单结构的第一结构复杂度大于所述第二表单结构的第二结构复杂度;

备份所述第二表单页面,将所述大数据库中已备份的所述第一表单页面更新为所述第二表单页面。

本申请实施例的第二方面提供了一种基于大数据的表单处理装置,所述装置包括:

获取单元,用于获取第一表单数据;

处理单元,用于根据第一表单结构将所述第一表单数据生成第一表单页面,所述第一表单页面包括第一表单属性信息,所述第一表单属性信息包括第一存储时长;

备份单元,用于备份所述第一表单页面,将所述第一表单页面存储至大数据库;

筛选单元,用于在所述第一表单页面的存储时长达到所述第一存储时长时,从所述第一表单数据中筛选部分表单数据,得到第二表单数据;

所述处理单元,还用于根据第二表单结构将所述第二表单数据生成第二表单页面,所述第一表单结构的第一结构复杂度大于所述第二表单结构的第二结构复杂度;

所述备份单元,还用于备份所述第二表单页面,将所述大数据库中已备份的所述第一表单页面更新为所述第二表单页面。

本申请实施例的第三方面提供了一种基于大数据的表单处理装置,包括处理器、存储器、通信接口,以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行本申请实施例第一方面所述的方法中的步骤的指令。

本申请实施例的第四方面提供了一种计算机可读存储介质,上述计算机可读存储介质用于存储计算机程序,上述计算机程序被处理器执行,以实现如本申请实施例第一方面所述的方法中所描述的部分或全部步骤。

本申请实施例的第五方面提供了一种计算机程序产品,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面所述的方法中所描述的部分或全部步骤。

实施本申请实施例,具有至少如下有益效果:

可以看出,通过本申请实施例,通过获取第一表单数据,根据第一表单结构将第一表单数据生成第一表单页面,第一表单页面包括第一表单属性信息,第一表单属性信息包括第一存储时长;备份第一表单页面,将第一表单页面存储至大数据库;在第一表单页面的存储时长达到第一存储时长时,从第一表单数据中筛选部分表单数据,得到第二表单数据;根据第二表单结构将第二表单数据生成第二表单页面,第一表单结构的第一结构复杂度大于第二表单结构的第二结构复杂度;备份第二表单页面,将大数据库中已备份的第一表单页面更新为第二表单页面,如此,能够在第一表单页面的存储时长达到第一存储时长时,通过减少表单内容,简化表单结构来渲染表单页面,可降低表单页面内存,还可缩短表单页面渲染时间,提升表单页面渲染效率。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种基于大数据的表单处理方法的流程示意图;

图2为本申请实施例提供的一种根据第一表单结构将第一表单数据生成第一表单页面的演示示意图;

图3为本申请实施例提供的另一种基于大数据的表单处理方法的流程示意图;

图4为本申请实施例提供的一种基于大数据的表单处理装置的流程示意图;

图5为本申请实施例提供的一种基于大数据的表单处理装置的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。

在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本申请所描述的实施例可以与其它实施例相结合。

本申请实施例中,在大数据领域中,很多应用程序或者业务系统会产生表单数据,应用程序或系统在运行过程中,一般会有流量高峰期,在流量高峰期,表单数据被浏览、访问或者调用的频率更高,因此,可生成结构复杂,视觉界面更加丰富的表单页面。到了后期,访问流量下降,表单数据被浏览的频率下降,或者,表单数据的利用率下降,则可以通过更加简化的表单结构来渲染表单页面,降低表单页面内存,还可以缩短表单页面渲染时间,如此,在表单数据较为庞大的场景下,可大大降低内存消耗,以及提升表单页面的渲染效率。

下面对本申请实施例进行详细介绍。

请参阅图1,图1为本申请实施例提供的一种基于大数据的表单处理方法的流程示意图。如图1所示,本申请实施例提供的基于大数据的表单处理方法应用于基于大数据的表单处理装置,该基于大数据的表单处理方法可包括以下步骤:

101、获取第一表单数据,根据第一表单结构将所述第一表单数据生成第一表单页面,所述第一表单页面包括第一表单属性信息,所述第一表单属性信息包括第一存储时长。

其中,表单数据,可以是终端设备获取用户填写的表单数据,也可以是终端设备获取应用程序或者业务系统在运行过程中产生的表单数据,此处不作限制。

具体实施中,终端设备可以预先存储不同的多个表单结构模板,然后根据第一表单数据涉及的数据类型、数据长度等信息选取一个适配的第一表单数据模板,进而可根据第一表单数据模板的第一表单结构将所述第一表单数据生成第一表单页面。

可选地,所述第一表单数据包括多个表单内容,上述步骤101中,所述根据第一表单结构将所述第一表单数据生成第一表单页面,包括:

11、根据所述第一表单结构创建表单;

12、通过所述表单获取所述多个表单内容对应的多个配置参数;

13、根据所述多个配置参数和所述多个表单内容生成表单内容组件,得到多个表单内容组件;

14、对所述多个表单内容组件进行渲染,得到所述第一表单页面。

其中,创建表单,可包括定义表单代码、名称、版本等。

其中,上述配置参数可包括以下至少一种:表单内容的尺寸大小以及位置参数、指标配置参数、引用配置参数、布局调整配置参数、数据限制配置参数、数据源配置参数、动作配置参数等,其中,指标配置参数可包括以下至少一种:表单的代码、名称、单位等;引用配置参数包括数据默认加载其他表单的数据;布局调整配置参数可包括以下至少一种:文本对齐、边框样式等;数据限制配置参数包括以下至少一种:只读、必填、可选填等;数据源配置参数可包括以下至少一种:字典、行政区划、部门、行业等常用或自定义数据源信息;动作设置参数可包括以下至少一种:控件联动、页面跳转、点击动作、数据回写等。

其中,通过对多个表单内容组件进行渲染,得到第一表单页面,可以使用户观及时查看第一表单页面的渲染效果。

可选地,所述表单包括多个表单控件,上述步骤12中,所述通过所述表单获取所述多个表单内容对应的多个配置参数,包括:

1201、接收用户针对所述多个表单控件的编辑指令,所述编辑指令携带所述多个配置参数;

1202、从所述编辑指令中提取所述多个配置参数。

如图2所示,为本申请实施例中一种根据第一表单结构将第一表单数据生成第一表单页面的演示示意图,其中,上述表单控件可包括以下至少一种:文本、单行填空、多行填空、下拉选择、单项选择、多项选择、自增行表格、批量复合、自增列表格、布局调整配置、指标配置、数据配置、动作配置等,其中,数据配置可包括以下至少一种:数据限制配置、数据源配置等,具体实施中,用户可通过编辑指令设置表单内容在表单页面中的配置参数。用户可通过拖拽、单击、双击、输入等编辑指令编辑多个表单控件,得到多个配置参数。

可见,通过一系列零编码的配置,使用户可以轻松快速地编辑或修改其所需要的表单效果,具备强大的灵活性,降低了大量的开发成本,显著地提升了表单生成效率。

102、备份所述第一表单页面,将所述第一表单页面存储至大数据库。

本申请实施例中,第一表单属性信息还可包括第一表单标识,可将第一表单页面进行备份,存储至大数据库,从而,可以在第一表单页面被重复访问、浏览、调用时,可以根据第一表单标识从大数据库中调用第一表单页面,进而对第一表单页面进行渲染。

103、在所述第一表单页面的存储时长达到所述第一存储时长时,从所述第一表单数据中筛选部分表单数据,得到第二表单数据。

本申请实施例中,终端设备可预先设定第一存储时长,在第一表单页面的存储时长达到第一存储时长时,可从第一表单数据中筛选部分表单数据,将该部分表单数据作为第二表单数据,筛选部分表单数据可以由用户手动筛选,也可以由终端设备自动筛选,本申请不作限制。

具体地,从第一表单数据中筛选部分表单数据,可以筛选出以下至少一种数据:必填项表单内容、满足预设规则的可选填项表单内容等。

可选地,所述多个表单内容包括必填项表单内容和可选填项表单内容,所述从所述第一表单数据中筛选部分表单数据,得到第二表单数据,包括:

31、确定多个表单内容中内容缺省的可选填项表单内容,以及非内容缺省的可选填项表单内容;

32、将所述内容缺省的可选填项表单内容,以及所述非内容缺省的可选填项表单内容中不满足预设规则的可选填项表单内容进行剔除,得到所述第二表单数据。

本申请实施例中,从第一表单数据中筛选部分表单数据,可剔除以下至少一种数据,将剩下的部分表单数据作为第二表单数据:表单内容中内容缺省的可选填项表单内容、不满足预设规则的可选填项表单内容。内容缺省的可选填项表单内容是指用户填写表单内容时,被设定为可选填项,且用户未进行填写的表单内容。具体实施中,用户在填写了可选填项表单内容后,用户填写的可选填项表单内容可能不满足预设规则,例如,可选填项表单内容需要用户回答一个问题,但用户填写的表单内容答非所问,表单内容不是问题的答案,实际应用中,此种可选填项表单内容继续保留意义不大,因此,可将不满足预设规则的表单内容进行剔除。

可选地,第一表单属性信息还可包括内容赋值表,具体地,在根据第一表单结构将所述第一表单数据生成第一表单页面的过程中,可根据用于是否填写表单内容的情况进行赋值,具体地,若终端设备未获取一项表单内容的数据信息,则赋值为0,若获取了该项表单的数据信息,则赋值为1;从而,在从所述第一表单数据中筛选部分表单数据的过程中,可直接查询内容赋值表,确定是否存在内容缺省,若一项表单内容对应的赋值为0,表明不存在缺省,可进一步获取用户填写的表单内容,判断该表单内容是否满足预设规则。如此,可仅通过查询内容赋值表判断是否存在内容缺省,可减少地址访问消耗的时间,提高筛选部分表单数据的效率。

可见,通过将用户未填写的表单数据进行剔除,以及将不满足预设规则的可选填项表单内容进行剔除,得到第二表单数据,可减少表单页面的内存大小,缩短第二表单页面的渲染时间,提升第二表单页面的渲染效率。

可选地,上述步骤32之前,所述方法还包括:

33、确定非内容缺省的任一可选填项表单内容的内容真实度以及有效存续时长;

34、若所述内容真实度低于预设真实度阈值,且所述有效存续时长小于或等于所述第一存储时长,则确定所述非内容缺省的可选填项表单内容中不满足预设规则。

本申请实施例中,确定非内容缺省的任一可选填项表单内容的内容真实度,具体地,可确定该任一可选填项表单内容的数据来源信息,根据数据来源信息对任一可选填项表单内容的内容真实度进行评估,具体地,可预先获取多个数据来源类型,数据来源类型例如可包括以下至少一种:权威机构或平台数据库、行业协会或组织的数据库、普通企业的业务平台数据库等等,此处不做限制,并对多个数据来源类型设置对应的真实度,得到多个真实度,然后根据该多个数据来源类型与多个真实度构建数据来源类型与真实度之间的映射关系,从而可在步骤33中,确定该任一可选填项表单内容的数据来源信息对应的数据来源类型,最后,根据该映射关系确定与该数据来源类型对应的真实度,将该真实度作为该任一可选填项表单内容的内容真实度。

其中,终端设备可预先设置预设真实度阈值,从而可在确定任一可选填项表单内容的内容真实度之后,判断该内容真实度是否低于预设真实度阈值,若是,则判断有效存续时长是否小于或等于所述第一存储时长,若是,则可确定非内容缺省的可选填项表单内容中不满足预设规则。如此,可将内容真实度较低,且有效存续时长小于或等于第一存储时长的可选填项表单内容进行剔除,从而提升第二表单数据的数据质量。

可选地,上述步骤33中,所述确定非内容缺省的任一可选填项表单内容的内容真实度,包括:

3301、获取所述任一可选填项表单内容的数据来源信息;

3302、对所述数据来源信息进行特征提取,得到数据来源特征集,所述数据来源特征集包括多个数据来源特征,且所述多个数据来源特征对应不同的多个优先级;

3303、按照优先级从高到低的顺序对所述多个数据来源特征依次进行内容真实度计算,并累计已经计算的内容真实度;

所述方法还包括:

3304、当所述内容真实度大于或等于所述预设真实度阈值时,停止进行内容真实度计算,将所述任一可选填项表单内容纳入所述第二表单数据。

具体实施中,在从第一表单数据中筛选部分表单数据的过程中,可以正向筛选满足预设规则的表单数据,也可反向提出不满足预设规则的数据,此外,考虑到数据来源信息中存在多个数据来源特征,进行内容真实度计算时,考虑到计算复杂度和计算时间的因素,可预先对不同的数据来源特征设置优先级,对内容真实度计算影响较大的数据来源特征对应的优先级更高,对内容真实度影响较小的数据来源特征对应的优先级更低,从而,可按照优先级从高到低的顺序依次累计计算的内容真实度,在内容真实度大于或等于预设真实度阈值时,停止进行内容真实度计算,则无需对后面的数据来源特征继续进行计算,如此,可减少内容真实度计算的计算量,进而,可确定该任一可选填项表单内容的内容真实度满足预设规则,将任一可选填项表单内容纳入第二表单数据,从而可提升数据筛选效率。

可选地,上述步骤103之前,所述方法还包括:

35、获取至少一个存储时长评估指标,所述存储时长评估指标包括以下至少一种:表单数据的时效性等级、有效存续时长、效益转化率;

36、确定所述至少一个存储时长评估指标对应的评估值,得到至少一个评估值;

37、根据所述至少一个评估值和所述至少一个存储时长评估指标对应的至少一个权值进行加权计算,得到目标评估值;

38、根据预设的评估值与存储时长之间的映射关系确定与所述目标评估值对应的第一存储时长。

其中,上述存储时长评估指标可包括以下至少一种:表单数据的时效性等级、有效存续时长、效益转化率等。

其中,时效性等级是指针对数据在时间维度上的产生效果或者影响的等级,实际应用中,表单数据的时效性等级越高,则表单数据能够在更长久时间内具备有效性,本申请实施例中,可根据数据来源确定是否为最新数据确定表单数据的时效性等级,具体地,可确定表单数据的源数据的产生时间,确定元数据产生时间到当前时间的时间间隔,根据预设的时间间隔与时效性等级之间的映射关系确定与时间间隔对应的时效性等级,进而,可将该时间间隔对应的时效性等级作为表单数据的时效性等级。上述有效存续时长是指表单数据可访问、可信赖、有效力的时长,例如可将表单数据根据有效存续时长的长期性、短期性、中期性划分不同的等级,有效存续时长越长,则对应的等级越高,表单数据可进行存储的第一存储时长越长。上述效益转化率是指表单数据转化成访问流量、引用频率或经济收益的转化率,表单数据的效益转化率越高,则表单数据的第一存储时长越长。

具体实施中,针对不同的数据表单,可通过不同的存储时长评估指标预估第一存储时长,例如,针对第一数据表单,可通过表单数据的时效性等级、有效存续时长、效益转化率三项评估指标来预估第一存储时长;针对第二数据表单,表单数据的时效性对表单数据的存储时长影响不大,则可通过表单数据的有效存续时长、效益转化率评估第一存储时长。如此,通过根据至少一个存储时长评估指标预估第一存储时长,能够从表单数据的时效性等级、有效存续时长、效益转化率等维度评估表单数据的第一存储时长,从而能够获得更加准确、有效、合理的第一存储时长。

其中,可预先构建至少一个存储时长评估指标中每一存储时长评估指标对应的评估函数,从而,可以在步骤36中确定所述至少一个存储时长评估指标对应的评估值时,调用存储时长评估指标对应的评估函数来计算对应的评估值,从而,可确定至少一个存储时长评估指标对应的至少一个评估值。

进一步地,可根据至少一个评估值和至少一个存储时长评估指标对应的至少一个权值进行加权计算,得到目标评估值,举例说明,若通过表单数据的时效性等级、有效存续时长、效益转化率三项评估指标来预估第一存储时长,则可调用时效性等级对应的第一评估函数来计算时效性等级对应的第一评估值,调用有效存续时长对应的第二评估函数来计算有效存续时长对应的第二评估值,调用效益转化率对应的第三评估函数来计算效益转化率对应的第三评估值,假定时效性等级对应第一权值,有效存续时长对应第二权值,效益转化率对应第三权值,根据以下公式计算目标评估值:目标评估值=第一评估值*第一权值+第二评估值*第二权值+第三评估值*第三权值。

最后,可根据预设的评估值与存储时长之间的映射关系确定与所述目标评估值对应的第一存储时长,从而能够获取更加有效、合理的第一存储时长。

104、根据第二表单结构将所述第二表单数据生成第二表单页面,所述第一表单结构的第一结构复杂度大于所述第二表单结构的第二结构复杂度。

本申请实施例中,不添加至新的表单页面中则在第二表单数据中,用户未填写的表单数据不需要进行渲染,不进行存储,不添加至新的表单页面中,简化表单结构,缩短表单页面的渲染时间,提升表单页面的渲染效率,减少表单页面的内存大小。

105、备份所述第二表单页面,将所述大数据库中已备份的所述第一表单页面更新为所述第二表单页面。

本申请实施例中,可将大数据库中已备份的第一表单页面更新为第二表单页面,从而,第二表单页面包括的第二表单数据的内存大小小于第一表单页面的第一表单数据的内存大小,如此,可降低表单页面内存,在数据表单的数量较为庞大时,可大大降低数据表单的内存消耗,此外,第一表单结构的第一结构复杂度大于所述第二表单结构的第二结构复杂度,还可在第二表单页面被重复访问、调用、引用时,缩短第二表单页面渲染时间,提升第二表单页面渲染效率。

可以看出,本申请实施例中,通过获取第一表单数据,根据第一表单结构将第一表单数据生成第一表单页面,第一表单页面包括第一表单属性信息,第一表单属性信息包括第一存储时长;备份第一表单页面,将第一表单页面存储至大数据库;在第一表单页面的存储时长达到第一存储时长时,从第一表单数据中筛选部分表单数据,得到第二表单数据;根据第二表单结构将第二表单数据生成第二表单页面,第一表单结构的第一结构复杂度大于第二表单结构的第二结构复杂度;备份第二表单页面,将大数据库中已备份的第一表单页面更新为第二表单页面,如此,能够在第一表单页面的存储时长达到第一存储时长时,通过减少表单内容,简化表单结构来渲染表单页面,可降低表单页面内存,还可缩短表单页面渲染时间,提升表单页面渲染效率。

请参阅图3,图3是本申请实施例提供的另一种基于大数据的表单处理方法的流程示意图,本申请实施例提供的基于大数据的表单处理方法应用于基于大数据的表单处理装置,该基于大数据的表单处理方法包括:

201、获取第一表单数据,根据所述第一表单结构创建表单。

202、通过所述表单获取所述多个表单内容对应的多个配置参数。

203、根据所述多个配置参数和所述多个表单内容生成表单内容组件,得到多个表单内容组件。

204、对所述多个表单内容组件进行渲染,得到所述第一表单页面,所述第一表单页面包括第一表单属性信息,所述第一表单属性信息包括第一存储时长,所述第一表单数据包括多个表单内容,所述多个表单内容包括必填项表单内容和可选填项表单内容。

205、备份所述第一表单页面,将所述第一表单页面存储至大数据库。

206、在所述第一表单页面的存储时长达到所述第一存储时长时,确定多个表单内容中内容缺省的可选填项表单内容,以及非内容缺省的可选填项表单内容。

207、将所述内容缺省的可选填项表单内容,以及所述非内容缺省的可选填项表单内容中不满足预设规则的可选填项表单内容进行剔除,得到所述第二表单数据。

208、根据第二表单结构将所述第二表单数据生成第二表单页面,所述第一表单结构的第一结构复杂度大于所述第二表单结构的第二结构复杂度。

209、备份所述第二表单页面,将所述大数据库中已备份的所述第一表单页面更新为所述第二表单页面。

其中,上述步骤201-209的具体实现过程可参照步骤101-步骤105中相应的描述,在此不再赘述。

可以看出,本申请实施例中,通过根据第一表单结构创建表单;通过表单获取多个表单内容对应的多个配置参数;根据多个配置参数和多个表单内容生成表单内容组件,得到多个表单内容组件;对多个表单内容组件进行渲染,得到第一表单页面,确定多个表单内容中内容缺省的可选填项表单内容,以及非内容缺省的可选填项表单内容;将内容缺省的可选填项表单内容,以及非内容缺省的可选填项表单内容中不满足预设规则的可选填项表单内容进行剔除,得到所述第二表单数据,如此,通过一系列零编码的配置,使用户可以轻松快速地编辑或修改其所需要的表单效果,具备强大的灵活性,降低了大量的开发成本,显著地提升了表单生成效率,通过将内容缺省的可选填项表单内容,以及非内容缺省的可选填项表单内容中不满足预设规则的可选填项表单内容进行剔除,以及简化表单结构来渲染表单页面,可降低表单页面内存,还可缩短表单页面渲染时间,提升表单页面渲染效率。

请参阅图4,图4是本申请实施例公开的基于大数据的表单处理装置的结构示意图,如图所示,该服务器包括处理器、存储器、通信接口,以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行以下步骤的指令:

获取第一表单数据,根据第一表单结构将所述第一表单数据生成第一表单页面,所述第一表单页面包括第一表单属性信息,所述第一表单属性信息包括第一存储时长;

备份所述第一表单页面,将所述第一表单页面存储至大数据库;

在所述第一表单页面的存储时长达到所述第一存储时长时,从所述第一表单数据中筛选部分表单数据,得到第二表单数据;

根据第二表单结构将所述第二表单数据生成第二表单页面,所述第一表单结构的第一结构复杂度大于所述第二表单结构的第二结构复杂度;

备份所述第二表单页面,将所述大数据库中已备份的所述第一表单页面更新为所述第二表单页面。

在一个可能的示例中,所述第一表单数据包括多个表单内容,在所述根据第一表单结构将所述第一表单数据生成第一表单页面方面,上述程序包括用于执行以下步骤的指令:

根据所述第一表单结构创建表单;

通过所述表单获取所述多个表单内容对应的多个配置参数;

根据所述多个配置参数和所述多个表单内容生成表单内容组件,得到多个表单内容组件;

对所述多个表单内容组件进行渲染,得到所述第一表单页面。

在一个可能的示例中,所述表单包括多个表单控件,在所述通过所述表单获取所述多个表单内容对应的多个配置参数方面,上述程序还包括用于执行以下步骤的指令:

接收用户针对所述多个表单控件的编辑指令,所述编辑指令携带所述多个配置参数;

从所述编辑指令中提取所述多个配置参数。

在一个可能的示例中,所述多个表单内容包括必填项表单内容和可选填项表单内容,在所述从所述第一表单数据中筛选部分表单数据,得到第二表单数据方面,上述程序包括用于执行以下步骤的指令:

确定多个表单内容中内容缺省的可选填项表单内容,以及非内容缺省的可选填项表单内容;

将所述内容缺省的可选填项表单内容,以及所述非内容缺省的可选填项表单内容中不满足预设规则的可选填项表单内容进行剔除,得到所述第二表单数据。

在一个可能的示例中,上述程序还包括用于执行以下步骤的指令:

确定非内容缺省的任一可选填项表单内容的内容真实度以及有效存续时长;

若所述内容真实度低于预设真实度阈值,且所述有效存续时长小于或等于所述第一存储时长,则确定所述非内容缺省的可选填项表单内容中不满足预设规则。

在一个可能的示例中,在所述确定非内容缺省的任一可选填项表单内容的内容真实度方面,上述程序包括用于执行以下步骤的指令:

获取所述任一可选填项表单内容的数据来源信息;

对所述数据来源信息进行特征提取,得到数据来源特征集,所述数据来源特征集包括多个数据来源特征,且所述多个数据来源特征对应不同的多个优先级;

按照优先级从高到低的顺序对所述多个数据来源特征依次进行内容真实度计算,并累计已经计算的内容真实度;

上述程序还包括用于执行以下步骤的指令:

当所述内容真实度大于或等于所述预设真实度阈值时,停止进行内容真实度计算,将所述任一可选填项表单内容纳入所述第二表单数据。

在一个可能的示例中,上述程序还包括用于执行以下步骤的指令:

获取至少一个存储时长评估指标,所述存储时长评估指标包括以下至少一种:表单数据的时效性等级、有效存续时长、效益转化率;

确定所述至少一个存储时长评估指标对应的评估值,得到至少一个评估值;

根据所述至少一个评估值和所述至少一个存储时长评估指标对应的至少一个权值进行加权计算,得到目标评估值;

根据预设的评估值与存储时长之间的映射关系确定与所述目标评估值对应的第一存储时长。

请参阅图5,图5是本实施例提供的一种基于大数据的表单处理装置的结构示意图,该装置400包括获取单元401、处理单元402、备份单元403和筛选单元404,其中,

所述获取单元401,用于获取第一表单数据;

所述处理单元402,用于根据第一表单结构将所述第一表单数据生成第一表单页面,所述第一表单页面包括第一表单属性信息,所述第一表单属性信息包括第一存储时长;

所述备份单元403,用于备份所述第一表单页面,将所述第一表单页面存储至大数据库;

所述筛选单元404,用于在所述第一表单页面的存储时长达到所述第一存储时长时,从所述第一表单数据中筛选部分表单数据,得到第二表单数据;

所述处理单元402,还用于根据第二表单结构将所述第二表单数据生成第二表单页面,所述第一表单结构的第一结构复杂度大于所述第二表单结构的第二结构复杂度;

所述备份单元403,还用于备份所述第二表单页面,将所述大数据库中已备份的所述第一表单页面更新为所述第二表单页面。

可选地,所述第一表单数据包括多个表单内容,在所述根据第一表单结构将所述第一表单数据生成第一表单页面方面,所述处理单元402具体用于:

根据所述第一表单结构创建表单;

通过所述表单获取所述多个表单内容对应的多个配置参数;

根据所述多个配置参数和所述多个表单内容生成表单内容组件,得到多个表单内容组件;

对所述多个表单内容组件进行渲染,得到所述第一表单页面。

可选地,所述表单包括多个表单控件,在所述通过所述表单获取所述多个表单内容对应的多个配置参数方面,所述处理单元402具体用于:

接收用户针对所述多个表单控件的编辑指令,所述编辑指令携带所述多个配置参数;

从所述编辑指令中提取所述多个配置参数。

可选地,所述多个表单内容包括必填项表单内容和可选填项表单内容,在所述从所述第一表单数据中筛选部分表单数据,得到第二表单数据方面,所述筛选单元404具体用于:

确定多个表单内容中内容缺省的可选填项表单内容,以及非内容缺省的可选填项表单内容;

将所述内容缺省的可选填项表单内容,以及所述非内容缺省的可选填项表单内容中不满足预设规则的可选填项表单内容进行剔除,得到所述第二表单数据。

可选地,所述筛选单元404还用于:

确定非内容缺省的任一可选填项表单内容的内容真实度以及有效存续时长;

若所述内容真实度低于预设真实度阈值,且所述有效存续时长小于或等于所述第一存储时长,则确定所述非内容缺省的可选填项表单内容中不满足预设规则。

可选地,所述处理单元402还用于:

获取至少一个存储时长评估指标,所述存储时长评估指标包括以下至少一种:表单数据的时效性等级、有效存续时长、效益转化率;

确定所述至少一个存储时长评估指标对应的评估值,得到至少一个评估值;

根据所述至少一个评估值和所述至少一个存储时长评估指标对应的至少一个权值进行加权计算,得到目标评估值;

根据预设的评估值与存储时长之间的映射关系确定与所述目标评估值对应的第一存储时长。

可选地,在所述确定非内容缺省的任一可选填项表单内容的内容真实度方面,所述筛选单元404具体用于:

获取所述任一可选填项表单内容的数据来源信息;

对所述数据来源信息进行特征提取,得到数据来源特征集,所述数据来源特征集包括多个数据来源特征,且所述多个数据来源特征对应不同的多个优先级;

按照优先级从高到低的顺序对所述多个数据来源特征依次进行内容真实度计算,并累计已经计算的内容真实度;

所述筛选单元404还用于:

当所述内容真实度大于或等于所述预设真实度阈值时,停止进行内容真实度计算,将所述任一可选填项表单内容纳入所述第二表单数据。

可以看出,本申请实施例中,通过获取第一表单数据,根据第一表单结构将第一表单数据生成第一表单页面,第一表单页面包括第一表单属性信息,第一表单属性信息包括第一存储时长;备份第一表单页面,将第一表单页面存储至大数据库;在第一表单页面的存储时长达到第一存储时长时,从第一表单数据中筛选部分表单数据,得到第二表单数据;根据第二表单结构将第二表单数据生成第二表单页面,第一表单结构的第一结构复杂度大于第二表单结构的第二结构复杂度;备份第二表单页面,将大数据库中已备份的第一表单页面更新为第二表单页面,如此,能够在第一表单页面的存储时长达到第一存储时长时,通过减少表单内容,简化表单结构来渲染表单页面,可降低表单页面内存,还可缩短表单页面渲染时间,提升表单页面渲染效率。

本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任何一种基于大数据的表单处理方法的部分或全部步骤。

本申请实施例还提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,该计算机程序使得计算机执行如上述方法实施例中记载的任何一种基于大数据的表单处理方法的部分或全部步骤。

需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。

本申请实施例所涉及到的终端设备可以包括各种具有无线通信功能的手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其他处理设备,以及各种形式的用户设备(userequipment,ue),移动台(mobilestation,ms)等等。为方便描述,上面提到的设备统称为终端设备。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在申请明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件程序模块的形式实现。

所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储器包括:u盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器、随机存取器、磁盘或光盘等。

以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1