基于表单的信息采集方法和装置与流程

文档序号:18900724发布日期:2019-10-18 21:54阅读:251来源:国知局
基于表单的信息采集方法和装置与流程

本发明涉及信息处理技术领域,尤其涉及一种基于表单的信息采集方法和装置。



背景技术:

随着计算机技术的发展,依托于互联网的业务服务成为主流,比如,在互联网上进行政务处理等,从而,用户可以基于互联网进行有关政务的网上填写和提交,不需要到有关部门现场填写,大大方便了用户的生活,提高了政务处理效率。

通常,支撑互联网业务服务的平台提供的代办理的事项多种多样,每一个事项都需要用户提供不同的信息,其中,以表单的形式采集用户填写的信息成为较为常用的一种方式,相关技术中,由相关人员采用编码的方式进行表单的设计开发,这种依赖于相关人员人工编码的方式,导致相关人员的设计工作量较大,降低了表单的生成效率,信息采集不够智能化。



技术实现要素:

本发明旨在至少在一定程度上解决相关技术中的技术问题之一。

为此,本发明的第一个目的在于提出一种基于表单的信息采集方法,以通过业务控件组的沉淀提高了表单的生成效率,减少了表单生成人员的工作量,进一步实现了信息采集的智能化。

本发明的第二个目的在于提出一种基于表单的信息采集装置。

本发明的第三个目的在于提出一种计算机设备。

本发明的第四个目的在于提出一种非临时性计算机可读存储介质。

为达上述目的,本发明第一方面实施例提出了一种基于表单的信息采集方法,包括以下步骤:获取训练事项样本数据库中每个训练事项样本对应的业务控件;确定同一训练事项样本中的多个业务控件被引用的组合方式,以形成一个或多个第一业务控件组;统计所有训练事项样本的所述第一业务控件组的引用次数,并根据所述引用次数确定一个或多个第二业务控件组;根据所述第二业务控件组生成表单并进行信息采集。

为达上述目的,本发明第二方面实施例提出了一种基于表单的信息采集装置,包括:获取模块,用于获取训练事项样本数据库中每个训练事项样本对应的业务控件;第一确定模块,用于确定同一训练事项样本中的多个业务控件被引用的组合方式,以形成一个或多个第一业务控件组;第二确定模块,用于统计所有训练事项样本的所述第一业务控件组的引用次数,并根据所述引用次数确定一个或多个第二业务控件组;生成模块,用于根据所述第二业务控件组生成表单并进行信息采集。

为达上述目的,本发明第三方面实施例提出了一种计算机设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器执行所述计算机程序时,实现如本发明第一方面实施例所述的基于表单的信息采集方法。

为了实现上述目的,本发明第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,当所述存储介质中的指令由处理器执行时,实现如本发明第一方面实施例所述的基于表单的信息采集方法。

上述技术方法,至少包含如下技术效果:

获取训练事项样本数据库中每个训练事项样本对应的业务控件,确定同一训练事项样本中的多个业务控件被引用的组合方式,以形成一个或多个第一业务控件组,进而,统计所有训练事项样本的所述第一业务控件组的引用次数,并根据所述引用次数确定一个或多个第二业务控件组,根据所述第二业务控件组生成表单并进行信息采集。由此,基于业务控件组的沉淀提高了表单的生成效率,减少了表单生成人员的工作量,进一步实现了信息采集的智能化。

本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:

图1为本发明实施例所提供的一种表单渲染场景示意图;

图2为本发明实施例所提供的另一种表单渲染场景示意图;

图3是根据本发明一个实施例的基于表单的信息采集方法的流程图;

图4是根据本发明一个实施例的基于表单的信息采集方法的应用场景示意图;

图5为本发明实施例提供的第一种基于表单的信息采集装置的结构示意图;

图6为本发明实施例提供的第二种基于表单的信息采集装置的结构示意图;

图7为本发明实施例提供的第三种基于表单的信息采集装置的结构示意图;

图8为本发明实施例提供的第四种基于表单的信息采集装置的结构示意图;

图9为本发明实施例提供的第五种基于表单的信息采集装置的结构示意图。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。

下面参考附图描述本发明实施例的基于表单的信息采集方法和装置。

在对本发明涉及的技术方案进行说明之前,首先对本发明实施例所涉及的一些名词进行定义,定义说明如下:

事项:与每个业务请求对应,用于指示具体的业务需求,比如,房屋贷款事项、结婚登记事项等。

业务控件:在完成对应的事项时所需要填写的信息对应的输入控件,比如对于房屋贷款事项而言,其待填写的信息包括身份信息、社保账号信息、房屋合同编号信息等,则对应的业务控件为身份证填写控件(比如为下拉框等),房屋合同编号填写控件等。

表单:由于考虑到目前很多的业务请求需要表格填写,因此,为了数据审批的方便,将有关界面中渲染出出表单,表单中包含了多个业务控件,其中,每个事项可对应于多个表单,比如,房屋贷款事项对应于公积金信息采集表单、收入证明表单等。

针对上述背景技术中提到的,由软件工程师手动编写表单导致表单生成效率低的技术问题,如图1所所示,本申请提出了一种表单服务平台,该服务平台,在接收到用户在业务服务网站上提交的业务请求后,根据该业务请求确定所需要的事项对应的表单,表单管理人员根据事项所需要的信息设计业务控件,基于该业务控件在业务服务网站上渲染出表单,以供用户填写信息,从而,业务服务网站上将用户填写的信息发送给审批系统进行审批等后续处理。这种方式可以缩短表单渲染周期,并且减小开发成本。

当然,在引入了表单服务平台后,虽然可以缩短表单渲染周期,且对有关技术人员的素质要求也变低了,比如,预先生成业务控件后,表单服务人员仅仅需要确定所需要的业务控件并使用即可,无需熟悉编写业务控件的代码,然而,在实际应用中,业务服务网站通常会包含成千上万的大事项,每个大事项包含了大量的需要渲染的业务控件,因此,通过表单服务平台进行逐一进行业务控件的确定,对表单管理人员而言,仍然具有较大的工作量压力。因此,如图2所示,本发明中,还引入了事项数据分析梳理平台,在该平台上,充分挖掘事项与事项之间的关系,基于该关系确定经常会同时出现的多个业务控件,在仅仅确定出多个相关的业务控件中的一个控件时,会将多个业务控件同时提供给表单管理人员,由此,表单管理人员无需一个一个的确定业务控件,直接复用多个业务控件,大大提高了作业效率。比如,当表单中需要身份证业务控件时,会将经常同时被引用的姓名业务控件、年龄业务控件、性别业务控件等一起显示给表单管理人员,相对于表单管理人员一个一个的确定业务控件,很显然大大提高了表单的生成效率。

下面参考附图3描述本发明实施例的基于表单的信息采集方法,如图3所示,该方法包括:

步骤101,获取训练事项样本库中每个训练事项样本对应的业务控件。

可以理解的是,训练事项样本库中包含了业务网站需要处理的所有事项,本申请中,获取训练事项样本库中每个训练事项样本对应的业务控件,以对事项样本之间的业务控件复用,发现业务控件之间的关系。

需要说明的是,上述获取训练事项样本数据库中每个训练事项样本对应的业务控件的方式不同,示例如下:

作为一种示例:由于每个事项对应于多个需要采集的信息,比如,对于身份信息采集事项,其对应的需要采集的信息包括身份证号码、身份证图像、姓名、住址、年龄等,每个需要采集的信息需要对应的业务控件来在表单中供用户填写。

因而,在本示例中,确定每个训练事项样本包含的第一待采集信息,基于第一待采集信息确定业务控件,比如,待采集信息为身份证信息,则对应的业务控件为输入控件(包含控件长度、控件颜色、控件格式等的设计)。需要说明的是,可以基于第一采集信息从已经创建好的业务控件中进行匹配,也可以由专门的技术人员根据要求编写。

作为另一种示例:

在本示例中,获取业务网站人员输入的业务需要,业务需要包含输入的事项和对应的待采集信息,进而,相关技术人员根据待采集信息确定并编写对应的业务控件。

步骤102,确定同一训练事项样本中的多个业务控件被引用的组合方式,以形成一个或多个第一业务控件组。

不难理解的是,对于一些较常被引用到的业务控件,如果发现他们之间的引用关系,可能会将一些经常被共用使用的业务控件作为一个业务控件组直接提供给表单管理人员复用,大大提高表单的渲染效率。

举例而言,如果业务控件a和业务控件b经常被同时引用,则在需要业务控件a时,同时将业务控件b显示给表单管理人员,以使表单管理人员无需确定业务控件b即可直接使用。

在本实施例中,基于同一训练事项样本中的多个业务控件被引用的组合方式,确定一个或多个第一业务控件组,其中,第一业务控件组中包含一个或多个业务控件,位于一个第一业务控件组中的业务控件之间认为具有被同一个训练事项同时引用的血缘关系。

需要说明的是,确定同一训练事项样本中的多个业务控件被引用的组合方式的方式不同,作为一种可能的实现方式,假设每个训练事项样本对应的业务控件个数为m个,m为大于1的自然数,遍历m个业务控件进行非重复的排列组合,生成一个或多个第一业务控件组。

举例而言,当m为3,对应于三个事项,事项1对应的业务控件为a、b、c,事项2对应的业务控件为a、c、d,事项3对应的业务控件为a、b、d,事项1对应的业务控件排列组合后得到的第一业务控件组为(a),(b),(c),(ab),(ac),(bc),(abc),事项2对应的业务控件排列组合后得到的第一业务控件组为(a),(b),(c),(ac),(ad),(cd),(acd),事项3对应的业务控件排列组合后得到的第一业务控件组为(a),(b),(d),(ab),(ad),(bd),(abd)。

步骤103,统计所有训练事项样本的第一业务控件组的引用次数,并根据引用次数确定一个或多个第二业务控件组。

可以理解,第一业务控件组中包含的业务控件虽然具有血缘关系,但是可能并不经常的被处理事项使用,因此,为了进一步对业务控件组沉淀,统计所有训练事项样本的第一业务控件组的引用次数,并根据引用次数确定一个或多个第二业务控件组。当第二业务控件组中包含多个业务控件时,多个业务控件经常被同一个事项同时引用。

具体的,统计所有训练事项样本的第一业务控件组的引用次数,即统计该第一业务控件组的训练事项样本的数量,并根据引用次数确定一个或多个第二业务控件组,比如,确定引用次数大于一定值的第一业务控件组为第二业务控件组。

当然,在实际执行过程中,很多业务控件虽然名称不同,但是其本质上采集的信息是一样的,比如对于“身份信息填写”,“身份证号码”和“个人id信息”这三个业务控件而言,本质上都是获取用户的身份证信息,因此,在本发明的一个实施例中,为了梳理出第一业务控件组真正的引用次数,还可确定所有第一业务控件组中每个业务控件对应的业务标签,即将每个业务控件于业务标签关联,可以基于语义关联等,比如,对于“身份信息填写”,“身份证号码”和“个人id信息”这三个业务控件而言,与业务标签“个人身份信息”关联,进而,确定属于同一个业务标签的业务控件组集合,其中,业务控件组集合中包含至少一个具有相同业务标签的第一业务控件组,统计到当前为止每个业务控件组集合中包含的所有第一业务控件组的引用次数之和,当然,要是到当前为止需要计算的计算量较大,还可设置一个预设时间,统计在预设时间内的所有第一业务控件组的引用次数之和,其中,预设时间根据实际需要标定,进一步的,将每个业务控件组集合中的引用次数之和作为该业务控件组集合中每个第一业务控件组的引用次数。

作为一种可能的示例,继续以上述以排列组合方式获取第一业务控件组为例进行说明,根据第一业务控件组包含的业务控件的数量对所有训练事项样本生成的所有第一业务控件组计算,获取具有相同业务控件的第一业务控件组对应的控件组数量,根据控件组数量生成多个排行榜,其中,每个排行榜中的第一业务控件组包含的业务控件数量相同,且不同的排行榜中的第一业务控件组包含的业务控件数量不同,将排行榜显示给技术人员,以获取技术人员确定的一个或多个第二业务控件组。

继续以上述事项1-3为例,可以,创建3个排行榜,包含一个业务控件的排行榜为:a(3),b(3),c(2),d(1),包含两个业务控件的排行榜为:ab(2),ac(2),ad(2),bc(1),bd(1),cd(1),包含三个业务控件的排行榜为:abc(1),acd(1),abd(1),其中,排行榜后的次数为被事项引用的总次数,可以将排行榜显示给技术人员,比如显示给表单管理员,以便于表单管理员根据该排行榜确定第二业务控件组。

作为另一种可能的实现方式,可以不预先生成第一业务控件组,而是统计所有训练事项样本对应的所有业务控件中每个业务控件的引用次数,确定引用次数大于预设阈值的a个候选业务控件,其中,a为大于1的自然数,该预设阈值根据实验数据标定,也可由相关技术人员根据需要自定义。

进一步的,确定出经常被使用的候选业务控件之后,梳理候选业务控件之间的血缘关系,找出经常被同一个训练事项样本引用的候选业务控件,即计算a个候选业务控件中任意b个业务控件被同一个训练事项样本引用的次数,比如,对于候选业务控件1、2和3而言,其对应的引用次数分别为1000、1500和1300,对于业务控件1、2和3被同一个训练样本事项同时引用的次数为1000,当然,也可以计算其同时被引用的概率,比如其同时被引用的概率为1000*3/(1000+1500+1300)=79%。

进一步的,根据概率大于预设阈值的候选业务控件生成第二业务控件组,比如,对于上述示例而言,将候选业务控件1、2和3作为一个第二业务控件组。

步骤104,根据第二业务控件组生成表单并进行信息采集。

具体的,在生成第二业务控件组后,根据第二业务控件组生成表单并进行信息的采集,其中,第二业务控件组业务包含多个业务控件时,一次提供给表单管理人员包含多个业务控件的业务控件组,表单管理人员将确定的业务控件提供给前端技术人员,前端技术人员渲染出对应的表单来采集信息。

在实际应用中,可以获取业务请求,该业务请求是根据业务服务网站的需要定制的,业务请求可以是网站管理人员发送的,进而,根据业务请求确定第二待采集信息,进而,如图2所示,将第二待采集信息发送至表单服务平台,由表单服务平台中的表单管理人员确定需要的表单,进而,事项数据分析梳理平台的事项分析员根据第二待采集信息发送至表单服务平台第二目标业务控件组,当然,当没有对应的业务控件组时也可以发送单个的业务控件。在获取第二目标业务控件组目标业务控件组后,可根据目标业务控件组在业务请求的反馈界面上渲染表单,以便于根据渲染的表单采集与业务请求对应的业务信息。比如,在表单生成平台显示目标业务控件组,确定表单管理人员在表单生成平台上选择的目标业务控件,将目标业务控件发送至前端开发人员,由前端开发人员根据目标业务控件渲染表单。

需要说明的是,在不同的应用场景中,根据第二待采集信息在多个业务控件组中确定第二目标业务控件组的方式不同,作为一种可能的实现方式,确定与第二待采集信息匹配的目标业务标签,确定与目标业务标签对应的第二目标业务控件组,或者,确定与第二待采集信息匹配的目标业务标签,确定与目标业务标签对应的目标业务控件所在的第二目标业务控件组。

在本实施例中,如图4所示,当多个第二待采集信息为1-6时,可以由表达人员根据需要将任意一个第二待采集信息1发送至事项数据分析梳理平台,事项数据分析梳理平台根据第二待采集信息1对应的目标业务标签a将第二目标业务控件组a1-a5反馈给表单服务平台,则表单服务平台显示目标业务控件组a1-a5,由于a1与第二待采集信息为1对应,a2-a5与第二待采集信息为2-5对应,由此,表单管理人员接下来仅仅需要确定第二待采集信息6对应的业务控件即可,大大降低了工作量。

在本示例中,也可直接将全部的第二待采集信息发送至事项数据分析梳理平台确定第二目标业务控件组,其确定第二目标业务控件组的方式可以为第二待采集信息与业务控件组的关键词匹配,也可以是上述示例示出的业务标签的匹配等。

综上,本发明实施例的基于表单的信息采集方法,获取训练事项样本数据库中每个训练事项样本对应的业务控件,确定同一训练事项样本中的多个业务控件被引用的组合方式,以形成一个或多个第一业务控件组,进而,统计所有训练事项样本的所述第一业务控件组的引用次数,并根据所述引用次数确定一个或多个第二业务控件组,根据所述第二业务控件组生成表单并进行信息采集。由此,基于业务控件组的沉淀提高了表单的生成效率,减少了表单生成人员的工作量,进一步实现了信息采集的智能化。

为了实现上述实施例,本发明还提出一种基于表单的信息采集装置。

图5为本发明实施例提供的一种基于表单的信息采集装置的结构示意图。

如图5所示,该装置包括:获取模块10、第一确定模块20、第二确定模块30和生成模块40。其中,

获取模块10,用于获取训练事项样本数据库中每个训练事项样本对应的业务控件。

第一确定模块20,用于确定同一训练事项样本中的多个业务控件被引用的组合方式,以形成一个或多个第一业务控件组。

第二确定模块30,用于统计所有训练事项样本的第一业务控件组的引用次数,并根据引用次数确定一个或多个第二业务控件组。

生成模块40,用于根据第二业务控件组生成表单并进行信息采集。

在本发明实施例的一种可能的实现方式中,如图6所示,在如图5所示的基础上,第二确定模块30,包括第一获取单元31、生成单元32和第二获取单元33,其中,

在本实施例中,每个训练事项样本对应的业务控件个数为m个,第一确定模块20用于遍历m个业务控件进行非重复的排列组合,生成一个或多个第一业务控件组。

第一获取单元31,用于根据第一业务控件组包含的业务控件的数量对所有训练事项样本生成的所有第一业务控件组计算,获取具有相同业务控件的第一业务控件组对应的控件组数量。

生成单元32,用于根据控件组数量生成多个排行榜,其中,每个排行榜中的第一业务控件组包含的业务控件数量相同,且不同的排行榜中的第一业务控件组包含的业务控件数量不同。

第二获取单元33,用于将排行榜显示给技术人员,以获取技术人员确定的一个或多个第二业务控件组。

在本发明实施例的一种可能的实现方式中,如图7所示,在如图6所示的基础上,获取模块10包括:第一确定单元11、第二确定单元12,其中,

第一确定单元11,用于确定每个训练事项样本包含的第一待采集信息。

第二确定单元12,用于根据第一待采集信息确定业务控件。

在本发明实施例的一种可能的实现方式中,如图8所示,在如图5所示的基础上,第二确定模块30,包括第三确定单元34、第四确定单元35和第五确定单元36,其中,

第三确定单元34,用于确定所有第一业务控件组中每个业务控件对应的业务标签。

第四确定单元35,用于根据业务标签确定包含至少一个第一业务控件组的业务控件组集合,其中,业务控件组集合中各个第一业务控件组对应业务标签相同。

第五确定单元36,用于根据业务控件组集合中包含的第一业务控件组的数量确定第一业务控件组的引用次数。

在本发明实施例的一种可能的实现方式中,如图9所示,在如图5所示的基础上,该装置还包括:第三确定模块50、第四确定模块60和渲染模块70,其中,

第三确定模块50,用于获取业务请求,根据业务请求确定第二待采集信息。

第四确定模块60,用于根据第二待采集信息确定第二目标业务控件组。

渲染模块70,用于根据第二目标业务控件组在业务请求的反馈界面上渲染表单,以便于根据渲染的表单采集与业务请求对应的业务信息。

需要说明的是,前述对基于表单的信息采集方法实施例的解释说明也适用于该实施例的基于表单的信息采集方法装置,此处不再赘述。

为了实现上述实施例,本发明还提出一种计算机设备,包括存储器、处理器及存储在存储器上并可处理器上运行的计算机程序,处理器执行所述计算机程序时,实现如前述实施例描述的基于表单的信息采集方法。

为了实现上述实施例,本发明还提出一种非临时性计算机可读存储介质,其上存储有计算机程序,当所述存储介质中的指令由处理器被执行时,使得能够执行如前述实施例描述的基于表单的信息采集方法。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(ram),只读存储器(rom),可擦除可编辑只读存储器(eprom或闪速存储器),光纤装置,以及便携式光盘只读存储器(cdrom)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。

应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。

此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1