一种信息录入方法及装置与流程

文档序号:18832771发布日期:2019-10-09 04:00阅读:247来源:国知局
一种信息录入方法及装置与流程

本申请涉及计算机技术领域,尤其涉及一种信息录入方法及装置。



背景技术:

随着时代的发展变化,许多活动需要掌握个人或者企业、组织等的相关信息而开展。在活动的开展过程中,双方针对某一业务达成协议或者签订意向合同,往往会需要向对方提供自身相关的真实信息以及双方经过协商后写明业务内容,并录入前述信息,以电子数据的形式进行存储。特别地,在电子发票的填写以及打印、单据的录入等业务活动过程中,需要将目标信息录入到指定的系统或者数据库中,以便于下一步活动的开展;但由于采用相应人员进行信息录入的方式,往往会出现一些纰漏。例如,在对投保单的内容进行录单的时候,一般会录入项目细节和时效、企业的名称及统一社会信用代码或者个人的姓名以及身份证号码等必要内容。当前,在录入投保单时,采用录单员手动录入的方式,无法保证录入信息的正确性,尤其在录入统一社会信用代码等数字串的时候,输入错误的可能性较大,例如,统一社会信用代码以及身份证号码等多数位的数字串在人工录入的情况下,经常会出现部分数字录错或者数字顺序录错等情形。而且,在其他需要填写个人或者企业信息的情况下(例如填写电子发票),也经常面对需要填写大量的信息,例如,发票抬头,接收发票方的邮箱、电话等联系方式或者公司、学校等组织的纳税人识别号等信息;该填写过程中繁琐的操作和输入信息量都没有办法得到缓减。

因此,如何有效地录入所需信息,提高录入信息的准确性,是本申请需要解决的问题。



技术实现要素:

本发明实施例提供一种信息录入方法及装置,可以有效地录入所需单据信息,提高录入信息的准确性。

第一方面,本发明实施例提供了一种信息录入方法,该方法可包括:

获取第一用户的身份标识和单据信息,所述第一用户的身份标识包括所述第一用户的名称;

根据所述第一用户的身份标识,从历史数据库中获取与所述身份标识对应的第一用户信息;

根据所述单据信息,从所述第一用户信息中筛选出与所述单据信息对应的必要录入信息;

根据预设的录入规则,将所述必要录入信息录入至单据。

实施本发明实施例,通过获得目标用户的身份信息(如投保对象的名称)和需要录入的单据类型以及该类型单据所需的信息内容;根据目标用户的身份信息获取与目标用户的信息,从目标用户相关的信息中筛选出填写该单据所需的目标用户的录入信息;针对筛选出的录入信息进行信息预处理,将处理过的必要录入信息录入单据填写页面中对应的区域。在本申请中,采用机器录入单据信息的方式,区别于现有技术中人工录入的方式,避免了人工手动录入导致的各类失误;在需要录入大量的不同用户信息的情况下,通过识别用户的身份标识,搜索并根据一定的筛选条件,获取单据录入所需要的准确信息,缓减录入过程中的繁琐操作;在处理包含字符或者数字的投保相关信息的情况下,结合具体的数字或者字符提取算法,能够准确录入数字或者字符,降低错误录入的可能性;将采集到的信息根据录入的规范向用户提供或者自动填入,减少录入流程的实际操作量。实施本发明实施例,能够提高录入信息的准确性和效率,简化单据信息的录入流程,保障了录入信息的准确、可靠。

在一种可能的实现方式中,所述根据所述单据信息,从所述第一用户信息中筛选出与所述单据信息对应的必要录入信息,包括:

通过预设的关键字提取算法对所述单据信息中的页面填写信息进行关键字提取,整合得到所述页面填写信息中所述必要录入信息的关键字和每一个关键字所需的必要录入信息的数量;

从获取的所述第一用户信息中,筛选出与所述必要录入信息中每一个关键字对应且满足所述数量的所述必要录入信息。

在一种可能的实现方式中,所述从获取的所述第一用户信息中筛选出与所述必要录入信息的关键字对应的所述必要录入信息之前,还包括:

搭建与所述必要录入信息的关键字对应的信息筛选规则库,所述信息识别规则库包括多种关键字对应的多条信息筛选规则;

从所述信息筛选规则库中,匹配出与所述必要录入信息的关键字包括的第一关键字对应的信息筛选规则,所述第一关键字对应的信息筛选规则用于从所述第一用户信息中筛选出所述必要录入信息。

在一种可能的实现方式中,所述方法还包括:

根据所述必要录入信息、所述预设的录入规则和所述单据信息,生成与所述单据信息对应的第一录入模板,并存储至历史模板库中;

当识别出所述第一用户的单据信息与所述第一录入模板匹配时,调用所述第一录入模板,录入所述第一用户的必要录入信息。

在一种可能的实现方式中,所述根据所述第一用户的身份标识,从历史数据库中获取与所述身份标识对应的第一用户信息,包括:

根据所述第一用户的身份标识,获取对应的预设筛选条件,所述预设筛选条件包括信息的类型、信息的时效性和同类型信息的数量;根据所述信息的类型、所述同类型信息的数量和所述第一用户的身份标识,筛选所述身份标识对应的关联信息;将所述身份标识对应的关联信息中满足时效性的关联信息按照单据关联性的强弱进行排序,其中,在满足时效性的关联信息中所述身份标识出现的频率越高,表示单据关联性越强;获取排列在预设排序名次之前的满足时效性的关联信息作为所述第一用户信息。

在一种可能的实现方式中,所述根据预设的录入规则,将所述必要录入信息录入至单据之前,还包括:

根据预设的信息处理规则,从所述必要录入信息中提取出符合录入要求的字符信息,所述字符信息包括文字和/或数字。

在一种可能的实现方式中,所述根据预设的信息处理规则,从所述必要录入信息中提取出符合录入要求的字符信息,包括:

按照预设的分词策略对从所述必要录入信息中提取的文字进行分词,获得所述必要录入信息中符合文字录入要求的文字;和/或,

按照预设的数字识别算法对从所述必要录入信息中提取的数字进行识别,获得所述必要投保信息中符合数字录入要求的数字。

第二方面,本发明实施例提供了一种信息录入装置,该装置可包括:

获取信息单元,用于获取第一用户的身份标识和单据信息,所述第一用户的身份标识包括所述第一用户的名称;

搜索单元,用于根据所述第一用户的身份标识,从历史数据库中获取与所述身份标识对应的第一用户信息;

筛选单元,用于根据所述单据信息,从所述第一用户信息中筛选出与所述单据信息对应的必要录入信息;

录入单元,用于根据预设的录入规则,将所述必要录入信息录入至单据。

在一种可能的实现方式中,所述筛选单元,还包括:

关键字提取单元,用于通过预设的关键字提取算法对所述单据信息中的页面填写信息进行关键字提取,整合得到所述页面填写信息中所述必要录入信息的关键字和每一个关键字对应的必要录入信息的数量;

信息识别单元,用于从获取的所述第一用户信息中,筛选出与所述必要录入信息中每一个关键字所需且满足所述数量的所述必要录入信息。

在一种可能的实现方式中,所述装置还包括规则匹配单元,用于:在从获取的所述第一用户信息中筛选出与所述必要录入信息的关键字对应的所述必要录入信息之前,搭建与所述必要录入信息的关键字对应的信息筛选规则库,所述信息识别规则库包括多种关键字对应的多条信息筛选规则;

从所述信息筛选规则库中,匹配出与所述必要录入信息的关键字包括的第一关键字对应的信息筛选规则,所述第一关键字对应的信息筛选规则用于从所述第一用户信息中筛选出所述必要录入信息。

在一种可能的实现方式中,所述装置还包括:模板生成单元,用于根据所述必要录入信息、所述预设的录入规则和所述单据信息,生成与所述单据信息对应的第一录入模板,并存储至历史模板库中;当识别出所述第一用户的单据信息与所述第一录入模板匹配时,调用所述第一录入模板,录入所述第一用户的必要录入信息。

在一种可能的实现方式中,所述搜索单元,具体用于:

根据所述第一用户的身份标识,获取对应的预设筛选条件,所述预设筛选条件包括信息的类型、信息的时效性和同类型信息的数量;

根据所述信息的类型、所述同类型信息的数量和所述第一用户的身份标识,筛选所述身份标识对应的关联信息;

将所述身份标识对应的关联信息中满足时效性的关联信息按照单据关联性的强弱进行排序,其中,在满足时效性的关联信息中所述身份标识出现的频率越高,表示单据关联性越强;获取排列在预设排序名次之前的满足时效性的关联信息作为所述第一用户信息。

在一种可能的实现方式中,所述装置还包括提取单元,用于在所述根据预设的录入规则,将所述必要录入信息录入至单据之前,根据预设的信息处理规则,从所述必要录入信息中提取出符合录入要求的字符信息,所述字符信息包括文字和/或数字。

在一种可能的实现方式中,所述提取单元,具体用于:按照预设的分词策略对从所述必要录入信息中提取的文字进行分词,获得所述必要录入信息中符合文字录入要求的文字;和/或,按照预设的数字识别算法对从所述必要录入信息中提取的数字进行识别,获得所述必要投保信息中符合数字录入要求的数字。

第三方面,本发明实施例提供了一种录单设备,包括存储部件、通信部件和处理部件,存储部件、通信部件和处理部件相互连接,其中,存储部件用于存储数据处理代码,通信部件用于与外部设备进行信息交互;处理部件被配置用于调用程序代码,执行上述第一方面所述的方法,此处不再赘述。

第四方面,本发明实施例提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现第一方面所述的方法,此处不再赘述。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。

图1是本发明实施例提供的一种信息录入系统架构示意图;

图2是本发明实施例提供的一种信息录入方法的流程示意图;

图3是本发明实施例提供的一种信息录入方法所应用场景的示意图;

图4是本发明实施例提供的另一种信息录入方法所应用场景的示意图;

图5是本发明实施例提供的一种信息录入装置的结构示意图;

图6是本发明实施例提供的一种录单设备的结构示意图。

具体实施方式

本发明实施例提供一种信息录入方法及装置,可以有效地录入所需投保信息,提高录入信息的准确性。

本申请说明书、权利要求书和附图中出现的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。此外,术语“第一”、“第二”和“第三”等是用于区别不同的对象,而并非用于描述特定的顺序。下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。

首先,对本申请中的部分用语进行解释说明,以便于本领域技术人员理解。

(1)投保单,称“要保单”或“投保申请书”,为投保人申请保险的一种书面形式,通常由保险人提供,即由投保人填明订立保险单所需要的项目。投保单的主要内容包括:被保险人的名称;保险标的名称及存放地点(如投保运输工具或运输货物,还须注明运输工具名称、货物数量及目的地等);投保的险别;保险期限;保险价值及保险金额等。填写投保单必须情况真实,否则将影响保险合同的效力。投保单一经保险人正式接受,保险责任即行开始。

(2)统一社会信用代码,为根据标准规定由18位阿拉伯数字或大写英文字母表示,分别是1位登记管理部门代码、1位机构类别代码、6位登记管理机关行政区划码、9位主体标识码、1位校验码。

(3)分词,或称中文分词(chinesewordsegmentation),指的是将一个汉字序列切分成一个个单独的词;分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。

下面先对本发明实施例所基于的其中一种信息录入系统架构进行描述,本申请提出的信息录入方法可以应用于该系统架构。请参见图1,图1是本发明实施例提供的一种信息录入系统架构示意图,如图1所示,该系统架构包含了终端和服务器;在本发明实施例中,信息录入方法可以应用于投保单的信息录入场景,终端1、终端2、终端3、……、终端n,表示服务器或者服务器组可以同时跟多个终端进行交互,本发明实施例对终端的数量不作限定;其中,

终端,可以是计算机网络中处于网络最外围的设备,也可以用于信息的输入以及处理结果的输出等。也可以称为系统、用户单元、用户站、移动站、移动台、远方站、远程终端、移动设备、用户终端、移动终端、无线通信设备、用户代理、用户装置、可安装插件的服务设备或用户设备(userequipment,ue)。例如,终端可以是蜂窝电话、移动电话、无绳电话、智能手表、可穿戴设备(wearabledevice)、平板设备、会话启动协议(sessioninitiationprotocol,sip)电话、无线本地环路(wirelesslocalloop,wll)站、个人数字助手(personaldigitalassistant,pda)、具备无线通信功能的手持设备、计算设备、车载通信模块、智能电表或连接到无线调制解调器的其它处理设备。本发明实施例中提及的终端可为手机、平板电脑、笔记本电脑、掌上电脑、移动互联网设备或其他移动终端,所述终端用于获得用户输入的第一用户的身份标识,并可以向用户展示单据的填写页面以及录入情况。

服务器,或者服务器组,是指一种通过快速获取、处理、分析和提取有价值的、海量和多样化数据,以交互数据为基础,为第三方使用带来各种便利的服务设备。在本发明实施例中,服务器可以执行以下操作:获取第一用户的身份标识和单据信息,所述第一用户的身份标识包括所述第一用户的名称;根据所述第一用户的身份标识,从历史数据库中获取与所述身份标识对应的第一用户信息;根据所述单据信息,从所述第一用户信息中筛选出与所述单据信息对应的必要录入信息;根据预设的录入规则,将所述必要录入信息录入至单据。当单据为投保单的情况下,服务器获取投保人的身份标识和投保单信息,并根据所述投保人的身份标识,获取投保人信息;根据所述投保单信息,从所述投保人信息中筛选并确定出与所述投保单信息对应的必要投保信息;根据预设的录入规则,将所述必要投保信息录入至所述投保单。

可以理解的是,图1所示的内容只是本发明实施例中的一种示例性的实施方式。本发明实施例中的系统架构可以包括但不仅限于以上系统架构。

下面结合上述系统架构和本申请中提供的一种信息录入方法的实施例,对本申请中提出的技术问题进行具体分析和解决。

请参见图2,图2是本发明实施例提供的一种信息录入方法的流程示意图,信息录入方法可以应用于信息录入系统(包括上述架构);在本发明实施例中,以投保单录入的应用场景为例进行描述。下面将结合图2,以服务器为执行主体为例,从服务器的单侧进行描述,该方法可以包括以下步骤s201-步骤s207;其中,可选的步骤可以包括步骤s204、s206和s207。

步骤s201:获取第一用户的身份标识和单据信息。

具体地,服务器可以通过终端获取第一用户(投保人)的身份标识和需要录入的单据信息(投保单信息),例如,在用户通过终端上输入“xx公司”作为投保人的身份标识,并且确认需要录入关于货物运输保险事宜的投保单信息之后,服务器可以通过网络获取到关于“xx公司”以及与货物运输保险的相关填写投保单所需的内容;所述投保人的身份标识包括所述投保人的名称,所述投保人的身份标识用于服务器根据投保人的身份标识获取与投保人相关的信息。所述投保单信息,可以包括以下5种内容:1、被保险人的名称和/或地址;2、保险标的的名称和/或存放地点;3、投保的险别;4、保险责任的起讫;5、保险价值及保险金额等。

步骤s202:根据所述第一用户的身份标识,从历史数据库中获取与所述身份标识对应的第一用户信息。

具体地,服务器根据所述投保人的身份标识,通过网络或者从离线数据库中搜索并获取与身份标识有关的第一用户信息(投保人信息),其中,离线数据库存储了大量的不同的投保人信息,便于服务器可以不通过网络直接获取数据库中的信息;在获取信息的过程中,服务器可以通过判断信息是否包含身份标识而识别该信息是否为需要的投保人信息,如果包含身份标识就获取该信息作为投保人信息;例如,服务器可以将“xx公司”作为信息搜索的关键字,在互联网上通过网络爬虫爬取与“xx公司”相关的网站信息;从网站信息中提取符合预设要求的投保人信息。

在一种可能的实现方式中,所述根据所述第一用户的身份标识,从历史数据库中获取与所述身份标识对应的第一用户信息,包括:根据所述第一用户的身份标识,获取对应的预设筛选条件,所述预设筛选条件包括信息的类型、信息的时效性和同类型信息的数量;根据所述信息的类型、所述同类型信息的数量和所述第一用户的身份标识,筛选所述身份标识对应的关联信息;将所述身份标识对应的关联信息中满足时效性的关联信息按照单据关联性的强弱进行排序,其中,在满足时效性的关联信息中所述身份标识出现的频率越高,表示其与单据关联性越强;获取排列在预设排序名次之前的满足时效性的关联信息作为所述第一用户信息。获取预设的筛选条件,所述筛选条件包括信息的类型、信息的时效性和同类型信息的数量;例如,信息的类型可以包括企业的统一社会信用代码、企业注册资金、企业地址、相关负责人的联系方式等,以企业地址为例对信息的时效性进行描述,企业地址在a地并能够获取该a地地址,后来企业地址更改为b地也能够在获取到该b地地址;服务器对于获得a地地址和b地地址,结合相应的存储或者更改时间判断出企业地址应该为b地地址,a地地址不具备时效性,并且b地地址的出现的频率以及应用场合较多、重要,而判断不应该获取该a地地址信息而是b地地址信息。以相关负责人的联系方式对同类型信息的数量进行描述,负责对接该投保项目的企业负责人为多人,就需要填写多个负责人姓名以及对应的联系电话,获取信息时候应该获取满足数量要求的姓名信息和对应联系方式信息。再例如,服务器根据“xx公司”在满足时效性的关联信息的每一个关联信息中出现的数量从多到少或者出现的频率从高到低,对获取的满足时效性的关联信息进行排序,排除数量出现频率低于预设频率阈值或者出现的数量小于预设数量值的关联信息,获取在排序列表中靠前的关联信息。例如,服务器在以“xx公司”作为搜索关键字的基础上,结合需要获得的企业联系人姓名的数量以及对应的联系方式数量作为获取的条件,获得符合数量要求的姓名和联系方式。

在一种可能的实现方式中,根据所述信息的时效性对所述身份标识对应的投保人信息的可信度进行判断,获取符合可信度要求的投保人信息。例如,服务器对于企业的注册资金,获得了多条关于注册资金总额的信息,其中每一条信息中包含资金数量和相应的日期,以距离搜索日期最近的日期对应的注册资金为符合录入要求的企业注册资金信息并获取。

在一种可能的实现方式中,根据所述投保人信息的获取条件检索公开的、可通过网络或者其他途径搜索的投保人信息,其中,所述获取条件还可以包括用户设置的哪些信息可以通过网络搜集,哪些信息可能由于涉及企业秘密等原因无法网络搜集。可选地,对于无法获取或者获取受到限制的必要录入信息,可以向用户反馈,并要求用户手动录入或提供相应的获取权限。

步骤s203:根据所述单据信息,从所述第一用户信息中筛选出与所述单据信息对应的必要录入信息。

具体地,服务器根据投保单信息,确定要录入的信息类型、信息数量、信息的录入顺序和录入要求等。在确定所述投保单信息之后,从获取的投保人信息中筛选出与投保单信息匹配的必要录入信息(必要投保信息)。

在一种可能的实现方式中,所述根据所述单据信息,从所述第一用户信息中筛选出与所述单据信息对应的必要录入信息,包括:通过预设的关键字提取算法对所述单据信息中的页面填写信息进行关键字提取,整合得到所述页面填写信息中所述必要录入信息的关键字和每一个关键字所需的必要录入信息的数量;从获取的所述第一用户信息中,筛选出与所述必要录入信息中每一个关键字对应且满足所述数量的所述必要录入信息。例如,服务器可以对单据的页面扫描件通过ocr(opticalcharacterrecognition,光学字符识别)进行识别,结合预设的锚点区域和目标文本区域的文本定义,得到页面中录入信息所需要的关键字,例如“公司名称”、“公司地址”、“公司法人”等,并且确认每个关键字需要的信息条数,例如,在填写公司法人时可能会需要多个法人的信息。

可选地,利用中文分词工具对页面填写信息中的待处理数据进行分词处理;以分词得到的短语为最小粒度单元,并根据特定模型获取长度不超过预设的关键字最大长度值的所有候选关键字;根据候选关键字的类型,将候选关键字记录到与类型对应的数据词典中。将中文分词与特定模型相结合的关键字的提取方法,保存并充分利用历史处理过程中的数据。

在一种可能的实现方式中,所述从获取的所述第一用户信息中筛选出与所述必要录入信息的关键字对应的所述必要录入信息之前,还包括:搭建与所述必要录入信息的关键字对应的信息筛选规则库,所述信息识别规则库包括多种关键字对应的多条信息筛选规则;从所述信息筛选规则库中,匹配出与所述必要录入信息的关键字包括的第一关键字对应的信息筛选规则,所述第一关键字对应的信息筛选规则用于从所述第一用户信息中筛选出所述必要录入信息。例如,与电话号码相关的关键字,对应的信息筛选规则可以包括数字字符串的长度,区号的设置以及座机和手机号码的区分等。

在一种可能的实现方式中,从获取的所述第一用户信息中,筛选出与所述必要录入信息中每一个关键字对应且满足所述数量的所述必要录入信息,包括:根据所述第一关键字对应的信息筛选规则从所述第一用户信息中筛选出所述必要录入信息。例如,服务器确定需要录入的信息类型为目标企业的统一社会信用代码,信息数量为1条且需要以数字字符串的形式填入相应的投保单区域;以“统一社会信用代码”作为在所述投保人信息中检索包含数字和“统一社会信用代码”的投保人信息,识别并确认录单需要的必要投保信息。

步骤s204:根据预设的信息处理规则,从所述必要投保信息中提取出符合录入要求的字符信息。

具体地,服务器对于筛选出的必要投保信息还需要进行信息的处理,为了准确直接地能所需要的信息录入到投保单中,需要针对具体的数据对象采用具体的数据处理方式(比如中文分词策略或者数字识别算法等)将所需要的文字和/或数字提取出来,所述字符信息包括文字和/或数字。

在一种可能的实现方式中,所述根据预设的信息处理规则,从所述必要投保信息中提取出符合录入要求的字符信息,包括:按照预设的分词策略对从所述必要投保信息中提取的文字进行分词,获得所述必要投保信息中符合文字录入要求的文字;和/或,按照预设的数字识别算法对从所述必要投保信息中提取的数字进行识别,获得所述必要投保信息中符合数字录入要求的数字。例如,在获取企业的统一社会信用代码的过程中,针对一段混合汉字、字母、数字等与“统一社会信用代码”相关的信息段中,可以结合预设的数字识别算法,从相关信息段中识别并提取出符合数据要求(例如:字符串长度与统一社会信用代码的字符串长度一致)的数字字符串作为统一社会信用代码。而针对文字信息的获取情况,可以对文字信息按照两种策略进行中文分词,第一种是基于词典的匹配,第二种是基于数据统计的匹配。例如,“信用代码”这个词就可以被分为信用和代码两个词,这是基于词典的匹配策略;基于数据的匹配则看哪几个字挨着出现的几率比较高,将相邻出现概率高的字作为组合提取。可选地,针对提取出的文字信息中,像“的”,“地”、“得”这样的组词是毫无意义的,可以去掉,并且可以去掉重复的信息。

步骤s205:根据预设的录入规则,将所述必要录入信息录入至单据。

具体地,服务器根据预设的录入规则将经过处理的必要投保信息录入至单据,所述预设的录入规则可以包括信息的录入顺序,录入信息的格式以及数据类型调整等。

步骤s206:根据所述必要录入信息、所述预设的录入规则和所述单据信息,生成与所述单据信息对应的第一录入模板,并存储至历史模板库中。

具体地,服务器根据所述必要投保信息、所述预设的录入规则和所述投保单信息(包括投保单的信息填写界面),生成与所述投保单信息对应的录入模板,确定录入模板适用的投保单种类,便于录入相同企业的同类保单或者不同投保对象的相似类型投保单。

在一种可能的实现方式中,将获得目标企业的统一社会信用代码填入填写模板中”统一社会信用代码”一项中,保存模板的内容,以便于以后该企业的相似类型投保单录入时使用。可选地,针对模板保存的信息可以设置核对信息的频率,更新信息以保障在录入信息的时效性和准确性。

步骤s207:当识别出所述第一用户的单据信息与所述第一录入模板匹配时,调用所述第一录入模板,录入所述第一用户的必要录入信息。

具体地,在服务器判断出当前需要录入的目标投保人的投保单信息与存储的录入模板有匹配的情况下,服务器调用录入模板,将所述目标投保人的必要投保信息录入至相应的投保单页面。

通过实施本发明实施例,获得投保对象的身份信息(如投保对象的名称)和需要录入信息的投保单类型以及该类型投保单所需的信息内容;根据投保对象的身份信息获取与投保对象相关的信息,从投保对象相关的信息中筛选出该投保单所需的投保对象的投保信息;针对筛选出的投保信息进行信息预处理,将处理过的投保信息录入投保单页面中对应的区域。在本申请中,采用机器录入投保单信息的方式,避免了人工手动录入导致错误信息的录入;即使对字符或者数字信息的处理,也能够降低录入错误的可能性;在需要录入大量复杂的投保信息的情况下,缓减录入过程中的繁琐操作。实施本发明实施例,能够提高录入信息的准确性和效率,简化投保单信息的录入流程,保障了录入信息的准确、可靠。

为了便于理解本发明实施例,以下示例性列举本申请中投保单信息录入方法所应用的场景,可以包括如下两个场景。

场景一,通过录单设备对投保单中的信息进行录入:

请参见图3,图3是本发明实施例提供的一种信息录入方法所应用场景的示意图,该场景中利用前述信息录入方法将投保单的信息录入。该应用场景中包括录单设备显示的单据页面(图3中以录单设备为终端设备如电脑为例),其中,用户可以通过录单设备的外设向录单设备输入数据,两者之间则可以通过蓝牙等无线方式或者数据连接线等有线方式进行连接。如图3所示,单据页面a(即投保单页面)所需的必要投保信息为公司名称、公司注册资金、法人电话、统一社会信用代码、公司地址,本发明实施例对单据页面的具体不作限定。录单设备在获取到投保人的身份标识(即xxxx股份有限公司)和投保单信息(即单据页面a)之后,将必要投保信息录入投保单页面中,例如,通过对“xxx有限公司”进行搜索,完成必要投保信息(即公司名称、公司注册资金、法人电话等)的搜索和筛选之后,自动将信息录入到投保单页面上“公司注册资金”、“法人电话”、“统一社会信用代码”和“公司地址”等内容对应的区域,或者如图虚线框中单据页面b所示,当用户点击相应的信息栏后,在页面显示备选信息供用户自主选择录入,完成相应投保单的信息录入,如单据页面c所示。通过实施本发明实施例,保障了录入信息的准确性和可靠性。

场景二,通过录单设备对增值税发票中的信息进行录入:

请参见图4,图4是本发明实施例提供的另一种信息录入方法所应用场景的示意图,该应用场景中包括录单设备显示的发票信息录入页面,录单设备以及相应外设的描述图3的描述类似,在此不再赘述。如单据页面d所示,录单设备获得增值税普通发票中购买方的名称以及销售方的名称,对发票的其他内容(如纳税人识别号、地址、电话以及开户行的账号等)进行填写,例如,通过销售方的“xxx股份有限公司”进行网络搜索,获得该公司的纳税人识别号、地址、电话和开户行以及对应账号等内容中的一个或者多个内容,根据录入规则填写到增值税普通发票页面的相应区域,如单据页面f所示,在图中以显示的部分信息为例,相应区域中(如纳税人识别号对应信息栏中)填入经过检索和确认的信息;购买方的信息填写操作与销售方的操作方法一致,在此不再赘述;本发明实施例对发票页面的内容以及具体在发票中填写的内容不作限定。

可以理解的是,图3和图4中的应用场景的只是本发明实施例中的几种示例性的实施方式,本发明实施例中的应用场景包括但不仅限于以上应用场景。

上述详细阐述了本发明实施例的方法,下面提供了本发明实施例的相关装置。

请参见图5,图5是本发明实施例提供的一种信息录入装置的结构示意图,信息录入装置50可以包括获取信息单元501、搜索单元502、筛选单元503、录入单元504、关键字提取单元505、规则匹配单元506、信息识别单元507、模板生成单元508和提取单元509。其中,可选的单元包括关键字提取单元505、规则匹配单元506、信息识别单元507、模板生成单元508和提取单元509。

获取信息单元501,用于获取第一用户的身份标识和单据信息,所述第一用户的身份标识包括所述第一用户的名称;

搜索单元502,用于根据所述第一用户的身份标识,从历史数据库中获取与所述身份标识对应的第一用户信息;

筛选单元503,用于根据所述单据信息,从所述第一用户信息中筛选出与所述单据信息对应的必要录入信息;

录入单元504,用于根据预设的录入规则,将所述必要录入信息录入至单据。

在一种可能的实现方式中,所述筛选单元503,还包括:

关键字提取单元505,用于通过预设的关键字提取算法对所述单据信息中的页面填写信息进行关键字提取,整合得到所述页面填写信息中所述必要录入信息的关键字和每一个关键字对应的必要录入信息的数量;

信息识别单元507,用于从获取的所述第一用户信息中,筛选出与所述必要录入信息中每一个关键字所需且满足所述数量的所述必要录入信息。

在一种可能的实现方式中,所述装置还包括规则匹配单元506,用于:在从获取的所述第一用户信息中筛选出与所述必要录入信息的关键字对应的所述必要录入信息之前,搭建与所述必要录入信息的关键字对应的信息筛选规则库,所述信息识别规则库包括多种关键字对应的多条信息筛选规则;从所述信息筛选规则库中,匹配出与所述必要录入信息的关键字包括的第一关键字对应的信息筛选规则,所述第一关键字对应的信息筛选规则用于从所述第一用户信息中筛选出所述必要录入信息。

在一种可能的实现方式中,所述装置还包括:模板生成单元508,用于根据所述必要录入信息、所述预设的录入规则和所述单据信息,生成与所述单据信息对应的第一录入模板,并存储至历史模板库中;当识别出所述第一用户的单据信息与所述第一录入模板匹配时,调用所述第一录入模板,录入所述第一用户的必要录入信息。

在一种可能的实现方式中,所述搜索单元502,具体用于:

根据所述第一用户的身份标识,获取对应的预设筛选条件,所述预设筛选条件包括信息的类型、信息的时效性和同类型信息的数量;

根据所述信息的类型、所述同类型信息的数量和所述第一用户的身份标识,筛选所述身份标识对应的关联信息;

将所述身份标识对应的关联信息中满足时效性的关联信息按照单据关联性的强弱进行排序,其中,在满足时效性的关联信息中所述身份标识出现的频率越高,表示单据关联性越强;

获取排列在预设排序名次之前的满足时效性的关联信息作为所述第一用户信息。

在一种可能的实现方式中,所述装置还包括提取单元509,用于在所述根据预设的录入规则,将所述必要录入信息录入至单据之前,根据预设的信息处理规则,从所述必要录入信息中提取出符合录入要求的字符信息,所述字符信息包括文字和/或数字。

在一种可能的实现方式中,所述提取单元509,具体用于:按照预设的分词策略对从所述必要录入信息中提取的文字进行分词,获得所述必要录入信息中符合文字录入要求的文字;和/或,按照预设的数字识别算法对从所述必要录入信息中提取的数字进行识别,获得所述必要投保信息中符合数字录入要求的数字。

需要说明的是,本申请装置实施例中所描述的信息录入装置50的各功能单元的功能,可参见上述图2所述的方法实施例中信息录入方法的相关描述,此处不再赘述。

本发明实施例提供了一种录单设备60,请参见图6,图6是本发明实施例提供的一种录单设备的结构示意图,如图6所示,信息录入装置50能以图4的结构实现,录单设备60可以包括至少一个存储部件601、至少一个处理部件602、至少一个通信部件603。此外,该设备还可以包括天线、电源等通用部件,在此不再详述。

存储部件601可以包括一个或多个存储单元,每个单元可以包括一个或多个存储器,存储部件可用于存储程序和各种数据,并能在前述设备运行过程中高速、自动地完成程序或数据的存取。可以采用具有两种稳定状态的物理器件来存储信息,所述两种稳定状态分别表示为“0”和“1”。前述存储部件601,可以是只读存储器(read-onlymemory,rom)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(randomaccessmemory,ram)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electricallyerasableprogrammableread-onlymemory,eeprom)、只读光盘(compactdiscread-onlymemory,cd-rom)或其他光盘存储、光碟存储(可以包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过总线与处理器相连接。存储器也可以和处理器集成在一起。

处理部件602,也可以称为处理器,处理单元,处理单板,处理模块、处理装置等。处理部件可以是中央处理器(centralprocessingunit,cpu),网络处理器(networkprocessor,np)或者cpu和np的组合,也可以是微处理器,特定应用集成电路(application-specificintegratedcircuit,asic),或一个或多个用于控制以上方案程序执行的集成电路。

通信部件603,也可以称为收发机,或收发器等,可以是用于与其他设备或通信网络通信,其中可以包括用来进行无线、有线或其他通信方式的单元。

当录单设备60为图1所述服务器时,所述处理部件602用于调用所述存储部件601的数据执行上述图2所述方法的相关描述,如下:

获取第一用户的身份标识和单据信息,所述第一用户的身份标识包括所述第一用户的名称;根据所述第一用户的身份标识,从历史数据库中获取与所述身份标识对应的第一用户信息;根据所述单据信息,从所述第一用户信息中筛选出与所述单据信息对应的必要录入信息;根据预设的录入规则,将所述必要录入信息录入至单据。

本发明实施例还提供了一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时可以包括上述方法实施例中记载的任意一种的部分或全部步骤。其中,而前述的计算机存储介质可包括:u盘、移动硬盘、磁碟、光盘、只读存储器(read-onlymemory,缩写:rom)或者随机存取存储器(randomaccessmemory,缩写:ram)等各种可以存储程序代码的介质。

本发明实施例还提供了一种计算机程序,该计算机程序可以包括指令,当该计算机程序被计算机执行时,使得计算机可以执行包括上述方法实施例中记载的任意一种的部分或全部步骤。

在本申请中,所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。

另外,在本申请各个实施例中的各功能组件可以集成在一个组件也可以是各个组件单独物理存在,也可以是两个或两个以上组件集成在一个组件中。上述集成的组件既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的组件如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

应理解,在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。尽管在此结合各实施例对本申请进行了描述,然而,在实施例所要求保护的本申请过程中,本领域技术人员可理解并实现公开实施例的其他变化。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1