本申请涉及信息,尤其涉及一种信息填充方法、装置及电子设备。
背景技术:
1、在用户办理贷款等业务的过程中,办理人员需要对用户的身份信息,比如用户身份证、、户口本、房产证、土地产权证、车辆产权证等证件信息进行录入。传统录入过程中需要办理人员手动对证件信息进行录入。例如,身份证需要办理人员手动录入姓名、性别、身份证号码、户籍、住址、出生年月等信息;房产证需要录入权利人、不动产单元号等信息。当用户办理的业务,证件类型多,且证件信息繁杂时,手工录入费时费力,办理效率低。此外,手工录入出错率高。
技术实现思路
1、本申请实施例提供了一种信息填充方法、装置及电子设备,用于提高办理效率,减少出错率。
2、第一方面,本申请实施例提供了一种信息填充方法,所述方法包括:
3、获取用户的待识别图像,所述待识别图像包括所述用户的文字身份信息;
4、识别所述待识别图像中的用户文字身份信息;
5、将所述用户文字身份信息进行提取处理,得到n个特征关键词,所述n为>1的整数;
6、将所述n个特征关键词依照概念确定所述文本类别,所述文本类型用于指示所述待识别图像的类别;
7、确定所述n个特征关键词的概念对应的概率,以根据所述概率在所述文本类别对应的输入框中填充。
8、可选地,所述将所述用户文字身份信息进行提取处理,得到n个特征关键词,包括:
9、将所述用户文字身份信息进行预处理,得到m个词组;所述m为大于或者等于n的整数;
10、从所述m个词组中提取支持分类的所述n特征关键词。
11、可选地,所述方法还包括:
12、为所述m个词组中每个词组添加概念;
13、对所述n个特征关键词进行概念排除歧义,得到所述n个特征关键词对应的目标概念,一个特征关键词对应一个目标概念;
14、所述将所述n个特征关键词依照概念确定所述文本类别,包括:
15、将所述n个特征关键词依照所述目标概念确定所述文本类别。
16、可选地,所述对所述n个特征关键词进行概念排除歧义,包括:
17、确定第i个特征关键词是否在概念词典中;所述概念词典用于存储多个关键词对应的概念;所述i为大于或者等于1,且小于或者等于n的整数;
18、若所述第i个特征关键词在所述概念词典中,且对应一个概念,则将所述第i个特征关键词标注的概念作为目标概念;
19、若所述第i个特征关键词在所述概念词典中,且对应至少两个概念,计算标注的概念在所述概念词典中出现的频率,将所述频率最高的概念作为所述第i个特征关键词的目标概念。
20、可选地,所述方法还包括:
21、若所述第i个特征关键词不在所述概念词典中,确定所述第i个特征关键词在专有名词词典中出现的概念,所述专有名词词典用于存储名字信息;
22、若所述第i个特征关键词在所述专有名词词典中出现一个概念,将所述第i个特征关键词标注的概念作为目标概念;
23、若所述第i个特征关键词在所述专有名词词典中出现多个概念,计算标注的概念在所述专有名词词典中出现的频率,将所述频率最高的概念作为所述第i个特征关键词的目标概念。
24、可选地,所述将所述n个特征关键词依照概念确定所述文本类别,包括:
25、通过评价函数对所述n个特征关键词进行评估,得到n个评估分,一个特征关键词对应一个评估分;所述评价函数为:
26、
27、fi(d)表示概念ci在文档d中出现的频率,n表示所有特征的数目,为评估分;
28、从所述n个评估分钟筛选出评估分在前t位的评估分,将所述前t位评估分对应的特征关键词作为目标特征关键词;
29、将所述目标特征关键词依照概念确定所述文本类别。
30、可选地,所述根据所述概率在所述文本类别对应的输入框中填充,包括:
31、将所述概率最高的特征关键词填充至所述文本类别对应的输入框中;
32、或者在所述文本类别对应的输入框的下拉框中,依照概率将所述n个特征关键词从高到低排序;响应于用户的触发操作,将所述触发操作对应的特征关键词自动填充至所述文本类别对应的输入框中。
33、可选地,所述识别所述待识别图像中的用户文字身份信息,包括:
34、利用光学文字识别技术ocr识别所述待识别图像中的用户文字身份信息。
35、第二方面,本申请实施例提供了一种信息填充装置,所述装置包括:
36、获取单元,用于获取用户的待识别图像,所述待识别图像包括所述用户的文字身份信息;
37、识别单元,用于识别所述待识别图像中的用户文字身份信息;
38、提取单元,用于将所述用户文字身份信息进行提取处理,得到n个特征关键词,所述n为>1的整数;
39、确定单元,用于将所述n个特征关键词依照概念确定所述文本类别,所述文本类型用于指示所述待识别图像的类别;
40、填充单元,用于确定所述n个特征关键词的概念对应的概率,以根据所述概率在所述文本类别对应的输入框中填充。
41、第三方面,本申请实施例提供了一种电子设备,包括存储器和处理器;
42、所述存储器与所述处理器耦合;
43、所述存储器存储有程序指令,当所述程序指令由所述处理器执行时,使得所述电子设备执行如第一方面任一项所述的方法。
44、有益效果:
45、本申请实施例提供了一种信息填充方法、装置及电子设备。通过识别待视图向的用户文字身份信息,将用户文字身份信息进行提取处理,得到n个特征关键词,将n个特征关键词依照概念确定文本类别。确定n个特征关键词对应的概念,根据概念在文本类别对应的输入框中填充。如此,通过识别图像文字身份信息,提取特征关键词依照概念分类,实现内容自动填充。相对于手动录入的方式,当输入选项较多或者识别文字较多时,输入效率高,且能够较少录入错误。此外,相对于单一文字填充方式,可以避免填充项错误或者识别顺序错误,办理人员无法选择填充的问题,容错性较高。
1.一种信息填充方法,其特征在于,所述方法包括:
2.根据权利要求1所述方法,其特征在于,所述将所述用户文字身份信息进行提取处理,得到n个特征关键词,包括:
3.根据权利要求2所述方法,其特征在于,所述方法还包括:
4.根据权利要求3所述方法,其特征在于,所述对所述n个特征关键词进行概念排除歧义,包括:
5.根据权利要求4所述方法,其特征在于,所述方法还包括:
6.根据权利要求1所述方法,其特征在于,所述将所述n个特征关键词依照概念确定所述文本类别,包括:
7.根据权利要求1所述方法,其特征在于,所述根据所述概率在所述文本类别对应的输入框中填充,包括:
8.根据权利要求1-7任一项所述方法,其特征在于,所述识别所述待识别图像中的用户文字身份信息,包括:
9.一种信息填充装置,其特征在于,所述装置包括:
10.一种电子设备,包括存储器和处理器;