本技术涉及数据处理,特别是涉及一种信息的识别方法、装置、计算机设备和存储介质。
背景技术:
1、随着信息技术的发展,服务机构(例如,航空公司)对用户身份信息(例如,电话号码、账号和身份证号等)的精准识别逐渐成为提高服务效率和信息管理质量的基础。
2、然而,由于服务机构的业务系统较多等原因,存在多个用户对应一个身份信息或者多个身份信息同时对应一个用户的情况,这会导致在识别用户的身份信息时出现识别错误或识别效率低的问题,从而降低服务机构的服务效率和服务质量。目前,对用户的身份信息进行识别的方法主要是:基于服务机构业务人员的业务经验,从海量的信息数据中查找与用户对应的身份信息。
3、然而,上述识别方法存在准确度低的问题。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能够提高信息识别准确度的信息的识别方法、装置、计算机设备和存储介质。
2、第一方面,本技术提供了一种信息的识别方法,包括:
3、确定与待识别用户对应的多个身份信息;
4、将待识别用户的标识和各身份信息输入至预测模型中进行匹配度预测,得到待识别用户与各身份信息之间的匹配度;
5、将匹配度最高的身份信息作为待识别用户的目标身份信息。
6、在其中一个实施例中,上述方法还包括:
7、根据待识别用户和多个身份信息,获取待识别用户对应的第一特征、各身份信息对应的第二特征、以及待识别用户和各身份信息之间关系的第三特征;
8、对第一特征、各第二特征和各第三特征进行融合,得到多个融合特征;
9、上述将待识别用户的标识和各身份信息输入至预测模型中进行匹配度预测,得到待识别用户与各身份信息之间的匹配度,包括:
10、将各融合特征输入至预测模型中进行匹配度预测,得到待识别用户与各身份信息之间的匹配度。
11、在其中一个实施例中,上述方法还包括:
12、对融合特征进行预处理,得到预处理后的融合特征;预处理包括特征分布统计处理、异常数据清洗处理、空值填充处理、标签编码处理、特征交叉处理和特征组合处理;
13、上述将各融合特征输入至预测模型中进行匹配度预测,得到待识别用户与各身份信息之间的匹配度,包括:
14、将预处理后的融合特征输入至预测模型中进行匹配度预测,得到待识别用户与各身份信息之间的匹配度。
15、在其中一个实施例中,上述方法还包括:
16、对多个身份信息进行加密处理,得到加密后的多个身份信息;
17、上述将待识别用户的标识和各身份信息输入至预测模型中进行匹配度预测,得到待识别用户与各身份信息之间的匹配度,包括:
18、将加密后的多个身份信息和待识别用户的标识输入至预测模型中进行匹配度预测,得到待识别用户与各身份信息之间的匹配度。
19、在其中一个实施例中,上述方法还包括:
20、获取样本数据集;样本数据集包括第一样本数据子集和第二样本数据子集,第一样本数据子集包括多个第一样本用户的标识、与各第一样本用户的标识对应的多个第一样本身份信息,第二样本数据子集包括多个第二样本身份信息、与各第二样本身份信息对应的多个第二样本用户的标识;
21、对样本数据集进行标注,得到标注样本数据集;
22、将标注样本数据集输入至初始预测模型中进行训练,得到预测模型。
23、在其中一个实施例中,对样本数据集进行标注,得到标注样本数据集,包括:
24、根据已明确对应关系的用户的标识和身份信息,对第一样本数据子集和第二样本数据子集进行标注;
25、将标注后的第一样本数据子集和标注后的第二样本数据子集进行合并去重处理,得到标注样本数据集。
26、在其中一个实施例中,上述方法还包括:
27、对样本数据集中的数据进行特征提取,得到样本特征数据集;样本特征数据集包括第一样本特征数据集、第二样本特征数据集和第三样本特征数据集,第一样本特征数据集包括多个第一样本用户的特征、与各第一样本用户的标识对应的多个第一样本身份信息的特征,第二样本特征数据集包括多个第二样本身份信息的特征、与各第二样本身份信息对应的多个第二样本用户的特征;第三样本特征数据集包括各第三样本用户和对应的身份信息之间的相关特征;
28、上述对样本数据集进行标注,得到标注样本数据集,包括:
29、对样本特征数据集进行标注,得到标注样本数据集。
30、第二方面,本技术还提供了一种信息的识别装置,包括:
31、确定模块,用于确定与待识别用户对应的多个身份信息;
32、预测模块,用于将待识别用户的标识和各身份信息输入至预测模型中进行匹配度预测,得到待识别用户与各身份信息之间的匹配度;
33、设置模块,用于将匹配度最高的身份信息设置为待识别用户的目标身份信息。
34、第三方面,本技术还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
35、确定与待识别用户对应的多个身份信息;
36、将待识别用户的标识和各身份信息输入至预测模型中进行匹配度预测,得到待识别用户与各身份信息之间的匹配度;
37、将匹配度最高的身份信息作为待识别用户的目标身份信息。
38、第四方面,本技术还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
39、确定与待识别用户对应的多个身份信息;
40、将待识别用户的标识和各身份信息输入至预测模型中进行匹配度预测,得到待识别用户与各身份信息之间的匹配度;
41、将匹配度最高的身份信息作为待识别用户的目标身份信息。
42、第五方面,本技术还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
43、确定与待识别用户对应的多个身份信息;
44、将待识别用户的标识和各身份信息输入至预测模型中进行匹配度预测,得到待识别用户与各身份信息之间的匹配度;
45、将匹配度最高的身份信息作为待识别用户的目标身份信息。
46、上述信息的识别方法、装置、计算机设备和存储介质,先确定与待识别用户对应的多个身份信息,再将待识别用户的标识和各身份信息输入至预测模型中进行匹配度预测,得到待识别用户与各身份信息之间的匹配度,然后将匹配度最高的身份信息作为待识别用户的目标身份信息。上述方法基于预测模型预测待识别用户和各身份信息之间的匹配度,再基于待识别用户和各身份信息之间的匹配度确定待识别用户对应的目标身份信息,与现有的通过人工经验确定待识别用户和身份信息的确定方法相比,上述方法将待识别用户的标识和各身份信息输入至训练好的预测模型中进行预测,得到待识别用户的目标身份信息,这极大提高了为待识别用户确定对应的身份信息的准确度;另外,本方案仅需将待识别用户的标识和各身份信息输入至训练好的预测模型即可得到待识别用户的目标身份信息,这也进一步提高了为待识别用户确定对应的身份信息的效率。