用户信息处理方法、装置、计算机设备及存储介质与流程

文档序号:17080259发布日期:2019-03-09 00:10阅读:107来源:国知局
用户信息处理方法、装置、计算机设备及存储介质与流程

本发明涉及信息处理技术领域,尤其涉及一种用户信息处理方法、装置、计算机设备及存储介质。



背景技术:

对于一些服务型的公司而言,往往需要使用多个不同的业务模块来为用户提供不同的业务服务,例如金融、保险等行业,其提供的贷款业务、保险业务等均分布在不同的业务模块里。这使得用户信息分布在各子业务模块的数据库和表格中,而这种情况下,当需要查找一个用户的尽可能完整的信息时,需要查找不同的业务模块的数据库和表格,才能获得完整的用户信息,操作耗时耗力效率低。



技术实现要素:

本发明的目的是提供一种用户信息处理方法、装置、计算机设备及存储介质,用于解决现有技术中由于查找完整的用户信息时需要查找不同的业务模块的数据库和表格导致用户信息查询效率低的问题。

为实现上述目的,本发明提供一种用户信息处理方法,包括以下步骤:从多个业务模块分别获取对应的基础数据表,所述多个业务模块用于为用户提供多个不同的业务服务的功能模块,所述基础数据表记录有对应业务模块的用户信息;根据获取到的不同基础数据表中相同的字段对所述获取到的基础数据表进行关联,建立关联关系;获取所述用户信息中的可识别号码,其中,每个所述可识别号码对应一个用户;基于所述关联关系对所述获取到的基础数据表进行数据融合,生成以所述可识别号码为主键的宽表。

可选地,根据获取到的不同基础数据表中相同的字段对所述获取到的基础数据表进行关联,建立关联关系包括:对获取到的基础数据表进行字段识别;将识别出的不同基础数据表上的字段进行匹配,匹配出各基础数据表中相同的字段;利用匹配出的相同的字段进行基础数据表之间的关联,建立对应的关联关系。

可选地,还包括:从基础数据表中提取第一信息推测规则所需的字段,作为所述第一信息推测规则的输入信息;利用所述第一信息推测规则对提取到的字段进行推测运算,得到相应的推测信息,记录在所述宽表中。

可选地,所述可识别号码包括以下之一:手机号、身份证号、车牌号、社保编号、公积金账号。

可选地,在所述可识别号码为手机号的情况下,获取所述用户信息中的可识别号码包括:从基础数据表中提取同一用户的多个手机号;分别获取所述多个手机号录入时间;获取录入时间最新的手机号,将其作为生成的宽表的主键,并将其他手机号与录入时间最新的手机号进行关联。

可选地,还包括:获取所述手机号的使用信息;提取所述手机号的网络识别号、地区编码和用户号码;利用第二信息推测规则对所述使用信息、网络识别号、地区编码和用户号码进行推测,得到推测信息,记录在所述宽表中。

可选地,在所述可识别号码为身份证号的情况下,获取所述用户信息中的可识别号码包括:从基础数据表中提取同一用户的多个身份证照片信息;分别获取所述多个身份证照片的录入时间;从录入时间最新的身份证照片上提取身份证信息和身份证号,其中,将提取到的身份证号作为生成的宽表的主键。

可选地,还包括:提取所述身份证号的地址码、生日期码、顺序码和校验码;利用第三信息推测规则对所述地址码、生日期码、顺序码和校验码进行推测,得到推测信息,记录在所述宽表中。

为实现上述目的,本发明还提供一种用户信息处理装置,其包括:第一获取单元,用于从多个业务模块分别获取对应的基础数据表,所述多个业务模块用于为用户提供多个不同的业务服务的功能模块,所述基础数据表记录有对应业务模块的用户信息;关联单元,用于根据获取到的不同基础数据表中相同的字段对所述获取到的基础数据表进行关联,建立关联关系;第二获取单元,用于获取所述用户信息中的可识别号码,其中,每个所述可识别号码对应一个用户;融合单元,用于基于所述关联关系对所述获取到的基础数据表进行数据融合,生成以所述可识别号码为主键的宽表。

可选地,关联单元具体用于对获取到的基础数据表进行字段识别;将识别出的不同基础数据表上的字段进行匹配,匹配出各基础数据表中相同的字段;利用匹配出的相同的字段进行基础数据表之间的关联,建立对应的关联关系。

可选地,还包括:第一推测单元,用于从基础数据表中提取第一信息推测规则所需的字段,作为所述第一信息推测规则的输入信息;利用所述第一信息推测规则对提取到的字段进行推测运算,得到相应的推测信息,记录在所述宽表中。

可选地,所述可识别号码包括以下之一:手机号、身份证号、车牌号、社保编号、公积金账号。

可选地,在所述可识别号码为手机号的情况下,所述第二获取单元具体用于从基础数据表中提取同一用户的多个手机号;分别获取所述多个手机号录入时间;获取录入时间最新的手机号,将其作为生成的宽表的主键,并将其他手机号与录入时间最新的手机号进行关联。

可选地,还包括:第二推测单元,用于获取所述手机号的使用信息;提取所述手机号的网络识别号、地区编码和用户号码;利用第二信息推测规则对所述使用信息、网络识别号、地区编码和用户号码进行推测,得到推测信息,记录在所述宽表中。

可选地,在所述可识别号码为身份证号的情况下,所述第二获取单元具体用于从基础数据表中提取同一用户的多个身份证照片信息;分别获取所述多个身份证照片的录入时间;从录入时间最新的身份证照片上提取身份证信息和身份证号,其中,将提取到的身份证号作为生成的宽表的主键。

可选地,还包括:第三推测单元,用于提取所述身份证号的地址码、生日期码、顺序码和校验码;利用第三信息推测规则对所述地址码、生日期码、顺序码和校验码进行推测,得到推测信息,记录在所述宽表中。

为实现上述目的,本发明还提供一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。

为实现上述目的,本发明还提供计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。

本发明通过获取每个业务模块的基础数据表,将不同的基础数据表进行关联,建立关联关系,以对这些数据进行数据融合,得到以用户的可识别号码作为主键的宽表。这样坐席在进行用户信息查询时只需要通过用户的可识别号码即可对其信息进行查询,方便快捷。

附图说明

图1为本发明实施例用户信息处理方法的流程图;

图2为本发明实施例用户信息处理装置的程序模块示意图;

图3为本发明实施例用户信息处理装置的硬件结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明提供的用户信息处理方法、装置、计算机设备及存储介质,适用于保险业务领域,提供了一种用户信息处理方法,这样坐席在查询用户信息时不需要查找多个业务模块,只需根据用户的可识别号码查询宽表中的数据即可。本发明通过获取每个业务模块的基础数据表,将不同的基础数据表进行关联,建立关联关系,以对这些数据进行数据融合,得到以用户的可识别号码作为主键的宽表。这样坐席在进行用户信息查询时只需要通过用户的可识别号码即可对其信息进行查询,方便快捷。

请参阅图1,本实施例的一种用户信息处理方法中,包括以下步骤:

步骤s101,从多个业务模块分别获取对应的基础数据表。所述多个业务模块用于为用户提供多个不同的业务服务的功能模块,所述基础数据表记录有对应业务模块的用户信息。

由于业务上的差异,不同的业务模块的用户信息存在差异。不同业务模块的用户信息分布在各业务模块的数据库和表格中,获取这些底层的基础数据表,以便于对其上记载的用户信息进行数据融合。

具体地,从多个业务模块分别获取对应的基础数据表可以包括:通过预先设置的数据爬取程序从各业务模块预留的api接口爬取所需要的基础数据表。

步骤s102,根据获取到的不同基础数据表中相同的字段对所述获取到的基础数据表进行关联,建立关联关系。

本实施例中,对获取到的基础数据表进行字段关联包括:对获取到的基础数据表进行字段识别;将识别出的不同基础数据表上的字段进行匹配,匹配出各基础数据表中相同的字段;利用匹配出的相同的字段进行基础数据表之间的关联,建立对应的关联关系。上述中进行识别和匹配的字段主要是指维度字段,例如“用户名”、“籍贯”等维度。由于一些基础信息的字段是相同的,可以对这些相同字段进行标记,形成不同基础数据表中相同字的关联,以便于在进行数据融合时,以上述标记为基础,将基础数据表融合成大宽表。

步骤s103,获取所述用户信息中的可识别号码,其中,每个所述可识别号码对应一个用户。本发明实施例中,可识别号码可以是手机号、身份证号、车牌号、社保编号或者公积金账号中的任一个。

步骤s104,基于所述关联关系对所述获取到的基础数据表进行数据融合,生成以所述可识别号码为主键的宽表。

基于所述关联关系对所述获取到的基础数据表进行数据融合可以是先进行基础数据表之间的两两融合,以逐步融合成一张大宽表;对同一维度的用户特征信息进行合并去重。例如,对于用户姓名、年龄等共同的特征信息进行合并,以避免融合后的数据表出现大量数据冗余。对于同一个用户,经过对基础数据表进行数据融合后,生成以其可识别号码为主键的宽表。由于生成的宽表其信息饱和度较高,通过用户的可识别号码就能够检索到宽表中全面的用户信息,无需再每个业务模块的数据库中进行查找,极大地提高了用户信息的检索效率。

作为一种可选的实施方式,本发明实施例还可以通过提取基础数据表中的字段和/或可识别号码的相关信息,设置推测型字段,通过预先设置的第一信息推测规则进行字段之间的交叉推理,得出相应的推测信息。具体地,方法还包括:

s11,从基础数据表中提取第一信息推测规则所需的字段,作为所述第一信息推测规则的输入信息。由于信息推测规则需要有相应的信息输入,因此,所需提取的字段是基于信息推测规则来提取的,这样才能保证推测信息的有效性。

s12,利用所述信息推测规则对提取到的字段进行推测运算,得到相应的推测信息,记录在宽表中。该推测信息可以作为宽表的一项数据,供业务人员进行查询。

需要说明的是,本发明实施例中,第一信息推测规则可以是预先通过机器学习训练得到的规则模型,得到的推测信息则是一种结论性的信息,挖掘出基础数据表中体现出的更深层次的信息。后面所述的第二信息推测规则和第三信息推测规则同理,将不再赘述。

例如,从基础数据表中提取得到用户的籍贯和年龄,然后提取用户的手机号,输入到第一信息推测规则,如果用户的籍贯是“湖北武汉”,年龄是20岁,手机号的号段为北京手机号,则可以推测出该用户为在北京上大学的学生。

由于在各业务模块记录用户信息时,手机号为比较常规的消息记录,并且手机号的更换或者同一用户存在多个手机号的情况比较常见。在上述可识别号码为手机号的情况下,本实施例的获取用户信息中的可识别号码可以包括:

s21,从基础数据表中提取同一用户的多个手机号。

在手机号不同的情况下,主要通过用户的其他维度信息来判断是否是同一用户,例如,身份证号、银行卡号等等。当这些具有唯一标识性的信息仍无法判断的时候,则可以通过其他信息的相同覆盖度来做判断,例如,联系地址、住址、家庭成员等信息,利用这些信息总体的相同程度来做判断,当相同的信息占到一定比例,则认为是同一用户。例如,作为判断的10个基础信息中,有7个基础信息完全相同,则认为是同一用户。

s22,分别获取所述多个手机号录入时间。

s23,获取录入时间最新的手机号,将其作为生成的宽表的主键,并将其他手机号与录入时间最新的手机号进行关联,以便于通过其他手机号也能够查找到宽表上相同的信息。

为了可以建立更全面立体的用户画像,完善用户信息,该用户信息处理方法还可以包括:

s31,获取所述手机号的使用信息。其中,使用信息可以是该手机号的在网时长、套餐等基本情况信息。

s32,提取所述手机号的网络识别号、地区编码和用户号码。手机号分为三段,各段有不同的编码方向:前3位—网络识别号;第4-7位—地区编码;第8-11位—用户号码。

s33,利用第二信息推测规则对所述使用信息、网络识别号、地区编码和用户号码进行推测,得到推测信息,记录在宽表中。其中,信息推测规则可以是根据大数据分析训练得到的,比如判断手机号前三位是否为“186”且“在网时长”大于等于8年,可推测出是否是“首批苹果用户”的推测信息。通过推测出的这些结论性信息,可以供业务人员进行参考。

上述步骤s31-s33仅仅是以用户手机号相关信息作出的推测信息的信息,这样,及时没有后台数据,也能够通过手机号本身解析出用户的相关行为特征信息。

由于在各业务模块记录用户信息时,身份证号为比较常规的消息记录,并且记录是通常会以身份证照片作为其完整的信息记录。但是由于身份证的更换会导致其上的住址、签发单位、有效期等信息发生变化,因此,在可识别号码为身份证号的情况下,本发明实施例的获取所述用户信息中的可识别号码可以包括:

s41,从基础数据表中提取同一用户的多个身份证照片信息。

由于身份证上的身份证号唯一,因此,可以直接通过身份证号确定是否是同一用户。

s42,分别获取所述多个身份证照片的录入时间。

s43,从录入时间最新的身份证照片上提取身份证信息和身份证号,其中,身份证号作为生成的宽表的主键,其他身份证信息作为有效信息覆盖宽表的其他数据。

为了可以建立更全面立体的用户画像,完善用户信息,该用户信息处理方法还可以包括:

s51,提取所述身份证号的地址码、生日期码、顺序码和校验码。公民身份号码是特征组合码,由十七位数字本体码和一位数字校验码组成。排列顺序从左至右依次为:六位数字地址码,八位数字出生日期码,三位数字顺序码和一位数字校验码。

s52,利用第三信息推测规则对所述地址码、生日期码、顺序码和校验码进行推测,得到推测结论,记录在宽表中。其中,信息推测规则可以是根据大数据分析训练得到的,例如判断身份证号码前四位为“3303””4405”或“4451”或“4452”或“3503”且判断“非土著”为是且“年龄”>28。通过推测出的这些结论性信息,可以供业务人员进行参考。

上述步骤仅仅是以用户身份证号相关信息作出的推测结论的信息,这样,即使没有后台数据,也能够通过身份证号本身解析出用户的相关行为特征信息。

请继续参阅图2,示出了一种用户信息处理装置,在本实施例中,用户信息处理装置10可以包括或被分割成一个或多个程序模块,一个或者多个程序模块被存储于存储介质中,并由一个或多个处理器所执行,以完成本发明,并可实现上述用户信息处理方法。本发明所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,比程序本身更适合于描述用户信息处理装置10在存储介质中的执行过程。

以下描述将具体介绍本实施例各程序模块的功能:

第一获取单元11,用于从多个业务模块分别获取对应的基础数据表,多个业务模块用于为用户提供多个不同的业务服务的功能模块,基础数据表记录有对应业务模块的用户信息。

关联单元12,用于根据获取到的不同基础数据表中相同的字段对获取到的基础数据表进行关联,建立关联关系。

第二获取单元13,用于获取用户信息中的可识别号码,其中,每个可识别号码对应一个用户。

融合单元14,用于基于关联关系对获取到的基础数据表进行数据融合,生成以可识别号码为主键的宽表。

本发明通过获取每个业务模块的基础数据表,将不同的基础数据表进行关联,建立关联关系,以对这些数据进行数据融合,得到以用户的可识别号码作为主键的宽表。这样坐席在进行用户信息查询时只需要通过用户的可识别号码即可对其信息进行查询,方便快捷。

可选地,关联单元具体用于对获取到的基础数据表进行字段识别;将识别出的不同基础数据表上的字段进行匹配,匹配出各基础数据表中相同的字段;利用匹配出的相同的字段进行基础数据表之间的关联,建立对应的关联关系。

可选地,还包括:第一推测单元,用于从基础数据表中提取第一信息推测规则所需的字段,作为第一信息推测规则的输入信息;利用第一信息推测规则对提取到的字段进行推测运算,得到相应的推测信息,记录在宽表中。

可选地,可识别号码包括以下之一:手机号、身份证号、车牌号、社保编号、公积金账号。

可选地,在可识别号码为手机号的情况下,第二获取单元具体用于从基础数据表中提取同一用户的多个手机号;分别获取多个手机号录入时间;获取录入时间最新的手机号,将其作为生成的宽表的主键,并将其他手机号与录入时间最新的手机号进行关联。

可选地,还包括:第二推测单元,用于获取手机号的使用信息;提取手机号的网络识别号、地区编码和用户号码;利用第二信息推测规则对使用信息、网络识别号、地区编码和用户号码进行推测,得到推测信息,记录在宽表中。

可选地,在可识别号码为身份证号的情况下,第二获取单元具体用于从基础数据表中提取同一用户的多个身份证照片信息;分别获取多个身份证照片的录入时间;从录入时间最新的身份证照片上提取身份证信息和身份证号,其中,将提取到的身份证号作为生成的宽表的主键。

可选地,还包括:第三推测单元,用于提取身份证号的地址码、生日期码、顺序码和校验码;利用第三信息推测规则对地址码、生日期码、顺序码和校验码进行推测,得到推测信息,记录在宽表中。

关于各单元的具体描述,可以参见上述方法实施例,这里不再赘述。

本实施例还提供一种计算机设备,如可以执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。本实施例的计算机设备20至少包括但不限于:可通过系统总线相互通信连接的存储器21、处理器22,如图3所示。需要指出的是,图3仅示出了具有组件21-22的计算机设备20,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。

本实施例中,存储器21包括:可读存储介质,具体可以包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器21可以是计算机设备20的内部存储单元,例如该计算机设备20的硬盘或内存。在另一些实施例中,存储器21也可以是计算机设备20的外部存储设备,例如该计算机设备20上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。当然,存储器21还可以既包括计算机设备20的内部存储单元也包括其外部存储设备。本实施例中,存储器21通常用于存储安装于计算机设备20的操作系统和各类应用软件,例如实施例一的用户信息处理装置10的程序代码等。此外,存储器21还可以用于暂时地存储已经输出或者将要输出的各类数据。

处理器22在一些实施例中可以是中央处理器(centralprocessingunit,cpu)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器22通常用于控制计算机设备20的总体操作。本实施例中,处理器22用于运行存储器21中存储的程序代码或者处理数据,例如运行用户信息处理装置10,以实现实施例一的用户信息处理方法。

本实施例还提供一种计算机可读存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘、服务器、app应用商城等等,其上存储有计算机程序,程序被处理器执行时实现相应功能。本实施例的计算机可读存储介质用于存储用户信息处理装置10,被处理器执行时实现实施例一的用户信息处理方法。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1