一种用户身份识别方法及系统的制作方法

文档序号:7810169阅读:167来源:国知局
一种用户身份识别方法及系统的制作方法
【专利摘要】本发明提出一种用户身份识别方法和系统,通过用户注册形成的基本信息,包括用户ID,用户名、Email、电话、计算机IP等,以及对网站用户行为数据进行提取,综合行为数据中涉及的用户ID、用户名、Email、电话号码、Cookie、计算机IP等信息,建立两者的用户信息关联关系并赋予唯一标识身份,能够对目前B2B网站中的用户做统一身份识别,建立身份特征关系,分辨新老用户,有效的跟踪用户行为,从而能够针对用户建立一系列应用,提高用户体验。
【专利说明】一种用户身份识别方法及系统

【技术领域】
[0001] 本发明涉及电子商务B2B领域,特别是一种用户身份识别方法及系统。

【背景技术】
[0002] 作为电子商务网站,为了更好的把握用户需求,提高用户体验,用户分析是网站分 析中一个重要组成部分。用户分析,需要了解网站的用户规模,跟踪网站的用户行为,发现 用户的行为特征、兴趣爱好及习惯等。通过用户分析,可以让网站清楚的了解用户的来源、 去向及用户的信息,分析用户对网站的满意度,找出网站、推广渠道等方面存在的问题,有 助于提高网站用户转化率;通过用户访问网站行为分析,对网站的用户的访问路径进行优 化,对各个页面的用户停留及退出情况进行分析,找出各页面存在的问题,提高页面及网站 的合理布局;通过用户行为分析,了解用户的行为习惯及兴趣偏好,为用户提供个性化定制 服务,有助于提高网站的用户忠诚度及用户粘性,留住网站用户;通过用户身份识别,为用 户提供个性化服务,可以帮助用户更快更好的找到优质满意的产品,为用户节约效率,提高 满意度。而在这之前必须首先能够识别每个用户,分辨他们是新用户还是老用户,分辨他们 是谁(用户名,邮箱,联系电话等)。
[0003] 作为B2B网站,针对用户提供的最主要服务:查询产品、查询商家、以及询盘并不 要求用户强制登录、注册等等。很多用户以游客身份接受网站提供的服务,使得用户识别显 得较为困难。要想能够准确的跟踪用户的行为,这就要求对任何一个来到网站的用户进行 身份识别及定位。
[0004] 在专利"基于特定信息的用户身份识别方法和系统"(申请号:CN 201210019678. 5)中,其提出的方法:通过将用户访问互联网情况的特定信息映射为用户 临时唯一标识,并从通讯网络侧获取该用户临时唯一标识和用户身份信息,基于用户临时 唯一标识将特定信息和用户身份信息关联起来。但此专利提出的方法主要根据"计算机IP 地址"或"计算机IP地址+端口号"作为用户临时唯一标识,这种方法数据来源较单一,受 到计算机IP变动影响大,唯一标识不够明确。本专利采用用户ID、用户名、邮箱、电话号码、 Cookie、计算机IP等确立用户身份ID,并建立关联关系,提高了身份识别的准确性。


【发明内容】

[0005] 针对现有技术中存在的不足,本发明实施例提供一种用户身份识别方法及系统, 解决目前电子商务B2B网站中为用户做统一身份识别的问题。
[0006] 本发明的技术方案如下,一种用户身份识别方法,包括:
[0007] 步骤一:从电子商务网站平台数据源系统中采集基础数据,对采集的基础数据进 行分类,形成两类数据,并存储于后台服务器中。这两类数据包括:
[0008] (1)有关用户注册形成的用户基本信息,包括用户ID、用户名、Email、电话、计算 机IP等;
[0009] (2)用户注册、登录、询盘、访问、搜索等网站行为的数据。
[0010] 步骤二:基于用户的注册、登录、询盘、访问、搜索等网站行为,提取最近1年时间 段内网站行为的记录,每种网站行为记录中包含了有关用户的身份信息,包括用户ID、用户 名、Email、电话号码、Cookie、计算机IP。结合用户注册的用户基本信息:用户ID,用户名、 Email、电话号码、计算机IP信息,将这些信息汇总到一起,并去掉完全重复的记录。
[0011] 其中,因每种行为记录的相关用户身份信息不完整,因此有的值可能为空;询盘分 用户登录发询盘情况和用户未登录发询盘情况,两种情况记录的用户信息不同。如下表所 /Jn 〇 [0012]

【权利要求】
1. 一种用户身份识别方法,包括: 步骤一:从电子商务网站平台数据源系统中采集基础数据,对采集的基础数据进行分 类,形成两类数据,并存储于后台服务器中; 步骤二:基于用户的注册、登录、询盘、访问、搜索网站行为,提取最近时间段内网站行 为的记录,每种网站行为记录中包含了有关用户的身份信息,包括用户ID、用户名、Email、 电话号码、Cookie、计算机IP ;结合用户注册的用户基本信息:用户ID,用户名、Email、电话 号码、计算机IP信息,将这些信息汇总到一起,并去掉完全重复的记录; 步骤三:根据用户ID、用户名、Email、电话号码、Cookie、计算机IP之间的关系,通过预 先设定的对应方法,对用户身份信息进行去重、身份归一化,最终得到用户身份关联关系以 及对应的身份信息,并对用户赋予唯一身份ID ; 步骤四:对身份ID关系库定时进行更新,对于网站用户新发生的行为,其涉及的用户 身份信息和新注册用户的基本信息,与身份ID关系库的信息进行比较归并,并且补充更新 身份ID关系库; 步骤五:身份ID及相关身份特征关系生成后,将身份特征关系应用于后续的用户行为 中;根据用户的每一条历史行为记录中的身份信息关联身份识别结果得到身份ID,即每个 用户都有网站的唯一身份ID,用于分析用户行为应用。
2. 根据权利要求1所述的方法,其特征在于:步骤一中的两类数据包括: (1) 有关用户注册形成的用户基本信息,包括用户ID、用户名、Email、电话、计算机IP; (2) 用户注册、登录、询盘、访问、搜索网站行为的数据。
3. 根据权利要求1所述的方法,其特征在于,步骤三中对应方法的子步骤具体为: 步骤3-1、首先对"登录"、"登录发询盘"的这两种网站行为的记录,以及"注册信息" 中的用户基本信息,进行身份信息的关联合并,找出同一用户ID对应的所有的用户名、 Email、电话号码、Cookie、计算机IP ;通过关联处理后,形成身份ID关系库; 步骤3-2、提取"未登录发询盘"网站行为记录的用户身份信息,与身份ID关系库做比 对,进行身份合并及更新; 步骤3-3、提取"访问"、"搜索"网站行为记录的用户身份信息,与身份ID关系库做比 对,进行身份合并及更新。
4. 根据权利要求3所述的方法,其特征在于: 步骤3-2具体为: 首先对Email进行比对,"未登录发询盘"网站行为记录的用户身份信息中包含有 Email信息,与身份ID关系库中的Email比对,若相同,将该网站行为记录的用户身份信息 合并到身份ID关系库的对应身份ID中;其他信息的电话号码、Cookie、计算机IP,在与该 身份ID的信息合并过程中先进行对应信息的比较,若两者对应信息相同,则不更新身份ID 关系库的相应身份ID信息,若有不同,则把该网站行为记录的对应用户身份信息增加到身 份ID关系库的对应身份ID中; 若Email不同,根据"未登录发询盘"网站行为记录的用户身份信息中包含的电话号 码,与身份ID关系库中的电话号码比对,若相同,将该网站行为记录的用户身份信息合并 到身份ID关系库的对应身份ID中,其他信息的Email、C〇〇kie、计算机IP,在与该身份ID的 信息合并过程中先进行对应信息的比较,若两者对应信息相同,则不更新身份ID关系库的 相应身份ID信息,若有不同,则把该网站行为记录的对应用户身份信息增加到身份ID关系 库的对应身份ID中;如果出现网站行为记录中的电话号码与多个身份ID的电话号码相同, 则将该网站行为记录中用户身份信息归并到身份ID关系库中最近发生行为的用户身份ID 中; 若Email、电话号码都不同,根据"未登录发询盘"网站行为记录的用户身份信息中包 含的Cookie,与身份ID关系库中的Cookie比对,若相同,将该网站行为记录的用户身份信 息合并到身份ID关系库的对应身份ID中,其他信息的Email、电话号码、计算机IP,在与该 身份ID的信息合并过程中先进行对应信息的比较,若两者对应信息相同,则不更新身份ID 关系库的相应身份ID信息,若有不同,则把该网站行为记录的对应用户身份信息增加到身 份ID关系库的对应身份ID中;其中,如果出现网站行为记录中的Cookie与多个身份ID的 Cookie相同,则将该网站行为记录中用户身份信息归并到身份ID关系库中最近发生行为 的用户身份ID中; 对于剩余的网站行为记录的用户身份信息,赋予新的身份ID,加入到身份ID关系库 中; 步骤3-3具体为: 根据"访问"、"搜索"网站行为记录的用户身份信息中包含的Cookie,与身份ID关系库 中的Cookie比对,若相同,将该网站行为记录的用户身份信息合并到身份ID关系库的对应 身份ID中,其他信息的Email、电话号码、计算机IP,在与该身份ID的信息合并过程中先进 行对应信息的比较,若两者对应信息相同,则不更新身份ID关系库的相应身份ID信息,若 有不同,则把该网站行为记录的对应用户身份信息增加到身份ID关系库的对应身份ID中; 其中,如果出现网站行为记录中的Cookie与多个身份ID的Cookie相同,则将该网站行为 记录中用户身份信息归并到身份ID关系库中最近发生行为的用户身份ID中; 若Cookie不同,对于剩下的、还没有归并到身份ID关系库的"访问"、"搜索"网站行为 记录,提取其所包含的用户身份信息的Email、电话号码、Cookie、计算机IP,然后针对不同 的网站行为记录,进行这些身份信息的比对,只要网站行为记录间有身份信息相同,则确定 他们是同一个用户,赋予同一个新的身份ID,并在身份ID关系库中增加这个新的身份ID ; 对于最后剩余的网站行为记录的用户身份信息,赋予新的身份ID,加入到身份ID关系 库中。
5. 根据权利要求1所述的方法,其特征在于,步骤四的具体子步骤为: 步骤4-1、对新时间段产生的"登录"、"登录发询盘"及"注册信息"的这三种网站行为 的记录,提取其中的用户身份信息,与身份ID关系库的信息进行比较,并把网站行为记录 中的身份信息补充更新到身份ID关系库的身份ID中; 步骤4-2、提取新时间段产生的"未登录发询盘"网站行为记录中的用户身份信息,与身 份ID关系库的信息进行比较,并把网站行为记录中的身份信息补充更新到身份ID关系库 的身份ID中; 步骤4-3、提取新时间段产生的"访问"、"搜索"网站行为记录中的用户身份信息,与身 份ID关系库的信息进行比较,并把网站行为记录中的身份信息补充更新到身份ID关系库 的身份ID中。
6. 根据权利要求5所述的方法,其特征在于: 步骤4-1具体为: 首先与身份ID关系库中存在"用户ID"的身份ID信息进行比较,若用户ID相同,则将 网站行为记录中的用户身份信息的其他数据,与匹配的身份ID对应的信息进行合并去重, 补充到身份ID关系库中; 若用户ID不同,则与身份ID关系库中无"用户ID"的身份ID信息进行比较,比较的范 围是两者的Email、电话号码、Cookie,如果两者在其中有任何一项有相同,则确定属于同一 个人,将身份ID关系库的对应身份ID赋予网站行为记录的用户,网站行为记录中的其他身 份信息相应补充到身份ID关系库的身份ID中; 最后,若比较无任何相同的身份信息,则生成新的身份ID增加到身份ID关系库中; 步骤4-2具体为: 首先对Email进行比对,"未登录发询盘"网站行为记录的用户身份信息中包含有 Email信息,与身份ID关系库中的Email比对,若相同,将该网站行为记录的用户身份信息 合并到身份ID关系库的对应身份ID中,其他信息的电话号码、Cookie、计算机IP,在与该 身份ID的信息合并过程中先进行对应信息的比较,若两者对应信息相同,则不更新身份ID 关系库的相应身份ID信息,若有不同,则把该网站行为记录的对应用户身份信息增加到身 份ID关系库的对应身份ID中; 若Email不同,根据"未登录发询盘"网站行为记录的用户身份信息中包含的电话号 码,与身份ID关系库中的电话号码比对,若相同,将该网站行为记录的用户身份信息合并 到身份ID关系库的对应身份ID中,其他信息的Email、C〇〇kie、计算机IP,在与该身份ID的 信息合并过程中先进行对应信息的比较,若两者对应信息相同,则不更新身份ID关系库的 相应身份ID信息,若有不同,则把该网站行为记录的对应用户身份信息增加到身份ID关系 库的对应身份ID中;如果出现网站行为记录中的电话号码与多个身份ID的电话号码相同, 则将该网站行为记录中用户身份信息归并到身份ID关系库中最近发生行为的用户身份ID 中; 若Email、电话号码都不同,根据"未登录发询盘"网站行为记录的用户身份信息中包 含的Cookie,与身份ID关系库中的Cookie比对,若相同,将该网站行为记录的用户身份信 息合并到身份ID关系库的对应身份ID中,其他信息的Email、电话号码、计算机IP,在与该 身份ID的信息合并过程中先进行对应信息的比较,若两者对应信息相同,则不更新身份ID 关系库的相应身份ID信息,若有不同,则把该网站行为记录的对应用户身份信息增加到身 份ID关系库的对应身份ID中;其中,如果出现网站行为记录中的Cookie与多个身份ID的 Cookie相同,则将该网站行为记录中用户身份信息归并到身份ID关系库中最近发生行为 的用户身份ID中; 对于最后剩余的网站行为记录的用户身份信息,赋予新的身份ID,加入到身份ID关系 库中; 步骤4-3具体为: 根据"访问"、"搜索"网站行为记录的用户身份信息中包含的Cookie,与身份ID关系库 中的Cookie比对,若相同,将该网站行为记录的用户身份信息合并到身份ID关系库的对应 身份ID中,其他信息的Email、电话号码、计算机IP,在与该身份ID的信息合并过程中先进 行对应信息的比较,若两者对应信息相同,则不更新身份ID关系库的相应身份ID信息,若 有不同,则把该网站行为记录的对应用户身份信息增加到身份ID关系库的对应身份ID中; 其中,如果出现网站行为记录中的Cookie与多个身份ID的Cookie相同,则将该网站行为 记录中用户身份信息归并到身份ID关系库中最近发生行为的用户身份ID中; 若Cookie不同,对于剩下的、还没有归并到身份ID关系库的"访问"、"搜索"网站行为 记录,提取其所包含的用户身份信息的Email、电话号码、Cookie、计算机IP,然后针对不同 的网站行为记录,进行这些身份信息的比对,只要网站行为记录间有身份信息相同,则确定 他们是同一个用户,赋予同一个新的身份ID,并在身份ID关系库中增加这个新的身份ID ; 对于最后剩余的网站行为记录的用户身份信息,赋予新的身份ID,加入到身份ID关系 库中。
7. -种用户身份识别系统,其特征在于,包括:数据信息采集与存储模块、数据整理/ 转换/集成模块、身份识别处理模块、身份更新维护模块、身份信息应用模块; 所述数据信息采集与存储模块,用于从网站平台的数据源系统中提取记录用户各种行 为的日志数据,包括访问、搜索、询盘、登录、注册行为;以及提取用户基本信息,包括用户 名、地区、电话基本信息的数据,并存储于后台服务器中; 所述数据整理/转换/集成模块,用于读取数据存储模块中的日志数据,对日志记录进 行解析,形成有关用户各种行为的中间层数据,并把包含用户注册填写基本信息,并存储于 后台服务器中; 所述身份更新维护模块,用于将新产生的用户行为中包含的身份信息,进行合并、修 正、补充和维护,形成新的身份ID及对应身份信息,补充更新到身份ID关系库中; 所述身份信息应用模块,用于将身份ID关系库中的身份应用于网站平台的用户行为 中,识别用户,对用户行为进行跟踪和分析。
8. 根据权利要求7所述的系统,其特征在于: 身份识别处理模块,包括身份信息知识单元、信息关联处理器1、身份特征信息关联子 模块1、信息判断处理器1、信息关联处理器2、身份特征信息关联子模块2、信息判断处理器 2、信息关联处理器3、身份特征信息关联模块组成; 身份信息知识单元用于从数据仓库子模块中的用户登录、询盘、访问、搜索等行为记录 中,以及用户注册的基本信息中提取身份特征信息,包括用户ID,用户名,Email、电话号码、 Cookie、计算机IP信息记录;将这些信息保存汇总到一起,去掉完全重复的记录; 信息关联处理器1用于对"登录"、"登录发询盘"的这2种网站行为的记录,以及"注册 信息"中的用户基本信息,进行身份关联合并,对同一用户ID对应的所有的用户名、Email、 电话号码、Cookie、计算机IP进行信息合并; 身份特征信息关联子模块1用于存储经信息关联处理器1合并去重的用户ID、用户名、 Email、电话号码、Cookie、计算机IP的对应关系,并对不同的用户ID赋予不同的身份ID, 形成身份ID信息记录; 信息判断处理器1用于将身份信息知识单元中的"未登录发询盘"行为记录中身份信 息与身份特征信息关联子模块1中产生的身份ID信息记录进行身份比较,若身份信息比较 相同,认为是同一个用户,则将新身份信息合并到身份特征信息关联子模块1中;若信息比 较不相同,则进入信息关联处理器2 ; 信息关联处理器2用于处理信息判断处理器1中还没有归并到身份ID的Email、电话 号码、Cookie、计算机IP信息,其中Email、电话号码、Cookie任一相同,贝U认为是同一个用 户,赋予同一身份ID ; 身份特征信息关联子模块2用于存储经信息关联处理器2关联合并的Email、电话号 码、Cookie、计算机IP与身份ID的关联关系,同时合并身份特征信息关联子模块1中存储 的身份ID与用户ID、用户名、Email、电话号码、Cookie、计算机IP的关联关系; 信息判断处理器2用于将身份信息知识单元中的"访问"、"搜索"行为中的用户身份信 息与身份特征信息关联子模块2中产生的身份ID信息记录进行身份比较,若身份信息比较 相同,认为是同一个用户,则将新身份信息合并到身份特征信息关联子模块2中;若信息比 较结果不相同,则进入信息关联处理器3 ; 信息关联处理器3用于处理信息判断处理器1中还没有归并到身份ID的网站行为记 录,如果他们之间的Cookie、计算机IP信息,如果Cookie相同,贝U认为是同一个用户,赋予 同一身份ID ; 身份特征信息关联模块用于存储经信息关联处理器3关联合并的Cookie与身份ID关 联关系后形成的身份ID信息记录,同时合并特征信息关联子模块2中存储的身份ID信息 记录。
9.根据权利要求7所述的系统,其特征在于: 身份更新维护模块包括新身份信息知识单元、信息判断处理器3、信息关联处理器4、 身份更新处理器、身份ID特征关系结果单元; 新身份信息知识单元用于存储定时更新的网站用户新发生的行为中的用户身份信息 和新注册用户的基本信息,并进行去重; 信息判断处理器3用于将新身份信息知识单元中的行为记录中身份信息,与身份特征 信息关联模块中的身份ID信息进行比较,若相同,进入身份更新处理器; 身份更新处理器用于将新的行为中的用户身份信息与身份特征信息关联模块身份ID 信息进行合并去重,更新现有身份ID的身份特征关系; 信息关联处理器4,用于处理剩下的、还没有归并到身份ID关系库的网站行为记录,在 其中用户身份信息之间,进行信息关联,形成新的的身份ID信息记录; 身份ID特征关系结果单元用于存储更新生成的身份ID信息记录,并且持续定时进行 更新。
【文档编号】H04L12/24GK104394118SQ201410367353
【公开日】2015年3月4日 申请日期:2014年7月29日 优先权日:2014年7月29日
【发明者】王婷 申请人:焦点科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1