一种社交网站用户中文备注名系统推荐方法

文档序号:8258947阅读:514来源:国知局
一种社交网站用户中文备注名系统推荐方法
【技术领域】
[0001]本发明涉及一种社交网站用户中文备注名系统推荐方法。
【背景技术】
[0002]随着互联网技术的发展,社交网络的出现更加拉近了人们彼此间的距离,在虚拟的网络世界里,人们以网名作为自己的身份,彼此进行着交流,现有的社交网站多种多样,由于网名的情况特殊,其与当事人自身不具备直接的联系,因此,在社交网站中,当两人成为好友,双方即可为对方设置备注名,以便在众多好友中,自己能准确获悉对方是谁;其中,当用户为好友设置备注名时,现有的社交网站系统会自动弹出为此人推荐的备注名,而对于这一技术,现有的备注名推荐方法主要根据社交网络中其他人对该人的备注名以及该人在不同的社交圈子中的备注名出现的频率进行统计加权,出现次数最多的的权值越高,越接近于真实人名;这种方法比较简单且在网络昵称数据量很大的情况下是有效的,但是对于人际关系相对复杂的人来说,其拥有很多不同的称呼,这样基于统计的效果就不太理想,各种昵称敬称等都会干扰到词频统计的效果;同时当网络昵称相对较少的时候,基于统计的效果也同样不甚理想。因此,现有的系统备注名推荐方法已不能适用于现有的社交网络当中。

【发明内容】

[0003]针对上述技术问题,本发明所要解决的技术问题是提供一种应用于社交网站,针对好友间备注名的设置,能够有效实现系统智能化推荐的社交网站用户中文备注名系统推荐方法。
[0004]本发明为了解决上述技术问题采用以下技术方案:本发明设计了一种社交网站用户中文备注名系统推荐方法,包括如下步骤:
[0005]步骤001.针对目标用户,获取社交网站中对应于该用户的所有网名,作为各个待处理网名,构成该用户的网名信息集合;
[0006]步骤002.根据预设网名长度基础权重和预设网名长度权重设定规则,针对该用户网名信息集合中的各个待处理网名,判断其长度,分别获得各个待处理网名的网名长度权重;
[0007]步骤003.根据预设分别对应于常用中文姓词库和非常用中文姓词库的常用中文姓基础权重和非常用中文姓基础权重,针对该用户网名信息集合中的各个待处理网名,分别判断其是否包含中文姓,以及该被包含中文姓属于常用中文姓词库或非常用中文姓词库,以此分别获得各个待处理网名的中文姓权重;
[0008]其中,常用中文姓基础权重和非常用中文姓基础权重均大于网名长度基础权重,并且常用中文姓基础权重大于非常用中文姓基础权重;
[0009]步骤004.针对该用户网名信息集合,根据中文词频率,获取频率由高至低排列的前η个高频词,构成高频词集合,并且高频词集合中的各个高频词均对应于预设高频词基础权重,其中,η为根据预设个数;
[0010]步骤005.根据预设高频词基础权重,针对该用户网名信息集合中的各个待处理网名,分别判断其是否包含高频词集合中的高频词,以及包含高频词的个数,以此分别获得各个待处理网名的高频词权重;
[0011]步骤006.针对该用户网名信息集合中的各个待处理网名,根据待处理网名的网名长度权重、中文姓权重、高频词权重,以及预设分别对应于网名长度、中文姓、高频词的权重系数,进行加权计算获得对应于待处理网名的总权重;
[0012]步骤007.获取该用户网名信息集合中总权重最高的待处理网名,作为该用户的系统推荐备注名。
[0013]作为本发明的一种优选技术方案:所述步骤001中,所述社交网站中对应于该用户的所有网名包括该用户在社交网站中的当前网名、所有历史网名,以及其他用户针对该用户设置的所有的备注名。
[0014]作为本发明的一种优选技术方案:所述步骤002中针对该用户网名信息集合中的各个待处理网名,分别按如下方法进行执行:
[0015]获得待处理网名的长度,并判断其是否满足预设的网名基础长度,是则将预设网名长度基础权重赋予该待处理网名,作为该待处理网名的网名长度权重;否则获得该待处理网名长度与预设网名基础长度的差值,根据预设网名长度权重设定规则,由预设网名长度基础权重减去该差值所对应的数值,所获得权重作为该待处理网名的网名长度权重。
[0016]作为本发明的一种优选技术方案:所述预设的网名基础长度为2?4位。
[0017]作为本发明的一种优选技术方案:所述步骤003中针对该用户网名信息集合中的各个待处理网名,分别按如下步骤进行执行:
[0018]步骤00301.判断待处理网名中是否包含中文姓,是则进入步骤00302,否则赋予该待处理网名的中文姓权重为0,获得该待处理网名中文姓权重的方法结束;
[0019]步骤00302.判断待处理网名中是否包含属于常用中文姓词库的中文姓,是则赋予该待处理网名的中文姓权重为常用中文姓基础权重,获得该待处理网名中文姓权重的方法结束;否则赋予该待处理网名的中文姓权重为非常用中文姓基础权重,获得该待处理网名中文姓权重的方法结束。
[0020]作为本发明的一种优选技术方案:所述步骤004中,η为4。
[0021]作为本发明的一种优选技术方案:所述步骤005中针对该用户网名信息集合中的各个待处理网名,分别按如下步骤进行执行:
[0022]步骤00501.判断待处理网名中是否包含高频词集合中的高频词,是则进入步骤00502,否则赋予该待处理网名的高频词权重为0,获得该待处理网名高频词权重的方法结束;
[0023]步骤00502.获得该待处理网名包含高频词的个数m,赋予该待处理网名的高频词权重为高频词基础权重Xm,获得该待处理网名高频词权重的方法结束。
[0024]本发明所述一种社交网站用户中文备注名系统推荐方法采用以上技术方案与现有技术相比,具有以下技术效果:本发明设计的社交网站用户中文备注名系统推荐方法,应用于社交网站,针对好友间备注名的设置,综合考虑网名的长度因素、构成因素,以及其中的字频因素,采用权重计算的方式,能够有效实现系统智能化推荐,不仅适用于用户网名数据量较大的情况,而且还能适用于一位用户拥有很多不同网名的情况和一位用户网名数据量较小的情况。
【附图说明】
[0025]图1为本发明设计社交网站用户中文备注名系统推荐方法的流程图;
[0026]图2为本发明设计社交网站用户中文备注名系统推荐方法的实施例应用模块示意图。
【具体实施方式】
[0027]下面结合说明书附图针对本发明的【具体实施方式】作进一步详细的说明。
[0028]如图1和图2所示,本发明设计的一种社交网站用户中文备注名系统推荐方法在实际应用过程当中,实际具体包括如下步骤:
[0029]步骤001.针对目标用户,获取社交网站中对应于该用户的所有网名,作为各个待处理网名,构成该用户的网名信息集合,存储于社交网络用户网名存储器中;其中,所述社交网站中对应于该用户的所有网名包括该用户在社交网站中的当前网名、所有历史网名,以及其他用户针对该用户设置的所有的备注名。
[0030]实际应用中,采用社交网络用户网名存储器实现针对用户的网名信息集合的存储,这其中,社交网络用户网名存储器采用关系数据库或者nosql数据库或者文件数据库以及其它可行的存储工具,并且社交网络用户网名存储器中针对存储的各个待处理网名,同时关联用户针对网名的使用时间,以及与用户的唯一的标识关联,并且当用户修改网名或者其他人对该用户添加/修改备注名时,系统会将新网名存储至社交网络用户网名存储器中,并与对应用户的唯一标识进行关联。
[0031]步骤002.权重计算模块从社交网络存储器中根据用户的唯一标识获取目标用户的所有的待处理网名,接着,权重计算模块根据预设网名长度基础权重和预设网名长度权重设定规则,针对该用户网名信息集合中的各个待处理网名,判断其长度,分别获得各个待处理网名的网名长度权重;其中,针对该用户网名信息集合中的各个待处理网名,分别按如下方法进行执行:
[0032]根据通常中文名字的长度为2-4个字,预设网名基础长度为2?4位,因此,首先获得待处理网名的长度,并判断其是否满足预设的网名基础长度2?4位,是则将预设网名长度基础权重赋予该待处理网名,作为该待处理网名的网名长度权重;否则获得该待处理网名长度与预设网名基础长度的差值,根据预设网名长度权重设定规则,由预设网名长度基础权重减去该差值所对应的数值,所获得权重作为该待处理网名的网名长度权重。
[0033]步骤003.权重计算模块根据预设分别对应于常用中文姓词库和非常用中文姓词库的常用中文姓基础权重和非常用中文姓基础权重,针对该用户网名信息集合中的各个待处理网名,分别判断其是否包含中文姓,以及该被包含中文姓属于常用中文姓词库或非常用中文姓词库,以此分别获得各个待处理网名的中文姓权重;其中,针对该用户网名信息集合中的各个待处理网名,分别按如下步骤进行执行:
[0034]步骤00301.判断待处理网名中是否包含中文姓,是则进入步骤00302,否则赋予该待处理网名的中文姓权重为0,获得该待处理网名中文姓权重的方法结束;
[0035]步骤00302.判断待处理网名中是否包含属于常用中文姓词库的中文姓,是则赋予该待处理网名的中文姓权重为常用中文姓基础权重,获得该待处理网名中文姓权重的方法结束;否则赋予该待处理网名的中文姓权重为非常用中文姓基础权重,获得该待处理网名中文姓权重的方法结束。其中,常用中文姓基础权重和非常用中文姓基础权重均大于网名长度基础权重,并且常用中文姓基础权重大于非常用中文姓基础权重。
[0036]并且其中,常用中文姓词库和非常用中文姓词库,根据网上公开提供的统计资料整理得来,包括常用复姓与单姓(150个左右),非常用中文姓词库(1000左右)包含了绝大部分中文姓(去除常用姓)。
[0037]步骤004.权重计算模块针对该用户网名信息集合,根据中文词频率,获取频率由高至低排列的前4个高频词,构成高频词集合,并且高频词集合中的各个高频词均对应于预设高频词基础权重。
[0038]步骤005.权重计算模块根据预设高频词基础权重,针对该用户网名信息集合中的各个待处理网名,分别判断其是否包含高频词集合中的高频词,以及包含高频词的个数,以此分别获得各个待处理网名的高频词权重
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1