一种用户分类方法及服务器的制造方法_6

文档序号:9922292阅读:来源:国知局
训练数据;
[0226]基于训练数据对分类模型进行训练,其中,进行训练可以为根据用户的多个特征作为输入数据,将已知的用户对应的类型作为结果,对分类模型进行训练;
[0227]基于测试数据对分类模型进行预测,其中,进行预测可以为根据用户的多个特征作为输入数据,基于分类模型得到对应的输出结果,判断输出结果与用户的类型匹配的概率,当概率高于预设的门限值时,确定分类模型建立成功;否则,继续进行训练。
[0228]分类模型的建立以及训练我们同时尝试使用两种策略:单个Softmax Regress1n多元分类器和多个One-vs-Al I Logistic Regress1n二元分类器,通过调优训练数据规模,正负例比例,优化算法和正则因子等,选取最优的分类器策略和参数,学习模型。最后,对全部用户做分类预估,为每个用户选取一个最大概率的婚恋标签。为了保证准确率,可以对最大概率设置阈值做截断,最终保证准确率和用户覆盖平衡,达到最佳的效果。
[0229]可见,通过采用上述方案,就能够基于历史服务数据获取到具备第一属性的至少一个标注用户,再基于至少一个维度的至少一种特征参数、以及标注用户的第一属性确定针对用户的第一属性的分类模型,根据所述分类模型为至少一个目标用户划分类别。如此,能够避免由于用户未填写的第一属性、或者填写第一属性过时,而导致的无法准确的为目标用户划分类别的问题。
[0230]本发明实施例所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、基站、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:U盘、移动硬盘、只读存储器(R0M,Read-0nly Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本发明实施例不限制于任何特定的硬件和软件结合。
[0231]本实施例基于上述设备实施例提供一个具体的硬件,如图9所示,所述装置包括处理器92、存储介质94以及至少一个外部通信接口 91;所述处理器92、存储介质94以及外部通信接口 91均通过总线93连接。所述处理器92可为微处理器、中央处理器、数字信号处理器或可编程逻辑阵列等具有处理功能的电子元器件。所述存储介质中存储有计算机可执行代码。
[0232]所述硬件可以为所述服务器。所述处理器执行所述计算机可执行代码时,至少能实现以下功能:基于社交网络用户的历史服务数据,获取到具备第一属性的至少一个标注用户;从至少一个维度获取到所述标注用户对应的至少一种特征参数,基于所述标注用户的特征参数、以及所述标注用户对应的第一属性,确定针对用户的第一属性的分类模型;基于所述针对用户的第一属性的分类模型,为社交网络中的至少一个目标用户划分其对应的第一属性的类别。
[0233]以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。
【主权项】
1.一种用户分类方法,其特征在于,所述方法包括: 基于社交网络用户的历史服务数据,获取到具备第一属性的至少一个标注用户;其中,所述第一属性用于表征所述社交网络用户的婚恋状态; 从至少一个维度获取到所述标注用户对应的至少一种特征参数,基于所述标注用户的特征参数、以及所述标注用户对应的第一属性,确定针对用户的第一属性的分类模型; 基于所述针对用户的第一属性的分类模型,为社交网络中的至少一个目标用户划分其对应的第一属性的类别。2.根据权利要求1所述的方法,其特征在于,获取到具备第一属性的至少一个标注用户之前,所述方法还包括: 基于社交网络用户的历史服务数据,选取第一属性为第一类别的至少一个第一类初始用户;其中,所述第一属性中包括有第一类别以及第二类别,所述第一类别与所述第二类别不同; 从除去所述至少一个第一类初始用户的全部用户中,选取至少一个第二类初始用户; 基于所述第一类初始用户以及第二类初始用户,建立针对用户的第一属性的二元分类模型。3.根据权利要求2所述的方法,其特征在于,所述从除去所述至少一个第一类初始用户的全部用户中,选取至少一个第二类初始用户,包括: 基于所述第一类初始用户的历史服务数据,确定所述第一类初始用户对应的共有特征; 基于所述第一类初始用户对应的共有特征,从所述社交网络中选取与所述第一类初始用户的共有特征差异值超过预设门限值的至少一个第二类初始用户。4.根据权利要求2所述的方法,其特征在于,所述获取到具备第一属性的至少一个标注用户,包括: 基于社交网络用户的历史服务数据,选取设置有第一属性的至少一个用户作为待处理用户; 基于所述二元分类模型对所述待处理用户进行分类得到针对所述待处理用户的分类结果; 根据所述待处理用户的第一属性与其对应的分类结果相同的概率,选取概率高于预设概率门限值的待处理用户作为标注用户。5.根据权利要求4所述的方法,其特征在于,所述选取概率高于预设概率门限值的待处理用户作为标注用户之后,所述方法还包括: 分别从至少一个维度获取到标注用户对应的历史服务数据; 基于所述至少一个维度的历史服务数据,对所述标注用户进行筛选,得到筛选后的标注用户。6.根据权利要求1所述的方法,其特征在于,所述从至少一个维度获取到所述标注用户对应的至少一种特征参数,包括以下至少之一: 基于标注用户的历史服务数据获取到所述标注用户的基本属性参数; 基于标注用户的历史服务数据获取到所述标注用户针对目标数据的操作参数; 基于标注用户的历史服务数据获取到所述标注用户与除所述标注用户之外的其他用户之间的交互数据确定的交互特征参数。7.根据权利要求6所述的方法,其特征在于,所述标注用户的基本属性参数,包括以下至少之一:登录位置信息、登录时间段、加入预设名称的群组、以及在所述群组的交互频率; 所述标注用户针对目标数据的操作参数,至少包括:针对预设类型的目标信息的操作频率以及操作时段; 所述标注用户与除所述标注用户之外的其他用户之间的交互数据确定的交互特征参数,包括以下至少之一:所述其他用户的性别属性、所述其他用户与所述标注用户之间的交互频率、以及与所述其他用户的登录地址信息。8.一种服务器,其特征在于,包括: 用户获取单元,用于基于社交网络用户的历史服务数据,获取到具备第一属性的至少一个标注用户;其中,所述第一属性用于表征所述社交网络用户的婚恋状态; 模型建立单元,用于从至少一个维度获取到所述标注用户对应的至少一种特征参数,基于所述标注用户的特征参数、以及所述标注用户对应的第一属性,确定针对用户的第一属性的分类模型; 分类单元,用于基于所述针对用户的第一属性的分类模型,为社交网络中的至少一个目标用户划分其对应的第一属性的类别。9.根据权利要求8所述的服务器,其特征在于, 用户获取单元,用于基于社交网络用户的历史服务数据,选取第一属性为第一类别的至少一个第一类初始用户;其中,所述第一属性中包括有第一类别以及第二类别,所述第一类别与所述第二类别不同;从除去所述至少一个第一类初始用户的全部用户中,选取至少一个第二类初始用户;基于所述第一类初始用户以及第二类初始用户,建立针对用户的第一属性的二元分类模型。10.根据权利要求9所述的服务器,其特征在于, 所述用户获取单元,用于基于所述第一类初始用户的历史服务数据,确定所述第一类初始用户对应的共有特征;基于所述第一类初始用户对应的共有特征,从所述社交网络中选取与所述第一类初始用户的共有特征差异值超过预设门限值的至少一个第二类初始用户。11.根据权利要求9所述的服务器,其特征在于, 所述用户获取单元,用于基于社交网络用户的历史服务数据,选取设置有第一属性的至少一个用户作为待处理用户;基于所述二元分类模型对所述待处理用户进行分类得到针对所述待处理用户的分类结果;根据所述待处理用户的第一属性与其对应的分类结果相同的概率,选取概率高于预设概率门限值的待处理用户作为标注用户。12.根据权利要求11所述的服务器,其特征在于, 所述用户获取单元,用于分别从至少一个维度获取到标注用户对应的历史服务数据;基于所述至少一个维度的历史服务数据,对所述标注用户进行筛选,得到筛选后的标注用户。13.根据权利要求8所述的服务器,其特征在于, 所述模型建立单元,用于从以下至少之一维度获取到所述标注用户对应的至少一种特征参数: 基于标注用户的历史服务数据获取到所述标注用户的基本属性参数; 基于标注用户的历史服务数据获取到所述标注用户针对目标数据的操作参数; 基于标注用户的历史服务数据获取到所述标注用户与除所述标注用户之外的其他用户之间的交互数据确定的交互特征参数。14.根据权利要求13所述的服务器,其特征在于,所述标注用户的基本属性参数,包括以下至少之一:登录位置信息、登录时间段、加入预设名称的群组、以及在所述群组的交互频率; 所述标注用户针对目标数据的操作参数,至少包括:针对预设类型的目标信息的操作频率以及操作时段; 所述标注用户与除所述标注用户之外的其他用户之间的交互数据确定的交互特征参数,包括以下至少之一:所述其他用户的性别属性、所述其他用户与所述标注用户之间的交互频率、以及与所述其他用户的登录地址信息。
【专利摘要】本发明公开了一种用户分类方法及服务器,其中方法包括:基于社交网络用户的历史服务数据,获取到具备第一属性的至少一个标注用户;从至少一个维度获取到所述标注用户对应的至少一种特征参数,基于所述标注用户的特征参数、以及所述标注用户对应的第一属性,确定针对用户的第一属性的分类模型;基于所述针对用户的第一属性的分类模型,为社交网络中的至少一个目标用户划分其对应的第一属性的类别。
【IPC分类】G06Q50/00, G06K9/62
【公开号】CN105701498
【申请号】CN201511033392
【发明人】王莉峰
【申请人】腾讯科技(深圳)有限公司
【公开日】2016年6月22日
【申请日】2015年12月31日
当前第6页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1