一种性别识别的方法及装置的制造方法_2

文档序号:9375787阅读:来源:国知局
r>[0063] 由此可见,对于包括两种性别语音数据的终端,无法准确地确认用户的性别,因此 将该部分数据去除,以提高后续得到的二分类预测模型的预测准确度。
[0064] 本实施例中,步骤Sl之后,该方法还包括如下步骤:
[0065] A01、获取已识别出用户性别的终端对应的用户好友关系。
[0066] 具体来说,获取用户好友关系的具体过程可为:对于每个终端,获取其中可分享信 息的分享记录和领取记录,根据每个可分享信息的分享记录和领取记录,将分享所述可分 享信息的第一终端和领取所述可分享信息的第二终端进行关联,生成多个终端对应的用户 好友关系。
[0067] A02、根据所述好友关系,获得与所述用户互为好友且预设优先级最高的第一用 户。
[0068] 具体来说,预设优先级最高即表示两者亲密度最高,两者互动最为频繁。
[0069] A03、判定所述第一用户与所述已识别出性别的用户互为异性。
[0070] 由此可见,本实施例还可根据已识别出用户性别的终端的用户好友列表,获得互 为好友且好友关系最相近的用户,将该用户认定为上述已识别出性别用户的配偶或男/女 朋友。
[0071] 如图2所示,为本公开另一实施例提供了一种性别识别的装置的结构示意图,该 装置包括:第一性别识别单元201、获取单元202、预测模型建立单元203及性别预测单元 204。其中:
[0072] 第一性别识别单元201,用于获取第一预设时间段内多个终端的语音数据,并根据 所述语音数据,对所述多个终端对应的用户的性别进行识别;
[0073] 获取单元202,用于获取第二预设时间段内已识别出用户性别的多个终端的出行 数据;
[0074] 预测模型建立单元203,用于将所述多个终端的出行数据作为训练语料进行二分 类训练,得到用于性别预测的二分类预测模型;
[0075] 性别预测单元204,用于根据所述二分类预测模型,以及终端的出行数据,对终端 对应的用户性别进行预测。
[0076] 本实施例中,第一性别识别单元201,用于:
[0077] 若一终端的语音数据包括一种性别的语音数据,则将所述性别作为终端对应的用 户的性别;
[0078] 若一终端的语音数据包括两种性别的语音数据,则将数量较多的语音对应的性别 作为终端对应的用户的性别。
[0079] 本实施例中,以打车系统为例,则上述出行数据可为周出行频率、出行时间段分 布、出行目的地POI分布及频率、用户积分商城兑换数据、给予小费金额、给予小费频率、用 券比例及用券平均值中的一种或多种。
[0080] 本实施例中,所述装置还包括第二性别识别单元,用于:
[0081] 获取已识别出用户性别的终端对应的用户好友关系;
[0082] 根据所述好友关系,获得与所述用户互为好友且预设优先级最高的第一用户;
[0083] 判定所述第一用户与所述已识别出性别的用户互为异性。
[0084] 本实施例中,所述用于性别测试的二分类预测模型为:
[0085]
[0086]
[0087] 其中,X表示的用户出行数据,y = 1表示预测为男性,y = 0表示预测为女性,w 表示系数。。
[0088] 对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关 之处参见方法实施例的部分说明即可。
[0089] 应当注意的是,在本公开的系统的各个部件中,根据其要实现的功能而对其中的 部件进行了逻辑划分,但是,本公开不受限于此,可以根据需要对各个部件进行重新划分或 者组合,例如,可以将一些部件组合为单个部件,或者可以将一些部件进一步分解为更多的 子部件。
[0090] 本公开的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行 的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用 微处理器或者数字信号处理器(DSP)来实现根据本公开实施例的系统中的一些或者全部 部件的一些或者全部功能。本公开还可以实现为用于执行这里所描述的方法的一部分或者 全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本公开的程 序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可 以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
[0091] 应该注意的是上述实施例对本公开进行说明而不是对本公开进行限制,并且本领 域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中, 不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词"包含"不排除存在 未列在权利要求中的元件或步骤。位于元件之前的单词"一"或"一个"不排除存在多个这 样的元件。本公开可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来 实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件 项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为 名称。
[0092] 以上实施方式仅适于说明本公开,而并非对本公开的限制,有关技术领域的普通 技术人员,在不脱离本公开的精神和范围的情况下,还可以做出各种变化和变型,因此所有 等同的技术方案也属于本公开的范畴,本公开的专利保护范围应由权利要求限定。
【主权项】
1. 一种性别识别的方法,其特征在于,该方法包括: 获取第一预设时间段内多个终端的语音数据,并根据所述语音数据,对所述多个终端 对应的用户的性别进行识别; 获取第二预设时间段内已识别出用户性别的多个终端的出行数据; 将所述多个终端的出行数据作为训练语料进行二分类训练,得到用于性别预测的二分 类预测模型; 根据所述二分类预测模型,以及终端的出行数据,对终端对应的用户的性别进行预测。2. 根据权利要求1所述的方法,其特征在于,所述根据所述语音数据,对所述多个终端 对应的用户的性别进行识别,包括: 若一终端的语音数据包括一种性别的语音数据,则将该性别作为所述终端对应的用户 的性别; 若一终端的语音数据包括两种性别的语音数据,则过滤掉该终端对应的语音数据。3. 根据权利要求1所述的方法,其特征在于,所述出行数据为周出行频率、出行时间段 分布、出行目的地信息点POI分布及频率、用户积分商城兑换数据、给予小费金额、给予小 费频率、用券比例及用券平均值中的一种或多种。4. 根据权利要求1所述的方法,其特征在于,所述根据所述语音数据,对所述多个终端 对应的用户的性别进行识别之后,还包括: 获取已识别出用户性别的终端对应的用户好友关系; 根据所述好友关系,获得与所述用户互为好友且预设优先级最高的第一用户; 判定所述第一用户与所述已识别出性别的用户互为异性。5. 根据权利要求1所述的方法,其特征在于,所述得到用于性别预测的二分类预测模 型为:其中,x表示的用户出行数据,y= 1表示预测为男性,y= 0表示预测为女性,w表示 系数。6. -种性别识别的装置,其特征在于,该装置包括: 第一性别识别单元,用于获取第一预设时间段内多个终端的语音数据,并根据所述语 音数据,对所述多个终端对应的用户的性别进行识别; 获取单元,用于获取第二预设时间段内已识别出用户性别的多个终端的出行数据; 预测模型建立单元,用于将所述多个终端的出行数据作为训练语料进行二分类训练, 得到用于性别预测的二分类预测模型; 性别预测单元,用于根据所述二分类预测模型,以及终端的出行数据,对终端对应的用 户的性别进行预测。7. 根据权利要求6所述的装置,其特征在于,所述第一性别识别单元,用于: 若一终端的语音数据包括一种性别的语音数据,则将该性别作为所述终端对应的用户 的性别; 若一终端的语音数据包括两种性别的语音数据,则过滤掉该终端对应的语音数据。8. 根据权利要求6所述的装置,其特征在于,所述出行数据为周出行频率、出行时间段 分布、出行目的地信息点POI分布及频率、用户积分商城兑换数据、给予小费金额、给予小 费频率、用券比例及用券平均值中的一种或多种。9. 根据权利要求6所述的装置,其特征在于,所述装置还包括第二性别识别单元,用 于: 获取已识别出用户性别的终端对应的用户好友关系; 根据所述好友关系,获得与所述用户互为好友且预设优先级最高的第一用户; 判定所述第一用户与所述已识别出性别的用户互为异性。10. 根据权利要求6所述的装置,其特征在于,所述用于性别测试的二分类预测模型 为:其中,x表示的用户出行数据,y= 1表示预测为男性,y= 0表示预测为女性,w表示 系数。
【专利摘要】本发明提供了一种性别识别的方法,包括:获取第一预设时间段内的多个终端的语音数据,并根据所述语音数据,对所述多个终端对应的用户的性别进行识别;获取第二预设时间段内已识别出用户性别的多个终端的出行数据;将所述多个终端的出行数据作为训练语料进行二分类训练,得到用于性别预测的二分类预测模型;根据所述二分类预测模型,以及终端的出行数据,对终端对应的用户的性别进行预测。本发明还提供了一种性别识别装置,包括第一性别识别单元、获取单元、预测模型建立单元及性别预测单元。本发明对性别的预测分析全面,且准确性较高,从而能够进一步根据不同性别的偏好,为不同性别的用户推送不同的个性化产品或应用。
【IPC分类】G06F17/30
【公开号】CN105095401
【申请号】CN201510394653
【发明人】卓呈祥
【申请人】北京嘀嘀无限科技发展有限公司
【公开日】2015年11月25日
【申请日】2015年7月7日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1