一种位置信息确定的方法以及服务器的制造方法

文档序号:10578183阅读:407来源:国知局
一种位置信息确定的方法以及服务器的制造方法
【专利摘要】本发明实施例公开了一种位置信息确定的方法,包括:读取待确定目标网络账号的地理位置信息,地理位置信息为关注目标网络账号的用户所在的位置信息;根据地理位置信息,获取特征编码参数;接收用户网络账号的样本标注参数,根据样本标注参数以及特征编码参数确定模型训练参数;根据模型训练参数以及特征编码参数,确定实际地理位置信息,实际地理位置信息用于指示目标网络账号当前服务的地理范围。本发明实施例还提供一种服务器。本发明实施例可以考虑到关注该网络账号的用户处于动态变化的情况,根据关注该网络账号的用户的地理位置来确定实际地理位置信息,从而降低数据的失真可能性,提高服务器确定网络账号实际服务信息的准确度。
【专利说明】
-种位置信息确定的方法从及服务器
技术领域
[0001] 本发明设及互联网通信领域,尤其设及一种位置信息确定的方法W及服务器。
【背景技术】
[0002] 随着互联网技术的发展,网络平台开放能力不断提升,网络账号的数量迅速增长, 而且网络账号的类型和服务逐步多样化,不同类型的网络账号在地域特征上也出现多样化 趋势。
[0003] 在实际应用过程中,通常将网络账号注册的地理位置或者期望服务的地理位置作 为该网络账号的地理位置属性,运类信息可W直接获取,或者进行简单的处理即可直接应 用。
[0004] 然而,网络账号注册的地理位置容易出现缺失或者失真等情况,而且关注网络账 号的用户往往处于一个动态变化的过程,而网络账号注册时的地理位置或者期望服务的地 理位置是固定的,不能反映出运类动态变化,从而导致数据失真,并且不能很好地判断网络 账号实际的服务范围。

【发明内容】

[0005] 本发明实施例提供了一种位置信息确定的方法W及服务器,可W考虑到关注该网 络账号的用户处于动态变化的情况,能够根据关注该网络账号的用户的地理位置来确定实 际地理位置信息,从而大大降低数据的失真可能性,更有效地提高服务器确定得到网络账 号的实际服务信息的准确度。
[0006] 有鉴于此,本发明第一方面提供一种位置信息确定的方法,包括:
[0007] 读取待确定目标网络账号的地理位置信息,所述地理位置信息为关注所述目标网 络账号的用户所在的位置信息;
[000引根据所述地理位置信息,获取所述目标网络账号的特征编码参数;
[0009] 接收用户网络账号的样本标注参数,并根据所述样本标注参数W及所述特征编码 参数确定模型训练参数;
[0010] 根据所述模型训练参数W及所述特征编码参数,确定所述目标网络账号的实际地 理位置信息,所述实际地理位置信息用于指示所述目标网络账号当前服务的地理范围。
[0011] 第二方面,本方面实施例还提供一种服务器,包括:
[0012] 读取模块,用于读取待确定目标网络账号的地理位置信息,所述地理位置信息为 关注所述目标网络账号的用户所在的位置信息;
[0013] 获取模块,用于根据所述读取模块读取的所述地理位置信息,获取所述目标网络 账号的特征编码参数;
[0014] 接收模块,用于接收用户网络账号的样本标注参数,并根据所述样本标注参数W 及所述获取模块获取的所述特征编码参数确定模型训练参数;
[0015] 确定模块,用于根据所述接收模块确定的所述模型训练参数W及所述获取模块获 取的所述特征编码参数,确定所述目标网络账号的实际地理位置信息,所述实际地理位置 信息用于指示所述目标网络账号当前服务的地理范围。
[0016] 第=方面,本方面实施例还提供一种服务器,包括:存储器、收发器、处理器W及总 线系统;
[0017] 其中,所述存储器用于存储程序;
[0018] 所述处理器用于执行所述存储器中的程序,具体如下步骤:
[0019] 读取待确定目标网络账号的地理位置信息,所述地理位置信息为关注所述目标网 络账号的用户所在的位置信息;
[0020] 根据所述地理位置信息,获取所述目标网络账号的特征编码参数;
[0021] 接收用户网络账号的样本标注参数,并根据所述样本标注参数W及所述特征编码 参数确定模型训练参数;
[0022] 根据所述模型训练参数W及所述特征编码参数,确定所述目标网络账号的实际地 理位置信息,所述实际地理位置信息用于指示所述目标网络账号当前服务的地理范围。
[0023] 从W上技术方案可W看出,本发明实施例具有W下优点:
[0024] 本发明实施例中,提供了一种位置信息确定的方法,服务器先读取待确定目标网 络账号的地理位置信息,然后根据地理位置信息,获取目标网络账号的特征编码参数,然后 服务器接收用户网络账号的样本标注参数,并根据样本标注参数W及特征编码参数确定模 型训练参数,最后根据模型训练参数W及特征编码参数,确定目标网络账号的实际地理位 置信息,实际地理位置信息用于指示目标网络账号当前服务的地理范围。通过采用上述方 式确定网络账号当前服务的地理范围,可W考虑到关注该网络账号的用户处于动态变化的 情况,能够根据关注该网络账号的用户的地理位置来确定实际地理位置信息,从而大大降 低数据的失真可能性,更有效地提高服务器确定得到网络账号的实际服务信息的准确度。
【附图说明】
[0025] 图1为本发明实施例中位置信息确定系统的架构图;
[0026] 图2为本发明实施例中位置信息确定的方法一个交互实施例示意图;
[0027] 图3为本发明实施例中位置信息确定的方法一个实施例示意图;
[0028] 图4为本发明实施例中地理属性分类系统训练模型图;
[0029] 图5为本发明实施例中分类器结构示意图;
[0030] 图6为本发明实施例中服务器一个实施例示意图;
[0031 ]图7为本发明实施例中服务器另一个实施例示意图;
[0032] 图8为本发明实施例中服务器另一个实施例示意图;
[0033] 图9为本发明实施例中服务器另一个实施例示意图;
[0034] 图10为本发明实施例中服务器另一个实施例示意图;
[0035] 图11为本发明实施例中服务器另一个实施例示意图;
[0036] 图12为本发明实施例中服务器另一个实施例示意图;
[0037] 图13为本发明实施例中服务器另一个实施例示意图;
[0038] 图14为本发明实施例中服务器一个结构示意图。
【具体实施方式】
[0039] 本发明实施例提供了一种位置信息确定的方法W及服务器,可W考虑到关注该网 络账号的用户处于动态变化的情况,能够根据关注该网络账号的用户的地理位置来确定实 际地理位置信息,从而大大降低数据的失真可能性,更有效地提高服务器确定得到网络账 号的实际服务信息的准确度。
[0040] 本发明的说明书和权利要求书及上述附图中的术语"第一"、"第二"、"第="、"第 四"等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理 解运样使用的数据在适当情况下可W互换,W便运里描述的本发明的实施例例如能够W除 了在运里图示或描述的那些W外的顺序实施。此外,术语"包括"和"具有"W及他们的任何 变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产 品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于运 些过程、方法、产品或设备固有的其它步骤或单元。
[0041] 应理解,本发明实施例中信息推送的控制方法应用于位置信息确定系统中,请参 阅图1,图1为本发明实施例中位置信息确定系统的架构图,如图所示,用于提供服务的主移 动终端与服务器之间建立通信连接,主移动终端提供目标网络账号,多个获取主移动移动 服务的副移动终端关注了目标网络账号,也可W称为是目标网络账号的"粉丝",主移动终 端将提供的服务上传至服务器,其他的副移动终端通过关注主移动终端来获取主移动终端 提供的服务器。
[0042] 而不同类型的目标网络账号在地域特征上也出现了多样化的趋势,有一些目标网 络账号面向全国粉丝体提供无差别服务,而另一些目标网络账号则针对目标省份或者目标 地区的粉丝提供面向本地生活和本地信息的定向服务,运些目标网络账号在服务覆盖的地 理范围上都出现了较大的差异,伴随着平台商业推广、捜索和广告等业务的深入开展,因此 需要了解目标网络账号实际服务的地理范围信息。
[0043] 需要说明的是,本发明方案中的主移动终端和副移动终端可W是智能手机、平板 电脑、个人数字助理(英文全称:Personal Digital Assistant,英文缩写:PDA)或者车载电 脑等,此处不应理解为对本发明的限定。
[0044] 为了便于理解,请参阅图2,图2为本发明实施例中位置信息确定的方法一个交互 实施例示意图,如图所示,步骤101中,移动终端先向服务器发送目标网络账号的地理位置 信息,目标网络账号可W是一个用于为用户提供服务的公众账号,多个移动终端分别向服 务器发送其所在的地理位置信息,例如在哪个省市,或者具体的经缔度等信息。步骤102中, 服务器会从多个移动终端提供的地理位置信息中提取对应的特征编码参数。接着在步骤 103中,用户还可W通过移动终端向服务器发送一组或多组用户网络账号对应的样本标注 参数,服务器通过机器学习的方法,利用运些样本标注参数计算出模型训练参数,即生成分 类器。最后,服务器在步骤105中,利用生成的分类器,W及从目标网络账号的地理位置信息 中提取的特征编码参数,确定出目标网络账号的实际地理位置信息。
[0045] 下面将从服务器的角度,对本发明中位置信息确定的方法进行介绍,请参阅图3, 本发明实施例中位置信息确定的方法一个实施例包括:
[0046] 201、读取待确定目标网络账号的地理位置信息,地理位置信息为关注目标网络账 号的用户所在的位置信息;
[0047] 本实施例中,服务器首先读取待确定目标网络账号的地理位置信息,其中,目标网 络账号可W是一个为多用户提供服务器的公众账号,例如微博账号或者微信公众号等。而 地理位置信息为关注目标网络账号的用户所在的位置信息,可W认为是目标网络账号的 "粉丝"所在的位置。
[0048] 目标网络账号在注册的时候,运营者可W选择所在的地理位置坐标点或者所在的 国家、省份和城市信息,作为目标网络账号的地理位置属性。运类信息通常是目标网络账号 属主注册或者期望服务的地点,与目标网络账号服务实际覆盖的地理范围往往有较大的差 异,而目标网络账号粉丝的实际地理分布,更能客观地反映出目标网络账号服务实际覆盖 的地理范围。
[0049] 其中,获取关注目标网络账号的用户所在地理位置信息可W通过W下方式提取, 例如可W从无线保真(英文全称:Wireless-Fidelity,英文缩写:WiFi)、网络之间互连的协 议(英文全称:Internet Protocol,英文缩写:IP)地址、基于位置服务(英文全称:Location Based Service,英文缩写:LBS)W及用户属性中所在的城市、省份或国家等信息中提取用 户所在地理位置信息,此处不作限定。
[0050] 202、根据地理位置信息,获取目标网络账号的特征编码参数;
[0051] 本实施例中,服务器根据获取到关注者的地理位置信息,可W从中再提取和计算 运些地理位置信息的特征编码参数。
[0052] 203、接收用户网络账号的样本标注参数,并根据样本标注参数W及特征编码参数 确定模型训练参数;
[0053] 本实施例中,服务器为了生成可用于确定出关注目标网络账号的用户所在的位置 信息属于哪一种地域分布类型的模型,首先将接收用户发送的一组或多组用户网络账号的 样本标注参数,根据机器学习算法,利用样本标注参数W及特征编码参数训练出一组模型 训练参数,即得到一组分类器。
[0054] 204、根据模型训练参数W及特征编码参数,确定目标网络账号的实际地理位置信 息,实际地理位置信息用于指示目标网络账号当前服务的地理范围。
[0055] 本实施例中,服务器根据训练得到的模型训练参数,W及从关注目标网络账号的 用户所在地理位置信息中提取特征编码参数,计算得到目标网络账号的实际地理位置信 息,实际地理位置信息用于指示目标网络账号当前服务的地理范围。
[0056] 具体地,服务器根据模型训练参数得到一组分类器,然后将特征编码参数输入至 分类器中,分类器将目标网络账号按照其关注人群的地域分布分成若干个类型。通过运种 方法计算目标网络账号关注用户人群的地理分布属性,将网络账号关注用户人群地理分布 属性作为目标网络账号的地理位置属性。
[0057] 本发明实施例中,提供了一种位置信息确定的方法,服务器先读取待确定目标网 络账号的地理位置信息,然后根据地理位置信息,获取目标网络账号的特征编码参数,然后 服务器接收用户网络账号的样本标注参数,并根据样本标注参数W及特征编码参数确定模 型训练参数,最后根据模型训练参数W及特征编码参数,确定目标网络账号的实际地理位 置信息,实际地理位置信息用于指示目标网络账号当前服务的地理范围。通过采用上述方 式确定网络账号当前服务的地理范围,可W考虑到关注该网络账号的用户处于动态变化的 情况,能够根据关注该网络账号的用户的地理位置来确定实际地理位置信息,从而大大降 低数据的失真可能性,更有效地提高服务器确定得到网络账号的实际服务信息的准确度。
[0058] 可选地,在上述图3对应的实施例的基础上,本发明实施例提供的位置信息确定的 方法第一个可选实施例中,特征编码参数包括归一化向量、规模系数W及峰度系数;
[0059] 根据地理位置信息,获取目标网络账号的特征编码参数,可W包括:
[0060] 根据地理位置信息计算规模系数;
[0061] 根据地理位置信息计算归一化向量;
[0062] 根据归一化向量计算峰度系数。
[0063] 本实施例中,服务器根据地理位置信息,获取目标网络账号的特征编码参数具体 可W是,服务器先根据地理位置信息计算规模系数,然后根据地理位置信息W及规模系数 计算得到归一化向量,最后通过归一化向量计算得到峰度系数,
[0064] 为了便于介绍,请参阅图4,图4为本发明实施例中地理属性分类系统训练模型图, 如图所示,实体箭头表示数据的流向,虚线箭头表示分类器控制信息的流向。地理属性分类 系统训练模型中主要包含四个模块,分别为特征编码模块、样本标注模块、模型训练模块和 分类器模块。其中,特征编码模块用于获取目标网络账号的特征编码参数,然后将特征编码 参数分别输入至模型训练模块和分类器。
[0065] 其次,本发明实施例中,举例了说明了目标网络账号的特征编码参数包括了规模 系数、归一化向量W及峰度系数,并且服务器根据地理位置信息计算规模系数W及归一化 向量,再根据归一化相邻计算出峰度系数。采用上述方式提升方案在实际应用中的可行性。
[0066] 可选地,在上述图3或图3对应的第一个实施例的基础上,本发明实施例提供的位 置信息确定的方法第二个可选实施例中,根据地理位置信息计算规模系数,可W包括:
[0067] 按照如下方式计算规模系数:
[006引
[0069] Mf表示目标网络账号f规模系数
[0070] Cfi表示目标网络账号f在编号为i区域的人数,其中,Cf冷Cf(W);
[0071]
用于表示目标网络账号f在编号为从i = 〇到i=n区域中的总人数,n表示总 区域数量。
[0072] 本实施例中,服务器采用地理属性分类系统训练模型中的特征编码模块计算规模 系数,运些规模系数为关注目标网络账号的用户当前地理位置信息所对应的规模系数,因 此在实际计算中会得到至少一个规模系数。此处为了便于说明,仅W计算一个规模系数为 例进行介绍。
[0073] 假设当前收集到目标网络账号的各地关注人数如下表1所示:
[0074] 表 1 「007^11

[0076] 根据上表,可W按照地域属性对运些数据进行聚合,生成一组变量Cf I,Cf 2,Cf 3, Cf4, ...,C迎,其中,Cf康示目标网络账号f在编号为i区域的人数,退域具体可W是按照省 份划分的区域,n则表示区域的总数。
[0077] 为了更准确地提取关注目标网络账号的用户分布特征,需要采用人数从多到少的 排列方式,即Cf冷Cf (i+i)
[0078] 按照如下方式计算账号f的规模系数:
[0079]
[0080] 再次,本发明实施例中,服务器可W采用公式计算规模系数,通过公式的计算得到 合理的规模系数,W此提升方案的实用性和可行性。
[0081] 可选地,在上述图3、图3对应的第一或第二个实施例的基础上,本发明实施例提供 的位置信息确定的方法第=个可选实施例中,根据地理位置信息计算归一化向量,可W包 括:
[00821 格昭々n下节井A管归一化向量;
[008;
[0084] kfi表示目标网络账号f在编号为i区域的人数所对应的归一化值,多个归一化值组 成归一化向量,kfi的取值范围为大于0且小于1。
[0085] 本实施例中,假设已经根据表1计算得到当前的规模系数为19939,于是可W结合 表1中的数据计算每个区域的归一化值。
[0086] 按照如下方式计算广东省的归一化值:
[0087]
[0088] 其他区域的归一化值也可W采用上述方式进行计算,多个归一化值最后可W组成 归一化向量。
[0089] 进一步地,本发明实施例中,在得到规模系数的基础上,还可W利用公式计算得到 归一化向量,W此提升服务器计算归一化向量的可行性W及合理性。
[0090] 可选地,在上述图3、图3对应的第一至第=个中任一项实施例的基础上,本发明实 施例提供的位置信息确定的方法第四个可选实施例中,根据归一化向量计算峰度系数,可 W包括:
[0091] 按照化下方式计算峰麼系数:
[0092]
[0093]
[0094] 表示目标网络账号f预设的归一化向量中归一化值的平均值;
[00%] N表示预设的参数,N的取值范围为大于0且小于等于所述i;
[0096] kfN表不第N个归一化向量中的归一化值,化fi,kf2,kf3,kf4,. . . ,kfN)表不归一化向 量中的一组子归一化向量;
[0097] Kurtf表示目标网络账号f的峰度系数,峰度系数用于表示分布睹缓程度;
[0098] 笑注目标网络账号的用户所分布的的四阶矩;
[0099] g示关注目标网络账号的用户所分布的的二阶矩。
[0100] 本实施例中,假设已经根据表1计算得到当前的规模系数为19939,且广东省的归 一化值为0.07347,于是可W继续结合表1中的数据计算每个区域的峰度系数。
[0101 ]首先根据表1中的各个数据,采用如下公式:
[0102]
[0103] 计算得到目标网络账号f预设的归一化向量中归一化值的平均值,然后采用如下 公式计算得到,目标网络账号f的峰麼系数:
[0104]
[0105] 更进一步地,本发明实施例中,在服务器计算得到规模系数和归一化向量的基础 上,可W利用公式继续计算得到峰度系数,W此提升服务器计算峰度系数的可行性和合理 性。
[0106] 可选地,在上述图3、图3对应的第一至第四个中任一项实施例的基础上,本发明实 施例提供的位置信息确定的方法第五个可选实施例中,接收用户网络账号的样本标注参 数,可W包括:
[0107] 接收一组用户网络账号.
[0108] 按照地理位置分布类型生成一组用户网络账号对应的样本标注参数。
[0109] 本实施例中,地理属性分类系统训练模型中的标注样本模块为用户提供了一个数 据标注的接口模块,用户可W通过运个接口将一组用户网络账号. . .,f 俞入标注样本模块,标注样本模块将按照地域分布类型生成样本标注参数 ^/(〇)'^/(1),^/口)'^/'口),~^/^1),然后将样本标注参数传递给模型训练模块,用于进行 模型训练。
[0110] 其次,本发明实施例中,服务器在接收一组用户网络账号后,可W按照地理位置分 布类型生成一组用户网络账号对应的样本标注参数。通过上述方式能够灵活地获取到用户 提供的用户网络账号,并生成样本标注参数,如果用户提供的数据足够多,所得到的样本标 注参数也越多,从而使得训练出的模型拟合度越高,从而提升方案的准确度。
[0111] 可选地,在上述图3、图3对应的第一至第五个中任一项实施例的基础上,本发明实 施例提供的位置信息确定的方法第六个可选实施例中,根据样本标注参数W及特征编码参 数确定模型训练参数,可W包括:
[0112] 按照规模系数将样本标注参数分配至不同的标注数据子集合;
[0113] 对每个标注数据子集合进行模型训练,并得到模型训练的结果;
[0114] 根据模型训练的结果确定模型训练参数。
[0115] 本实施例中,服务器根据样本标注参数W及特征编码参数确定模型训练参数的步 骤可W是,服务器先按照峰度系数将样本标注数据分配至不同的标注数据子集合,具体为:
[0116] 地理属性分类系统训练模型中的模型训练模块接收样本标注模块输出的样本标 注参数L/"),L/'(i),L尸2>,Lf。1>尸1 )和特征编码模块输出的归一化向量kfi,kf2,kf3, kf4, ...,kfN、规模系数Mf和峰度系数Kudf,模型训练模块可W按照规模系数Mf将样本标注 参数L户。>,Iy",L严,,L户,...,L户",分配到不同的集合中,运些集合为Si ,1 = 0,1,2,3,4, 5. .n。分配方式如下:
[0117]
[0118] I即表示每个标注数据子集合,通过上述方式将标注数据集合分成多个标注数据 子集合,不同规模的目标网络账号分到不同的集合中每个标注数据子集合Si可W独立地进 行模型训练,并且针对不同"粉丝"规模的目标网络账号独立训练模型,可W提高模型分类 的准确率。在对每个标注数据子集合进行模型训练后,可W得到模型训练的结果,最后根据 模型训练的结果确定模型训练参数。对每个标注数据子集合进行模型训练的过程将在下面 第屯个实施例中进行具体介绍。
[0119] 再次,本发明实施例中,服务器根据样本标注参数W及特征编码参数确定模型训 练参数,可W是先按照规模系数将样本标注参数分配至不同的标注数据子集合,然后对每 个标注数据子集合进行模型训练,并得到模型训练的结果,最后根据模型训练的结果确定 模型训练参数。通过上述方法,服务器可W针对不同"粉丝"规模的目标网络账号独立进行 训练,W此提高模型分类的准确率。
[0120] 可选地,在上述图3、图3对应的第一至第六个中任一项实施例的基础上,本发明实 施例提供的位置信息确定的方法第屯个可选实施例中,标注数据子集合包括标注数据测试 集合W及标注数据训练集合;
[0121 ]标注数据测试集合用于对标注数据子集合中的第一标注数据进行迭代计算;
[0122] 标注数据训练集合用于对标注数据子集合中的第二标注数据进行模型训练。
[0123] 本实施例中,服务器包括的地理属性分类系统训练模型中的模型训练模块,会对 每个标注数据子集合进行模型训练,首先可W将标注数据子集合划分为标注数据测试集合 W及标注数据训练集合,
[0124] 下面对单个的标注数据子集合Si模型训练的方式进行说明。
[0125] 模型训练模块采用监督学习的方式,运里可W采用常见的机器学习算法,可W是 决策树、贝叶斯、线性判别式、逻辑回归等。
[0126] 其中,决策树是是直观运用概率分析的一种图解法,在已知各种情况发生概率的 基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其 可行性。在机器学习中,决策树是一个预测模型,它代表的是对象属性与对象值之间的一种 映射关系。
[0127] 贝叶斯为利用捜集到的信息对原有判断进行修正提供了有效手段。在采样之前, 对各种假设有一个判断,即先验概率,关于先验概率的分布,通常可根经验判断确定,当无 任何信息时,一般假设各先验概率相同,较复杂精确的可利用包括最大赌技术或边际分布 密度W及相互信息原理等方法来确定先验概率分布。
[0128] 线性判别式的基本思想是将高维的模式样本投影到最佳鉴别矢量空间,W达到抽 取分类信息和压缩特征空间维数的效果,投影后保证模式样本在新的子空间有最大的类间 距离和最小的类内距离,即模式在该空间中有最佳的可分离性。
[0129] 逻辑回归是一种广义线性回归,与多重线性回归分析有很多相同之处。它们的模 型形式基本上相同。
[0130] 需要说明的是,在实际应用中,还可W存在其他的机器学习算法,此处不作限定。
[0131] 接下来,模型训练模块选取的算法可W用Yi表示,模型训练模块将标注数据子集 合Si分为标注数据测试集合S Wi和标注数据训练集合,即将多个标注数据子集合分为 第一标注数据和第二标注数据,第一标注数据的集合构成了标注数据测试集合,而第二标 注数据的集合构成了标注数据训练集合。标注数据训练集合用于训练模型的参数,标 注数据测试集合用于测试模型的准确性,模型经过多次迭代训练,直至模型的准确率 收敛到一定状态。
[0132] 模型训练针对不同规模31的训练出不同的模型,运些模型的模型训练参数^:1'严作 为控制信号传输给分类器;模型训练模块训练产生多组分类器控制参数,运组分类分别对 不同粉丝规模目标网络账号进行分类。
[0133] 进一步地,本发明实施例中,可W将标注数据子集合划分为标注数据测试集合W 及标注数据训练集合,其中,标注数据测试集合用于对标注数据子集合中的第一标注数据 进行迭代计算,标注数据训练集合用于对标注数据子集合中的第二标注数据进行模型训 练。通过上述方式,可W训练出拟合度更高的模型,而且在对标注数据的测试和训练中不断 完善模型,提升模型的动态适应性。
[0134] 可选地,在上述图3、图3对应的第一至第屯个中任一项实施例的基础上,本发明实 施例提供的位置信息确定的方法第八个可选实施例中,根据模型训练参数W及特征编码参 数,确定目标网络账号的实际地理位置信息,可W包括:
[0135] 根据规模系数,将目标网络账号的特征编码参数分配至子分类器中,子分类器用 于根据特征编码参数输出目标网络账号的地理位置属性类别,地理位置属性类别包括集中 型、局部分散型W及全局分散型中的一种;
[0136] 根据地理位置属性类别确定目标网络账号的实际地理位置信息。
[0137] 本实施例中,模型训练参数用于生成分类器,请参阅图5,图5为本发明实施例中分 类器结构示意图,如图所示,分类器包括了分组函数W及多个子分类器Yl至Yn,子分类器通 常可W是指机器学习算法,不同的子分类器可W选择不同的机器学习算法,例如决策树、贝 叶斯、线性判别式或逻辑回归等。
[0138] 分组函数按照特征编码参数中的规模系数,将特征编码参数分配到相应的子分类 器中,子分类器接收特征编码参数中的归一化向量和峰度系数,然后输出目标网络账号的 地理位置属性类别。
[0139] 地理位置属性类别包括集中型、局部分散型W及全局分散型中的一种,其中,集中 型表示目标网络账号的关注用户集中分布在单一的城市,局部分散型表示目标网络账号的 关注用户集中分布在某一省份的城市或者地理位置相邻的城市群,全局分散型表示目标网 络账号的关注用户分布在全国范围内的多个城市,运些城市在地理位置上并不是相邻的。
[0140] 对于集中型的目标网络账号,则可W进一步确定该目标网络账号集中的城市,即 采用统计法确定。对于局部分散性的目标网络账号,将可W进一步计算出其分散区域所在 的省份。
[0141] 其次,本发明实施例中,服务器根据模型训练参数W及特征编码参数,确定目标网 络账号的实际地理位置信息,具体可W先根据规模系数,将目标网络账号的特征编码参数 分配至子分类器中,子分类器用于根据特征编码参数输出目标网络账号的地理位置属性类 另IJ,地理位置属性类别包括集中型、局部分散型W及全局分散型中的一种,最后根据地理位 置属性类别确定目标网络账号的实际地理位置信息。采用上述方式,具体构建了一个可用 于输出目标网络账号实际地理位置信息的模型,训练模型中的分类器引入了多个子分类 器,充分考虑到了目标网络账号规模的多样性,从数据层面训练出多个子分类器,每个子分 类器只针对某一个规模的目标网络账号,运样的模型能够与训练数据更好地你拟合,提高 模型的识别能力。
[0142] 为便于理解,下面W-个具体应用场景对本发明中一种位置信息确定的方法进行 详细描述,具体为:
[0143] 甲公司开设了一个公众账号A,目前有30个不同区域的用户关注甲公司的公众账 号A,关注的情况如表2所示:
[0144] 表2
[0146]
[0147] 现在需要确定公众账号A实际服务的地区,于是服务器采用地理属性分类系统训 练模型中的特征编码模块计算规模系数,即:
[014 引
[0149] 且上述计算已满足Cfi^Cf(W)的条件。
[0150] 然后分别计算每个区域的归一化值,W重庆市为例,即:
[0151]
[0152] W此类推,计算出各个地区的归一化值,根据各个地区的归一化值组成归一化向 量,如表2所示。
[0153] 接下来,计算出归一化向量中归一化值的平均值,即: 「01541
[0155]最后,计算目标网络账号的峰度系数,即:
[0156]
[0157] 将运些数据输入至模型中的分类器,由于分类器根据规模系数15211将特征数据 分配到子分类器Y中,子分类器Y采用逻辑回归算法。子分类器Y接收归一化向量和峰度系 数,输出公众账号A最终地理位置属性类别为局部分散型,并可W进一步得到分散区域所在 的省份为重庆、北京、上海和天津。
[0158] 于是将公众账号A的实际服务区域确定为重庆。
[0159] 下面对本发明中的服务器进行详细描述,请参阅图6,所述服务器包括:
[0160] 读取模块301,用于读取待确定目标网络账号的地理位置信息,所述地理位置信息 为关注所述目标网络账号的用户所在的位置信息;
[0161 ]获取模块302,用于根据所述读取模块301读取的所述地理位置信息,获取所述目 标网络账号的特征编码参数;
[0162] 接收模块303,用于接收用户网络账号的样本标注参数,并根据所述样本标注参数 W及所述获取模块302获取的所述特征编码参数确定模型训练参数;
[0163] 确定模块304,用于根据所述接收模块303确定的所述模型训练参数W及所述获取 模块302获取的所述特征编码参数,确定所述目标网络账号的实际地理位置信息,所述实际 地理位置信息用于指示所述目标网络账号当前服务的地理范围。
[0164] 本实施例中,读取模块301读取待确定目标网络账号的地理位置信息,所述地理位 置信息为关注所述目标网络账号的用户所在的位置信息,获取模块302根据所述读取模块 301读取的所述地理位置信息,获取所述目标网络账号的特征编码参数,接收模块303接收 用户网络账号的样本标注参数,并根据所述样本标注参数W及所述获取模块302获取的所 述特征编码参数确定模型训练参数,确定模块304根据所述接收模块303确定的所述模型训 练参数W及所述获取模块302获取的所述特征编码参数,确定所述目标网络账号的实际地 理位置信息,所述实际地理位置信息用于指示所述目标网络账号当前服务的地理范围。
[0165] 本发明实施例中,提供了一种位置信息确定的方法,服务器先读取待确定目标网 络账号的地理位置信息,然后根据地理位置信息,获取目标网络账号的特征编码参数,然后 服务器接收用户网络账号的样本标注参数,并根据样本标注参数W及特征编码参数确定模 型训练参数,最后根据模型训练参数W及特征编码参数,确定目标网络账号的实际地理位 置信息,实际地理位置信息用于指示目标网络账号当前服务的地理范围。通过采用上述方 式确定网络账号当前服务的地理范围,可W考虑到关注该网络账号的用户处于动态变化的 情况,能够根据关注该网络账号的用户的地理位置来确定实际地理位置信息,从而大大降 低数据的失真可能性,更有效地提高服务器确定得到网络账号的实际服务信息的准确度。
[0166] 可选地,在上述图6所对应的实施例的基础上,请参阅图7,本发明实施例提供的服 务器的另一实施例中,
[0167] 所述特征编码参数包括归一化向量、规模系数W及峰度系数;
[0168] 所述获取模块302包括:
[0169] 第一计算单元3021,用于根据所述地理位置信息计算所述规模系数;
[0170] 第二计算单元3022,用于根据所述地理位置信息计算所述归一化向量;
[0171] 第=计算单元3023,用于根据所述第二计算单元3022计算的所述归一化向量计算 所述峰度系数。
[0172] 其次,本发明实施例中,举例了说明了目标网络账号的特征编码参数包括了规模 系数、归一化向量W及峰度系数,并且服务器根据地理位置信息计算规模系数W及归一化 向量,再根据归一化相邻计算出峰度系数。采用上述方式提升方案在实际应用中的可行性。
[0173] 可选地,在上述图7所对应的实施例的基础上,请参阅图8,本发明实施例提供的服 务器的另一实施例中,
[0174] 所述第一计算单元3021包括:
[0175] 第一计算子单元30211,用于按照如下方式计算所述规模系数:
[0176]
[0177] 所述Mf表示所述目标网络账号f所述规模系数
[0178] 所述Cfi表示所述目标网络账号f在编号为i区域的人数,其中,Cfi^Cf(W);
[0179]
3于表示所述目标网络账号f在编号为从i=〇到i = n区域中的总人数,n表 示总区域数量。
[0180] 再次,本发明实施例中,服务器可W采用公式计算规模系数,通过公式的计算得到 合理的规模系数,W此提升方案的实用性和可行性。
[0181] 可选地,在上述图8所对应的实施例的基础上,请参阅图9,本发明实施例提供的服 务器的另一实施例中,
[0182] 所述第二计算单元3022包括:
[0183] 笛^^管革苗-9^21,用于按照如下方式计算所述归一化向量:
[0184]
[0185] 所述kfi表示所述目标网络账号f在编号为i区域的人数所对应的归一化值,多个所 述归一化值组成所述归一化向量,所述kfi的取值范围为大于0且小于1。
[0186] 进一步地,本发明实施例中,在得到规模系数的基础上,还可W利用公式计算得到 归一化向量,W此提升服务器计算归一化向量的可行性W及合理性。
[0187] 可选地,在上述图8所对应的实施例的基础上,请参阅图10,本发明实施例提供的 服务器的另一实施例中,
[0188] 所述第=计算单元3023包括:
[0189] 第=计算子单元30231,用于按照如下方式计算所述峰度系数:
[0190]
[0191]
[0192] 所述表示所述目标网络账号f预设的所述归一化向量中所述归一化值的平均 值;
[0193] 所述N表示预设的参数,N的取值范围为大于0且小于等于所述i;
[0194] 所述kfN表不第N个所述归一化向量中的归一化值,所述化fi,kf2,kf3,kf4, . . . ,kfN) 表示所述归一化向量中的一组子归一化向量,所述Sum表示求和运算;
[01%]所述阮的:表示所述目标网络账号f的所述峰度系数,所述峰度系数用于表示分布 睹缓程度;
[0196] 所a 表示关注所述目标网络账号的用户所分布的的四阶矩;
[0197] 所a 表示关注所述目标网络账号的用户所分布的的二阶矩。
[0198] 更进一步地,本发明实施例中,在服务器计算得到规模系数和归一化向量的基础 上,可W利用公式继续计算得到峰度系数,W此提升服务器计算峰度系数的可行性和合理 性。
[0199] 可选地,在上述图6所对应的实施例的基础上,请参阅图11,本发明实施例提供的 服务器的另一实施例中,
[0200] 所述接收模块303包括:
[0201] 接收单元3031,用于接收一组所述用户网络账号;
[0202] 生成单元3032,用于按照地理位置分布类型生成所述接收单元3031接收的所述一 组所述用户网络账号对应的所述样本标注参数。
[0203] 其次,本发明实施例中,服务器在接收一组用户网络账号后,可W按照地理位置分 布类型生成一组用户网络账号对应的样本标注参数。通过上述方式能够灵活地获取到用户 提供的用户网络账号,并生成样本标注参数,如果用户提供的数据足够多,所得到的样本标 注参数也越多,从而使得训练出的模型拟合度越高,从而提升方案的准确度。
[0204] 可选地,在上述图11所对应的实施例的基础上,请参阅图12,本发明实施例提供的 服务器的另一实施例中,
[02化]所述接收模块303包括:
[0206] 分配单元3033,用于按照所述规模系数将所述样本标注参数分配至不同的标注数 据子集合;
[0207] 训练单元3034,用于对所述分配单元3033分配的每个所述标注数据子集合进行模 型训练,并得到所述模型训练的结果;
[0208] 第一确定单元3035,用于根据所述训练单元3034训练得到的所述模型训练的结果 确定所述模型训练参数。
[0209] 再次,本发明实施例中,服务器根据样本标注参数W及特征编码参数确定模型训 练参数,可W是先按照规模系数将样本标注参数分配至不同的标注数据子集合,然后对每 个标注数据子集合进行模型训练,并得到模型训练的结果,最后根据模型训练的结果确定 模型训练参数。通过上述方法,服务器可W针对不同"粉丝"规模的目标网络账号独立进行 训练,W此提高模型分类的准确率。
[0210] 可选地,在上述图11所对应的实施例的基础上,本发明实施例提供的服务器的另 一实施例中,
[0211] 所述标注数据子集合包括标注数据测试集合W及标注数据训练集合;
[0212] 所述标注数据测试集合用于对所述标注数据子集合中的第一标注数据进行迭代 计算;
[0213] 所述标注数据训练集合用于对所述标注数据子集合中的第二标注数据进行模型 训练。
[0214] 进一步地,本发明实施例中,可W将标注数据子集合划分为标注数据测试集合W 及标注数据训练集合,其中,标注数据测试集合用于对标注数据子集合中的第一标注数据 进行迭代计算,标注数据训练集合用于对标注数据子集合中的第二标注数据进行模型训 练。通过上述方式,可W训练出拟合度更高的模型,而且在对标注数据的测试和训练中不断 完善模型,提升模型的动态适应性。
[0215] 可选地,在上述图6至图10中任一项所对应的实施例的基础上,请参阅图13,本发 明实施例提供的服务器的另一实施例中,
[0216] 所述确定模块304包括:
[0217] 输出单元3041,用于根据所述规模系数,将所述目标网络账号的特征编码参数分 配至子分类器中,所述子分类器用于根据所述特征编码参数输出所述目标网络账号的地理 位置属性类别,所述地理位置属性类别包括集中型、局部分散型W及全局分散型中的一种;
[0218] 第二确定单元3042,用于根据所述输出单元输出的所述地理位置属性类别确定所 述目标网络账号的实际地理位置信息。
[0219] 其次,本发明实施例中,服务器根据模型训练参数W及特征编码参数,确定目标网 络账号的实际地理位置信息,具体可W先根据规模系数,将目标网络账号的特征编码参数 分配至子分类器中,子分类器用于根据特征编码参数输出目标网络账号的地理位置属性类 另IJ,地理位置属性类别包括集中型、局部分散型W及全局分散型中的一种,最后根据地理位 置属性类别确定目标网络账号的实际地理位置信息。采用上述方式,具体构建了一个可用 于输出目标网络账号实际地理位置信息的模型,训练模型中的分类器引入了多个子分类 器,充分考虑到了目标网络账号规模的多样性,从数据层面训练出多个子分类器,每个子分 类器只针对某一个规模的目标网络账号,运样的模型能够与训练数据更好地你拟合,提高 模型的识别能力。
[0220] 图14是本发明实施例提供的一种服务器结构示意图,该服务器400可因配置或性 能不同而产生比较大的差异,可W包括一个或一个W上中央处理器(英文全称:central processing units,英文缩写:CPU)422(例如,一个或一个W上处理器)和存储器432,一个 或一个W上存储应用程序442或数据444的存储介质430(例如一个或一个W上海量存储设 备)。其中,存储器432和存储介质430可W是短暂存储或持久存储。存储在存储介质430的程 序可W包括一个或一个W上模块(图示没标出),每个模块可W包括对服务器中的一系列指 令操作。更进一步地,中央处理器422可W设置为与存储介质430通信,在服务器400上执行 存储介质430中的一系列指令操作。
[0221] 服务器400还可W包括一个或一个W上电源426,一个或一个W上有线或无线网络 接口 450, 一个或一个W上输入输出接口 458,和/或,一个或一个W上操作系统441,例如 Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,化eeBSDTM等等。
[0222] 上述实施例中由服务器所执行的步骤可W基于该图14所示的服务器结构。
[0223] 其中,中央处理器422用于,
[0224] 读取待确定目标网络账号的地理位置信息,所述地理位置信息为关注所述目标网 络账号的用户所在的位置信息;
[0225] 根据所述地理位置信息,获取所述目标网络账号的特征编码参数;
[0226] 接收用户网络账号的样本标注参数,并根据所述样本标注参数W及所述特征编码 参数确定模型训练参数;
[0227] 根据所述模型训练参数W及所述特征编码参数,确定所述目标网络账号的实际地 理位置信息,所述实际地理位置信息用于指示所述目标网络账号当前服务的地理范围。
[022引其中,中央处理器422具体用于,
[0229] 根据所述地理位置信息计算所述规模系数;
[0230] 根据所述地理位置信息计算所述归一化向量;
[0231 ]根据所述归一化向量计算所述峰度系数。
[0232] 其中,中央处理器422具体用于,
[0233] 按照如下方式计算所述规模系数:
[0234]
[0235] 所述Mf表示所述目标网络账号f所述规模系数
[0236] 所述Cfi表示所述目标网络账号f在编号为i区域的人数;
[0237]
目于表示所述目标网络账号f在编号为从i=〇到i = n区域中的总人数,n表 示总区域数量。
[0238] 其中,中央处理器422具体用于,
[0239] 肤昭fm下市才A管听述归一化向量;
[0240]
[0241] 所述kfi表示所述目标网络账号f在编号为i区域的人数所对应的归一化值,所述 kfi的取值范围为大于0且小于1。
[0242] 其中,中央处理器422具体用于,
[0243] 按照如下方式计算所述峰度系数:
[0244]
[0245] 、,…i
/
[0246] 所述表示所述目标网络账号f预设的归一化向量平均值;
[0247] 所述N表示预设的参数,N的取值范围为大于0且小于等于所述i;
[024引所述kfN表示第N个所述归一化向量中的归一化值,所述化fi,kf2,kf3,kf4, . . .,kfN) 表示所述归一化向量中的一组子归一化向量;
[0249] 所述1(11的:表示所述目标网络账号f的所述峰度系数,所述峰度系数用于表示分布 睹缓程度;
[0250] 所i 示关注所述目标网络账号的用户所分布的的四阶矩;
[0巧1] 所i ^示关注所述目标网络账号的用户所分布的的二阶矩。
[0252] 其中,中央处理器422具体用于,
[0253] 接收一组所述用户网络账号;
[0254] 按照地理位置分布类型生成所述一组所述用户网络账号对应的所述样本标注参 数。
[0巧5] 其中,中央处理器422具体用于,
[0256] 按照所述峰度系数将所述样本标注参数分配至不同的标注数据子集合;
[0257] 对每个所述标注数据子集合进行模型训练,并得到所述模型训练的结果;
[0258] 根据所述模型训练的结果确定所述模型训练参数。
[0259] 其中,中央处理器422具体用于,
[0260] 根据所述规模系数,将所述目标网络账号的特征编码参数分配至子分类器中,所 述子分类器用于根据所述特征编码参数输出所述目标网络账号的地理位置属性类别,所述 地理位置属性类别包括集中型、局部分散型W及全局分散型中的一种;
[0261] 根据所述地理位置属性类别确定所述目标网络账号的实际地理位置信息。
[0262] 所属领域的技术人员可W清楚地了解到,为描述的方便和简洁,上述描述的系统, 装置和单元的具体工作过程,可W参考前述方法实施例中的对应过程,在此不再寶述。
[0263] 在本申请所提供的几个实施例中,应该理解到,所掲露的系统,装置和方法,可W 通过其它的方式实现。例如,W上所描述的装置实施例仅仅是示意性的,例如,所述单元的 划分,仅仅为一种逻辑功能划分,实际实现时可W有另外的划分方式,例如多个单元或组件 可W结合或者可W集成到另一个系统,或一些特征可W忽略,或不执行。另一点,所显示或 讨论的相互之间的禪合或直接禪合或通信连接可W是通过一些接口,装置或单元的间接禪 合或通信连接,可W是电性,机械或其它的形式。
[0264] 所述作为分离部件说明的单元可W是或者也可W不是物理上分开的,作为单元显 示的部件可W是或者也可W不是物理单元,即可W位于一个地方,或者也可W分布到多个 网络单元上。可W根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目 的。
[0265] 另外,在本发明各个实施例中的各功能单元可W集成在一个处理单元中,也可W 是各个单元单独物理存在,也可W两个或两个W上单元集成在一个单元中。上述集成的单 元既可W采用硬件的形式实现,也可W采用软件功能单元的形式实现。
[0266] 所述集成的单元如果W软件功能单元的形式实现并作为独立的产品销售或使用 时,可W存储在一个计算机可读取存储介质中。基于运样的理解,本发明的技术方案本质上 或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可WW软件产品的形式 体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用W使得一台计算机 设备(可W是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全 部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-化Iy Memory,英文缩写:ROM)、随机存取存储器(英文全称:Random Access Memory,英文缩写: RAM)、磁碟或者光盘等各种可W存储程序代码的介质。
[0267] W上所述,W上实施例仅用W说明本发明的技术方案,而非对其限制;尽管参照前 述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可W对前 述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而运些 修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
【主权项】
1. 一种位置信息确定的方法,其特征在于,包括: 读取待确定目标网络账号的地理位置信息,所述地理位置信息为关注所述目标网络账 号的用户所在的位置信息; 根据所述地理位置信息,获取所述目标网络账号的特征编码参数; 接收用户网络账号的样本标注参数,并根据所述样本标注参数W及所述特征编码参数 确定模型训练参数; 根据所述模型训练参数W及所述特征编码参数,确定所述目标网络账号的实际地理位 置信息,所述实际地理位置信息用于指示所述目标网络账号当前服务的地理范围。2. 根据权利要求1所述的方法,其特征在于,所述特征编码参数包括归一化向量、规模 系数W及峰度系数; 所述根据所述地理位置信息,获取所述目标网络账号的特征编码参数,包括: 根据所述地理位置信息计算所述规模系数; 根据所述地理位置信息计算所述归一化向量; 根据所述归一化向量计算所述峰度系数。3. 根据权利要求2所述的方法,其特征在于,所述根据所述地理位置信息计算所述规模 系数,包括: 按照如下方式计算所述规模系数:所述Mf表示所述目标网络账号f所述规模系数 所述Cf康示所述目标网络账号f在编号为i区域的人数,其中,Cf冷Cf(w);用于表示所述目标网络账号f在编号为从i = 〇到i=n区域中的总人数,η表示总 区域数量。4. 根据权利要求3所述的方法,其特征在于,所述根据所述地理位置信息计算所述归一 化向量,包括: 按照如下方式计算所述归一化向量:所述kfi表示所述目标网络账号f在编号为i区域的人数所对应的归一化值,多个所述归 一化值组成所述归一化向量,所述kfi的取值范围为大于0且小于1。5. 根据权利要求4所述的方法,其特征在于,所述根据所述归一化向量计算所述峰度系 数,包括: 按照如下方式计算所述峰度系数:所述表示所述目标网络账号f预设的所述归一化向量中所述归一化值的平均值; 所述N表示预设的参数,N的取值范围为大于0且小于等于所述i; 所述kfN表不第N个所述归一化向量中的归一化值,所述化fl,kf2,kf3,kf4,...,kfN)表不 所述归一化向量中的一组子归一化向量,所述S皿表示求和运算; 所述阮的:表示所述目标网络账号f的所述峰度系数,所述峰度系数用于表示分布睹缓 程度; 所述表示关注所述目标网络账号的用户所分布的的四阶矩; 所过表示关注所述目标网络账号的用户所分布的的二阶矩。6. 根据权利要求1所述的方法,其特征在于,所述接收用户网络账号的样本标注参数, 包括: 接收一组所述用户网络账号; 按照地理位置分布类型生成所述一组所述用户网络账号对应的所述样本标注参数。7. 根据权利要求6所述的方法,其特征在于,所述根据所述样本标注参数W及所述特征 编码参数确定模型训练参数,包括: 按照所述规模系数将所述样本标注参数分配至不同的标注数据子集合; 对每个所述标注数据子集合进行模型训练,并得到所述模型训练的结果; 根据所述模型训练的结果确定所述模型训练参数。8. 根据权利要求7所述的方法,其特征在于,所述标注数据子集合包括标注数据测试集 合W及标注数据训练集合; 所述标注数据测试集合用于对所述标注数据子集合中的第一标注数据进行迭代计算; 所述标注数据训练集合用于对所述标注数据子集合中的第二标注数据进行模型训练。9. 根据权利要求1至5中任一项所述的方法,其特征在于,所述根据所述模型训练参数 W及所述特征编码参数,确定所述目标网络账号的实际地理位置信息,包括: 根据所述规模系数,将所述目标网络账号的特征编码参数分配至子分类器中,所述子 分类器用于根据所述特征编码参数输出所述目标网络账号的地理位置属性类别,所述地理 位置属性类别包括集中型、局部分散型W及全局分散型中的一种; 根据所述地理位置属性类别确定所述目标网络账号的实际地理位置信息。10. -种服务器,其特征在于,包括: 读取模块,用于读取待确定目标网络账号的地理位置信息,所述地理位置信息为关注 所述目标网络账号的用户所在的位置信息; 获取模块,用于根据所述读取模块读取的所述地理位置信息,获取所述目标网络账号 的特征编码参数; 接收模块,用于接收用户网络账号的样本标注参数,并根据所述样本标注参数W及所 述获取模块获取的所述特征编码参数确定模型训练参数; 确定模块,用于根据所述接收模块确定的所述模型训练参数W及所述获取模块获取的 所述特征编码参数,确定所述目标网络账号的实际地理位置信息,所述实际地理位置信息 用于指示所述目标网络账号当前服务的地理范围。11. 根据权利要求10所述的服务器,其特征在于,所述特征编码参数包括归一化向量、 规模系数W及峰度系数; 所述获取模块包括: 第一计算单元,用于根据所述地理位置信息计算所述规模系数; 第二计算单元,用于根据所述地理位置信息计算所述归一化向量; 第Ξ计算单元,用于根据所述第二计算单元计算的所述归一化向量计算所述峰度系 数。12. 根据权利要求11所述的服务器,其特征在于,所述第一计算单元包括: 第一计算子单元,用于按照如下方式计算所述规模系数:所述Mf表示所述目标网络账号f所述规模系数 所述Cf康示所述目标网络账号f在编号为i区域的人数,其中,Cf冷Cf(w);用于表示所述目标网络账号f在编号为从i = 〇到i=n区域中的总人数,η表示总 区域数量。13. 根据权利要求12所述的服务器,其特征在于,所述第二计算单元包括: 第二计算子单元,用于按照如下方式计算所述归一化向量:所述kfi表示所述目标网络账号f在编号为i区域的人数所对应的归一化值,多个所述归 一化值组成所述归一化向量,所述kfi的取值范围为大于0且小于1。14. 根据权利要求13所述的服务器,其特征在于,所述第Ξ计算单元包括: 第Ξ计算子单元,用于按照如下方式计算所述峰度系数:所述^表示所述目标网络账号f预设的所述归一化向量中所述归一化值的平均值; 所述N表示预设的参数,N的取值范围为大于0且小于等于所述i; 所述kfN表示第N个所述归一化向量中的归一化值,所述化fi,kf2,kf3,kf4, . . .,kfN)表示 所述归一化向量中的一组子归一化向量,所述S皿表示求和运算; 所述1(11^:表示所述目标网络账号f的所述峰度系数,所述峰度系数用于表示分布睹缓 程度; 所述表示关注所述目标网络账号的用户所分布的的四阶矩; 所过g示关注所述目标网络账号的用户所分布的的二阶矩。15. 根据权利要求10所述的服务器,其特征在于,所述接收模块包括: 接收单元,用于接收一组所述用户网络账号; 生成单元,用于按照地理位置分布类型生成所述接收单元接收的所述一组所述用户网 络账号对应的所述样本标注参数。16. 根据权利要求15所述的服务器,其特征在于,所述接收模块包括: 分配单元,用于按照所述规模系数将所述样本标注参数分配至不同的标注数据子集 合; 训练单元,用于对所述分配单元分配的每个所述标注数据子集合进行模型训练,并得 到所述模型训练的结果; 第一确定单元,用于根据所述训练单元训练得到的所述模型训练的结果确定所述模型 训练参数。17. 根据权利要求16所述的服务器,其特征在于,所述标注数据子集合包括标注数据测 试集合W及标注数据训练集合; 所述标注数据测试集合用于对所述标注数据子集合中的第一标注数据进行迭代计算; 所述标注数据训练集合用于对所述标注数据子集合中的第二标注数据进行模型训练。18. 根据权利要求10至14中任一项所述的服务器,其特征在于,所述确定模块包括: 输出单元,用于根据所述规模系数,将所述目标网络账号的特征编码参数分配至子分 类器中,所述子分类器用于根据所述特征编码参数输出所述目标网络账号的地理位置属性 类别,所述地理位置属性类别包括集中型、局部分散型W及全局分散型中的一种; 第二确定单元,用于根据所述输出单元输出的所述地理位置属性类别确定所述目标网 络账号的实际地理位置信息。19. 一种服务器,其特征在于,包括:存储器、收发器、处理器W及总线系统; 其中,所述存储器用于存储程序; 所述处理器用于执行所述存储器中的程序,具体如下步骤: 读取待确定目标网络账号的地理位置信息,所述地理位置信息为关注所述目标网络账 号的用户所在的位置信息; 根据所述地理位置信息,获取所述目标网络账号的特征编码参数; 接收用户网络账号的样本标注参数,并根据所述样本标注参数w及所述特征编码参数 确定模型训练参数; 根据所述模型训练参数W及所述特征编码参数,确定所述目标网络账号的实际地理位 置信息,所述实际地理位置信息用于指示所述目标网络账号当前服务的地理范围。
【文档编号】H04L29/08GK105939383SQ201610438602
【公开日】2016年9月14日
【申请日】2016年6月17日
【发明人】段培, 陈谦, 陈培炫, 郑博
【申请人】腾讯科技(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1