一种确定网络设备的应用场景的方法、装置和计算设备与流程

文档序号:11523941阅读:255来源:国知局
一种确定网络设备的应用场景的方法、装置和计算设备与流程

本发明涉及移动数据挖掘技术领域,尤其涉及一种用于确定网络设备的应用场景的方法、装置和计算设备。



背景技术:

随着移动互联网技术的发展,越来越多的用户将其家庭宽带通过路由器自建家庭wifi热点,家庭成员可将其拥有的移动终端连接至家庭wifi,方便地获取各种信息和服务。

家庭wifi作为家庭用户的连网入口,具有巨大的价值潜力。通过识别家庭wifi和其连接记录,可以进一步探寻该家庭的用户画像、消费偏好、运营商归属等信息,从而为企业制定经营策略提供参考,实现定向推送和精准营销。此外,通过识别家庭wifi,可以洞悉住户的周边状况,对房地产商以及消费者的房地产选址有重要参考意义。

因此,有必要从众多网络中将家庭网络有效识别出来。



技术实现要素:

为此,本发明提供一种确定网络设备的应用场景的方法、装置和计算设备,以判断某网络设备是否为家用网络设备,从而实现家庭网络的识别。

根据本发明的一个方面,提供一种确定网络设备的应用场景的方法,该方法在计算设备中执行,其中,所述网络设备适于由一个或者多个客户端设备连接,以便为所述客户端设备提供互联网接入,所述计算设备适于经由互联网收集所述客户端设备的网络连接信息,所述客户端设备的网络连接信息包括所述客户端设备所连接的网络设备记录以及相应的客户端连接记录,该方法包括:获取在预定时间内与所述网络设备相关的多条客户端连接记录;根据所述多条客户端连接记录确定所述网络设备的特征信息;根据所述特征信息,采用分类器确定所述网络设备的应用场景。

可选地,在根据本发明的确定网络设备的应用场景的方法中,所述应用场景包括家用场景和非家用场景。

可选地,在根据本发明的确定网络设备的应用场景的方法中,网络设备记录包括:网络设备id,网络设备所对应的网络名称,网络设备的位置;客户端连接记录包括:客户端id,客户端所连接的网络设备id,连接时间,连接地点。

可选地,在根据本发明的确定网络设备的应用场景的方法中,网络设备的特征信息包括以下信息中的一项或多项:日平均连接客户端数;周一-周日每一天的日平均连接客户端数;一天内各时间段的平均连接客户端数;重复连接指数。

可选地,在根据本发明的确定网络设备的应用场景的方法中,在确定客户端数时,同一个客户端id仅被计数一次;所述重复连接指数为:客户端连接次数与客户端数的比值。

可选地,在根据本发明的确定网络设备的应用场景的方法中,时间段的长度为3小时。

可选地,在根据本发明的确定网络设备的应用场景的方法中,还包括根据网络设备记录来确定网络设备的应用场景:若网络设备的位置位于居民小区内,则将该网络设备的应用场景标记为家用场景;若网络名称中包括特定关键字,则将该网络设备的应用场景标记为非家用场景。

可选地,在根据本发明的确定网络设备的应用场景的方法中,特定关键字包括hotel、inn、restaurant、mcdonald、酒店、宾馆、商场。

可选地,在根据本发明的确定网络设备的应用场景的方法中,分类器按照以下方法训练:获取多个已确定了应用场景的网络设备的特征信息;定义如下损失函数:

其中,n为已确定了应用场景的网络设备的数目,yi为第i个网络设备的应用场景标签,其取值为1或0,1表示家用场景,0表示非家用场景;xi为第i个网络设备的特征信息向量,所述特征信息向量为由第i个网络设备的特征信息所构成的向量;w和b为待定参数;计算使所述损失函数取得最小值时的最优待定参数值w*、b*。

可选地,在根据本发明的确定网络设备的应用场景的方法中,根据所述特征信息,采用分类器确定所述网络设备的应用场景的步骤包括:按照以下公式计算网络设备的应用场景为家用场景的概率:

其中,x为网络设备的特征信息向量;若p(y=1|x)>0.5,则将网络设备的应用场景标记为家用场景;若p(y=1|x)≤0.5,则将网络设备的应用场景标记为非家用场景。

根据本发明的一个方面,提供一种确定网络设备的应用场景的装置,该装置驻留于计算设备中,其中,所述网络设备适于由一个或者多个客户端设备连接,以便为所述客户端设备提供互联网接入,所述计算设备适于经由互联网收集所述客户端设备的网络连接信息,所述客户端设备的网络连接信息包括所述客户端设备所连接的网络设备记录以及相应的客户端连接记录,该装置包括:数据获取模块,获取在预定时间内与所述网络设备相关的多条客户端连接记录;特征提取模块,根据所述多条客户端连接记录确定所述网络设备的特征信息;场景确定模块,适于根据所述特征信息,采用分类器确定所述网络设备的应用场景。

根据本发明的一个方面,提供一种计算设备,包括如上所述的确定网络设备的应用场景的装置。

根据本发明的技术方案,根据与网络设备相关的多条客户端连接记录确定该网络设备的特征信息,并基于该特征信息,采用分类器确定所述网络设备的应用场景,从而判断该网络设备是否为家用网络设备,即该网络设备所对应的网络是否为家庭网络。

本发明深入考虑了家庭网络的特征,并据此为网络设备设计了多个能够用于判定其应用场景的特征信息,使得应用场景的判断更为准确、高效。

本发明的分类器由已知应用场景的网络设备的特征信息训练而得出,通过该分类器,可以得出网络设备的应用场景为家用场景的概率,并根据该概率来判定网络设备是否应用于家用场景。

除了采用分类器来确定网络设备的应用场景的技术方案之外,还可以根据网络设备记录来确定网络设备的应用场景。例如,当网络设备的位置位于居民小区内时,将网络设备的应用场景标记为家用场景;当网络设备所对应的网络名称包括hotel、inn等特定关键字时,将网络设备的应用场景标记为非家用场景。

附图说明

为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。

图1示出了根据本发明一个实施例的网络系统100的示意图;

图2示出了根据本发明一个实施例的计算设备200的结构图;

图3示出了根据本发明一个实施例的确定网络设备的应用场景的装置300的结构图;

图4示出了根据本发明另一个实施例的确定网络设备的应用场景的装置400的结构图;

图5示出了根据本发明另一个实施例的确定网络设备的应用场景的装置500的结构图;

图6示出了根据本发明一个实施例的确定网络设备的应用场景的方法600的流程图;以及

图7示出了根据本发明另一个实施例的确定网络设备的应用场景的方法700的流程图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

图1示出了根据本发明一个实施例的网络系统100的示意图。图1所示的网络系统100包括计算设备200、数据库、多个网络设备1~n、以及多个客户端设备1-6。应当指出,图1中的网络系统100仅是示例性的,在具体的实践情况中,网络系统100中可以有不同数量的计算设备、数据库、网络设备和客户端设备,本发明对网络系统中所包括的计算设备、数据库、网络设备以及客户端设备的数目不做限制。

网络设备可以是诸如无线路由器、无线网卡等可以创建无线局域网热点的设备,客户端设备可以是诸如手机、平板电脑、笔记本电脑、电视盒子等可以连接无线网络的设备。计算设备200可以实现为服务器,例如文件服务器、数据库服务器、应用程序服务器和web服务器等,也可以实现为包括桌面计算机和笔记本计算机配置的个人计算机。此外,计算设备200还可以实现为小尺寸便携(或者移动)电子设备的一部分,这些电子设备可以是诸如蜂窝电话、个人数字助理(pda)、个人媒体播放器设备、无线网络浏览设备、个人头戴设备、应用专用设备、或者可以包括上面任何功能的混合设备。

图1中,每个网络设备可以由一个或多个客户端设备连接,适于为客户端设备提供互联网接入。例如,网络设备1可以为客户端设备1和2提供网络接入,网络设备2可以为客户端设备3提供网络接入,网络设备n可以为客户端设备4-6提供网络接入。应当指出,网络设备和客户端设备之间的连接关系并不是一成不变的,客户端设备可以在不同的网络设备之间迁移。例如,在图1所示的网络系统100中,客户端设备1与网络设备1相连,但是在其他时刻,客户端设备1也可以与网络设备1断开连接,并连接至网络设备2、网络设备n或图1中未示出的其他网络设备。客户端设备的迁移使得网络设备和客户端设备能够形成一个相互关联的动态网络。

计算设备200可以经由互联网收集客户端设备的网络连接信息,上述客户端设备的网络连接信息包括客户端设备所连接的网络设备记录以及相应的客户端连接记录。

计算设备200可以经由互联网收集客户端连接记录和网络设备记录,并将其存储于数据库中。应当指出,数据库可以作为本地数据库驻留于计算设备200中,也可以作为远程数据库设置于计算设备200之外,本发明对数据库的部署方式不做限制。

根据一种实施例,网络设备记录包括:网络设备id,网络设备所对应的网络名称,网络设备的位置;客户端连接记录包括:客户端id,客户端所连接的网络设备id,连接时间,连接地点。客户端连接记录和网络设备记录可以以键值对的方式存储于关系型数据库中,但是关系型数据库的存储方式将会导致数据记录非常多,查询和处理会非常耗时。此外,关系型数据库的存储方式无法表述客户端连接记录之间、网络设备记录之间、以及客户端连接记录和网络设备记录之间的关系,而实际上,上述关系是非常紧密的。例如,从一个网络设备出发,可以找到连接过该网络设备的客户端,进而又可以找出这些客户端连接过的其他网络设备,以此类推,可以得到一个由庞大的关系网,这个关系网相当于一个无向图,该图的节点即为网络设备,边为客户端连接记录,两点之间有边连接表示存在客户端曾连接过这两点所对应的网络设备。在这种数据记录关系紧密的情况下,一种优选的实施例是采用图数据库,例如graphsql对数据记录进行存储。在图数据库中,节点为网络设备记录,包括网络设备id,网络设备所对应的网络名称,网络设备的位置;边为客户端连接记录,包括客户端id,连接时间,连接地点,另外,应当指出,由于边与点相连,边上所存储的客户端连接记录也相当于包括了客户端所连接的网络设备id。图数据库的存储方式更注重数据记录之间的关系,且能够实现高效的数据查询。参考以上描述,本领域技术人员可以根据实际需要,选择合适的数据库类型,本发明对数据库的类型亦不做限制。

图2示出了根据本发明一个实施例的计算设备200的结构图。在基本配置202中,计算设备200典型地包括系统存储器206和一个或者多个处理器204。存储器总线208可以用于在处理器204和系统存储器206之间的通信。

取决于期望的配置,处理器204可以是任何类型的处理,包括但不限于:微处理器(μp)、微控制器(μc)、数字信息处理器(dsp)或者它们的任何组合。处理器204可以包括诸如一级高速缓存210和二级高速缓存212之类的一个或者多个级别的高速缓存、处理器核心214和寄存器216。示例的处理器核心214可以包括运算逻辑单元(alu)、浮点数单元(fpu)、数字信号处理核心(dsp核心)或者它们的任何组合。示例的存储器控制器218可以与处理器204一起使用,或者在一些实现中,存储器控制器218可以是处理器204的一个内部部分。

取决于期望的配置,系统存储器206可以是任意类型的存储器,包括但不限于:易失性存储器(诸如ram)、非易失性存储器(诸如rom、闪存等)或者它们的任何组合。系统存储器206可以包括操作系统220、一个或者多个应用222以及程序数据224。在一些实施方式中,应用222可以布置为在操作系统上利用程序数据224进行操作。

计算设备200还可以包括有助于从各种接口设备(例如,输出设备242、外设接口244和通信设备246)到基本配置102经由总线/接口控制器230的通信的接口总线240。示例的输出设备242包括图形处理单元248和音频处理单元250。它们可以被配置为有助于经由一个或者多个a/v端口252与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口244可以包括串行接口控制器254和并行接口控制器256,它们可以被配置为有助于经由一个或者多个i/o端口258和诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、触摸输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备246可以包括网络控制器260,其可以被布置为便于经由一个或者多个通信端口264与一个或者多个其他计算设备262通过网络通信链路的通信。

网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块,并且可以包括任何信息递送介质。“调制数据信号”可以这样的信号,它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例,通信介质可以包括诸如有线网络或者专线网络之类的有线介质,以及诸如声音、射频(rf)、微波、红外(ir)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。

在本发明中,计算设备200的应用222中包括确定网络设备的应用场景的装置300。装置300可以作为搜索引擎的一个插件驻留于计算设备200的浏览器中,或作为一个独立的软件安装于计算设备200中,本发明对装置300在计算设备200中的存在形式不做限制。装置300能够获取与网络设备相关的多条客户端连接记录,根据与网络设备相关的多条客户端连接记录确定该网络设备的特征信息,并基于该特征信息,采用分类器确定所述网络设备的应用场景。根据一种实施例,应用场景包括家用场景和非家用场景,即,装置300可以判断某网络设备是否为家用网络设备。

图3示出了根据本发明一个实施例的确定网络设备的应用场景的装置300的结构图。如图3所示,确定网络设备的应用场景的装置300包括数据获取模块310,特征提取模块320和场景确定模块330,其中,场景确定模块330包括分类器332。

数据获取模块310适于获取在预定时间内与网络设备相关的多条客户端连接记录。其中,预定时间可由本领域技术人员根据实际需要自行设置,例如,预定时间可以是1个月,1个季度,等等。根据一种实施例,一条客户端连接记录包括以下信息:客户端id,客户端所连接的网络设备id,连接时间,连接地点。其中,客户端id用于唯一标识一个客户端。

数据获取模块310获取到上述多条客户端连接记录后,将其传递给特征提取模块320,由特征提取模块320根据预定时间内的相关的多条客户端连接记录来确定网络设备的特征信息。

特征信息的设置应该能充分考虑家庭网络的种种特点,例如连接的客户端数目往往是一个固定的比较小的数值,工作日和非工作日的客户端连接情况不一样,一天当中工作时段和非工作时段的客户端连接情况不一样,反复连接情况普遍,等等。根据一种实施例,特征信息可以包括以下信息中的一项或多项:

1)日平均连接客户端数。在统计客户端数时,同一个客户端id仅被计数一次,即在统计客户端数时,同一个客户端不会出现重复计数。客户端数与客户端连接次数是不同的概念,一个客户端可能与网络设备发生多次客户端连接。

2)周一~周日每一天的日平均连接客户端数。这一组相当于有7项特征信息。根据一种实施例,也可以将上述7项特征信息简化为工作日(包括周一~周五)的日平均连接客户端数和周末(包括周六、周日)的日平均连接客户端数两项特征信息。

3)一天内各时间段的平均连接客户端数。时间段的长度可以由本领域技术人员根据实际需要而设置,根据一种实施例,时间段的长度为3小时,这时,一天内各时间段的平均连接客户端数相当于8项特征信息,即0:00~3:00,3:00~6:00,…,21:00~24:00每个时间段中的平均连接客户端数。

4)重复连接指数。根据一种实施例,重复连接指数为客户端连接次数与客户端数的比值。

特征提取模块320确定了网络设备的特征信息后,将该特征信息传递至场景确定模块330,由分类器332来根据网络设备的特征信息来确定网络设备的应用场景。同时,根据一种优选的实施例,特征提取模块320在确定了网络设备的特征信息后,将该特征信息存储至数据库,方便后续使用。

分类器332可以是一个由本领域技术人员自行设置的固定的分类模型,也可以是一个根据已知的应用场景数据所训练出来的模型。本发明对分类器的来源及存在形式不做限制,只要其能够实现网络设备的应用场景分类即可。根据一种实施例,分类器332可以体现为以下公式:

其中,x为由网络设备的特征信息所构成的特征信息向量,p(y=1|x)表示网络设备的应用场景为家用场景的概率,w、b为已知的常数。

分类器332通过公式(1)计算出网络设备的应用场景为家用场景的概率后,可以根据该概率来确定网络设备的应用场景:若p(y=1|x)>0.5,则将网络设备的应用场景标记为家用场景;若p(y=1|x)≤0.5,则将网络设备的应用场景标记为非家用场景。当然,公式(1)所示的分类器仅是示例性的,本领域技术人员也可以采用其他公式来定义分类器,本发明对此不做限制。

根据一种实施例,在确定了网络设备的应用场景后,将该应用场景信息存储至数据库,以便后续使用。

图4示出了根据本发明另一个实施例的确定网络设备的应用场景的装置400的结构图。如图4所示,装置400包括数据获取模块310、特征提取模块320和场景确定模块330,其中,场景确定模块330包括分类器332和简易确定模块334。装置400中的数据获取模块310、特征提取模块320、分类器332的功能和处理逻辑与图3中所示相同,可以参考前述描述,此处不再赘述。

简易确定模块334适于根据网络设备记录来确定网络设备的应用场景。根据一种实施例,网络设备记录包括:网络设备id,网络设备所对应的网络名称,网络设备的位置。其中,网络设备id适于唯一标识一个网络设备,根据一种实施例,网络设备id为网络设备的bssid(basicservicesetidentifier)。

简易确定模块334可以根据网络设备记录直接、简单地确定网络设备的应用场景。例如,若网络设备的位置位于居民小区内(此处在判断网络设备的位置是否位于居民小区内时,需要结合地图数据进行判断,例如可以结合百度地图、高德地图、谷歌地图等地图数据),则将该网络设备的应用场景标记为家用场景。若网络名称中包括特定关键字,则将该网络设备的应用场景标记为非家用场景,根据一种实施例,上述特定关键字包括但不限于hotel、inn、restaurant、mcdonald、酒店、宾馆、商场。当然,简易确定模块334还可以采用其他的方法来确定网络设备的应用场景,本发明对此不做限制。

根据一种实施例,在简易确定模块334确定了网络设备的应用场景后,将该应用场景信息存储至数据库,以便后续使用。

图5示出了根据本发明另一个实施例的确定网络设备的应用场景的装置500的结构图。图5中,数据获取模块310、特征提取模块320的功能和处理逻辑与图3中所示相同,简易确定模块334的功能和处理逻辑与图4中所示相同,关于这些模块的内容可以参考前述描述,此处不再赘述。

图5所示的确定网络设备的应用场景的装置500中还包括分类器训练模块340,适于训练分类器332。根据一种实施例,分类器训练模块340可以按照以下步骤训练分类器:

1)获取多个已确定了应用场景的网络设备的特征信息。此处,对于已确定了应用场景的网络设备,本发明对其应用场景的确定方式不做限制,例如,其应用场景可以有本领域技术人员自行标定,或由简易确定模块334来确定。

2)定义如下损失函数:

其中,n为已确定了应用场景的网络设备的数目,yi为第i个网络设备的应用场景标签,其取值为1或0,1表示家用场景,0表示非家用场景;xi为第i个网络设备的特征信息向量,所述特征信息向量为由第i个网络设备的特征信息所构成的向量;w和b为待定参数。

3)计算使所述损失函数取得最小值时的最优待定参数值w*、b*。本领域技术人员可以自行编写代码求解w*、b*,也可以采用现有的算法包,例如开源并行计算框架spark的机器学习库mllib中的lbfgs算法包来求解,本发明对w*、b*的具体计算过程不做限制。

分类器训练模块340根据以上步骤计算出w*、b*后,分类器332随之确定,分类器332的公式如下:

其中,x为由网络设备的特征信息所构成的特征信息向量,p(y=1|x)表示网络设备的应用场景为家用场景的概率,w*、b*为分类器训练模块340训练得出的最优参数。该公式与公式(1)的区别仅在于常量参数的来源不同。对于该公式,w*、b*为分类器训练模块340训练得出,w*、b*是一个优化结果,而公式(1)中的w、b为本领域技术人员根据经验自行设置。

当然,分类器训练模块340还可以采用除上述公式(2)之外的其他方法来训练分类器,分类器332也可以为除上述公式(3)之外的其他形式,本发明对分类器训练模块340所采用的训练方法、以及训练得出的分类器332的形式不做限制。

分类器332确定后,即可以进行网络设备应用场景的确定,具体的确定过程与图3中所示类似,即按照公式(3)计算网络设备的应用场景为家用场景的概率,若p(y=1|x)>0.5,则将网络设备的应用场景标记为家用场景;若p(y=1|x)≤0.5,则将网络设备的应用场景标记为非家用场景。

根据另一种实施例,分类器训练模块340也可以设置于装置500之外,如图5中的虚线框所示,其功能与处理逻辑与前述设置于装置500之内时的情况相同。

图6示出了根据本发明一个实施例的确定网络设备的应用场景的方法600的流程图。如图6所示,该方法始于步骤s610。

在步骤s610中,获取在预定时间内与网络设备相关的多条客户端连接记录。根据一种实施例,预定时间可由本领域技术人员根据实际需要自行设置,例如,预定时间可以是1个月,1个季度,等等。一条客户端连接记录包括以下信息:客户端id,客户端所连接的网络设备id,连接时间,连接地点。其中,客户端id用于唯一标识一个客户端。

随后,在步骤s620中,根据多条客户连接记录确定网络设备的特征信息。根据一种实施例,网络设备的特征信息包括以下信息中的一项或多项:日平均连接客户端数;周一~周日每一天的日平均连接客户端数;一天内各时间段的平均连接客户端数;重复连接指数。各项信息的具体定义可以参见前述对特征提取模块320的描述,此处不再赘述。

随后,在步骤s630中,根据特征信息,采用分类器确定网络设备的应用场景。本发明对分类器的形式不做限制,只要其能够实现网络设备的应用场景分类即可。根据一种实施例,分类器可以是本领域技术人员自行设置的分类模型,例如公式(1),根据公式(1)可以计算出网络设备的应用场景为家用场景的概率,并可以根据该概率来确定网络设备的应用场景:若p(y=1|x)>0.5,则将网络设备的应用场景标记为家用场景;若p(y=1|x)≤0.5,则将网络设备的应用场景标记为非家用场景。

根据另一种实施例,分类器为根据多个已确定了应用场景的网络设备的特征信息训练而得出。例如,可以定义如公式(2)所示的损失函数,并求得使该损失函数取得最小值时的最优待定参数值w*、b*,根据w*、b*来确定如公式(3)所示的分类器。随后,则可以进一步根据公式(3)来计算网络设备的应用场景为家用场景的概率p(y=1|x),若p(y=1|x)>0.5,则将网络设备的应用场景标记为家用场景;若p(y=1|x)≤0.5,则将网络设备的应用场景标记为非家用场景。

图7示出了根据本发明另一个实施例的确定网络设备的应用场景的方法700的流程图。如图7所示,该方法始于步骤s710。

在步骤s710中,获取网络设备记录和在预定时间内与网络设备相关的多条客户端连接记录。根据一种实施例,网络设备记录包括:网络设备id,网络设备所对应的网络名称,网络设备的位置。其中,网络设备id适于唯一标识一个网络设备,根据一种实施例,网络设备id为网络设备的bssid。客户端连接记录包括:客户端id,客户端所连接的网络设备id,连接时间,连接地点。其中,客户端id用于唯一标识一个客户端。

随后,在步骤s720中,判断根据网络设备记录是否可以确定网络设备的应用场景,若是,则执行步骤s730,若否,则执行步骤s740。

在步骤s730中,根据网络设备记录确定网络设备的应用场景。步骤s730实现的是一套简易的应用场景确定程序,其可以根据网络设备记录直接、简单地确定网络设备的应用场景。根据一种实施例,步骤s730中确定网络设备的应用场景的具体过程可以是:若网络设备的位置位于居民小区内(此处在判断网络设备的位置是否位于居民小区内时,需要结合地图数据进行判断,例如可以结合百度地图、高德地图、谷歌地图等地图数据),则将该网络设备的应用场景标记为家用场景。若网络名称中包括特定关键字,则将该网络设备的应用场景标记为非家用场景,根据一种实施例,上述特定关键字包括但不限于hotel、inn、restaurant、mcdonald、酒店、宾馆、商场。

在步骤s740中,根据多条客户端连接记录确定网络设备的特征信息。

在步骤s750中,根据特征信息,采用分类器确定网络设备的应用场景。步骤s740、s750分别与方法600中的步骤s620、s630相对应,步骤s740、s750的具体过程可以参考前述对步骤s620、s630的描述,此处不再赘述。

方法700与方法600的区别在于,多了一套根据网络设备记录来确定网络设备的应用场景的方案,即相对于方法600来说,添加了步骤s720和s730,同时,在步骤s710所示的数据获取过程中还需要获取网络设备记录。

a6:a4所述的确定网络设备的应用场景的方法,其中,所述时间段的长度为3小时。

a7:a3所述的确定网络设备的应用场景的方法,其中,还包括根据网络设备记录来确定网络设备的应用场景:若所述网络设备的位置位于居民小区内,则将该网络设备的应用场景标记为家用场景;若所述网络名称中包括特定关键字,则将该网络设备的应用场景标记为非家用场景。

a8:a7所述的确定网络设备的应用场景的方法,其中,所述特定关键字包括hotel、inn、restaurant、mcdonald、酒店、宾馆、商场。

a9:a2-8中任一项所述的确定网络设备的应用场景的方法,其中,所述分类器按照以下方法训练:

获取多个已确定了应用场景的网络设备的特征信息;

定义如下损失函数:

其中,n为已确定了应用场景的网络设备的数目,yi为第i个网络设备的应用场景标签,其取值为1或0,1表示家用场景,0表示非家用场景;xi为第i个网络设备的特征信息向量,所述特征信息向量为由第i个网络设备的特征信息所构成的向量;w和b为待定参数;

计算使所述损失函数取得最小值时的最优待定参数值w*、b*。

a10:a9所述的确定网络设备的应用场景的方法,其中,所述根据所述特征信息,采用分类器确定所述网络设备的应用场景的步骤包括:

按照以下公式计算网络设备的应用场景为家用场景的概率:

其中,x为网络设备的特征信息向量;

若p(y=1|x)>0.5,则将网络设备的应用场景标记为家用场景;

若p(y=1|x)≤0.5,则将网络设备的应用场景标记为非家用场景。

b15:b14所述的确定网络设备的应用场景的装置,其中,所述特征提取模块在确定客户端数时,同一个客户端id仅被计数一次;所述重复连接指数为:客户端连接次数与客户端数的比值。

b16:b14所述的确定网络设备的应用场景的装置,其中,所述时间段的长度为3小时。

b17:b13所述的确定网络设备的应用场景的装置,其中,所述数据获取模块还适于获取网络设备记录,所述场景确定模块中还包括简易确定模块,适于根据网络设备记录来确定网络设备的应用场景:若所述网络设备的位置位于居民小区内,则将该网络设备的应用场景标记为家用场景;若所述网络名称中包括特定关键字,则将该网络设备的应用场景标记为非家用场景。

b18:b17所述的确定网络设备的应用场景的装置,其中,所述特定关键字包括hotel、inn、restaurant、mcdonald、酒店、宾馆、商场。

b19:b12-18中任一项所述的确定网络设备的应用场景的装置,其中,还包括分类器训练模块,适于按照以下步骤训练所述分类器:

获取多个已确定了应用场景的网络设备的特征信息;

定义如下损失函数:

其中,n为已确定了应用场景的网络设备的数目,yi为第i个网络设备的应用场景标签,其取值为1或0,1表示家用场景,0表示非家用场景;xi为第i个网络设备的特征信息向量,所述特征信息向量为由第i个网络设备的特征信息所构成的向量;w和b为待定参数;

计算使所述损失函数取得最小值时的最优待定参数值w*、b*。

b20:b19所述的确定网络设备的应用场景的装置,其中,所述场景确定模块适于按照以下步骤确定所述网络设备的应用场景:

按照以下公式计算网络设备的应用场景为家用场景的概率:

其中,x为网络设备的特征信息向量;

若p(y=1|x)>0.5,则将网络设备的应用场景标记为家用场景;

若p(y=1|x)≤0.5,则将网络设备的应用场景标记为非家用场景。

在此处所提供的说明书中,算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与本发明的示例一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。

如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。

尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1