移动上网用户分类方法及装置与流程

文档序号:12271502阅读:218来源:国知局
移动上网用户分类方法及装置与流程

本发明涉及移动上网数据分析领域,具体而言,涉及一种移动上网用户分类方法及装置。



背景技术:

移动上网数据是体现用户属性的重要数据,其中包含用户的终端、消费能力、位置信息、上网业务偏好等营销关键信息,通过运营商自有业务与用户属性进行匹配,筛选出目标营销用户,可以帮助运营商进行业务、产品进行精确匹配,精选运营渠道,实现运营商端到端业务内容的精细化运营。

传统的用户分类方法中,对用户数据的采集手段复杂,采集数据不全面,不能获得用户准确的上网数据,无法做到对用户属性的准确定位。



技术实现要素:

为了克服现有技术中的上述不足,本发明所要解决的技术问题是提供一种移动上网用户分类方法及装置。

就方法而言,本发明提供了一种移动上网用户分类方法,应用于与多个用户终端数据及移动上网服务的运营服务器连接的数据分析设备,所述方法包括:

从所述用户终端获取用户的上网原始信令数据。

解析所述上网原始信令数据,获得用户的上网行为,所述上网行为包括上网所用的终端、上网位置、上网所用应用软件、网页操作行为类型、浏览内容类型、联网网络类型或上网用户身份。

根据用户所述上网行为中打开的网站的归属领域、上网所用应用程序的归属领域、用户对网页的操作行为或对所述应用程序的操作行为,得到该上网行为的分类标签。

通过网络爬虫爬取用户在所述上网行为中打开网页的内容,获取并保存所述网页的内容中与所述分类标签相关的数据信息。

统计指定时间段内所述上网行为的分类标签及与该分类标签相关的数据信息,获得上网行为统计结果,根据所述上网行为统计结果及用户的个人信息,为该用户指定对应的用户属性标签,其中所述个人信息包括用户的上网位置信息、用户上网所用终端的设备信息及用户注册的身份信息。

进一步地,在上述方法中,所述解析所述上网原始信令数据,获得用户的执行的上网行为的步骤包括:

采用深度包检测技术对所述上网原始信令数据的进行解析,获得移动终端用户上网访问的URL地址。

对所述URL地址进行分类及深度分析,从所述URL地址获得关键字段。

根据所述关键字段的内容在预设的网页内容规则库中匹配相应的用户操作或网页内容,对所述网页内容规则库中包括所述用户操作或网页内容与所述关键字段的对应关系。

根据所述用户操作或网页内容,结合所述上网原始信令数据中的用户信息,获得用户的上网行为。

进一步地,在上述方法中,根据用户所述上网行为中打开的网站的归属领域、上网所用应用程序的归属领域、用户对网页的操作行为或对所述应用程序的操作行为,得到该上网行为的分类标签的步骤包括:

根据所述上网行为中用户打开的网站的归属领域或上网所用应用程序的归属领域,为该上网行为指定第一分类标签。

根据所述上网行为中用户打开的网站子页或应用程序子页,为该上网行为指定所述第一分类标签下的第二分类标签。

根据所述上网行为中用户对网页的操作行为或对所述应用程序的操作行为,为该上网行为指定所述第二分类标签下的第三分类标签。

进一步地,在上述方法中,所述用户对网页的操作行为或对所述应用程序的操作行为包括:

用户输入的文本和/或图片信息。

用户对网页内容的收藏或关注操作。

用户对网页文本或图片或声音或视频的浏览操作。

用户对网页连接或网页控件的操作。

进一步地,在上述方法中,所述方法还包括:

根据所述用户属性标签为用户推送相应的服务或咨询内容。

就装置而言,本发明提供一种移动上网用户分类装置,所述装置包括:

上网原始信令数据获取模块,用于从所述用户终端获取用户的上网原始信令数据。

上网行为解析模块,用于解析所述上网原始信令数据,获得用户的上网行为,所述上网行为包括上网所用的终端、上网位置、上网所用应用软件、网页操作行为类型、浏览内容类型、联网网络类型或上网用户身份。

分类标签指定模块,用于根据用户所述上网行为中打开的网站的归属领域、上网所用应用程序的归属领域、用户对网页的操作行为或对所述应用程序的操作行为,得到该上网行为的分类标签。

具体浏览信息获取模块,用于通过网络爬虫爬取用户所述上网行为中链接网页中的具体数据信息,获取并保存所述具体数据信息中与所述类标签相关的具体浏览信息。

用户标签指定模块,用于统计指定时间类用户上网行为中的所述分类标签、具体浏览信息及用户个人数据,根据统计结果为该用户指定对应的用户属性标签。

进一步地,在上述装置中,所述上网行为解析模块包括:

深度包检测子模块,用于采用深度包检测技术对所述上网原始信令数据的进行解析,获得移动终端用户上网访问的URL地址。

URL地址深度分析子模块,用于对所述URL地址进行分类及深度分析,从所述URL地址获得关键字段。

网页匹配子模块,用于根据所述关键字段的内容在预设的网页内容规则库中匹配相应的用户操作或网页内容,对所述网页内容规则库中包括所述用户操作或网页内容与所述关键字段的对应关系。

内容分析子模块,用于根据所述用户操作或网页内容,结合所述上网原始信令数据中的用户信息,获得用户的上网行为。

进一步地,在上述装置中,所述分类标签指定模块包括:

第一分类标签指定子模块,用于根据所述上网行为中用户链接的网站或使用的应用程序的归属领域,为该上网行为指定第一分类标签。

第二分类标签指定子模块,用于根据所述上网行为中用户链接的网站子页或应用程序子页,为该上网行为指定所述第一分类标签下的第二分类标签。

第三分类标签指定子模块,用于根据所述上网行为中用户在网站或应用程序中执行的操作动作,为该上网行为指定所述第二分类标签下的第三分类标签。

进一步地,在上述装置中,所述第三分类标签指定模块中用户在网站或应用程序中执行的操作动作包括:

用户输入的文本和/或图片信息。

用户对网页内容的收藏或关注操作。

用户对网页文本或图片或声音或视频的浏览操作。

用户对网页连接或网页控件的操作。

进一步地,在上述装置中,所述装置还包括:

推送模块,用于根据所述用户属性标签为用户推送相应的服务或咨询内容。

相对于现有技术而言,本发明具有以下有益效果:

本发明提供的一种移动上网用户分类方法及装置,通过对用户所述上网原始信令数据的解析获得用户的所述上网行为,并根据用户的所述上网行为获得上网行为的分类标签及与该分类标签相关的数据信息,统计用户所述分类标签及与该分类标签相关的数据信息,并结合用户个人信息为该用户指定对应的用户属性标签。如此,对用户上网数据的进行全面地分析统计,使得获得的用户属性标签更加准确客观。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本发明实施例提供的数据分析设备交互示意图;

图2为本发明实施例提供的数据分析设备结构框图;

图3为本发明实施例提供的移动上网用户分类方法流程示意图;

图4为本发明步骤S120子步骤流程示意图;

图5为本发明步骤S130子步骤流程示意图;

图6为本发明实施例提供的移动上网用户分类装置的一种结构框图;

图7为本发明实施例提供的移动上网用户分类装置的另一种结构框图。

图标:100-数据分析设备;110-上网用户分类装置;111-上网原始信令数据获取模块;112-上网行为解析模块;113-分类标签指定模块;114-具体浏览信息获取模块;115-用户标签指定模块;116-推送模块;120-存储器;130-处理器;200-用户终端;300-运营商服务器;400-网络;1121-深度包检测子模块;1122-URL地址深度分析子模块;1123-网页匹配子模块;1124-内容分析子模块;1131-第一分类标签指定子模块;1132-第二分类标签指定子模块;1133-第三分类标签指定子模块。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。

因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

在本发明的描述中,需要说明的是术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

本实施例提供的一种移动大数据解析方法及装置应用于对移动终端用户的上网行为进行大数据分析的数据分析设备100上。请参照图1,图1为所述数据分析设备100通过网络400与用户终端200及运营商服务器300的交互示意图。

请参照图2,图1所示的数据分析设备100的结构框图。所述数据分析设备100包括移动上网用户分类装置110、存储器120、处理器130。

所述存储器120、处理器130及各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述移动上网用户分类装置110包括至少一个可以软件或固件(firmware)的形式存储于所述存储器120中或固化在所述数据分析设备100的操作系统(operating system,OS)中的软件功能模块。所述处理器130用于执行所述存储器120中存储的可执行模块,例如所述移动上网用户分类装置110所包括的软件功能模块及计算机程序等。

其中,所述存储器120可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器120用于存储程序,所述处理器130在接收到执行指令后,执行所述程序。

请参考图3,图3位本实施例提供的应用于图2所述数据分析设备100的一种移动上网用户分类方法,所述方法包括以下步骤。

步骤S110,获取用户的上网原始信令数据。

具体地,在本实施例中,所述上网原始信令数据包括用户使用的移动上网终端与移动上网服务运营商通信服务器之间交互的原始数据。

步骤S120,解析所述上网原始信令数据,获得用户的上网行为,所述上网行为包括上网所用的终端、上网位置、上网所用应用软件、网页操作行为类型、浏览内容类型、联网网络类型或上网用户身份。

具体地,请参照图4,在本实施例中,步骤S120可以包括以下子步骤。

子步骤S121,采用深度包检测技术对所述上网原始信令数据的进行解析,获得移动终端用户上网访问的URL地址。

具体地,在本实施例中,通过深度包检测(Deep Packet Inspection,DPI)技术对所述上网原始信令数据的进行解析。深度包检测技术是在传统的IP数据包检测技术,即在OSI第二层至第四层之间包含的数据包元素的检测分析的基础上,增加了对应用层数据的协议识别、数据包内容检测及深度解码。

子步骤S122,对所述URL地址进行分类及深度分析,从所述URL地址获得关键字段。

URL地址中包含多个字段,其中一些字段包含该URL地址对应网页中的内容。如,用户在网页中执行搜索动作时,链接的URL地址中包含含义为“搜索”的搜索命令关键字段,及用户搜索内容的关键字段。所述数据分析设备100对用户链接的URL地址进行分类及深度分析,提取URL地址中的关键字段,及各关键字段的关联关系。

子步骤S123,根据所述关键字段的内容在预设的网页内容规则库中匹配相应的用户操作或网页内容,对所述网页内容规则库中包括所述用户操作或网页内容与所述关键字段的对应关系。

子步骤S124,根据所述用户操作或网页内容,结合所述上网原始信令数据中的用户信息,获得用户的上网行为。

步骤S130,根据用户所述上网行为中打开的网站的归属领域、上网所用应用程序的归属领域、用户对网页的操作行为或对所述应用程序的操作行为,得到该上网行为的分类标签。

具体地,请参照图5,在本实施列中,步骤S130可以包括以下子步骤。

子步骤S131,根据所述上网行为中用户打开的网站的归属领域或上网所用应用程序的归属领域,为该上网行为指定第一分类标签。

在本实施列中,所述数据分析设备100通过解析用户打开网站的网址及上网所用的应用程序,根据所述网站及应用程序的归属领域判断用户的关注领域,所述第一分类标签包括,但不仅限于,新闻实事、金融保险、汽车地产、旅游出行、生活服务、网络400游戏、即时通信、在线教育、手机阅读、音乐视频、体育娱乐、科技军事、电子商务、电子支付等。

子步骤S132,根据所述上网行为中用户打开的网站子页或应用程序子页,为该上网行为指定所述第一分类标签下的第二分类标签。

在本实施列中,所述分析设备通过解析用户打开的网站子页的类型或打开的应用程序子页的类型,进一步判断细化用户关注的领域,将该上网行为指定所述第一分类标签下的第二分类标签。如,用户打开音乐类网站,则为该上网行为指定第一分类标签为“音乐视频”,用户打开网站中;流行乐子页或子栏目,则所述数据分析设备100将该上网动作指定为所述第一分类标签“音乐视频”标签下的第二分类标签“流行乐”。

子步骤S133,根据所述上网行为中用户对网页的操作行为或对所述应用程序的操作行为,为该上网行为指定所述第二分类标签下的第三分类标签。

在本实施例中,所述数据分析设备100识别用户所述上网行为中执行的操作,进一步判断细化用户的关注领域,该上网行为指定所述第二分类标签下的第三分类标签。其中,所述用户对网页的操作行为或对所述应用程序的操作行为包括:用户输入的文本和/或图片信息;用户对网页内容的收藏或关注操作;用户对网页文本或图片或声音或视频的浏览操作;用户对网页连接或网页控件的操作。如,在子步骤S132的基础上,用户在流行乐网页下搜索或收听或收藏了XXX歌手的歌曲或专辑,则所述数据分析设备100将该上网行为执行未第二分类标签“流行乐”的第三分类标签“XXX歌手”。

步骤S140,通过网络爬虫爬取用户在所述上网行为中打开网页的内容,获取并保存所述网页的内容中与所述分类标签相关的数据信息。

在本实施例中,所述数据分析设备100获得用户连接的URL地址,通过网络400爬虫对所述URL地址对应的网页内容进行爬取,获取网页内容中与所述分类标签相关的数据信息。如,用户上网在“房产汽车”网页中,打开了“汽车”子网页,并进行了搜索操作,搜索“YYY品牌汽车的价格”,所述数据分析设备100获得用户搜索结果中与“YYY品牌汽车的价格”对应数据位“ZZZ万元”。则所述数据分析设备100将“ZZZZ万元”作为与所述第一分类标签“房产汽车”、所述第二分类标签“汽车”、所述第三分类标签“YYY品牌汽车的价格”对应的相关的数据信息并保存。

步骤S150,统计指定时间段内所述上网行为的分类标签及与该分类标签相关的数据信息,获得上网行为统计结果,根据所述上网行为统计结果及用户的个人信息,为该用户指定对应的用户属性标签,其中所述个人信息包括用户的上网位置信息、用户上网所用终端的设备信息及用户注册的身份信息。

在本实施例中,统计一定时间段内所述上网行为的分类标签及与该分类标签相关的数据信息,获得上网行为统计结果,并从移动数据服务运营商处获得用户的个人信息。根据所述上网行为统计结果及用户个人信息判断用户属于哪个群体。如,统计用户在1个月内有多次分类标签为“房产汽车”、“汽车”及“YYY品牌汽车的价格”的上网行为,且统计到与该分类标签对应的数据信息为“100万元”,则所述数据分析设备100将该用户的用户属性标签指定为“高端汽车消费用户”。

值得说明的是,上述分类标签的名称或类型仅为解释本实施例实施方案的举例的一种实施方式,并不构成对分类标签名称或类型的限定,在本实施例其他实施方式中,也可以采用其他不同的分类标签名称或类型。

进一步地,在本实施例中,实施方法还可以包括以下步骤。

根据所述用户属性标签为用户推送相应的服务或资讯内容。

在本实施例中,所述数据分析设备100还可根据所述用户属性标签为用户推送响应的内容,如,用户分类标签为“体育爱好者”则为用户推送体育类的新闻。

请参照图6,实施例还提供一种移动上网用户分类装置110,所述装置包括:

上网原始信令数据获取模块111,用于从所述用户终端200获取用户的上网原始信令数据;

上网行为解析模块112,用于解析所述上网原始信令数据,获得用户的上网行为,所述上网行为包括上网所用的终端、上网位置、上网所用应用软件、网页操作行为类型、浏览内容类型、联网网络400类型或上网用户身份;

分类标签指定模块113,用于根据用户所述上网行为中打开的网站的归属领域、上网所用应用程序的归属领域、用户对网页的操作行为或对所述应用程序的操作行为,得到该上网行为的分类标签;

具体浏览信息获取模块114,用于通过网络400爬虫爬取用户所述上网行为中链接网页中的具体数据信息,获取并保存所述具体数据信息中与所述类标签相关的具体浏览信息;

用户标签指定模块115,用于统计指定时间类用户上网行为中的所述分类标签、具体浏览信息及用户个人数据,根据统计结果为该用户指定对应的用户属性标签。

进一步地,请参照图7,所述上网行为解析模块112包括:

深度包检测子模块1121,用于采用深度包检测技术对所述上网原始信令数据的进行解析,获得移动终端用户上网访问的URL地址;

URL地址深度分析子模块1122,用于对所述URL地址进行分类及深度分析,从所述URL地址获得关键字段;

网页匹配子模块1123,用于根据所述关键字段的内容在预设的网页内容规则库中匹配相应的用户操作或网页内容,对所述网页内容规则库中包括所述用户操作或网页内容与所述关键字段的对应关系;

内容分析子模块1124,用于根据所述用户操作或网页内容,结合所述上网原始信令数据中的用户信息,获得用户的上网行为。

进一步地,请再次参照图7,所述分类标签指定模块113包括:

第一分类标签指定子模块1131,用于根据所述上网行为中用户链接的网站或使用的应用程序的归属领域,为该上网行为指定第一分类标签;

第二分类标签指定子模块1132,用于根据所述上网行为中用户链接的网站子页或应用程序子页,为该上网行为指定所述第一分类标签下的第二分类标签;

第三分类标签指定子模块1133,用于根据所述上网行为中用户在网站或应用程序中执行的操作动作,为该上网行为指定所述第二分类标签下的第三分类标签。

进一步地,所述第三分类标签指定模块113中用户在网站或应用程序中执行的操作动作包括:

用户输入的文本和/或图片信息;

用户对网页内容的收藏或关注操作;

用户对网页文本或图片或声音或视频的浏览操作;

用户对网页连接或网页控件的操作。

进一步地,请再次参照图7,所述装置还包括:

推送模块116,用于根据所述用户属性标签为用户推送相应的服务或咨询内容。

综上所述,本发明提供的一种移动上网用户分类方法及装置,通过对用户所述上网原始信令数据的解析获得用户的所述上网行为,并根据用户的所述上网行为获得上网行为的分类标签及与该分类标签相关的数据信息,统计用户所述分类标签及与该分类标签相关的数据信息,并结合用户个人信息为该用户指定对应的用户属性标签。如此,对用户上网数据的进行全面地分析统计,使得获得的用户属性标签更加准确客观。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1