基于流量分析识别用户行为对象的方法和装置与流程

文档序号:11143333阅读:216来源:国知局
基于流量分析识别用户行为对象的方法和装置与制造工艺
本发明实施例涉及流量识别技术,尤其涉及一种基于流量分析识别用户行为对象的方法和装置。
背景技术
:近年来,数据业务呈现爆炸式的增长,对用户的数据流进行识别则是运营商进行网络管理和服务优化的重要研究内容。目前,数据流识别主要是采用机器学习的方法来实现,具体为:根据数据流中包含的用户上网日志和用户网络通信数据包等,分析数据流的持续时长、端口号、包长和时间间隔等统计特征,并根据统计特征对数据流进行分类识别,从而研究用户的兴趣偏好,例如,针对端口号的分布,采用信息熵特征和数据挖掘技术对多种数据流进行分类识别;或者,通过考察数据流的持续时长和时间间隔的相关系数对语音流量进行分类识别等。但是,对于经过端口地址转换、隐私保护等技术处理过的数据流,运营商无法通过分析用户网络通信数据包来获取数据流的统计特征,即运营商无法通过数据流识别来研究用户的兴趣偏好,导致运营商不能根据用户的兴趣偏好为用户提供数据业务,严重影响了数据业务的服务质量。技术实现要素:本发明实施例提供一种基于流量分析识别用户行为对象的方法和装置,使得运营商可以根据行为对象研究用户的兴趣偏好,从而根据用户的兴趣偏好为用户提供数据业务,提高数据业务的服务质量。第一方面,本发明实施例提供一种基于流量分析识别用户行为对象的方法,包括:获取用户数据流中的上网日志;根据预设的用户知识库,识别所述上网日志对应的上网行为,并对所述上网日志进行语义化标注,得到标注后的上网日志;其中,所述标注后的上网日志包括用户标识、上网时间、行 为名称和行为对象;根据所述标注后的上网日志中的上网时间和行为名称,确定所述标注后的上网日志中的第一日志和第二日志为关联事件;其中,所述第二日志对应的行为对象为空;根据所述关联事件生成中间事件,所述中间事件包括所述用户标识、所述第二日志对应的上网时间和所述第一日志对应的行为对象。其中,用户数据流为运营商服务器获取到的用户的移动终端的数据流,用户知识库中包括URL的解析规则、关键字符串与行为ID之间的对应关系、行为ID与行为名称之间的对应关系、关键字符串与行为对象之间的对应关系等,上网日志对应的上网行为至少包括行为名称和行为对象,语义化标注指的是为上网日志的上网行为打标签,关联事件为行为之间具有必然联系、且连续发生的多个事件,行为对象为空指的是根据用户知识库无法获取到该上网日志对应的行为对象,中间事件用于研究用户的偏好信息。本实施例提供的基于流量分析识别用户行为对象的方法,根据用户数据流中的上网日志识别用户的行为和行为对象,便于运营商根据行为对象研究用户的兴趣偏好,从而根据用户的兴趣偏好为用户提供数据业务,提高数据业务的服务质量。结合第一方面,在第一方面的第一种可能实现方式中,所述根据所述标注后的上网日志中的上网时间和行为名称,确定所述标注后的上网日志中的第一日志和第二日志为关联事件,具体为:根据所述第二日志对应的行为名称,确定所述第二日志为关键事件;根据所述第一日志对应的上网时间和所述第二日志对应的上网时间,确定所述第一日志和所述第二日志为连续产生的上网日志。在本实施例中,关键事件为用于决定用户偏好的事件,运营商服务器确定关键事件后,再确定第一日志和第二日志为连续产生的上网日志,从而找出关联事件,由于关联事件中的行为对象为空,根据第一日志和第二日志之间的关联关系可以推测出关键事件中的行为对象,从而可以根据关键事件的行为对象研究用户偏好,为用户提供感兴趣的数据业务,方便用户及时获取所需的信息。结合第一方面或第一方面的第一种可能实现方式,在第一方面的第二种可能实现方式中,所述预设的用户知识库包括URL解析规则库、行为知识库和对象知识库;所述根据预设的用户知识库,识别所述上网日志对应的上网行为,并对所述上网日志进行语义化标注,得到标注后的上网日 志,具体为:根据所述URL解析规则库,解析所述上网日志,识别所述上网日志对应的上网行为;根据所述上网日志对应的上网行为和所述行为知识库,确定所述上网日志对应的行为名称;根据所述上网日志对应的上网行为和和对象知识库,确定所述上网日志对应的行为对象;将确定的行为名称和行为对象,添加到所述上网日志中生成所述标注后的上网日志。其中,URL解析库用于存储URL的解析规则,解析规则具体包括不同的关键字符串与不同的行为ID或者行为对象类别之间的对应关系;行为知识库包括行为ID与行为名称之间的对应关系,用于识别上网日志对应的行为名称;对象知识库包括关键字符串与行为对象之间的对应关系,用于识别上网日志对应的行为对象。在本实施例中,根据用户知识库中的URL解析规则库、行为知识库和对象知识库对上网日志中的关键字符串进行解析,确定上网日志对应的用户的行为和行为对象,处理过程简单精确,有利于运营商快速准确的获取用户的偏好信息,为用户提供更佳的数据业务。结合第一方面的任一种可能实现方式,在第一方面的第三种可能实现方式中,所述上网日志为商务类上网日志。结合第一方面的第三种可能实现方式,在第一方面的第四种可能实现方式中,所述第一日志对应的行为名称为浏览,所述第二日志对应的行为名称为加入购物车或者提交订单。可选地,结合第一方面的任一种可能实现方式,在第一方面的第五种可能实现方式中,所述根据预设的用户知识库,识别所述上网日志对应的上网行为,并对所述上网日志进行语义化标注,得到标注后的上网日志之后,所述方法还包括:根据所述标注后的上网日中对应的行为名称,从所述标注后的上网日志中提取目标事件;则所述根据所述标注后的上网日志中的上网时间和行为名称,确定所述标注后的上网日志中的第一日志和第二日志为关联事件,具体为:根据所述标注后的上网日志中的上网时间和行为名称,确定目标事件中的第一日志和第二日志为关联事件。在本实施例中,目标事件为各行为之间相关联、且能决定用户偏好的多个事件,从标注后的上网日志中提取目标事件,仅对目标事件进行分析,能更快速度的确定关联事件,有效提高了识别用户行为对象的效率。可选地,结合第一方面的第五种可能实现方式,在第一方面的第六种可能实现方式中,所述从所述标注后的上网日志中提取目标事件之后,所述方法还包括:将预设时间周期内的所述用户数据流划分多个数据流分段,其中,每个数据流分段均以关键事件作为数据流的终点。在本实施例中,以关键事件为特征为用户数据流进行划分,相当于对用户数据流近似”归类”的作用,方便对用户数据流进行管理。第二方面,本发明实施例提供一种基于流量分析识别用户行为对象的装置,包括:获取模块,用于获取用户数据流中的上网日志;识别模块,用于根据预设的用户知识库,识别所述上网日志对应的上网行为,并对所述上网日志进行语义化标注,得到标注后的上网日志;其中,所述标注后的上网日志包括用户标识、上网时间、行为名称和行为对象;确定模块,用于根据所述标注后的上网日志中的上网时间和行为名称,确定所述标注后的上网日志中的第一日志和第二日志为关联事件;其中,所述第二日志对应的行为对象为空;生成模块,用于根据所述关联事件生成中间事件,所述中间事件包括所述用户标识、所述第二日志对应的上网时间和所述第一日志对应的行为对象。本实施例的装置用于执行第一方面提供的基于流量分析识别用户行为对象的方法,其实现原理和有益效果类似,此处不再赘述。结合第二方面,在第二方面的第一种可能实现方式中,所述确定模块具体用于根据所述第二日志对应的行为名称,确定所述第二日志为关键事件;并根据所述第一日志对应的上网时间和所述第二日志对应的上网时间,确定所述第一日志和所述第二日志为连续产生的上网日志。本实施例中,确定模块的用于执行第一方面的第一种可能实现方式提供的方法,其实现原理和有益效果类似,此处不再赘述。结合第二方面或第二方面的第一种可能实现方式,在第二方面的第二种可能实现方式中,所述预设的用户知识库包括URL解析规则库、行为知识库和对象知识库;所述识别模块具体用于根据所述URL解析规则库,解析所述上网日志,识别所述上网日志对应的上网行为;根据所述上网日志对应的的上网行为和所述行为知识库,确定所述上网日志对应的行为名称;根据所述上网日志对应的上网行为和和对象知识库,确定所述上网日志对应的行为对象;将确定的行为名称和行为对象,添加到所述上网日志中生成所述标注后 的上网日志。本实施例的装置用于执行第一方面的第二种可能实现方式提供的方法,其实现原理和有益效果类似,此处不再赘述。结合第二方面的任一种可能实现方式,在第二方面的第三种可能实现方式中,所述上网日志为商务类上网日志。结合第二方面的第三种可能实现方式,在第二方面的第四种可能实现方式中,所述第一日志对应的行为名称为浏览,所述第二日志对应的行为名称为加入购物车或者提交订单。可选地,结合第二方面的任一种可能实现方式,在第二方面的第五种可能实现方式中,所述确定模块还用于根据所述标注后的上网日中对应的行为名称,从所述标注后的上网日志中提取目标事件;并根据所述标注后的上网日志中的上网时间和行为名称,确定所述目标事件中的第一日志和第二日志为关联事件。本实施例的装置用于执行第一方面的第五种可能实现方式提供的方法,其实现原理和有益效果类似,此处不再赘述。可选地,结合第二方面的第五种可能实现方式,在第二方面的第六种可能实现方式中,所述确定模块还用于将预设时间周期内的所述用户数据流划分多个数据流分段,其中,每个数据流分段均以关键事件作为数据流的终点。本实施例的装置用于执行第一方面的第六种可能实现方式提供的方法,其实现原理和有益效果类似,此处不再赘述。第三方面,本发明实施例提供一种服务器,包括存储器,用于存储计算机可执行程序代码;收发器,以及处理器,与所述存储器和所述收发器耦合;其中所述程序代码包括指令,当所述处理器执行所述指令时,所述指令使所述网元执行以下操作:获取用户数据流中的上网日志;根据预设的用户知识库,识别所述上网日志对应的上网行为,并对所述上网日志进行语义化标注,得到标注后的上网日志;其中,所述标注后的上网日志包括用户标识、上网时间、行为名称和行为对象;根据所述标注后的上网日志中的上网时间和行为名称,确定所述标注后的上网日志中的第一日志和第二日志为关联事件;其中,所述第二日志对应的行为对象为空;根据所述关联事件生成中间事件,所述中间事件包括所述用户标识、所述第二日志对应的上网时间和所述第一日志对应的行为对象。所述存储器用于存储所述用户知识库和所述中间事件。本实施例的服务 器用于执行第一方面提供的基于流量分析识别用户行为对象的方法,其实现原理和有益效果类似,此处不再赘述。第四方面,本发明的实施例提供一种存储指令的非瞬时计算机可读介质,所述指令可由一个或多个处理器执行以完成以下操作:获取用户数据流中的上网日志;根据预设的用户知识库,识别所述上网日志对应的上网行为,并对所述上网日志进行语义化标注,得到标注后的上网日志;其中,所述标注后的上网日志包括用户标识、上网时间、行为名称和行为对象;根据所述标注后的上网日志中的上网时间和行为名称,确定所述标注后的上网日志中的第一日志和第二日志为关联事件;其中,所述第二日志对应的行为对象为空;根据所述关联事件生成中间事件,所述中间事件包括所述用户标识、所述第二日志对应的上网时间和所述第一日志对应的行为对象。所述存储器用于存储所述用户知识库和所述中间事件。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本发明实施例提供的基于流量分析识别用户行为对象的方法的应用场景示意图;图2为本发明实施例一提供的基于流量分析识别用户行为对象的方法的流程图;图3为本发明实施例二提供的基于流量分析识别用户行为对象的方法的流程图;图4为本发明实施例三提供的基于流量分析识别用户行为对象的装置结构示意图;图5为本发明实施例五提供的服务器的结构示意图。具体实施方式为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。图1为本发明实施例提供的基于流量分析识别用户行为对象的方法的应用场景示意图。如图1所示,该场景包括数据源1、大数据中心2和行为分析,其中,行为分析可以包括时空行为分析3、通信行为分析4和互联网行为分析5等,互联网行为分析可以包括商务类行为分析6、社交类行为分析7等。数据源1为运营商获取到的用户的移动终端的数据流,例如,移动运营商通过服务GPRS支持节点(ServingGPRSSupportNode,简称SGSN,其中,GPRS为通用分组无线服务技术,英文全称为GeneralPacketRadioService)与SGSN之间、以及SGSN与网关GPRS支持节点(GatewayGPRSSupportNode,简称GGSN)之间的Gn接口获取到的用户的移动终端的数据流。大数据中心2为运营商数据的集中管理控制中心,将数据源1中的数据经过加工处理,进行相关数据的汇总和存储。行为分析是对大数据中心2中经过汇总的相关数据进行分析,获取用户的相关信息,例如,获取用户的兴趣偏好信息等,后续向用户的移动终端APP推送一些用户感兴趣的信息。本发明提供的基于流量分析识别用户行为对象的方法主要针对用户的商务类行为进行分析,从而研究用户的偏好,该方法也可以用于分析用户的其它行为,例如,社交类行为等,本发明中并不以此为限。图2为本发明实施例一提供的基于流量分析识别用户行为对象的方法的流程图。本实施例的执行主体可以为运营商服务器,如图2所示,该方法包括以下步骤:步骤101、获取用户数据流中的上网日志。在本实施例中,用户数据流为运营商服务器获取到的用户的移动终端的数据流,例如,移动用户A的手机上淘宝APP的上网日志。表1为本发明提供的一种上网日志的结构。如表1所示,上网日志可以包括用户标识、统一资源定位符(UniformResourceLocator,简称URL)、Header(UA)、访问时间、CellID、流量、时长等信息,其中,用户标识可以为用户的电话号码、 登录名称等可以标识用户的信息;URL为用户的移动终端访问的网站的地址;Header(UA)为上网日志的标头,标头(header)是服务器以超文本传输协议(HyperTextTransferProtocol,简称HTTP)协义传输超级文本标记语言(HyperTextMarkupLanguage,简称HTML)数据到浏览器前所送出的字串,Header(UA)中的UA为用户代理,Header(UA)函数中包括用户使用的浏览器信息,具体可以包括硬件平台、系统软件、应用软件等信息;CellID表示为用户的移动终端提供服务的小区标识,通过CellID可以定位出用户的移动终端所在的位置;流量为用户的移动终端访问该网站时所使用的流量信息,访问时间为访问网站的起始时间,时长表示用户的移动终端停留在该网站的持续时间,根据访问时间和时长可以确定该上网日志的起始时间和结束时间。表1用户标识URLHeader(UA)访问时间CellID流量时长步骤102、根据预设的用户知识库,识别上网日志对应的上网行为,并对上网日志进行语义化标注,得到标注后的上网日志;其中,标注后的上网日志包括用户标识、上网时间、行为名称和行为对象。在本实施例中,用户知识库中包括URL的解析规则、关键字符串与行为ID之间的对应关系、行为ID与行为名称之间的对应关系、关键字符串与行为对象之间的对应关系等。具体的,用户知识库可以包括URL解析规则库、对象知识库、媒体知识库、行为知识库;其中,URL解析规则库用于表征URL的解析规则,例如,根据关键字符串解析出用户的行为ID、行为对象的类别、媒体工具的类别等,由于URL规则解析库解析出的是行为ID、行为对象类别、媒体工具类别,因此,需要进一步的根据对象知识库、行为知识库、媒体知识库对用户的行为名称、具体的行为对象和媒体工具进行识别。对象知识库用于对用户的行为对象进行识别,例如,识别出行为对象为女装、手机、奶粉等;媒体知识库用于对用户使用的媒体工具进行识别,例如,识别出用户使用淘宝APP;行为知识库用于对用户的行为名称进行识别,例如,识别出用户的行为名称为登录、搜索、浏览、加入购物车等。需要说明的是,本实施例中,还可以根据需求在用户知识库中添加其他的知识库,本发明中并不以此为限。在本实施例中,上网日志对应的上网行为至少包括行为名称和行为对象,例如,用户上淘宝搜索手机,则该上网日志对应的上网行为中的行为名称为搜索,行为对象为手机。语义化标注指的是为上网日志的上网行为打标签,例如,若根据用户知识库识别出上网日志对应的行为ID为10002,则行为ID对应的语义化标注为搜索商品。下面以用户在网上购物为例,详细说明步骤102的方案。表2为本实施例提供的一则上网日志,表2中仅示出了表1所示的上网日志中的用户标识、访问时间和URL,其中,用户标识为用户的电话号码。表3为本实施例提供的一则标注后的上网日志。如表2所示,该上网日志中包括用户的电话号码、访问该网站的访问时间、时长和URL,其中,URL中的黑色字体为关键字符串,根据用户知识库中的URL规则解析库对该关键字符串进行解析,识别出该上网日志对应的上网行为,例如,根据search.**.com可以解析出用户的行为名称为搜索,根据iphone6s可以获得行为对象为iphone6s手机,如表3所示,标注后的上网日志包括用户的手机号码、访问时间(为了便于说明,将访问时间和时长等价替换成起始时间和结束时间,下同)、行为名称和行为对象。表2表3可选地,在本实施例中,标注后的上网日中还可以包括预分类、用户位置、APP等信息,其中,预分类用于对用户的行为对象进行归类,例如,该用户关注的为母音用品、数码产品等,用户位置用于表示用户的移动终端所在的位置,APP包括用户使用的客户端、浏览器等信息。步骤103、根据标注后的上网日志中的上网时间和行为名称,确定标注后的上网日志中的第一日志和第二日志为关联事件;其中,第二日志对应的行为对象为空。在本实施例中,如表3所示,上网时间包括起始时间和结束时间。关联事件为行为之间具有必然联系、且连续发生的多个事件,行为对象为空指的是根据用户知识库无法获取到该上网日志对应的行为对象,由于数据隐私保护,上网日志中的URL中用于解析行为对象的关键字符串会缺失,因此,该上网日志对应的行为对象为空。表4为本实施例提供的一组标注后的上网日志。如表4所示,按照时间顺序将这4个标注后的上网日志分别标记为事件1、事件2、事件3和事件4,根据网上购物的特点,用户在加入购物车之前一定先浏览商品,因此,浏览商品与加入购物车之间具有必然联系,并且,事件3和事件4为两个连续发生的事件,因此,事件3和事件4为关联事件,其中,由于经过数据加密,无法根据上网日志识别出加入购物车的行为对象。表4步骤104、根据关联事件生成中间事件,中间事件包括用户标识、第二日志对应的上网时间和第一日志对应的行为对象。在本实施例中,中间事件用于研究用户的偏好信息,根据中间事件,可以研究用户在某个时期的兴趣偏好,从而后续为用户推送相关的信息。例如,如表4所示,第一日志为事件3,第二日志为事件4,则该中间事件中的用户标识为电话号码15300000123,上网时间为2014111020:05:04-2014111020:07:08,行为对象为iphone6s,则根据该中间事件可知用户在2014年11月10日关注了iphone6s手机,后续可以为该用户的电话号码为15300000123的手机上的淘宝、京东等购物类APP推送有关iphone6s手机的相关信息。本实施例提供的基于流量分析识别用户行为对象的方法,运营商服务器获取用户数据流中的日志,根据预设的用户知识库,识别上网日志对应的上网行为,并对上网日志进行语义化标注,得到包括用户标识、上网时间、行为名称和行为对象的标注后的上网日志,根据标注后的上网日志中的上网时间和行为名称,确定标注后的上网日志中的第一日志和第二日志为关联事件,再根据关联事件生成中间事件,使得运营商通过分析中间事件中的行为对象,研究用户的兴趣偏好,并根据用户的兴趣偏好为用户提供数据业务,从而提高数据业务的服务质量。图3为本发明实施例二提供的基于流量分析识别用户行为对象的方法的流程图。图3为图2所示实施例的一种具体实现方式,主要涉及图2所示实施例中的步骤102和步骤103的具体实现方式,如图3所示,该方法包括以下步骤:步骤201、获取用户数据流中的上网日志。在本实施例中,步骤201和图2所示实施例中的步骤101的实现原理相同,此处不再赘述。可选地,上网日志为商务类上网日志。在本实施例中,可以对用户数据流中的上网日志进行筛选,获取用户数据流中的商务类上网日志,例如,可以筛选出用户A的手机上淘宝、天猫、京东等APP的上网日志,从而针对用户的商务类上网日志进行分析。可选地,在本实施例中,预设的用户知识库包括URL解析规则库、行为知识库和对象知识库;则图2所示实施例中的步骤102的具体实现方法包括 步骤202至步骤205。步骤202、根据URL解析规则库,解析上网日志,识别上网日志对应的上网行为。在本实施例中,URL解析库用于存储URL的解析规则,该解析规则具体可以包括不同的关键字符串与不同的行为ID或者行为对象类别之间的对应关系。以表2为例,可以基于http://、?、&等特殊标识来识别关键字符串,根据URL解析库解析关键字符串search.**.com可以获得对应的行为ID为10001,解析关键字符串mobileSearch可以获知对应的行为对象类别为手机等。步骤203、根据上网日志对应的上网行为和行为知识库,确定上网日志对应的行为名称。在本实施例中,该行为知识库中保存了行为ID与行为名称之间的对应关系,用于识别上网日志对应的行为名称,表5为本发明提供的一种商务类行为知识库。参照表2和表5,根据表2中的URL中的关键字符串search.**.com解析出的行为ID为10001,则根据行为知识库确定该上网日志对应的行为名称为登录。表5步骤204、根据上网日志的上网行为和和对象知识库,确定上网日志对应的行为对象。在本实施例中,对象知识库用于识别上网日志对应的具体的行为对象,由于根据URL规则解析库识别出行为对象的预分类,还需要根据对 象知识库进一步地识别用户关注的具体的商品信息。例如,URL解析库识别出用户关注商品的类别为手机、母婴产品、食品等,在表2所示的上网日志中,URL规则解析库通过关键字符串mobileSearch识别出用户关注的商品类别为手机,对象知识库根据iphone6s识别出用户搜索的商品具体为iphone6s手机。步骤205、将确定的行为名称和行为对象,添加到上网日志中生成标注后的上网日志。在本实施例中,根据确定的行为名称和行为对象对上网日志进行语义化标注,形成标注后的上网日志,标注后的上网日志的形式如表4所示。可选地,图2所示实施例中的步骤103的实现方法可以包括步骤206和步骤207。步骤206、根据第二日志对应的行为名称,确定第二日志为关键事件。在本实施例中,关键事件为用于决定用户偏好的事件,例如,用户在网上购物时,如果将某件商品加入购物车或者提交订单,则说明用户需要或者喜欢这件商品,因此,根据加入购物车或者提交订单对应的商品信息可以确定用户的偏好。步骤207、根据第一日志对应的上网时间和第二日志对应的上网时间,确定第一日志和第二日志为连续产生的上网日志。在本实施例中,确定关联事件不仅包括确定关键事件,还需要确定第一日志和第二日志为连续产生的上网日志。如表4所示,确定加入购物车对应的标注后的上网日志为关键事件之后,根据标注后的上网日志的时间,可知,第三条标注后的上网日志和第四条标注后的上网日志为两条连续产生的上网日志,因此,第三条标注后的上网日志和第四条标注后的上网日志为关联事件。可选地,若以网上购物为例,由于在加入购物车或者提交订单之前,用户必然先进行浏览,查看商品信息,则在本实施例中,第一日志对应的行为名称为浏览,第二日志对应的行为名称为加入购物车或者提交订单。步骤208、根据关联事件生成中间事件,中间事件包括用户标识、第二日志对应的上网时间和第一日志对应的行为对象。在本实施例中,步骤208的方法实现原理与图2所示实施例中的步骤104 的方法实现原理相同,此处不再赘述。本实施例提供的基于流量分析识别用户行为对象的方法,运营商服务器获取用户数据流中的日志,根据URL解析规则库,解析上网日志,识别上网日志对应的上网行为,并根据上网日志对应的上网行为、行为知识库、对象知识库分别确定上网日志对应的行为名称和行为对象,将确定的行为名称和行为对象,添加到上网日志中,生成标注后的上网日志,并根据标注后的上网日志中第二日志对应的行为名称,确定第二日志为关键事件,根据第一日志对应的上网时间和第二日志对应的上网时间,且确定第一日志和第二日志为连续产生的上网日志,从而确定第一日志和第二日志为关联事件,根据关联事件生成中间事件,使得运营商通过分析中间事件中的行为对象,研究用户的兴趣偏好,并根据用户的兴趣偏好为用户提供数据业务,从而提高数据业务的服务质量。可选地,在上述图2或图3所示实施例的基础上,得到标注后的上网日志之后,还可以包括:根据上网日志对应的行为名称,从标注后的上网日志中提取目标事件,则根据标注后的上网日志中的上网时间和行为名称,确定标注后的上网日志中的第一日志和第二日志为关联事件,具体为:根据标注后的上网日志中的上网时间和行为名称,确定目标事件中的第一日志和第二日志为关联事件。在本实施例中,目标事件为各行为之间相关联、且能决定用户偏好的多个事件。例如,以网上购物为例,目标事件可以包括搜索商品、浏览商品、加入购物车、提交订单、确认收货等事件,从而仅对目标事件进行分析,能更快速度的确定关联事件,提高识别用户行为对象的效率。可选地,从标注后的上网日志中提取目标事件之后,还可以包括:将预设时间周期内的用户数据流划分多个数据流分段,其中,每个数据流分段均以关键事件作为数据流的终点。在本实施例中,可以以加入购物车、提交订单等关键事件作为每个数据流的终点,将一天的用户数据流划分为多个数据流,这样划分出来的每段数据流可以看作分别以加入购物车、提交订单等事件为特征的数据段,最终起到对数据流近似”归类”的作用,方便对用户数据流进行管理。图4为本发明实施例三提供的基于流量分析识别用户行为对象的装置结 构示意图。如图4所示,该装置包括获取模块11、识别模块12、确定模块13和生成模块14。获取模块11用于获取用户数据流中的上网日志。识别模块12用于根据预设的用户知识库,识别上网日志对应的上网行为,并对上网日志进行语义化标注,得到标注后的上网日志;其中,标注后的上网日志包括用户标识、上网时间、行为名称和行为对象。确定模块13用于根据标注后的上网日志中的上网时间和行为名称,确定标注后的上网日志中的第一日志和第二日志为关联事件;其中,第二日志对应的行为对象为空。生成模块14用于根据关联事件生成中间事件,中间事件包括用户标识、第二日志对应的上网时间和第一日志对应的行为对象。本实施例的装置,可以用于执行图2所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。在图4所示实施例的基础上,在本发明实施例四提供的基于流量分析识别用户行为对象的装置中,确定模块13具体用于根据第二日志对应的行为名称,确定第二日志为关键事件;并根据第一日志对应的上网时间和第二日志对应的上网时间,确定第一日志和第二日志为连续产生的上网日志。可选地,预设的用户知识库包括URL解析规则库、行为知识库和对象知识库。识别模块12具体用于根据URL解析规则库,解析上网日志,识别上网日志对应的上网行为;根据上网日志对应的的上网行为和行为知识库,确定上网日志对应的行为名称;根据上网日志对应的上网行为和和对象知识库,确定上网日志对应的行为对象;将确定的行为名称和行为对象,添加到上网日志中生成标注后的上网日志。可选地,上网日志为商务类上网日志。可选地,第一日志对应的行为名称为浏览,第二日志对应的行为名称为加入购物车或者提交订单。本实施例的装置,可以用于执行图3所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。图5为本发明实施例五提供的服务器的结构示意图。所述服务器包含一个或多个端口508,与收发器(transceiver)506相耦合。收发器506可以是发射器,接收器或其组合,从其他网络节点通过端口508发送或接收数据包。处理器502耦合到收发器506,用于处理数据包。处理器502可包含一个或多 个多核处理器和/或存储器504。处理器502可以是一个通用处理器,专用集成电路(applicationspecificintegratedcircuit,ASIC),或数字信号处理器(DSP)。存储器504可为非瞬时性的存储介质,与处理器502相耦合,用于保存不同类型的数据。存储器504可包含只读存储器(readonlymemory,ROM),随机存取存储器(randomaccessmemory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是磁盘存储器。存储器504可用于保存实现图2或图3所述相关方法的指令。另一个实施例中,服务器包括存储器504,处理器502和收发器506以及与收发器耦合的一个或多个端口508。存储器504,用于存储计算机可执行程序代码;处理器502与所述存储器504和所述收发器506耦合;其中所述程序代码包括指令,当所述处理器执行所述指令时,所述指令使所述网元执行以下操作:获取用户数据流中的上网日志;根据预设的用户知识库,识别所述上网日志对应的上网行为,并对所述上网日志进行语义化标注,得到标注后的上网日志;其中,所述标注后的上网日志包括用户标识、上网时间、行为名称和行为对象;根据所述标注后的上网日志中的上网时间和行为名称,确定所述标注后的上网日志中的第一日志和第二日志为关联事件;其中,所述第二日志对应的行为对象为空;根据所述关联事件生成中间事件,所述中间事件包括所述用户标识、所述第二日志对应的上网时间和所述第一日志对应的行为对象。本实施例的服务,可以用于执行图2或3所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:只读存储器(Read-OnlyMemory,简称ROM)、随机存取存储器(randomaccessmemory,简称RAM)、磁碟或者光盘等各种可以存储程序代码的介质。最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对 其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1