一种基于用户行为关联分析的信息推荐方法及装置的制作方法

文档序号:6375460阅读:247来源:国知局
专利名称:一种基于用户行为关联分析的信息推荐方法及装置的制作方法
技术领域
本申请涉及信息推荐的技术领域,特别是涉及一种基于用户行为关联分析的信息推荐方法和一种基于用户行为关联分析的信息推荐装置。
背景技术
随着因特网的日益壮大,网络用户也越来越多。通常情况下,用户在点击网页或在搜索引擎下搜索某个关键字的时候,会产生相关的网络报文。一般而言,一些大型网站会根据用户访问行为所产生的网络报文进行关联分析。例如,用户在访问某大型门户网站时,看到网页上有某个比较感兴趣的话题,于是
打开此链接,这样的用户访问行为都会被该网站的服务器捕捉到,即该网站的服务器会记录该用户的这些访问信息;或如,当用户访问某个大型搜索引擎时,此网站的服务器会记录用户的搜索信息和点击信息。通过对用户的这些网站访问信息进行关联分析,可以获得用户在该网站上行为,分析该用户在该网站上的上网习惯,从而可以对用户的上网行为进行关联分析。用户行为分析,是指在获得网站访问量基本数据的情况下,对有关数据进行统计、分析,从中发现用户访问网站的规律,并为用户推荐用户个性化的信息。现有技术中,网络用户访问网站信息只能通过单个网站获得,即传统的用户行为关联分析主要基于单个网站服务器的网络报文信息,由于不同服务器之间跨系统通信的难度,现有技术无法对用户进行全方位的行为信息关联分析,从而无法获得准确的用户行为关联分析,无法为用户推荐个性化的信息。因此,目前需要本领域技术人员迫切解决的一个技术问题就是提出一种基于用户行为关联分析的信息推荐机制,以获取用户的全方位上网行为,提高用户行为关联分析的准确性,从而为用户推荐个性化的信息。

发明内容
本申请所要解决的技术问题是提供一种基于用户行为关联分析的信息推荐方法和装置,用以对不同服务器之间跨系统网络报文进行用户行为分析,以提高用户行为关联分析的准确性,进而为用户推荐个性化的信息。为了解决上述问题,本申请公开了一种基于用户行为关联分析的信息推荐方法,包括获取跨网网络报文,所述跨网网络报文为从预先部署的多个网关中获取的网络报文;从所述跨网网络报文中提取用户行为信息,其中,所述用户行为信息包括用户标识;根据所述用户行为信息计算所述用户标识对应的行为之间的关联信息;针对用户的某一行为信息,返回从其用户标识对应的行为之间的关联信息中提取的关联的相应行为信息。优选地,所述用户行为信息包括第一用户行为信息和第二用户行为信息。优选地,所述用户标识对应的行为之间的关联信息包括用户标识对应的与所述第二用户行为信息关联的第一用户行为信息;所述根据用户行为信息计算所述用户标识对应的行为之间的关联信息的步骤包括分别获取所述第一用户行为信息的发生时间和第二用户行为信息的发生时间;按照所述用户标识分别组织对应的第一用户行为信息及发生时间,以及,对应的第二用户行为信息及发生时间;依据发生时间组织关联的第一用户行为信息和第二用户行为信息,并计算所述关联的第一用户行为信息与第二用户行为信息的出现频次;根据所述关联的第一用户行为信息和第二用户行为信息的出现频次,统计如下信息第二用户行为信息的出现频次;第一用户行为信息和第二用户行为信息同时出现的频次;所述第一用户行为信息和第二用户行为信息同时出现的频次与第二用户行为信息出现频次的比例;根据所述第一用户行为信息和第二用户行为信息同时出现的频次与第二用户行为信息出现频次的比例,获取用户标识对应的与所述第二用户行为信息关联的第一用户行为信息。优选地,所述针对用户的某一行为信息返回从其用户标识对应的行为之间的关联信息中提取的关联的相应行为信息的步骤包括按照所述第一用户行为信息和第二用户行为信息同时出现的频次与第二用户行为信息出现频次的比例从大到小排序,提取排序在前的N个与所述第二用户行为信息关联的第一用户行为信息,所述N为正整数;针对用户的第二用户行为信息,返回所述提取的第一用户行为信息。优选地,所述用户标识对应的行为之间的关联信息包括用户标识对应的与所述第二用户行为信息关联的第一用户行为信息;所述根据用户行为信息计算所述用户标识对应的行为之间的关联信息的步骤包括分别获取所述第一用户行为信息的发生时间和第二用户行为信息的发生时间;按照所述用户标识分别组织对应的第一用户行为信息及发生时间,以及,对应的第二用户行为信息及发生时间;依据发生时间组织关联的第一用户行为信息和第二用户行为信息,并计算所述关联的第一用户行为信息与第二用户行为信息的出现频次;根据所述关联的第一用户行为信息和第二用户行为信息的出现频次,统计如下信息第二用户行为信息的出现频次;第一用户行为信息和第二用户行为信息同时出现的频次;
所述第一用户行为信息和第二用户行为信息同时出现的频次与第二用户行为信息出现频次的比例;根据所述第一用户行为信息和第二用户行为信息同时出现的频次与第二用户行为信息出现频次的比例,获取用户标识对应的与所述第二用户行为信息关联的第一用户行为信息;按照所述第一用户行为信息和第二用户行为信息同时出现的频次与第二用户行为信息出现频次的比例从大到小排序,提取排序在前的N个与所述第二用户行为信息关联的第一用户行为信息,所述N为正整数。优选地,所述针对用户的某一行为信息返回从其用户标识对应的行为之间的关联信息中提取的关联的相应行为信息的步骤包括针对用户的第二用户行为信息,返回从其用户标识对应的与所述第二用户行为信息关联的第一用户行为信息中,提取的第一用户行为信息。优选地,所述第一用户行为信息还包括用户标识所对应的访问网站信息,所述第二用户行为信息还包括用户标识所对应的搜索关键词信息;或者,所述第一用户行为信息还包括用户标识所对应的点击广告信息,所述第二用户行为信息还包括用户标识所对应的访问网站信息;或者,所述第一用户行为信息还包括用户标识所对应的第一访问网站信息,所述第二用户行为信息还包括用户标识所对应的第二访问网站信息。本申请实施例还公开了一种基于用户行为关联分析的信息推荐装置,包括如下模块跨网网络报文获取模块,用于获取跨网网络报文,所述跨网网络报文为从预先部署的多个网关中获取的网络报文;用户行为信息提取模块,用于从所述跨网网络报文中提取用户行为信息,其中,所述用户行为信息包括用户标识;关联信息计算模块,用于根据所述用户行为信息计算所述用户标识对应的行为之间的关联信息;关联信息返回模块,用于针对用户的某一行为信息,返回从其用户标识对应的行为之间的关联信息中提取的关联的相应行为信息。优选地,所述用户行为信息包括第一用户行为信息和第二用户行为信息。优选地,所述第一用户行为信息还包括用户标识所对应的访问网站信息,所述第二用户行为信息还包括用户标识所对应的搜索关键词信息;或者,所述第一用户行为信息还包括用户标识所对应的点击广告信息,所述第二用户行为信息还包括用户标识所对应的访问网站信息;或者,所述第一用户行为信息还包括用户标识所对应的第一访问网站信息,所述第二用户行为信息还包括用户标识所对应的第二访问网站信息。
与现有技术相比,本申请包括以下优点本申请通过在多个地理位置部署多个网关以获得用户在这些地方上网的网络报文,得到用户全方位的上网行为,再根据用户的上网行为对其进行关联分析,计算两种行为之间的相关程度,得到准确有序的用户标识对应的行为之间的关联信息,从而为用户提供准确的行为推荐信息。


图I是本申请的一种基于用户行为关联分析的信息推荐方法实施例I的步骤流程图;图2是本申请的一种基于用户行 为关联分析的信息推荐方法实施例2的步骤流程图;图3是本申请的一种基于用户行为关联分析的信息推荐方法实施例3的步骤流程图;图4是本申请的一种基于用户行为关联分析的信息推荐装置实施例I的结构框图;图5是本申请的一种基于用户行为关联分析的信息推荐装置实施例5的结构框图。
具体实施例方式为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式
对本申请作进一步详细的说明。本申请实施例通过在多个地理位置部署多个网关以获得用户在这些地方上网的网络报文,得到用户全方位的上网行为,再根据用户的上网行为对其进行关联分析,从而为用户提供准确的推荐信息。参考图I示出了一种基于用户行为关联分析的信息推荐方法实施例I的步骤流程图,具体可以包括以下步骤步骤101、获取跨网网络报文,所述跨网网络报文为从预先部署的多个网关中获取的网络报文;步骤102、从所述跨网网络报文中提取用户行为信息;其中,所述用户行为信息中可以包括用户标识;作为本实施例的一种优选示例,所述用户行为信息包括第一用户行为信息和第二用户行为信息。步骤103、根据所述用户行为信息计算所述用户标识对应的行为之间的关联信息;其中,所述用户标识对应的行为之间的关联信息包括用户标识对应的与所述第二用户行为信息关联的第一用户行为信息;在本申请的一种优选实施中,所述步骤103可以包括如下子步骤子步骤Sll :分别获取所述第一用户行为信息的发生时间和第二用户行为信息的发生时间;
子步骤S12 :按照所述用户标识分别组织对应的第一用户行为信息及发生时间,以及,对应的第二用户行为信息及发生时间;子步骤S13 :依据发生时间组织关联的第一用户行为信息和第二用户行为信息,并计算所述关联的第一用户行为信息与第二用户行为信息的出现频次;子步骤S14:根据所述关联的第一用户行为信息与第二用户行为信息的出现频次,统计如下信息第二用户行为信息的出现频次;第一用户行为信息和第二用户行为信息同时出现的频次;所述第一用户行为信息和第二用户行为信息同时出现的频次与第二用户行为信息出现频次的比例;子步骤S15 :根据所述第一用户行为信息和第二用户行为信息同时出现的频次与第二用户行为信息出现频次的比例,获取用户标识对应的与所述第二用户行为信息关联的第一用户行为信息。步骤104 :针对用户的某一行为信息,返回从其用户标识对应的行为之间的关联信息中提取的关联的相应行为信息。在本申请的一种优选实施例中,所述步骤104可以包括如下子步骤子步骤S21 :按照所述第一用户行为信息和第二用户行为信息同时出现的频次与第二用户行为信息出现频次的比例从大到小排序,提取排序在前的N个与所述第二用户行为信息关联的第一用户行为信息,所述N为正整数;子步骤S22 :针对用户的第二用户行为信息,返回所述提取的第一用户行为信息。本实施例通过在多个地理位置部署多个网关来获取用户的跨网网络报文,从跨网网络报文中提取用户的行为信息并计算用户标识对应的两个行为之间的关联信息,以此来提高用户行为关联分析的准确性;针对用户的某一行为信息,返回从其用户标识对应的行为之间的关联信息中提取的关联的相应行为信息的步骤中,首先会对两个行为之间的关联信息进行排序,从而为用户推荐个性化的信息。参考图2示出了一种基于用户行为关联分析的信息推荐方法实施例2的步骤流程图,具体可以包括以下步骤步骤201、获取跨网网络报文,所述跨网网络报文为从预先部署的多个网关中获取的网络报文;步骤202、从所述跨网网络报文中提取用户行为信息;其中,所述用户行为信息中可以包括用户标识;作为本实施例的一种优选示例,所述用户行为信息包括第一用户行为信息和第二用户行为信息。步骤203、根据所述用户行为信息计算所述用户标识对应的行为之间的关联信息;在本申请的一种优选实施中,所述用户标识对应的行为之间的关联信息可以包括用户标识对应的与所述第二用户行为信息关联的第一用户行为信息,在这种情况下,所述步骤203可以包括如下子步骤子步骤S31 :分别获取所述第一用户行为信息的发生时间和第二用户行为信息的发生时间;子步骤S32 :按照所述用户标识分别组织对应的第一用户行为信息及发生时间,以及,对应的第二用户行为信息及发生时间;子步骤S33 :依据发生时间组织关联的第一用户行为信息和第二用户行为信息,并计算所述关联的第一用户行为信息与第二用户行为信息的出现频次;子步骤S34:根据所述关联的第一用户行为信息与第二用户行为信息的出现频次,统计如下信息第二用户行为信息的出现频次;第一用户行为信息和第二用户行为信息同时出现的频次;所述第一用户行为信息和第二用户行为信息同时出现的频次与第二用户行为信息出现频次的比例;子步骤S35 :根据所述第一用户行为信息和第二用户行为信息同时出现的频次与第二用户行为信息出现频次的比例,获取用户标识对应的与所述第二用户行为信息关联的第一用户行为信息;子步骤S36 :按照所述第一用户行为信息和第二用户行为信息同时出现的频次与第二用户行为信息出现频次的比例从大到小排序,提取排序在前的N个与所述第二用户行为信息关联的第一用户行为信息,所述N为正整数。步骤204 :针对用户的某一行为信息返回从其用户标识对应的行为之间的关联信息中提取的关联的相应行为信息。在本申请的一种优选实施例中,所述步骤204可以包括如下子步骤子步骤S41 :针对用户的第二用户行为信息,返回从其用户标识对应的与所述第二用户行为信息关联的第一用户行为信息中,提取的第一用户行为信息。在本申请的一种优选实施例中,所述第一用户行为信息还可以包括用户标识所对应的访问网站信息,所述第二用户行为信息还可以包括用户标识所对应的搜索关键词信息;本实施例即提供了一种基于搜索关键词信息与访问网站信息关联分析的网站信息推荐方法,应用本实施例,例如,当用户搜索一个关键字时,用户标识对应的搜索关键词与访问网站的关联信息中提取前5个网站推荐给用户。在本申请的另一种优选实施例中,所述第一用户行为信息还包括用户标识所对应的访问网站信息,所述第二用户行为信息还包括用户标识所对应的点击广告信息;本实施例即提供了一种基于点击广告信息与访问网站信息关联分析的广告信息推荐方法,应用本实施例,例如,当用户访问某个网站时,从用户标识对应的访问网站与点击广告信息之间的关联信息提取前5个广告显示给用户。在本申请的另一种优选实施例中,所述第一用户行为信息还包括用户标识所对应的第一访问网站信息,所述第二用户行为信息还包括用户标识所对应的第二访问网站信息;本实施例即提供了一种基于第一访问网站信息与第二网站访问关联分析的网站信息推荐方法,应用本实施例,例如,当用户访问一个网站的时候,用户标识对应第一访问网站信息与第二访问网站信息之间的关联信息中提取前5个网站推荐给用户。
本实施例与图I所示的方法实施例的不同之处在于,本实施例通过在多个地理位置部署多个网关来获取用户的跨网网络报文,从跨网网络报文中提取用户的行为信息并计算用户标识对应的两个行为之间的关联信息,以此来提高用户行为关联分析的准确性,并且,在计算用户标识对应的两个行为之间的关联信息过程中对两个行为之间的关联信息进行排序,针对用户的某一行为信息,返回从其用户标识对应的行为之间的关联信息中提取的关联的相应行为信息,从而为用户推荐个性化的信息。参考图3示出了一种基于用户行为关联分析的信息推荐方法实施例3的步骤流程图,具体可以包括以下步骤步骤301 :获取跨网网络报文,所述跨网网络报文为从预先部署的多个网关中获取的网络报文;步骤302 :从所述跨网网络报文中提取用户行为信息;其中,所述用户行为信息中可以包括用户标识;作为本实施例的一种优选示例,所述用户行为信息包括第一用户行为信息和第二用户行为信息。步骤303 :分别获取所述第一用户行为信息的发生时间和第二用户行为信息的发生时间;步骤304 :按照所述用户标识分别组织对应的第一用户行为信息及发生时间,以及,对应的第二用户行为信息及发生时间;例如User01,hostOl, timeOl步骤305 :生成所述用户标识与第一用户行为信息及发生时间的键值对,和/或,所述用户标识与第二用户行为信息及发生时间的键值对并排序;例如生成的键值对,如下所示User01\t hostOl,timeOlUser02\t host02,time03User01\t keyOl,time02排序后的结果显示如下User01\t hostOl, timeOlUser01\t keyOl,time02User02\t host02,time03步骤306 :依据发生时间组织关联的第一用户行为信息和第二用户行为信息,并计算所述关联的第一用户行为信息与第二用户行为信息的出现频次;步骤307 :生成所述第一用户行为信息及第二用户行为信息与所述关联的第一用户行为信息与第二用户行为信息的出现频次的键值对并合并排序;例如,生成的键值对如下所示hostOl, key01\t3host02,key03\t8hostOl, key01\t6排序后结果如下显示hostOl, key01\t9
host02, key03\t8步骤308 :根据所述关联的第一用户行为信息与第二用户行为信息的出现频次,统计如下信息第二用户行为信息的出现频次;第一用户行为信息和第二用户行为信息同时出现的频次;所述同时出现的频次与第二用户行为信息出现频次的比例;步骤309 :生成第二用户行为信息与第一用户行为信息及所述关联的第一用户行为信息和第二用户行为信息的出现频次的键值对并排序;例如生成的键值对如下显示key01\t hostOl,9key03\t host02,8key01\t host03,7步骤310 :根据所述第一用户行为信息和第二用户行为信息同时出现的频次与第二用户行为信息出现频次的比例,获取用户标识对应的与所述第二用户行为信息关联的第一用户行为信息;例如,host03, keyOl, 16, 7, 7/16hostOl, keyOl, 16,9,9/16步骤311 :按照所述第一用户行为信息和第二用户行为信息同时出现的频次与第二用户行为信息出现频次的比例从大到小排序,提取排序在前的N个与所述第二用户行为信息关联的第一用户行为信息,所述N为正整数;例如hostOl, keyOl, 16,9,9/16host03, keyOl, 16, 7, 7/16步骤312 :统计第一用户行为信息的出现频率;步骤313 :生成第一用户行为信息,第一用户行为信息的出现频次与第二用户行为信息,第二用户行为信息的出现频次,第一用户行为信息和第二用户行为信息同时出现的频次,所述同时出现的频次与第二用户行为信息出现频次的比例的键值对并排序;例如生成的键值对如下显示sports, sina. com. cn, 16\t 欧洲杯,20,8,0. 4 I 伦敦奥运,30,6,0. 25 I ····步骤314:针对用户的第二用户行为信息,返回从其用户标识对应的与所述第二用户行为信息关联的第一用户行为信息中,提取的第一用户行为信息。为使本领域技术人员更好地理解本申请,以下通过一个具体应用的实例说明本申请的基于用户行为关联分析的信息推荐方法的过程。所述第一用户行为信息为用户标识所对应的访问网站信息,所述第二用户行为信息为用户标识所对应的搜索关键词信息,基于关键词信息与访问网站信息关联分析的访问网站信息推荐方法的过程(网站-关键词分析过程)如下Job ( 一个完整的MapReduce作业,用于完成具有特定数据处理功能的任务;其中Map是指映射,它是将一整块数据映射成很多小块进行处理用以支持高度并发的任务;其中分到哪块又是由Key (键)的哈希值来确定的;Reduce是指规约,以Map的输出作为输入,规约成一个更小的数据集)所示I、Jobl :得到每个用户的一系列上网行为信息,这些信息包括用户访问的所有网站和搜索的所有关键词以及这些行为发生的时间。从访问网站的日志信息{(用户,访问的网站,访问时间)}(该Job的Map输入)得到这个用户访问了哪些网站、何时访问网站的列表信息K用户,访问的网站列表,访问时间列表)}(整个作业的输出);从搜索关键词信息{(用户,搜索的关键词,搜索时间)}(也是该Job的Map输入)得到这个用户搜索了哪些关键词以及何时 搜索该关键词的列表信息K用户,搜索的关键词列表,搜索时间列表)}(也是整个作业的输出)。该Job的Map输出是以用户作为Key,时间和该用户访问的网站或搜索的关键词作为Value的键值对;Reduce的输入就是Map的输出,在传递的过程中按照Key进行哈希并排序好。Reduce的输出即整个作业的输出。举例如下Map的输出有如下几行User01\t hostOl, timeOlUser02\t host02, time03User01\t keyOl, time02经过哈希后用户标识相同的行输出到同一个Reduce程序中,并且对用户标识进行排序如下User01\t hostOl, timeOlUser01\t keyOl, time02User02\t host02, time03注\t代表Key和Value的分隔符为Tab键。2、Job2 :根据每一个用户的用户号进行关联得到网站和关键词的对应信息K访问的网站,搜索的关键词)};所述对应信息即访问网站与搜索的关键词的关联度(频次),可以采取以下算法实现关联度(频次)=0. 667+ (6-间隔秒数/600) /3其中,间隔时间大于I小时不计算其关联度;只有小于等于一小时才计算其关联度,如果时间间隔越小,两者之间的关联度越大,时间间隔越大,两者之间的关联度就越小。因为一个用户在浏览网页时有时会刷新网页,在这里我们只计算一次有效点击,即一个时间段内用户访问了多次某个网站和搜索了某个关键词时只算一次。所述关联度表征访问该网站的人去搜索这个关键词的概率,通过这个概率值可以反映该关键词概况这个网站内容的程度。所述步骤Job2的Map输出即访问的网站、搜索的关键词以及它们之间的关联度(频次),举例如下hostOl, key01\t3host02, key03\t8hostOl, key01\t6
Reduce以此作为输入,由于在Map的输出中网站和关键词这个二元组可能会重复,因此在Reduce阶段则合并这个二元组并累计最终的关联度(频次)。Reduce的输出如下hostOl, key01\t9host02,key03\t83、Job3:统计访问网站与搜索的关键词之间的相关性,可以得到如下数据信息K访问的网站,搜索的关键词,关键词出现的频次n,网站和关键词都出现的频次m,两者的比例 r(m/n))};其中,r反映了这个关键词在多大程度上与目标网站的相关联,即访问某个网站的
人更倾向搜索某些关键词的程度;所述步骤Job3的Map的输出是以搜索的关键词作为Key、剩余的访问的网站以及频次等字段作为Value的键值对,举例如下key01\t hostOl,9key03\t host02,8key01\t host03,7Reduce阶段则统计出该搜索的关键词出现的频次,Reduce的输出举例如下hostOl, keyOl, 16,9,9/16host02, key03,8,8,1host03, keyOl, 16, 7, 7/164、Job4 :合并所述步骤Job3的访问网站相同的信息,并并且统计出该网站出现的频次,得到如下数据信息K访问的网站,该网站出现的频次,搜索的关键词1,关键词出现的频次nl,网站和关键词都出现的频次ml,两者的比例rl(ml/nl) |搜索的关键词2,关键词出现的频次n2,网站和关键词都出现的频次m2,两者的比例r2 (m2/n2)…);具体而言,所述Job4的具体实施步骤如下所示在Map阶段中从Job4获得输入,对整行进行分割,提取访问的网站并将其作为Key,其他如搜索关键词和频次等字段作为Value进行输出;以Map阶段的输出作为Reduce阶段的输入,在此过程中具有相同的Key(访问的网站)都被映射到某个特定的Reduce中并且会按照Key的字典序进行排序,在Reduce阶段先抽取出Key,相同的Key放到一起,判断本行读取的Key和上一行读取的Key是否相同;如果本行读取的Key和上一行读取的Key相同,则将其关联的Value (搜索的关键词等字段)加入到一个列表中;否则,则认为是新的Key出现,先对这个关键词列表按照关联度进行从大到小排序,并将上一行的Key (访问的网站)和关联该网站的关键词列表打印出来。最后结果举例如下sports, sina. Co m. cn, 16\t 欧洲杯,20,8,0. 4 I 伦敦奥运,30,6,0. 25 I ····作为本实施例的一种优选示例,根据上述的根据关键词分析网站的过程得到的分析结果进行推荐信息,示例如下当用户搜索一个关键字时,用户标识对应的搜索关键词与访问网站的关联信息中提取前5个网站推荐给用户。在具体实现中,基于点击广告信息与访问网站信息关联分析的广告信息推荐方法与上例基于搜索关键词信息与访问网站信息关联分析的网站信息推荐方法情形一样,即把用户标识所对应的访问网站信息作为第一用户行为信息,把用户标识所对应的点击广告信息作为第二用户行为信息,例如,当一个用户访问新浪体育的时候,不必知道这个用户的其他信息,只是基于这个用户访问了新浪体育这个行为,就知道这个用户所具有的一些普遍特征,比如说用户倾向于搜索有关体育的关键词,点击体育相关的广告,访问体育相关的网站。利用这些已经存储到数据库中的信息,提取出用户最可能感兴趣的5个(自定义)广告展示出来。在具体实现中,基于第一访问网站信息与第二访问网站信息关联分析的网站信息推荐方法与上例基于搜索关键词信息与访问网站信息关联分析的网站信息推荐方法情形一样,即把用户标识所对应的第一访问网站信息作为第一用户行为信息,把用户标识所对应的第二访问网站信息作为第二用户行为信息,例如,当一个用户访问新浪体育的时候,不必知道这个用户的其他信息,只是基于这个用户访问了新浪体育这个行为,就知道这个用户所具有的一些普遍特征,比如说用户倾向于搜索有关体育的关键词,点击体育相关的广
告,访问体育相关的网站。利用这些已经存储到数据库中的信息,提取出前5个(自己定义)最相关的网站显示出来。需要说明的是,对于上述方法实施例而言,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。参考图4示出了本申请的一种基于用户行为关联分析的信息推荐装置实施例I的结构框图,具体可以包括如下模块跨网网络报文获取模块401,用于获取跨网网络报文,所述跨网网络报文为从预先部署的多个网关中获取的网络报文;用户行为信息提取模块402,用于从所述跨网网络报文中提取用户行为信息;其中,所述用户行为信息包括用户标识,第一用户行为信息和第二用户行为信息。关联信息计算模块403,用于根据所述用户行为信息计算所述用户标识对应的行为之间的关联信息;其中,所述用户标识对应的行为之间的关联信息包括用户标识对应的与所述第二用户行为信息关联的第一用户行为信息;关联信息返回模块404,用于针对用户的某一行为信息,返回从其用户标识对应的行为之间的关联信息中提取的关联的相应行为信息。在本申请的一种优选实施例中,所述关联信息计算模块403包括如下子模块时间获取子模块,用于分别获取所述第一用户行为信息的发生时间和第二用户行为信息的发生时间;用户行为组织子模块,用于按照所述用户标识分别组织对应的第一用户行为信息及发生时间,以及,对应的第二用户行为信息及发生时间;频次计算子模块,用于依据发生时间组织关联的第一用户行为信息和第二用户行为信息,并计算所述关联的第一用户行为信息与第二用户行为信息的出现频次;
信息统计子模块,用于根据所述关联的第一用户行为信息和第二用户行为信息的出现频次,统计如下信息第二用户行为信息的出现频次;第一用户行为信息和第二用户行为信息同时出现的频次;所述第一用户行为信息和第二用户行为信息同时出现的频次与第二用户行为信息出现频次的比例;关联信息获取子模块,用于根据所述第一用户行为信息和第二用户行为信息同时出现的频次与第二用户行为信息出现频次的比例,获取用户标识对应的与所述第二用户行为信息关联的第一用户行为信息。在本申请的一种优选实施例中,所述关联信息返回模块404包括如下子模块排序子模块,用于按照所述第一用户行为信息和第二用户行为信息同时出现的频次与第二用户行为信息出现频次的比例从大到小排序,提取排序在前的N个与所述第二用户行为信息关联的第一用户行为信息,所述N为正整数;第一返回子模块,用于针对用户的第二用户行为信息,返回所述提取的第一用户行为信息。参考图5示出了本申请的一种基于用户行为关联分析的信息推荐装置实施例2的结构框图,具体可以包括如下模块跨网网络报文获取模块501,用于获取跨网网络报文,所述跨网网络报文为从预先部署的多个网关中获取的网络报文;用户行为信息提取模块502,用于从所述跨网网络报文中提取用户行为信息;其中,所述用户行为信息包括用户标识,第一用户行为信息和第二用户行为信息。关联信息计算模块503,用于根据所述用户行为信息计算所述用户标识对应的行为之间的关联信息;其中,所述用户标识对应的行为之间的关联信息包括用户标识对应的与所述第二用户行为信息关联的第一用户行为信息;关联信息返回模块504,用于针对用户的某一行为信息,返回从其用户标识对应的行为之间的关联信息中提取的关联的相应行为信息。在本申请的一种优选实施例中,所述关联信息计算模块503包括如下子模块时间获取子模块,用于分别获取所述第一用户行为信息的发生时间和第二用户行为信息的发生时间;用户行为组织子模块,用于按照所述用户标识分别组织对应的第一用户行为信息及发生时间,以及,对应的第二用户行为信息及发生时间;频次计算子模块,用于依据发生时间组织关联的第一用户行为信息和第二用户行为信息,并计算所述关联的第一用户行为信息与第二用户行为信息的出现频次;信息统计子模块,用于根据所述关联的第一用户行为信息和第二用户行为信息的出现频次,统计如下信息第二用户行为信息的出现频次;第一用户行为信息和第二用户行为信息同时出现的频次;所述第一用户行为信息和第二用户行为信息同时出现的频次与第二用户行为信息出现频次的比例;关联信息获取子模块,用于根据所述第一用户行为信息和第二用户行为信息同时出现的频次与第二用户行为信息出现频次的比例,获取用户标识对应的与所述第二用户行为信息关联的第一用户行为信息;排序子模块,用于按照所述第一用户行为信息和第二用户行为信息同时出现的频次与第二用户行为信息出现频次的比例从大到小排序,提取排序在前的N个与所述第二用户行为信息关联的第一用户行为信息,所述N为正整数;在本申请的一种优选实施例中,所述关联信息返回模块504包括如下子模块第二返回子模块,用于针对用户的第二用户行为信息,返回从其用户标识对应的与所述第二用户行为信息关联的第一用户行为信息中,提取的第一用户行为信息。本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与
其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的系统。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令系统的制造品,该指令系统实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。以上对本申请所提供的一种用户行为关联分析方法和一种用户行为关联分析系统进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式
及应用范围上均会有改变之处,综上所述,本
说明书内容不应理解为对本申请的限制。
权利要求
1.一种基于用户行为关联分析的信息推荐方法,其特征在于,包括 获取跨网网络报文,所述跨网网络报文为从预先部署的多个网关中获取的网络报文; 从所述跨网网络报文中提取用户行为信息,其中,所述用户行为信息包括用户标识; 根据所述用户行为信息计算所述用户标识对应的行为之间的关联信息; 针对用户的某一行为信息,返回从其用户标识对应的行为之间的关联信息中提取的关联的相应行为信息。
2.根据权利要求I所述的方法,其特征在于,所述用户行为信息包括第一用户行为信息和第二用户行为信息。
3.根据权利要求2所述的方法,其特征在于,所述用户标识对应的行为之间的关联信息包括用户标识对应的与所述第二用户行为信息关联的第一用户行为信息; 所述根据用户行为信息计算所述用户标识对应的行为之间的关联信息的步骤包括 分别获取所述第一用户行为信息的发生时间和第二用户行为信息的发生时间; 按照所述用户标识分别组织对应的第一用户行为信息及发生时间,以及,对应的第二用户行为信息及发生时间; 依据发生时间组织关联的第一用户行为信息和第二用户行为信息,并计算所述关联的第一用户行为信息与第二用户行为信息的出现频次; 根据所述关联的第一用户行为信息和第二用户行为信息的出现频次,统计如下信息 第二用户行为信息的出现频次; 第一用户行为信息和第二用户行为信息同时出现的频次; 所述第一用户行为信息和第二用户行为信息同时出现的频次与第二用户行为信息出现频次的比例; 根据所述第一用户行为信息和第二用户行为信息同时出现的频次与第二用户行为信息出现频次的比例,获取用户标识对应的与所述第二用户行为信息关联的第一用户行为信肩、O
4.根据权利要求3所述的方法,其特征在于,所述针对用户的某一行为信息返回从其用户标识对应的行为之间的关联信息中提取的关联的相应行为信息的步骤包括 按照所述第一用户行为信息和第二用户行为信息同时出现的频次与第二用户行为信息出现频次的比例从大到小排序,提取排序在前的N个与所述第二用户行为信息关联的第一用户行为信息,所述N为正整数; 针对用户的第二用户行为信息,返回所述提取的第一用户行为信息。
5.根据权利要求2所述的方法,其特征在于,所述用户标识对应的行为之间的关联信息包括用户标识对应的与所述第二用户行为信息关联的第一用户行为信息; 所述根据用户行为信息计算所述用户标识对应的行为之间的关联信息的步骤包括 分别获取所述第一用户行为信息的发生时间和第二用户行为信息的发生时间; 按照所述用户标识分别组织对应的第一用户行为信息及发生时间,以及,对应的第二用户行为信息及发生时间; 依据发生时间组织关联的第一用户行为信息和第二用户行为信息,并计算所述关联的第一用户行为信息与第二用户行为信息的出现频次; 根据所述关联的第一用户行为信息和第二用户行为信息的出现频次,统计如下信息第二用户行为信息的出现频次; 第一用户行为信息和第二用户行为信息同时出现的频次; 所述第一用户行为信息和第二用户行为信息同时出现的频次与第二用户行为信息出现频次的比例; 根据所述第一用户行为信息和第二用户行为信息同时出现的频次与第二用户行为信息出现频次的比例,获取用户标识对应的与所述第二用户行为信息关联的第一用户行为信息; 按照所述第一用户行为信息和第二用户行为信息同时出现的频次与第二用户行为信息出现频次的比例从大到小排序,提取排序在前的N个与所述第二用户行为信息关联的第一用户行为信息,所述N为正整数。
6.根据权利要求5所述的方法,其特征在于,所述针对用户的某一行为信息返回从其用户标识对应的行为之间的关联信息中提取的关联的相应行为信息的步骤包括 针对用户的第二用户行为信息,返回从其用户标识对应的与所述第二用户行为信息关联的第一用户行为信息中,提取的第一用户行为信息。
7.根据权利要求2或3或4或5或6所示的方法,其特征在于, 所述第一用户行为信息还包括用户标识所对应的访问网站信息,所述第二用户行为信息还包括用户标识所对应的搜索关键词信息; 或者, 所述第一用户行为信息还包括用户标识所对应的点击广告信息,所述第二用户行为信息还包括用户标识所对应的访问网站信息; 或者, 所述第一用户行为信息还包括用户标识所对应的第一访问网站信息,所述第二用户行为信息还包括用户标识所对应的第二访问网站信息。
8.一种基于用户行为关联分析的信息推荐装置,其特征在于,包括如下模块 跨网网络报文获取模块,用于获取跨网网络报文,所述跨网网络报文为从预先部署的多个网关中获取的网络报文; 用户行为信息提取模块,用于从所述跨网网络报文中提取用户行为信息,其中,所述用户行为信息包括用户标识; 关联信息计算模块,用于根据所述用户行为信息计算所述用户标识对应的行为之间的关联信息; 关联信息返回模块,用于针对用户的某一行为信息,返回从其用户标识对应的行为之间的关联信息中提取的关联的相应行为信息。
9.根据权利要求8所述的装置,其特征在于,所述用户行为信息包括第一用户行为信息和第二用户行为信息。
10.根据权利要求8或9所示的装置,其特征在于, 所述第一用户行为信息还包括用户标识所对应的访问网站信息,所述第二用户行为信息还包括用户标识所对应的搜索关键词信息; 或者, 所述第一用户行为信息还包括用户标识所对应的点击广告信息,所述第二用户行为信息还包括用户标识所对应的访问网站信息; 或者, 所述第一用户行为信息还包括用户标识所对应的第一访问网站信息,所述第二用户行为信息还包括用户标识所对应的第二访问网站信息。
全文摘要
本申请提供了一种基于用户行为关联分析的信息推荐方法及装置,其中所述方法包括获取跨网网络报文,所述跨网网络报文为从预先部署的多个网关中获取的网络报文;从所述跨网网络报文中提取用户行为信息,其中,所述用户行为信息包括用户标识;根据所述用户行为信息计算所述用户标识对应的行为之间的关联信息;针对用户的某一行为信息,返回从其用户标识对应的行为之间的关联信息中提取的关联的相应行为信息。本申请可以获取用户的全方位上网行为,提高用户行为关联分析的准确性,从而为用户推荐个性化的信息。
文档编号G06F17/30GK102855309SQ201210299810
公开日2013年1月2日 申请日期2012年8月21日 优先权日2012年8月21日
发明者肖燕京, 刘书良, 罗峰, 黄苏支, 李娜 申请人:亿赞普(北京)科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1