用户兴趣发现方法和装置制造方法

文档序号:6542317阅读:180来源:国知局
用户兴趣发现方法和装置制造方法
【专利摘要】本发明公开了用户兴趣发现方法和装置,其中的一种用户兴趣发现方法包括:向网络侧发送用户的兴趣信息请求,并接收网络侧根据所述请求返回的用户的兴趣信息,所述用户的兴趣信息包括:类别和实体词;将所述用户的兴趣信息展示在用户的网络终端设备所显示的话题选择区;接收用户针对话题选择区输入的话题选择信息,并根据所述话题选择信息确定用户选择的类别和实体词;将用户选择的类别和实体词传输至网络侧,所述用户选择的类别和实体词用于网络侧修正网络侧预先存储的所述用户的兴趣信息。本发明提供的技术方案可以进一步准确的确定出用户兴趣。
【专利说明】用户兴趣发现方法和装置
[0001]技术类别
[0002]本发明涉及网络访问【技术领域】,具体涉及用户兴趣发现方法以及相应的用户兴趣发现装置。
【背景技术】
[0003]个性化信息推荐技术由于其能够使网络侧向用户下发符合用户兴趣的信息,因此,个性化信息推荐技术可以有效提高网络资源的点击量和阅读量。有鉴于此,个性化信息推荐技术逐渐在网络访问中得到越来越多的应用。
[0004]在个性化信息推荐技术中,准确及时的发现用户兴趣是该技术中的一个非常重要的环节。
[0005]现有的用户兴趣发现方式主要包括两种,即一种方式为弓I导用户主动将其兴趣告知网络侧;而另一种方式为自动发现用户兴趣,即根据用户的行为信息(即用户的网络访问行为数据)发现用户兴趣;其中,上述用户的行为信息可以包括:用户浏览过的网页的信息、用户搜索过的关键词、用户发表的微博的信息、用户发表的博客(blog)的信息以及用户购买的商品等等。
[0006]目前,根据用户的行为信息发现用户兴趣的具体实现方式通常为:在用户阅读一篇文档或者阅读网页等内容时,确定出该文档所属的类别,从而可以将该类别确定为用户的兴趣;当然,也可以进一步将该用户所涉足的多个类别进行比对,将用户涉足最多的一个或者两个类别确定为用户的兴趣。
[0007]发明人在实现本发明过程中发现,现有的发现用户兴趣的实现方式易产生误判现象,下面举两个具体的例子进行说明:
[0008]第一个具体的例子,用户阅读某一内容有时是存在干扰性因素的,而依据该干扰性因素所发现的用户兴趣很可能并不是用户真正的兴趣;如某一类别是热门类别,从而用户阅读该类别的内容的机会往往更多,然而,这并不代表用户对该类别真正感兴趣;再如,由于弹窗推送或者用户被标题误导会引发用户浏览相关内容,然而,用户浏览的这些内容并不能表示出用户真正的兴趣所在。
[0009]第二个具体的例子,用户的阅读可能会表现出其浅度且暂时的兴趣,而如果根据用户阅读的这部分内容将用户浅度且暂时的兴趣识别为用户真正的兴趣,则产生用户兴趣的误判;如用户在看一部电视剧的过程中,有时会对电视剧中的演员进行搜索,以阅读了一些有关于该演员的介绍信息,用户的这种阅读行为通常并不具有高阅读量以及持续发生的特点,如果据此识别出用户对该演员感兴趣,并向用户推送与该演员相关的信息显然并不合适。

【发明内容】

[0010]本发明的目的在于,克服现有的用户兴趣发现方式所存在的技术问题,提供一种用户兴趣发现方法以及相应的用户兴趣发现装置,所要解决的技术问题是,进一步准确的确定出用户兴趣。
[0011]本发明的目的以及解决其技术问题可以采用以下的技术方案来实现。
[0012]依据本发明提出的一种用户兴趣发现方法,包括:向网络侧发送用户的兴趣信息请求,并接收网络侧根据所述请求返回的用户的兴趣信息,所述用户的兴趣信息包括:类别和实体词;将所述用户的兴趣信息展示在用户的网络终端设备所显示的话题选择区;接收用户针对话题选择区输入的话题选择信息,并根据所述话题选择信息确定用户选择的类别和实体词;将用户选择的类别和实体词传输至网络侧,所述用户选择的类别和实体词用于网络侧修正网络侧预先存储的所述用户的兴趣信息。
[0013]依据本发明提出的一种用户兴趣发现装置,包括:请求模块,用于向网络侧发送用户的兴趣信息请求,并接收网络侧根据所述请求返回的用户的兴趣信息,所述用户的兴趣信息包括:类别和实体词;显示模块,用于将所述用户的兴趣信息展示在用户的网络终端设备所显示的话题选择区;确定模块,用于接收用户针对话题选择区输入的话题选择信息,并根据所述话题选择信息确定用户选择的类别和实体词;传输模块,用于将用户选择的类别和实体词传输至网络侧,所述用户选择的类别和实体词用于网络侧修正网络侧预先存储的所述用户的兴趣信息。
[0014]依据本发明提出的另一种用户兴趣发现方法,包括:接收用户的兴趣信息请求,并根据预先存储的兴趣信息向用户的网络终端设备返回所述用户的兴趣信息,所述用户的兴趣信息包括:类别和实体词;接收来自所述网络终端设备的所述用户选择的类别和实体词;根据所述用户选择的类别和实体词对所述预先存储的兴趣信息中的所述用户的兴趣信息进行修正。
[0015]依据本发明提出的另一种用户兴趣发现装置,包括:请求响应模块,用于接收用户的兴趣信息请求,并根据预先存储的兴趣信息向用户的网络终端设备返回所述用户的兴趣信息,所述用户的兴趣信息包括:类别和实体词;接收模块,用于接收来自所述网络终端设备的所述用户选择的类别和实体词;修正模块,用于根据所述用户选择的类别和实体词对所述预先存储的兴趣信息中的所述用户的兴趣信息进行修正。
[0016]借由上述技术方案,本发明提供的用户兴趣发现方法和装置至少具有下列优点及有益效果:本发明实施例通过将网络侧传输来的用户的兴趣信息显示在话题选择区,使用户可以选择其感兴趣的类别和实体词,这样,网络侧可以根据用户选择的类别和实体词修正其存储的用户的兴趣信息;从而本发明可以更加准确的确定出用户感兴趣的类别和实体词,最终可以更为精准的为用户下发其真正感兴趣的内容。
[0017]上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述以及其他目的、特征和优点能够更明显易懂,以下特举较佳的实施例,详细说明如下。
【专利附图】

【附图说明】
[0018]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。[0019]图1是本发明实施例提供的用户兴趣发现方法流程图;
[0020]图2是本发明实施例提供的网络侧设置用户的兴趣信息的流程图;
[0021]图3是本发明实施例提供的网络侧设置用户的兴趣信息的框架示意图;
[0022]图4是本发明实施例提供的用户兴趣发现装置示意图;
[0023]图5是本发明实施例提供的设置于网络侧的用户兴趣发现装置示意图。
【具体实施方式】
[0024]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,说明书所描述的实施例仅仅是本发明部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员依次所获得的、而没有经过创造性劳动付出的其他实施例,都属于本发明保护的范围。
[0025]实施例一、用户兴趣发现方法。该用户兴趣发现方法的流程以及示意如图1所示。
[0026]S100、向网络侧发送用户的兴趣信息请求,并接收网络侧根据该请求返回的用户的兴趣信息。
[0027]具体的,用户的网络终端设备可以在用户启动相应的应用(如话题推荐应用或者浏览器客户端等)时,产生承载有用户标识的用户的兴趣信息请求,并向网络侧发送该用户的兴趣信息请求。该用户的兴趣信息请求可以为基于HTTP (HTTP-Hypertext transferprotocol,超文本转移协议)的消息等。
[0028]上述用户标识应为可以唯一标识出一个用户的信息,如该用户标识可以为浏览器客户端标识等。
[0029]S110、网络侧接收用户的兴趣信息请求,并根据预先存储的兴趣信息向用户的网络终端设备返回所述用户的兴趣信息。
[0030]具体的,网络侧预先存储有网络中多个用户的兴趣信息,如网络侧预先存储有网络中多个用户的用户标识与类别和实体词的对应关系信息。网络侧在接收到网络终端设备传输来的用户的兴趣信息请求后,从该用户的兴趣信息请求中获取用户标识,然后,从其存储的兴趣信息中查找该用户标识对应的兴趣信息(包括类别和实体词),并将查找到的全部兴趣信息或者查找到的部分兴趣信息返回给用户的网络终端设备。
[0031]在网络侧查找到的该用户的全部兴趣信息的数量较多时,可以从该用户的全部兴趣信息中选取部分兴趣信息,如按照用户感兴趣的程度选取用户最感兴趣的多个兴趣信息。上述数量较多可以是指类别数量较多(如查找到的全部兴趣信息中的类别的数量超过第一预定值,第一预定值的取值可以根据实际画面的布局设计来决定,如第一预定值为20),也可以是指类别下的实体词数量较多(如查找到的兴趣信息中的某个类别所对应的实体词的数量超过第二预定值,同样的,第二预定值的取值可以根据实际画面的布局设计来决定,如第二预定值为20)。也就是说,网络侧选取的部分兴趣信息可以是网络侧从查找到的全部类别中选取的部分类别,也可以是网络侧从查找到的某个类别的全部实体词中选取的部分实体词。
[0032]网络侧预先存储的网络中多个用户的兴趣信息可以是网络侧对其采集到的多个用户的网络访问行为数据进行分析而获得并存储的,且网络侧存储的各用户的兴趣信息可以基于后续采集到的各用户的网络访问行为数据通过离线方式或者在线方式而更新。[0033]另外,需要特别说明的是,在网络侧查找到的该用户的全部兴趣信息的数量较少或者没有查找到该用户的兴趣信息等情况下,网络侧可以为该用户添加一些兴趣信息,如在查找到的用户的兴趣信息的数量较少的情况下,网络侧将与该用户具有相同类别兴趣的其他用户的该类别下的该用户所不具有的实体词添加在该用户的该类别下。网络侧可以将为该用户添加的实体词作为该用户感兴趣的实体词存储在相应的类别下。网络侧可以对上述添加的实体词进行特别标注,以便于后续网络侧对该实体词的删减处理;再如,在没有查找到该用户的兴趣信息的情况下,网络侧可以将类似于当前热门类别中的热门实体词等类别和实体词信息作为该用户的兴趣信息,也可以通过IP地址来确定用户进一步的兴趣信息,如所在地理区域(例如北京市五道口地区)可对应消费水平和对邻近地信息感兴趣,甚至进一步地确定用户所在行业(如位于搜狐网络大厦的地址推断在互联网行业)对应消费倾向和对行业相关信息感兴趣,或者可以通过用户之前在网络上留下的访问痕迹,如发表的微博,论坛的留言等信息来辅助确定用户的兴趣信息。
[0034]一个具体的例子,网络侧可以将网络中与该用户兴趣最相近的用户分拣出来,然后,将分拣出来的用户的某些感兴趣的实体词抽取出来,这些抽取出来的实体词可以下发给用户,从而本实施例可以形成一种群体个性化的概念。
[0035]一个更具体的例子,用户喜欢娱乐类别(也可以称为娱乐话题),且经常关注范冰冰和黄晓明这两个实体词,从而网络侧会在其存储多个用户的兴趣信息中查找同样关注这两个实体词的其他用户,其他用户形成一个用户群,如果该用户群中关注赵薇这一实体词的阈值达到了预定指标,则可以将赵薇这个实体词一起下发给该用户,且网络侧可以在其存储的兴趣信息中为该用户增加相应的实体词。
[0036]网络侧设置并存储各用户的兴趣信息的过程的一个具体的例子如下述实施例二中的描述,在此不再详细说明。
[0037]S120、将接收到的用户的兴趣信息展示在用户的网络终端设备所显示的话题选择区。
[0038]具体的,网络终端设备在用户启动上述应用后会为用户显示相应的话题选择画面;在网络终端设备第一次为用户显示相应的话题选择画面的情况下,该话题选择画面可以称为冷启动页面,即在从未获得过用户选择的类别和实体词的情况下,为用户展示的话题选择画面为冷启动页面。
[0039]为用户显示的话题选择画面上包含有话题选择区,且该画面上还可以包含有产品说明区,该产品说明区中的内容通常不能够被用户所点选,产品说明区主要用于展示预定数量的实体词的说明信息,产品说明区还可以用于展示预定数量的类别的说明信息,另外,产品说明区还可以用于展示本应用的说明信息等;产品说明区可以使用户充分了解本应用中的话题选择的功能等。
[0040]用户的网络终端设备在接收到网络侧下发的用户的兴趣信息后,将用户的兴趣信息展示在该话题选择区。用户的兴趣信息在话题选择区的展示方式可以多种形式,如在话题选择区显示接收到的兴趣信息中所有的类别,在用户点击某个类别时,以弹窗的形式展示接收到的兴趣信息中该类别所对应的所有实体词;再如在话题选择区同时显示接收到的兴趣信息中的所有的类别以及类别所对应的实体词。
[0041]S130、接收用户针对话题选择区输入的话题选择信息,并根据话题选择信息确定用户选择的类别和实体词。
[0042]具体的,用户可以通过在话题选择区中相应位置的点击来选择类别或者选择实体词;如果用户通过点击选择了某个类别,然而并没有选择该类别下的实体词,则可以认为用户选择了该类别以及该类别下的所有实体词;如果用户通过点击选择了某个类别下的一个或者多个实体词,则可以认为用户选择了该类别以及该类别下的一个或者多个实体词。
[0043]S140、将用户选择的类别和实体词传输至网络侧,这里的用户选择的类别和实体词主要用于网络侧修正其预先存储的该用户的兴趣信息。
[0044]具体的,用户的网络终端设备可以将用户选择的类别和实体词通过基于HTTP的消息等传输至网络侧。
[0045]S150、网络侧接收来自网络终端设备的用户选择的类别和实体词,且网络侧根据接收到的类别和实体词来修正其预先存储的该用户的兴趣信息。
[0046]具体的,网络侧修正用户的兴趣信息的一个例子为:如果网络侧为该用户添加了其他用户感兴趣的实体词并没有被用户所选择,则网络侧应删除上述为用户添加的实体词;如果网络侧为该用户添加了其他用户感兴趣的实体词被用户所选择,则网络侧应保留上述为用户添加的实体词,并去除为该实体词设置的用于表示该实体词为基于其他用户感兴趣的实体词而为用户添加的实体词的特别标记;例如,用户对足球类别中的实体词C罗感兴趣,然而,用户并没有选择网络侧为其推荐的与C罗相关的实体词,则网络侧应将与C罗相关的实体词删除。
[0047]网络侧根据接收到的类别和实体词来修正其预先存储的该用户的兴趣信息的另一个例子为:网络侧根据用户选择的类别和实体词增强其存储的用户对该类别和/或实体词的感兴趣程度,同时,网络侧根据用户未选择的类别和实体词减弱其存储的用户对该类别和/或实体词的感兴趣程度。
[0048]网络侧根据接收到的类别和实体词来修正其预先存储的该用户的兴趣信息的再一个例子为:网络侧确定与用户选择的实体词相关的其他实体词,在网络侧存储的用户的感兴趣信息中包含有上述其他实体词的情况下,网络侧增强用户对上述其他实体词的感兴趣程度;在网络侧存储的用户的感兴趣信息中没有包含上述其他实体词的情况下,网络侧将上述其他实体词存储在用户的感兴趣信息中,并相应设置用户对其他实体词的感兴趣程度。
[0049]网络侧可以根据群体个性化的概念来找到与某实体词相关的其他实体词。具体地,网络侧可以将网络中与该用户兴趣最相近的用户分拣出来,然后,将分拣出来的用户的某些感兴趣的实体词抽取出来,这些抽取出来的实体词可以下发给用户,从而本实施例可以形成一种群体个性化的概念。
[0050]一个更具体的例子:用户选择了 “赵薇”这个实体词,则网络侧首先会增强用户对“赵薇”这个实体词感兴趣的程度;其次,网络侧会增强用户对“赵薇”所属的“娱乐”这个类别的感兴趣程度;还有,在用户的感兴趣信息中包含有属于“娱乐”类别的与“赵薇”相关的其他实体词(如“黄晓明”)(网络侧会在其存储多个用户的兴趣信息中查找关注赵薇这个实体词的其他用户,其他用户形成一个用户群,如果该用户群中关注黄晓明这一实体词的阈值达到了预定指标,则可以确定黄晓明为赵薇的其他实体词)的情况下,网络侧增强用户对上述其他实体词的感兴趣程度;在用户的感兴趣信息中没有包含有属于“娱乐”类别的与“赵薇”相关的其他实体词(如“黄晓明”)的情况下,网络侧将上述其他实体词作为用户感兴趣的实体词添加“娱乐”类别下,并相应设置新增加的实体词的感兴趣程度。实施例二、用户兴趣发现方法。该用户兴趣发现方法的流程以及示意如图2和图3所示。
[0051]图2中,S200、采集用户的网络访问行为数据。
[0052]具体的,本实施例中的用户的网络访问行为数据包括:用户浏览过的网页的信息、用户搜索过的关键词、用户发表的微博的信息(如从微博中提取出的至少一个关键词等)、用户发表的博客的信息(如从博客中提取出的至少一个关键词等)以及用户购买的商品的信息等等。上述网络访问行为数据还可以包括用户进行网络访问行为的时间信息,如用户激活浏览器客户端的时间、用户关闭浏览器客户端的时间、用户登录网络的时间、用户浏览网页的时间、用户搜索关键词的时间、用户发表微博的时间、用户发表博客的时间以及用户购买商品的时间等等。上述用户进行网络访问行为的时间信息可以用于后续的访问频度以及访问间隔等的计算。
[0053]本实施例可以利用用户的网络终端设备中的浏览器客户端来采集用户的网络访问行为数据。一个具体的例子,用户的网络终端设备中的浏览器客户端可以方便的获取到用户执行网络访问操作的相关信息,即用户的网络访问行为数据,这样,浏览器客户端可以根据其内部预先设定的网络设备地址,将其采集到的用户的网络访问行为数据传输给相应的网络设备(如浏览器服务器端所在的网络设备或者其他设备),从而使相应的网络设备可以方便的采集到用户的网络访问行为数据。需要特别说明的是,本实施例在进行用户的网络访问行为数据的传输过程中,浏览器客户端还应将其标识信息随网络访问行为数据一起传输至相应的网络设备,这样,网络设备可以基于浏览器客户端的标识信息来确定出其接收到的网络访问行为数据所对应的用户;也就是说,在本实施例中,用户可以使用浏览器客户端的标识信息来表示。
[0054]浏览器客户端可以将其采集到的网络访问行为数据实时传输给相应的网络设备,浏览器客户端也可以将其采集到的网络访问行为数据定时或者不定时的传输给相应的网络设备,例如每到整点时刻,浏览器客户端将其采集并本地存储的由用户在前一小时中所进行的网络访问操作而产生的网络访问行为数据传输给相应的网络设备,在成功传输后,浏览器客户端删除上述本地存储的已经成功传输至相应的网络设备的网络访问行为数据;再例如,浏览器客户端在其采集并本地存储的网络访问行为数据达到预定数量(如采集并本地存储的网络访问行为数据所占用的存储空间达到预定存储空间大小)时,将本地存储的所有网络访问行为数据传输给相应的网络设备,并在成功传输后,浏览器客户端删除上述本地存储的已经成功传输至相应的网络设备的网络访问行为数据。
[0055]本实施例也可以利用API(Application Programming Interface,应用程序接口)从网络侧来采集用户的网络访问行为数据。在利用API从网络侧来采集用户的网络访问行为数据的情况下,本实施例可以获取到用户更多的网络访问行为数据,如本实施例可以利用API获取到在浏览器客户端开始向网络设备上报网络访问行为数据之前用户执行的网络访问所产生并存储在网络侧的网络访问行为数据(该数据可以用于进行针对全网用户的群体数据分析),也就是说,在浏览器客户端在被配置为获取用户的网络访问行为数据并向相应的网络设备发送网络访问行为数据之前,用户利用该浏览器客户端所执行的网络访问操作对应的网络访问行为数据可以通过API采集。[0056]利用API采集用户的网络访问行为数据的第一个具体的例子为:网络设备(如浏览器服务器端所在的网络设备等)在接收到浏览器客户端通过其所在的网络终端设备传输来的信息时,立即判断其接收到的信息中是否包含有微博或者博客等的登录信息,如果网络设备判断出其接收到的信息中包含有登录信息,则网络设备从登录信息中获取登录用户的登录账户信息,并利用API从相应的服务器中获取登录用户利用其登录账号所发表的内容(如登录用户发表的博客或者微博等内容),然后,网络设备针对其获取的内容进行提取关键词等处理,从而网络设备采集到用户(即浏览器客户端标识所表示的用户)的网络访问行为数据;其中,利用API获取登录用户利用其登录账号所发表的内容并不仅限于登录用户利用其登录账号本次发表的内容,还可以包括登录用户利用其登录账号在之前一段时间(如当前时间的前一个月)所发表的内容。
[0057]利用API采集用户的网络访问行为数据的第二个具体的例子为:网络设备根据预先设定的时间(如每天的凌晨)定时的针对其在预定时间间隔(如24小时)内接收到的所有浏览器客户端通过其网络终端设备传输来的所有信息进行集中分析,以从其接收到的所有信息中识别出包含有微博或者博客等的登录信息的信息,然后,网络设备根据这些识别出的信息中所包含的登录用户的登录信息利用API从相应的服务器(如微博或者博客等对应的服务器)中获取各登录用户利用其登录账号所发表的内容(如登录用户发表的博客或者微博等内容),之后,网络设备针对其获取的内容进行提取关键词等处理,从而网络设备采集到用户(即浏览器客户端标识所表示的用户)的网络访问行为数据;其中,利用API获取登录用户利用其登录账号所发表的内容并不仅限于登录用户利用其登录账号本次发表的内容,还可以包括登录用户利用其登录账号在之前一段时间(如当前时间的前一个月)所发表的内容。
[0058]需要说明的是,在上述第一个具体的例子和第二个具体的例子中,如果一台网络终端设备存在多人使用的情况,则来自该网络终端设备中的浏览器客户端的多条信息中可能会包括多个不同的登录用户的登录信息;在该情况下,本实施例可以将来自一台网络终端设备中的浏览器客户端的多条信息中的多个不同的登录用户的登录信息分别对应的内容中的关键词都作为一个用户(即浏览器客户端标识所表示的用户)的网络访问行为数据,也就是说,不对登录用户进行区分;当然,本实施例也可以将来自一台网络终端设备中的浏览器客户端的多条信息中的多个不同的登录用户中的其中一个登录用户的登录信息对应的内容中的关键词作为一个用户(即浏览器客户端所表示的用户)的网络访问行为数据,也就是说,本实施例可以对登录用户进行区分;例如,本实施例可以将多个登录用户中登录次数最多的一个登录用户的登录信息对应的内容中的关键词作为本实施例中的用户(即浏览器客户端所表示的用户)的网络访问行为数据,而对其他登录用户的登录信息不进行获取相应内容以及提取关键词等的处理操作,即将登录次数最多的一个登录用户与浏览器客户端标识所表示的用户相关联。
[0059]本实施例还可以采用除上述两种例举的利用浏览器客户端采集方式以及API采集方式之外的其他方式来获取用户的网络访问行为数据。另外,本实施例中的用户的网络终端设备可以是用户的计算机或者智能移动电话或者平板电脑等可以进行网络访问的网络终端设备。
[0060]S210、根据网络访问行为数据所包含的实体词以及预先设定的各类别分别对应的多个实体词确定上述步骤采集到的网络访问行为数据所属的类别。
[0061]具体的,本实施例可以预先将每个类别表示为由一系列的实体词构成的一个向量,针对网络设备接收到的一网络访问行为数据而言,网络设备可以先将该网络访问行为数据所包含的实体词(如包含一个或者多个实体词)通过预定算法计算出一向量,然后,通过预定的距离函数度量该网络访问行为数据所对应的向量与各类别对应的向量之间的距离,之后,根据度量出的各距离确定出上述接收到的网络访问行为数据所属的类别(如将距离最近的类别确定为该网络访问行为数据所属的类别)。
[0062]本实施例也可以采用其他方式来确定上述采集到的网络访问行为数据所属的类另Ij,在此不再一一例举说明。
[0063]S220、根据网络访问行为数据对应的多个维度上的属性信息计算网络访问行为数据的权重值。
[0064]具体的,本实施例中的网络访问行为数据对应有多个维度(这里的维度也可以称为统计维度),且在每一个维度上均对应有相应的属性信息,该属性信息并不表示网络访问行为数据在其对应的维度上所固有的属性,而是一种由于用户的访问行为而使其在维护上所具有的临时属性。
[0065]一个具体的例子,本实施例中的网络访问行为数据对应的多个维度上的属性信息可以包括:网络访问行为数据所属类别的触达次数、网络访问行为数据所属类别的访问频度、产生该网络访问行为数据的访问方式以及网络访问行为数据所对应的内容资源的信息质量。
[0066]另一个具体的例子,本实施例中的网络访问行为数据对应的多个维度上的属性信息可以包括:网络访问行为数据所属类别的触达次数、网络访问行为数据所属类别的访问间隔、产生该网络访问行为数据的访问方式以及网络访问行为数据所对应的内容资源的信
息质量。
[0067]再一个具体的例子,本实施例中的网络访问行为数据对应的多个维度上的属性信息可以包括:网络访问行为数据所属类别的触达次数、网络访问行为数据所属类别的访问频度、网络访问行为数据所属类别的访问间隔、产生该网络访问行为数据的访问方式以及网络访问行为数据所对应的内容资源的信息质量。
[0068]其中,上述网络访问行为数据所属类别的触达次数表示用户对该类别的触达次数,也就是说,在一个类别范围内,如果对该类别的所有网络访问行为数据的触达进行顺序计次的话,则该网络访问行为数据对应的顺序计次值即为该网络访问行为数据所属类别的触达次数。上述网络访问行为数据所属类别的触达次数可以由网络设备来设置。
[0069]其中,上述网络访问行为数据所属类别的访问频度表示用户对该类别的访问频度,也就是说,在一个类别范围内,如果将该类别中的每一条网络访问行为数据均作为用户对该类别的一次访问,则在将该网络访问行为数据实时纳入到对该类别的访问频度的计算时所获得的访问频度值可以作为该网络访问行为数据所述类别的访问频度。上述网络访问行为数据所属类别的访问频度可以由网络设备来计算并设置。触达次数和访问频度之间是存在关系的,如在一段时间内的触达次数越多,则访问频度会越高,一个具体的例子,如果用户经常看NBA新闻,则实体词NBA的触达次数会很多,与此同时,实体词NBA在时间维度上所表现出的访问频度也会越高。[0070]其中,上述产生该网络访问行为数据的访问方式是指用户在进行相应的网络访问而产生该网络访问行为数据时所采用的具体的访问方式,如网络访问行为数据是用户由于主动访问而产生的(如主动打开浏览器客户端并在地址栏中输入相应的URL的网页浏览以及主动搜索关键词的网页浏览等),还是用户由于点击推送的弹窗或者网页中的内容而产生的。上述产生该网络访问行为数据的访问方式可以由浏览器客户端来设置,并随网络访问行为数据一起传输至网络设备。
[0071]其中,上述网络访问行为数据所对应的内容资源的信息质量可以在一定程度上表示出相应的内容资源的专业程度,内容资源的信息质量可以利用该内容资源所属类别中至少一个高端用户对该网络访问行为数据所对应的内容资源的访问情况来确定;这里的高端用户可以为已经被确定为对该类别(上述接收到的网络访问行为数据所属的类别)具有兴趣的用户(也可以称为该类别中的资深用户)。一个具体的例子,本实施例可以根据网络访问行为数据所对应的内容资源是否被相应类别中的一个或多个高端用户所访问和/或被相应类别中的所有高端用户所访问的次数等相关信息来决定该网络访问行为数据所对应的内容资源在信息质量上的具体取值。上述网络访问行为数据所对应的内容资源的信息质量可以由网络设备来设置。另外,上述高端用户也可以为不但被确定为对该类别具有兴趣且还应对该类别的兴趣达到发烧程度的用户,如在用户对内容资源所属类别的关注度不但达到相应的兴趣阈值,而且还达到预定阈值的情况下,该用户被确定为该类别的高端用户,该预定阈值高于网络资源所属类别对应的兴趣阈值;再如,在用户对内容资源所属类别的关注度不但达到相应的兴趣阈值,而且该用户还对预定网站进行过访问,则可以将该用户确定为高端用户;上述预定网站通常为专业性较强的网站。
[0072]其中,上述网络访问行为数据所属类别的访问间隔表示用户对该类别的访问间隔;即在用户的多次上网过程中,对一类别的前一次访问和对该类别的下一次访问之间间隔的用户上网次数;这里的上网次数可以以天为单位计算(即用户在一天之内的多次上网作为该用户的一次上网),本实施例中的上网次数也可以以其他单位来计算,如以用户打开浏览器客户端的次数为单位计算。上述网络访问行为数据所属类别的访问间隔可以由网络设备来计算并设置。一个具体的例子,用户在I月7日上网访问了体育类别中的内容资源,之后,用户一直没有上网,直到I月10日,用户才再次上网,并再次访问了体育类别中的内容资源,那么可以将相应的网络访问行为数据所属类别的访问间隔设置为1,而并不是将该访问间隔设置为I月7日与I月10日之间间隔的天数。
[0073]本实施例可以预先为所有维度或者部分维度上的不同属性信息分别设置相应的系数,如为主动访问设置的系数高于为被动访问设置的系数,再如为被高端用户访问的内容资源对应的信息质量设置的系数高于没有被高端用户访问的内容资源对应的信息质量设置的系数。这样,本实施例在确定出网络访问行为数据对应的多个维度上的属性信息后,可以利用各属性信息以及相对应的系数计算出网络访问行为数据的权重值。本实施例可以根据实际情况采用相应的计算方法来进行网络访问行为数据的权重值的计算,具体的计算方法在此不再一一详细举例说明。
[0074]本实施例可以在接收到一条网络访问行为数据或者同时接收到多条网络访问行为数据时,立即计算接收到的网络访问行为数据的权重值,并将计算出的权重值与网络访问行为数据以及其所对应的各维度上的属性信息一起本地存储。当然,本实施例也可以采用定时或者不定时的方式来处理其接收到的网络访问行为数据,例如,每到整点时刻,网络设备将其接收并本地存储的所有未进行计算的网络访问行为数据进行权重值计算,并在计算完成后,将计算出的权重值连同相应的网络访问行为数据以及网络访问行为数据对应的各维度上的属性信息一起存储;再例如,网络设备在其本地存储的网络访问行为数据达到预定数量(如接收并本地存储的网络访问行为数据所占用的存储空间达到预定存储空间大小)时,对本地存储的所有未进行权重值计算的网络访问行为数据进行权重值计算,并在计算完成后,将计算出的各权重值连同对应的网络访问行为数据以及网络访问行为数据对应的各维度上的属性信息一起存储。
[0075]用户的网络访问行为数据、网络访问行为数据对应的多个维度上的属性信息以及计算出的权重值等可以一起存储在该用户的特征库(如图3所示)中。
[0076]本实施例可以采用多种方式来计算网络访问行为数据的权重值,具体的实现方式可以根据实际应用情况来设置,在此不再详细例举说明。
[0077]S230、根据用户的网络访问行为数据的权重值确定用户对网络访问行为数据所属的类别的关注度。
[0078]具体的,本实施例可以实时的方式计算用户对网络访问行为数据所属的类别的关注度,也就是说,网络设备每接收到一条网络访问行为数据或者网络设备同时接收到多条网络访问行为数据时,可以立即进行网络访问行为数据的关注度计算,并利用当前计算出的关注度来修正用户对该网络访问行为数据所属类别的关注度(如图3中的“在线处理”,并利用“在线处理”的结果修正“特征库”中的存储信息)。
[0079]本实施例也可以采用非实时的方式(即离线方式)计算用户对网络访问行为数据所属的类别的关注度,例如,在每天的凌晨对前一天接收到的该用户的网络访问行为数据进行关注度的计算处理,在计算处理完成后,利用当前计算出的关注度来修正用户对各网络访问行为数据所属类别的关注度(如图2中的“离线处理”,并利用“离线处理”的结果修正“特征库”中的存储信息)。
[0080]本实施例可以采用多种方式利用用户的网络访问行为数据的权重值来计算用户对网络访问行为数据所属类别的关注度,具体的实现方式可以根据实际情况来设置,在此不再详细例举说明。
[0081]S240、根据用户对网络访问行为数据所属类别的关注度和预先设定的相应类别对应的兴趣阈值识别用户的兴趣。
[0082]具体的,本实施例中预先设定的相应类别对应的兴趣阈值是根据网络中多个用户(如全网用户)对属于该类别中的内容资源进行访问所产生的网络访问行为数据而设置的。
[0083]由于多个用户(如全网用户)对一个类别的访问情况可以体现出该类别被不同用户所关注的程度的差异,因此,利用多个用户对一个类别的访问情况来设置该类别的兴趣阈值可以较准确的体现出对该类别感兴趣的用户对该类别的实际访问情况,从而本实施例通过利用这样的兴趣阈值来对用户是否对该类别有兴趣进行判断,可以使判断的结果更加准确。
[0084]一个具体的例子,设定有两个类别,即第一类别和第二类别,第一类别是一个能够时常被大家接触到的类别(如NBA),而第二类别是一个不能够时常被大家接触到的类别(如观赏鱼),用户A对第一类别的访问次数往往会大大超出用户A对第二类别的访问次数,然而,这并不能准确的表示出第一类别是用户A的兴趣所在,也就是说,如果通过将用户A对第一类别的访问次数和对第二类别的访问次数进行比较来确定用户A的兴趣是第一类别,则很有可能确定出的兴趣并不是用户A的兴趣。从实际情况来看,由于多个用户(如全网用户)接触第一类别的机会都较多,而接触第二类别的机会都较少,因此,根据网络中多个用户对该第一类别和第二类别的访问情况来看,为第一类别设置的兴趣阈值应高于为第二类别设置的兴趣阈值。
[0085]一个更具体的例子,体育新闻类别的内容更新量较大,用户A平均每天都有10篇体育新闻的阅读量,而观赏鱼类别的内容更新量较少,用户A平均每天有2篇观赏鱼内容的阅读量,而从全网用户的访问情况来看,每天有20篇体育新闻的阅读量的用户才算是对体育新闻类别感兴趣,而每天有2篇观赏鱼的阅读量的用户就可以算是对观赏鱼类别感兴趣了。
[0086]不同用户对不同类别的网络访问分布情况与不同用户对同一类别的网络访问分布情况如下述表1和表2所示。
[0087]表1
[0088]
【权利要求】
1.一种用户兴趣发现方法,其特征在于,包括: 向网络侧发送用户的兴趣信息请求,并接收网络侧根据所述请求返回的用户的兴趣信息,所述用户的兴趣信息包括:类别和实体词; 将所述用户的兴趣信息展示在用户的网络终端设备所显示的话题选择区; 接收用户针对话题选择区输入的话题选择信息,并根据所述话题选择信息确定用户选择的类别和实体词; 将用户选择的类别和实体词传输至网络侧,所述用户选择的类别和实体词用于网络侧修正网络侧预先存储的所述用户的兴趣信息。
2.如权利要求1所述的方法,其特征在于,所述方法还包括: 在将所述用户的兴趣信息展示在用户的网络终端设备所显示的话题选择区的情况下,在用户的网络终端设备所显示的产品说明区中展示类别的说明信息、实体词的说明信息以及所述方法对应的产品的说明信息中的至少一个。
3.如权利要求1或2所述的方法,其特征在于,所述用户的兴趣信息包括:网络侧基于所述用户的网络访问行为数据与网络中多个用户的网络访问行为数据的比较结果而设置的用户感兴趣的类别和实体词。
4.如权利要求3所述的方法,其特征在于,所述用户的兴趣信息还包括: 属于所述用户的兴趣信息中的类别但不是所述用户的兴趣信息中的实体词而是其他用户的兴趣信息中的实体词;所述其他用户为其兴趣信息中具有所述用户的兴趣信息中的类别的用户。
5.如权利要求3所述的方法,其特征在于,所述网络侧设置用户感兴趣的类别包括下述步骤: 采集用户的网络访问行为数据; 根据所述网络访问行为数据所包含的实体词以及预先设定的各类别分别对应的多个实体词确定所述网络访问行为数据所属的类别; 根据所述网络访问行为数据对应的多个维度上的属性信息计算所述网络访问行为数据的权重值; 根据所述用户的网络访问行为数据的权重值确定所述用户对所述网络访问行为数据所属的类别的关注度; 根据所述用户对所述网络访问行为数据所属类别的关注度和预先设定的相应类别对应的兴趣阈值识别所述用户感兴趣的类别,其中,所述类别对应的兴趣阈值是根据网络中多个用户对该类别进行访问的网络访问行为数据设置的。
6.如权利要求5所述的方法,其特征在于,所述网络侧设置用户感兴趣的实体词包括下述步骤: 根据所述用户的网络访问行为数据对应的多个维度上的属性信息计算所述用户的网络访问行为数据中的实体词的权重值; 根据所述用户的网络访问行为数 据中的实体词的权重值确定所述用户对所述网络访问行为数据所属的类别中的实体词的关注度; 根据所述用户对所述网络访问行为数据所属类别中的实体词的关注度和预先设定的相应类别中的实体词对应的兴趣阈值识别所述用户感兴趣的实体词。
7.一种用户兴趣发现装置,其特征在于,包括: 请求模块,用于向网络侧发送用户的兴趣信息请求,并接收网络侧根据所述请求返回的用户的兴趣信息,所述用户的兴趣信息包括:类别和实体词; 显示模块,用于将所述用户的兴趣信息展示在用户的网络终端设备所显示的话题选择区; 确定模块,用于接收用户针对话题选择区输入的话题选择信息,并根据所述话题选择信息确定用户选择的类别和实体词; 传输模块,用于将用户选择的类别和实体词传输至网络侧,所述用户选择的类别和实体词用于网络侧修正网络侧预先存储的所述用户的兴趣信息。
8.如权利要求7所述的装置,其特征在于,所述显示模块还用于: 在将所述用户的兴趣信息展示在用户的网络终端设备所显示的话题选择区的情况下,在用户的网络终端设备所显示的产品说明区中展示类别的说明信息、实体词的说明信息以及所述方法对应的产品的说明信息中的至少一个。
9.如权利要求7或8所述的装置,其特征在于,所述用户的兴趣信息包括:网络侧基于所述用户的网络访问行为数据与网络中多个用户的网络访问行为数据的比较结果而设置的用户感兴趣的类别和实体词。
10.如权利要求9所 述的装置,其特征在于,所述用户的兴趣信息还包括: 属于所述用户的兴趣信息中的类别但不是所述用户的兴趣信息中的实体词而是其他用户的兴趣信息中的实体词;所述其他用户为其兴趣信息中具有所述用户的兴趣信息中的类别的用户。
11.如权利要求9所述的装置,其特征在于,所述装置还包括: 采集模块,用于采集用户的网络访问行为数据; 确定类别模块,用于根据所述网络访问行为数据所包含的实体词以及预先设定的各类别分别对应的多个实体词确定所述网络访问行为数据所属的类别; 权重值模块,用于根据所述网络访问行为数据对应的多个维度上的属性信息计算所述网络访问行为数据的权重值; 关注度模块,用于根据所述用户的网络访问行为数据的权重值确定所述用户对所述网络访问行为数据所属的类别的关注度; 兴趣识别模块,用于根据所述用户对所述网络访问行为数据所属类别的关注度和预先设定的相应类别对应的兴趣阈值识别所述用户感兴趣的类别,其中,所述类别对应的兴趣阈值是根据网络中多个用户对该类别进行访问的网络访问行为数据设置的。
12.如权利要求11所述的装置,其特征在于: 权重值模块还用于,根据所述用户的网络访问行为数据对应的多个维度上的属性信息计算所述用户的网络访问行为数据中的实体词的权重值; 关注度模块还用于,根据所述用户的网络访问行为数据中的实体词的权重值确定所述用户对所述网络访问行为数据所属的类别中的实体词的关注度; 兴趣识别模块还用于,根据所述用户对所述网络访问行为数据所属类别中的实体词的关注度和预先设定的相应类别中的实体词对应的兴趣阈值识别所述用户感兴趣的实体词。
13.一种用户兴趣发现方法,其特征在于,包括:接收用户的兴趣信息请求,并根据预先存储的兴趣信息向用户的网络终端设备返回所述用户的兴趣信息,所述用户的兴趣信息包括:类别和实体词; 接收来自所述网络终端设备的所述用户选择的类别和实体词; 根据所述用户选择的类别和实体词对所述预先存储的兴趣信息中的所述用户的兴趣信息进行修正。
14.如权利要求13所述的方法,其特征在于,所述预先存储的兴趣信息包括:基于所述用户的网络访问行为数据与网络中多个用户的网络访问行为数据的比较结果而设置的用户感兴趣的类别和实体词。
15.如权利要求14所述的方法,其特征在于,所述预先存储的兴趣信息还包括: 属于所述用户的兴趣信息中的类别但不是所述用户的兴趣信息中的实体词而是其他用户的兴趣信息中的实体词;所述其他用户为其兴趣信息中具有所述用户的兴趣信息中的类别的用户。
16.如权利要求14所述的方法,其特征在于,所述预先存储的用户感兴趣的类别是通过下述步骤设置的: 采集用户的网络访问行为数据; 根据所述网络访问行为数据所包含的实体词以及预先设定的各类别分别对应的多个实体词确定所述网络访问行为数据所属的类别; 根据所述网络访问行为数据对应的多个维度上的属性信息计算所述网络访问行为数据的权重值; 根据所述用户的网络访问行为数据的权重值确定所述用户对所述网络访问行为数据所属的类别的关注度; 根据所述用户对所述网络访问行为数据所属类别的关注度和预先设定的相应类别对应的兴趣阈值识别所述用户感兴趣的类别,其中,所述类别对应的兴趣阈值是根据网络中多个用户对该类别进行访问的网络访问行为数据设置的。
17.如权利要求16所述的方法,其特征在于,所述预先存储的用户感兴趣的实体词是通过下述步骤设置的: 根据所述用户的网络访问行为数据对应的多个维度上的属性信息计算所述用户的网络访问行为数据中的实体词的权重值; 根据所述用户的网络访问行为数据中的实体词的权重值确定所述用户对所述网络访问行为数据所属的类别中的实体词的关注度; 根据所述用户对所述网络访问行为数据所属类别中的实体词的关注度和预先设定的相应类别中的实体词对应的兴趣阈值识别所述用户感兴趣的实体词。
18.一种用户兴趣发现装置,其特征在于,包括: 请求响应模块,用于接收用户的兴趣信息请求,并根据预先存储的兴趣信息向用户的网络终端 设备返回所述用户的兴趣信息,所述用户的兴趣信息包括:类别和实体词; 接收模块,用于接收来自所述网络终端设备的所述用户选择的类别和实体词; 修正模块,用于根据所述用户选择的类别和实体词对所述预先存储的兴趣信息中的所述用户的兴趣信息进行修正。
19.如权利要求18所述的装置,其特征在于,所述预先存储的兴趣信息包括:基于所述用户的网络访问行为数据与网络中多个用户的网络访问行为数据的比较结果而设置的用户感兴趣的类别和实体词。
20.如权利要求19所述的装置,其特征在于,所述预先存储的兴趣信息还包括: 属于所述用户的兴趣信息中的类别但不是所述用户的兴趣信息中的实体词而是其他用户的兴趣信息中的实体词;所述其他用户为其兴趣信息中具有所述用户的兴趣信息中的类别的用户。
21.如权利要求14所述的装置,其特征在于,所述装置还包括: 采集模块,用于采集用户的网络访问行为数据; 确定类别模块,用于根据所述网络访问行为数据所包含的实体词以及预先设定的各类别分别对应的多个实体词确定所述网络访问行为数据所属的类别; 权重值模块,用于根据所述网络访问行为数据对应的多个维度上的属性信息计算所述网络访问行为数据的权重值; 关注度模块,用于根据所述用户的网络访问行为数据的权重值确定所述用户对所述网络访问行为数据所属的类别的关注度; 兴趣识别模块,用于根据所述用户对所述网络访问行为数据所属类别的关注度和预先设定的相应类别对应的兴趣阈值识别所述用户感兴趣的类别,其中,所述类别对应的兴趣阈值是根据网络中多个用户对该类别进行访问的网络访问行为数据设置的。
22.如权利要求21所述 的装置,其特征在于: 权重值模块还用于,根据所述用户的网络访问行为数据对应的多个维度上的属性信息计算所述用户的网络访问行为数据中的实体词的权重值; 关注度模块还用于,根据所述用户的网络访问行为数据中的实体词的权重值确定所述用户对所述网络访问行为数据所属的类别中的实体词的关注度; 兴趣识别模块还用于,根据所述用户对所述网络访问行为数据所属类别中的实体词的关注度和预先设定的相应类别中的 实体词对应的兴趣阈值识别所述用户感兴趣的实体词。
【文档编号】G06F17/30GK103888466SQ201410124527
【公开日】2014年6月25日 申请日期:2014年3月28日 优先权日:2014年3月28日
【发明者】李达, 郭奇 申请人:北京搜狗科技发展有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1