确定兴趣标签权重的方法、装置、存储介质及电子设备与流程

文档序号:20839664发布日期:2020-05-22 17:20阅读:259来源:国知局
确定兴趣标签权重的方法、装置、存储介质及电子设备与流程

本公开涉及涉及信息推荐的技术领域,具体地,涉及一种确定兴趣标签权重的方法、装置、存储介质及电子设备。



背景技术:

现今,越来越多的用户使用电子设备,通过互联网获取所需的信息,例如,通过移动电话进行网上新闻、幽默笑话等阅读,以了解基于自己兴趣爱好的各种事实动态,用以缓解生活及工作压力。

以新闻为例,随着互联网上信息的爆炸式发展,每天发生的新闻数量庞大、新闻类型繁多,用户从如此海量的新闻中找到符合自己兴趣爱好的新闻,需要花费大量的时间,导致新闻浏览效率较低。



技术实现要素:

本公开的目的是提供一种确定兴趣标签权重的方法、装置、存储介质及电子设备,通过本公开确定的兴趣标签权重,可以提高信息推荐的命中率,从而提升用户的信息浏览效率。

为了实现上述目的,本公开提供一种确定兴趣标签权重的方法,包括:获取用户当前浏览的信息的信息标签及各信息标签的原始权重;在所述用户当前浏览的信息为热点信息时,对所述信息标签的原始权重进行权重热点衰减处理,得到信息标签的当前权重;获取用户浏览信息的行为权重;将各信息标签确定为用户的兴趣标签,并根据各个信息标签的当前权重及行为权重确定各兴趣标签的目标权重;所述兴趣标签的目标权重用于表征用户对该兴趣标签的关注度。

可选地,所述在所述用户当前浏览的信息为热点信息时,对所述信息标签的原始权重进行权重热点衰减处理,得到信息标签的当前权重包括:当所述用户当前浏览的信息的点击次数超过预设次数时,则所述用户当前浏览的信息为热点信息,根据所述点击次数确定第一衰减系数;将所述第一衰减系数与所述信息标签的原始权重相乘,得到信息标签的当前权重。

可选地,所述在所述用户当前浏览的信息为热点信息时,对所述信息标签的原始权重进行权重热点衰减处理,得到信息标签的当前权重包括:当所述用户当前浏览的信息是第一信息时,则所述用户当前浏览的信息为热点信息,确定所述用户当前浏览的信息的发布时间;所述第一信息是当前浏览的网站页面在预设区域内显示的第一条供用户阅读的信息;利用所述发布时间距当前时间的时间间隔确定第二衰减系数;将所述第二衰减系数与所述信息标签的原始权重相乘,得到信息标签的当前权重。

可选地,所述根据各个信息标签的当前权重及行为权重确定各兴趣标签的目标权重包括:根据各个信息标签的当前权重及行为权重确定用户的各兴趣标签的待定权重;对用户的每一个本次确定的兴趣标签,若存在已保存的兴趣标签与本次确定的兴趣标签相同的情况,则将与本次确定的兴趣标签相同的已保存的兴趣标签的目标权重进行时间衰减处理后与本次确定的兴趣标签的待定权重累加,得到本次确定的兴趣标签的目标权重,通过本次确定的兴趣标签的目标权重更新与本次确定的兴趣标签相同的已保存的兴趣标签的目标权重,或者,若不存在已保存的兴趣标签与本次确定的兴趣标签相同的情况,则将本次确定的兴趣标签的待定权重作为该兴趣标签的目标权重,并保存。

可选地,在所述确定用户的兴趣标签及兴趣标签的目标权重之后,还包括:将保存的各兴趣标签的目标权重进行周期性时间衰减处理,并更新保存的各兴趣标签的目标权重。

可选地,所述将兴趣标签的目标权重进行时间衰减处理包括:在所述兴趣标签为用户的长期兴趣标签时,则通过线性衰减函数对该兴趣标签的目标权重进行线性衰减处理;所述用户的长期兴趣标签是指在预设时间之前已保存的,且目标权重未衰减至小于等于第一阈值的兴趣标签;或者,在所述兴趣标签为用户的短期兴趣标签时,则通过遗忘函数对该兴趣标签的目标权重进行非线性衰减处理;所述短期兴趣标签是除所述长期兴趣标签之外的其他兴趣标签。

进一步地,本申请还提供了一种确定兴趣标签的装置,包括:获取模块,用于获取用户当前浏览的信息的信息标签及各信息标签的原始权重;处理模块,用于在所述用户当前浏览的信息为热点信息时,对所述信息标签的原始权重进行权重热点衰减处理,得到信息标签的当前权重;所述获取模块,还用于获取用户浏览信息的行为权重;确定模块,用于将各信息标签确定为用户的兴趣标签,并根据各个信息标签的当前权重及行为权重确定各兴趣标签的目标权重;所述兴趣标签的目标权重用于表征用户对该兴趣标签的关注度。

可选地,处理模块,具体用于当所述用户当前浏览的信息的点击次数超过预设次数时,则所述用户当前浏览的信息为热点信息,根据所述点击次数确定第一衰减系数;将所述第一衰减系数与所述信息标签的原始权重相乘,得到信息标签的当前权重。

可选地,处理模块,具体用于当所述用户当前浏览的信息是第一信息时,则所述用户当前浏览的信息为热点信息,确定所述用户当前浏览的信息的发布时间;所述第一信息是当前浏览的网站页面在预设区域内显示的第一条供用户阅读的信息;利用所述发布时间距当前时间的时间间隔确定第二衰减系数;将所述第二衰减系数与所述信息标签的原始权重相乘,得到信息标签的当前权重。

可选地,确定模块,具体用于根据各个信息标签的当前权重及行为权重确定用户的各兴趣标签的待定权重;对用户的每一个本次确定的兴趣标签,若存在已保存的兴趣标签与本次确定的兴趣标签相同的情况,则将与本次确定的兴趣标签相同的已保存的兴趣标签的目标权重进行时间衰减处理后与本次确定的兴趣标签的待定权重累加,得到本次确定的兴趣标签的目标权重,通过本次确定的兴趣标签的目标权重更新与本次确定的兴趣标签相同的已保存的兴趣标签的目标权重,或者,若不存在已保存的兴趣标签与本次确定的兴趣标签相同的情况,则将本次确定的兴趣标签的待定权重作为该兴趣标签的目标权重,并保存。

可选地,处理模块,还用于将保存的各兴趣标签的目标权重进行周期性时间衰减处理,并更新保存的各兴趣标签的目标权重。

可选地,所述将兴趣标签的目标权重进行时间衰减处理包括:在所述兴趣标签为用户的长期兴趣标签时,则通过线性衰减函数对该兴趣标签的目标权重进行线性衰减处理;所述用户的长期兴趣标签是指在预设时间之前已保存的,且目标权重未衰减至小于等于第一阈值的兴趣标签;或者,在所述兴趣标签为用户的短期兴趣标签时,则通过遗忘函数对该兴趣标签的目标权重进行非线性衰减处理;所述短期兴趣标签是除所述长期兴趣标签之外的其他兴趣标签。

进一步的,本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述实施例所述的确定兴趣标签权重的方法中任一项所述方法的步骤。

进一步的,本申请还提供了一种电子设备,包括:存储器,其上存储有计算机程序;处理器,用于执行所述存储器中的所述计算机程序,以实现上述实施例所述的确定兴趣标签权重的方法中任一项所述方法的步骤。

通过上述技术方案,获取用户当前浏览的信息的信息标签及各信息标签的原始权重,在当前浏览的信息为热点信息时,对信息标签的原始权重进行权重热点衰减处理,得到信息标签的当前权重;获取用户浏览信息的行为权重;将各信息标签确定为用户的兴趣标签,并根据各个信息标签的当前权重及行为权重确定各兴趣标签的目标权重。这样,若用户当前浏览的信息为热点信息时,由于热点信息是大众普遍关注的,与用户的实际兴趣关联性较小,因此可以先将此信息标签的原始权重进行热点衰减处理,再根据经热点衰减处理后的信息标签的当前权重及获取的行为权重确定用户的兴趣标签的目标权重,即为将从热点信息中获取的兴趣标签的目标权重进行了衰减处理,避免其权重过大,提高了各兴趣标签的权重的准确性,从而在基于用户的各兴趣标签权重进行信息推荐时,可以提高信息推荐的命中率,进而提升用户的信息浏览效率。

本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。

附图说明

附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:

图1是本申请实施例公开的一种确定兴趣标签权重的方法的流程示意图;

图2是本申请实施例公开的另一种确定兴趣标签权重的方法的流程示意图;

图3是本申请实施例公开的一种确定兴趣标签权重的装置的结构示意图;

图4是本申请公开的一种电子设备的结构示意图。

具体实施方式

以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。

目前,为了提升用户的信息浏览效率,需根据用户的喜好为用户推荐信息。在现有技术中,通过分析用户浏览的信息及其行为可以获知用户的兴趣标签及各兴趣标签的权重,以此来表征用户对不同内容的喜好程度。其中,兴趣标签的权重用于表征用户对该兴趣标签的关注度。兴趣标签的权重确定的越准确,则基于兴趣标签向用户推荐的信息的命中率越高,用户的信息浏览效率也就越高。常用确定用户兴趣标签权重的方法为:先获取用户当前浏览的信息的信息标签及信息标签的权重,根据用户对浏览信息的行为确定行为权重,再根据信息标签的权重及行为权重,与历史兴趣标签的权重衰减后的值确定出用户的兴趣标签的最终权重。然而,对于一个瞬间热点的事件,如某某明显离婚事件,用户集中关注了几天之后,就不再继续关注了,表明该事件不再是用户感兴趣的事件了,而根据现有的用户兴趣标签的权重确定方法,该事件确定的兴趣标签的最终权重较大且衰减的较慢。这样利用上述方法确定的兴趣标签的权重,确定用户的喜好为用户推荐信息,其命中率较低,无法提升用户的信息浏览效率。

而在本申请中,先获取用户当前浏览的信息的信息标签及个信息标签的原始权重;在用户浏览的信息为热点信息时,对信息标签的原始权重进行权重热点衰减处理,得到信息标签的当前权重;获取用户浏览信息的行为权重;将信息标签确定为用户的兴趣标签,进而根据各个信息标签的当前权重及行为权重,确定出各个兴趣标签的目标权重。在申请中,若用户当前浏览的信息为热点信息时,由于热点信息是大众普遍关注的,与用户的实际兴趣关联性较小,因此可以先将此信息标签的原始权重进行热点衰减处理,再根据经热点衰减处理后的信息标签的当前权重及获取的行为权重确定用户的兴趣标签的目标权重,即为将从热点信息中获取的兴趣标签的目标权重进行了衰减处理,避免其权重过大,提高了各兴趣标签的权重的准确性,从而在基于用户的各兴趣标签权重进行信息推荐时,可以提高信息推荐的命中率,进而提升用户的信息浏览效率。

本申请实施例提供了一种确定兴趣标签权重的方法,如图1所示,包括:

步骤s101、获取用户当前浏览的信息的信息标签及各信息标签的原始权重。

具体的,在用户当前浏览的信息中,获取此信息中的信息标签及每个信息标签的原始权重。其中,信息的信息标签及信息标签的原始权重可以通过自然语言处理中的关键字提取方法获取。例如通过tf-idf(termfrequency-inversedocumentfrequency,词频-逆文档频率)算法提取信息中的信息标签及其原始权重。或者,通过textrank算法获取信息的信息标签及信息标签的原始权重。

需要说明的是,获取用户当前浏览的信息的信息标签及各信息标签的原始权重的算法还可以是其他算法,本申请对此不做限制。

步骤s102、在用户当前浏览的信息为热点信息时,对信息标签的原始权重进行权重热点衰减处理,得到信息标签的当前权重。

具体的,在获取了当前浏览的信息的信息标签及其原始权重后,由于需要将热点信息的信息标签的原始权重进行衰减处理,因此需先确定当前浏览的信息是否为热点信息。在确定是热点信息时,需对信息标签的原始权重进行权重热点衰减处理,得到信息标签的当前权重。

进一步的,确定当前浏览的信息是否为热点信息可以从当前浏览的信息的点击次数确定。此时,用户当前浏览的信息为热点信息时,对信息标签的原始权重进行权重热点衰减处理,得到信息标签的当前权重包括:当用户当前浏览的信息的点击次数超过预设次数时,则用户当前浏览的信息为热点信息,根据点击次数确定第一衰减系数;将第一衰减系数与信息标签的原始权重相乘,得到信息标签的当前权重。

即为,在确定当前浏览的信息是否为热点信息时,可以检测当前浏览的信息的点击次数,确定其点击次数是否超过预设次数,若超过预设次数,则说明大众关注度较高,则确定为热点信息。也就是说,检测当前浏览的信息的点击量是否达到预设的值。若点击量达到预设的值,例如点击量超过1万次,则说明超过1万多人关注,属于大众关注度较高的信息,确定为热点信息。此时,根据当前浏览的信息的实际点击次数确定第一衰减系数,将第一衰减系数与信息标签的原始权重相乘,即为对信息标签的原始权重进行第一衰减处理,得到信息标签的当前权重。

进一步的,根据点击次数确定第一衰减系数包括:根据公式m1=max(2-a*exp(n-b),0)确定第一衰减系数。其中,m1为第一衰减系数,a为调节幅度参数,n为点击次数,b为预设次数。需要说明的是,调节幅度参数a是根据实际需衰减的幅度大小预先确定的。

当然,确定当前浏览的信息是否为热点信息还可以从当前浏览的信息是否为第一信息来确定,此时,在用户当前浏览的信息为热点信息时,对信息标签的原始权重进行权重热点衰减处理,得到信息标签的当前权重包括:

当用户当前浏览的信息是第一信息时,则用户当前浏览的信息为热点信息,确定用户当前浏览的信息的发布时间。利用发布时间距当前时间的时间间隔确定第二衰减系数。将第二衰减系数与所述信息标签的原始权重相乘,得到信息标签的当前权重。其中,第一信息是当前浏览的网站页面在预设区域内显示的第一条供用户阅读的信息。

也就是说,检测用户当前浏览的信息是否为第一信息,即为检测用户当前浏览的信息是否为当前浏览的网站页面在预设区域内显示的第一条供用户阅读的信息。如果用户当前浏览的信息是第一信息,即为当前浏览的信息是当前浏览的网站页面在预设区域内显示的第一条供用户阅读的信息,则确定当前浏览的信息是热点信息。此时,检测当前浏览的信息,确定其发布时间。根据当前浏览的信息的发布时间与当前时间的时间间隔来确定第二衰减信息。并在确定第二衰减系数后,将第二衰减系数与信息标签的原始权重相乘,即为利用第二衰减系数对信息标签的原始权重进行第二衰减处理,得到信息标签的当前权重。

进一步的,根据当前浏览的信息发布时间与当前时间的时间间隔确定第二衰减系数包括:根据下述公式确定第二衰减系数,当t大于c时,m2=1/(k*t+d),当t大于0且不大于c时,m2=1。其中,m2为第二衰减系数,t为当前浏览的信息发布时间与当前时间的时间间隔,c为预设时间阈值,k及d均为预先设置的衰减参数,在设置衰减参数k及d时,需k及d满足条件k*c+d=1。

需要说的是,确定信息标签是否为热点信息时,可以仅通过检测当前浏览的信息的点击次数来确定,也可以仅通过检测当前浏览的信息是否为第一信息来确定,当然,还可以即检测当前浏览的信息的点击次数,又检测当前浏览的信息是否为第一信息。在即检测当前浏览的信息的点击次数,又检测当前浏览的信息是否为第一信息时,若当前浏览的信息仅是点击次数超过预设次数,并不是第一信息时,则对信息标签的原始权重仅需通过第一衰减系数进行第一衰减处理。若当前浏览的信息仅是第一信息,其点击次数并未超过预设次数时,则对信息标签的原始权重仅需通过第二衰减系数进行第二衰减处理。若当前浏览的信息的点击次数超过预设次数,且当前浏览的信息又是第一信息时,则将当前浏览的信息的信息标签的原始权重即需通过第一衰减系数进行第一衰减处理,又需通过第二衰减系数进行第二衰减处理,经过两次衰减处理后,得到的信息标签的权重即为信息标签的当前权重。

步骤s103、获取用户浏览信息的行为权重。

具体的,根据用户对当前浏览的信息的行为,获取其行为权重。即为,根据用户对当前浏览的信息是否仅是浏览,或者是否收藏该信息,或者是否分享该信息,或者是否评论该信息的行为,在确定行为权重。

需要说明的是,用户的行为还可以包含其他行为,且用户每个行为对应的行为权重是根据实际需求预先设定的,本申请对用户的行为不做限制。例如,分享的行为权重为1,收藏的行为权重为0.8,评论的行为权重为0.6,浏览的行为权重为0.4。

步骤s104、将各信息标签确定为用户的兴趣标签,并根据各个信息标签的当前权重及行为权重确定各兴趣标签的目标权重。

其中,兴趣标签的目标权重用于表征用户对该兴趣标签的关注度。

具体的,用户浏览信息,则可以认为用户对此信息有兴趣,此时,将当前浏览的信息的信息标签均确定为用户的兴趣标签。由于用户对每个兴趣标签的关注度不同,因此,可以通过兴趣标签的目标权重来表示用户对每个兴趣标签的关注指数。此时,可以根据上述步骤得到的各个信息标签的当前权重及获取的行为权重,确定各个兴趣标签的目标权重。

进一步的,根据各个信息标签的当前权重及行为权重确定各兴趣标签的目标权重包括:根据各个信息标签的当前权重及行为权重确定用户的各兴趣标签的待定权重;

对用户的每一个本次确定的兴趣标签,若存在已保存的兴趣标签与本次确定的兴趣标签相同的情况,则将与本次确定的兴趣标签相同的已保存的兴趣标签的目标权重进行时间衰减处理后与本次确定的兴趣标签的待定权重累加,得到本次确定的兴趣标签的目标权重,通过本次确定的兴趣标签的目标权重更新与本次确定的兴趣标签相同的已保存的兴趣标签的目标权重。

或者,若不存在已保存的兴趣标签与本次确定的兴趣标签相同的情况,则将本次确定的兴趣标签的待定权重作为该兴趣标签的目标权重,并保存。

也就是说,在将信息标签确定为用户的兴趣标签后,需进一步确定兴趣标签的目标权重。此时,可以根据信息标签的当前权重及用户的行为权重确定出兴趣标签的待定权重,即为将各个信息标签的当前权重与行为权重相乘得到用户的各兴趣标签的待定权重。

需要说明的是,针对上述确定的所有兴趣标签中的每一个兴趣标签,其目标权重均是通过下述方法得到的。在下述说明中,为了方便描述,以确定的所有兴趣标签中的一个兴趣标签的目标权重为例进行说明。

在将当前浏览的信息的信息标签确定为用户的兴趣标签后,由于本次确定的兴趣标签与历史的兴趣标签相同时,需将本次确定的兴趣标签的待定权重与历史的兴趣标签的目标权重累加得到本次确定的兴趣标签的目标权重。而在本申请中,每次确定出兴趣标签及其目标权重后,均进行保存。因此,在确定本次确定的兴趣标签是否与历史的兴趣标签相同时,可以检测已保存的兴趣标签中是否有与本次确定的兴趣标签相同的兴趣标签。若已保存的兴趣标签中有与本次确定的兴趣标签相同的兴趣标签,则需要将本次确定的兴趣标签的待定权重与已保存的跟本次确定的兴趣标签相同的兴趣标签的目标权重进行累加,才能得到本次确定的兴趣标签的目标权重。在将与本次确定的兴趣标签相同的已保存的兴趣标签的目标权重与本次确定的兴趣标签的待定权重累加之前,需先对与本次确定的兴趣标签相同的已保存的兴趣标签的目标权重进行时间衰减处理,再将其与本次确定的兴趣标签的待定权重累加得到本次确定的兴趣标签的目标权重。在得到本次确定的兴趣标签的目标权重后,通过本次确定的兴趣标签的目标权重,更新与本次确定的兴趣标签相同的已保存的兴趣标签的目标权重。即为,将与本次确定的兴趣标签相同的已保存的兴趣标签的目标权重更新为最新值。

示例性的,当前确定的兴趣标签为内容a,内容b及内容c,若已保存的兴趣标签中有内容a,内容c,内容d等。此时,通过检测已保存的兴趣标签,可以确定出已保存的兴趣标签中,内容a及内容c与本次确定的兴趣标签中的内容a及内容c相同。即为存在已保存的兴趣标签与本次确定的兴趣标签相同的情况。此时,需先将已保存的内容a的目标权重进行时间衰减处理,再将已保存的内容a的进行了时间衰减处理后的目标权重与本次确定的内容a的待定权重进行累加得到本次确定的内容a的目标权重。并将已保存的内容a的目标权重更新为本次确定的内容a的目标权重。同理,本次确定的内容c的目标权重也是上述方法得到,在此不再赘述。

或者,在已保存的兴趣标签中没有与本次确定的兴趣标签相同的兴趣标签时,则说明本次确定的兴趣标签是第一次出现,此时,将本次确定的兴趣标签的待定权重作为此兴趣标签的目标权重,并对此兴趣标签及其目标权重进行保存。

进一步的,上述将兴趣标签的目标权重进行时间衰减处理包括:在兴趣标签为用户的长期兴趣标签时,则通过线性衰减函数对该兴趣标签的目标权重进行线性衰减处理。

其中,用户的长期兴趣标签是指在预设时间之前已保存的,且目标权重未衰减至小于等于第一阈值的兴趣标签。

或者,在兴趣标签为用户的短期兴趣标签时,则通过遗忘函数对该兴趣标签的目标权重进行非线性衰减处理。

其中,短期兴趣标签是除长期兴趣标签之外的其他兴趣标签。

具体的,用户的兴趣标签随时可能会发生变化,有的兴趣标签可能是近段时间比较关注以后不再关注的,有的兴趣标签可能是长时间一直比较关注。由此,可将用户的兴趣标签划分为长期兴趣标签及短期兴趣标签。其中,将在预设时间之前已保存的,且目标权重未衰减至小于等于第一阈值的兴趣标签确定为长期兴趣标签。将自预设时间至当前时间段内保存的,且目标权重未衰减至小于等于第一阈值的兴趣标签确定为短期标签。此时,在对兴趣标签的目标权重进行时间衰减处理时,由于长期兴趣标签及短期兴趣标签对应的时间衰减处理不同,因此需要先确定此兴趣标签是长期标签还是短期兴趣标签。可以先针对当前时间,将预设时间之前保存的兴趣标签,且目标权重未衰减至小于等于第一阈值的兴趣标签确定为长期兴趣标签。例如,预设时间为一周,可以针对当前时间,将一周前保存的兴趣标签,且目标权重未衰减至小于等于第一阈值的兴趣标签,确定为长期兴趣标签。在确定出长期兴趣标签后,检测需将目标权重进行时间衰减处理的兴趣标签是否为长期兴趣标签,即为检测长期兴趣标签中,是否有与需将目标权重进行时间衰减处理的兴趣标签相同的。如果长期兴趣标签中有与需将目标权重进行时间衰减处理的兴趣标签相同的,则确定需将目标权重进行时间衰减处理的兴趣标签为长期兴趣标签,如果长期兴趣标签中没有与需将目标权重进行时间衰减处理的兴趣标签相同的,则确定需将目标权重进行时间衰减处理的兴趣标签为短期兴趣标签。

在需将目标权重进行时间衰减处理的兴趣标签为用户的长期兴趣标签时,通过线性衰减函数对此兴趣标签的目标权重进行线性衰减处理,即为,通过公式w1=w2-t1/g对此兴趣标签的目标权重进行线性衰减处理,得到时间衰减处理后的该兴趣标签的目标权重。其中,w1为时间衰减处理后的该兴趣标签的目标权重,w2为进行时间衰减处理前的此兴趣标签的目标权重,t1为此兴趣标签上一次进行时间衰减处理的时间与当前时间间的时间间隔;g为预先设置的线性衰减系数,是根据衰减幅度的大小来确定的。衰减幅度越大,则g越小,衰减幅度越小,则g越大。

在需将目标权重进行时间衰减处理的兴趣标签为用户的短期兴趣标签时,通过遗忘函数对此兴趣标签的目标权重进行非线性衰减处理,即为,通过公式w1=1-0.56*w2^0.06对此兴趣标签的目标权重进行非线性衰减处理,得到时间衰减处理后的该兴趣标签的目标权重。

如上例中,需对已保存的内容a及内容c的目标权重进行时间衰减处理。假设,预设时间为一周,当前时间为2019年12月13日,已保存的内容a的保存时间为2019年12月3日,已保存的内容c的保存时间为2019年12月10日。将当前时间一周前已保存的,且目标权重大于第一阈值的兴趣标签确定为长期兴趣标签。将除长期兴趣标签之外的其他标签确定为短期标签。假设已保存的内容a及内容c的目标权重均大于第一阈值,此时可以通过内容a及内容c的保存时间确定出已保存的内容a为长期兴趣标签,已保存的内容c为短期兴趣标签。这样一来,需对已保存的内容a的目标权重通过线性衰减函数进行线性衰减处理,对已保存的内容c的目标权重通过遗忘函数进行非线性衰减处理。即为,在对已保存的内容a的目标权重进行时间衰减处理时,确定出已保存的内容a为用户的长期兴趣标签,此时,通过公式w1=w2-t1/g对已保存的内容a的目标权重进行线性衰减处理。

在对已保存的内容c的目标权重进行时间衰减处理时,确定出已保存的内容c为用户的短期兴趣标签,此时,通过公式w1=1-0.56*w2^0.06对已保存的内容c的目标权重进行非线性衰减处理。

需要说明的是,预设时间是根据实际需求预先设置的。可以是一周,也可以是一个月,还可以是其他时间,本申请对此不做限制。第一阈值是预先设置的,当目标权重衰减后的值小于第一阈值时,说明该兴趣标签用户已不再关注。第一阈值可以是0,也可是0.01或是其他值,本申请对此不做限制。

需要说明的是,在上述步骤确定出用户当前浏览的信息不是热点信息时,则直接将各信息标签的原始权重确定为各个信息标签的当前权重,并执行步骤s103-s104,在此不再赘述。

进一步的,在上述步骤s104之后,如图2所示,还包括:

步骤s105、将保存的各兴趣标签的目标权重进行周期性时间衰减处理,并更新保存的各兴趣标签的目标权重。

具体的,在确定出用户的各兴趣标签及其目标权重后,保存的各兴趣标签的目标权重并不是一成不变的,而是随着时间时刻衰减的,因此可以定期衰减并更新保存的兴趣标签的目标权重,以便后续更准确的根据用户的兴趣标签及其目标权重为用户提供个性化服务。即为,可以周期性将保存的各兴趣标签的目标权重进行时间衰减处理,并更新保存的各兴趣标签的目标权重。

需要说明的是,在本步骤中的对保存的各兴趣标签的目标权重进行时间衰减处理的过程可以参考上述步骤s104中的将与本次确定的兴趣标签相同的已保存的兴趣标签的目标权重进行时间衰减处理的过程,在此不再赘述。

进一步的,在保存的各兴趣标签的目标权重进行周期性时间衰减处理,若衰减后的目标权重的值小于等于第一阈值时,说明该兴趣标签用户已不再关注,可以将保存的该兴趣标签及其对应的目标权重删除。

这样一来,可以仅保存用户关注的兴趣标签,将因用户误点信息而产生的兴趣标签自动删除,还可以将用户不再关注的兴趣标签自动删除,进而可以使保存的兴趣标签及其目标权重更加符合实际情况,更准确。

在本申请中,若用户当前浏览的信息为热点信息时,由于热点信息是大众普遍关注的,与用户的实际兴趣关联性较小,因此可以先将此信息标签的原始权重进行热点衰减处理,再根据经热点衰减处理后的信息标签的当前权重及获取的行为权重确定用户的兴趣标签的目标权重,即为将从热点信息中获取的兴趣标签的目标权重进行了衰减处理,避免其权重过大,提高了各兴趣标签的权重的准确性,从而在基于用户的各兴趣标签权重进行信息推荐时,可以提高信息推荐的命中率,进而提升用户的信息浏览效率。

本申请公开了一种确定兴趣标签的装置300,如图3所示,包括:

获取模块301,用于获取用户当前浏览的信息的信息标签及各信息标签的原始权重。

处理模块302,用于在用户当前浏览的信息为热点信息时,对信息标签的原始权重进行权重热点衰减处理,得到信息标签的当前权重。

具体的,处理模块302,具体用于当用户当前浏览的信息的点击次数超过预设次数时,则用户当前浏览的信息为热点信息,根据点击次数确定第一衰减系数;将第一衰减系数与信息标签的原始权重相乘,得到信息标签的当前权重。

当用户当前浏览的信息是第一信息时,则用户当前浏览的信息为热点信息,确定用户当前浏览的信息的发布时间。利用发布时间距当前时间的时间间隔确定第二衰减系数;将第二衰减系数与信息标签的原始权重相乘,得到信息标签的当前权重。

其中,第一信息是当前浏览的网站页面在预设区域内显示的第一条供用户阅读的信息。

获取模块301,还用于获取用户浏览信息的行为权重。

确定模块303,用于将各信息标签确定为用户的兴趣标签,并根据各个信息标签的当前权重及行为权重确定各兴趣标签的目标权重。

其中,兴趣标签的目标权重用于表征用户对该兴趣标签的关注度。

具体的,确定模块303,具有用于根据各个信息标签的当前权重及行为权重确定用户的各兴趣标签的待定权重;

对用户的每一个本次确定的兴趣标签,若存在已保存的兴趣标签与本次确定的兴趣标签相同的情况,则将与本次确定的兴趣标签相同的已保存的兴趣标签的目标权重进行时间衰减处理后与本次确定的兴趣标签的待定权重累加,得到本次确定的兴趣标签的目标权重,通过本次确定的兴趣标签的目标权重更新与本次确定的兴趣标签相同的已保存的兴趣标签的目标权重,

或者,若不存在已保存的兴趣标签与本次确定的兴趣标签相同的情况,则将本次确定的兴趣标签的待定权重作为该兴趣标签的目标权重,并保存。

进一步的,确定模块303将兴趣标签的目标权重进行时间衰减处理具体为:

在兴趣标签为用户的长期兴趣标签时,则确定模块303通过线性衰减函数对该兴趣标签的目标权重进行线性衰减处理。其中,用户的长期兴趣标签是指在预设时间之前已保存的,且目标权重未衰减至小于等于第一阈值的兴趣标签。

或者,

在兴趣标签为用户的短期兴趣标签时,则确定模块303通过遗忘函数对该兴趣标签的目标权重进行非线性衰减处理。其中,短期兴趣标签是除长期兴趣标签之外的其他兴趣标签。

进一步的,上述处理模块302,还用于将保存的各兴趣标签的目标权重进行周期性时间衰减处理,并更新保存的各兴趣标签的目标权重。

具体的,处理模块302将保存的各兴趣标签的目标权重进行周期性时间衰减处理具体为:

针对每个保存的兴趣标签,在兴趣标签为用户的长期兴趣标签时,则处理模块302通过线性衰减函数对该兴趣标签的目标权重进行线性衰减处理。其中,用户的长期兴趣标签是指在预设时间之前已保存的,且目标权重未衰减至小于等于第一阈值的兴趣标签。

或者,

在兴趣标签为用户的短期兴趣标签时,则处理模块302通过遗忘函数对该兴趣标签的目标权重进行非线性衰减处理。其中,短期兴趣标签是除长期兴趣标签之外的其他兴趣标签。

在本申请中,若用户当前浏览的信息为热点信息时,由于热点信息是大众普遍关注的,与用户的实际兴趣关联性较小,因此可以先将此信息标签的原始权重进行热点衰减处理,再根据经热点衰减处理后的信息标签的当前权重及获取的行为权重确定用户的兴趣标签的目标权重,即为将从热点信息中获取的兴趣标签的目标权重进行了衰减处理,避免其权重过大,提高了各兴趣标签的权重的准确性,从而在基于用户的各兴趣标签权重进行信息推荐时,可以提高信息推荐的命中率,进而提升用户的信息浏览效率。

关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

图4是根据一示例性实施例示出的一种电子设备400的框图。如图4所示,该电子设备400可以包括:处理器401,存储器402。该电子设备400还可以包括多媒体组件403,输入/输出(i/o)接口404,以及通信组件405中的一者或多者。

其中,处理器401用于控制该电子设备400的整体操作,以完成上述的确定兴趣标签权重的方法中的全部或部分步骤。存储器402用于存储各种类型的数据以支持在该电子设备400的操作,这些数据例如可以包括用于在该电子设备400上操作的任何应用程序或方法的指令,以及应用程序相关的数据,例如联系人数据、收发的消息、图片、音频、视频等等。该存储器402可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(staticrandomaccessmemory,简称sram),电可擦除可编程只读存储器(electricallyerasableprogrammableread-onlymemory,简称eeprom),可擦除可编程只读存储器(erasableprogrammableread-onlymemory,简称eprom),可编程只读存储器(programmableread-onlymemory,简称prom),只读存储器(read-onlymemory,简称rom),磁存储器,快闪存储器,磁盘或光盘。多媒体组件403可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器402或通过通信组件405发送。音频组件还包括至少一个扬声器,用于输出音频信号。i/o接口404为处理器401和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件405用于该电子设备400与其他设备之间进行有线或无线通信。无线通信,例如wi-fi,蓝牙,近场通信(nearfieldcommunication,简称nfc),2g、3g、4g、nb-iot、emtc、或其他5g等等,或它们中的一种或几种的组合,在此不做限定。因此相应的该通信组件405可以包括:wi-fi模块,蓝牙模块,nfc模块等等。

在一示例性实施例中,电子设备400可以被一个或多个应用专用集成电路(applicationspecificintegratedcircuit,简称asic)、数字信号处理器(digitalsignalprocessor,简称dsp)、数字信号处理设备(digitalsignalprocessingdevice,简称dspd)、可编程逻辑器件(programmablelogicdevice,简称pld)、现场可编程门阵列(fieldprogrammablegatearray,简称fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的确定兴趣标签权重的方法。

在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的确定兴趣标签权重的方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器402,上述程序指令可由电子设备400的处理器401执行以完成上述的确定兴趣标签权重的方法。

在另一示例性实施例中,还提供一种计算机程序产品,该计算机程序产品包含能够由可编程的装置执行的计算机程序,该计算机程序具有当由该可编程的装置执行时用于执行上述的确定兴趣标签权重的方法的代码部分。

以上结合附图详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,可以对本公开的技术方案进行多种简单变型,这些简单变型均属于本公开的保护范围。

另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本公开对各种可能的组合方式不再另行说明。

此外,本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1