即时通讯消息提示的全排序方法与流程

文档序号:18009278发布日期:2019-06-25 23:47阅读:466来源:国知局
即时通讯消息提示的全排序方法与流程
本发明涉及互联网通信领域,尤其涉及即时通讯消息提示的全排序方法。
背景技术
:在移动互联网即时通讯类的app中,消息提示排序的方式一般按照时间进行倒序,即根据时间,最新的消息排在最顶部。虽然这种方式在很多场景下均比较适用,但并没有考虑到使用者的环境场景等客观因素,如使用者不希望在工作时间内将娱乐性质的消息置顶,则传统的消息提示排序方式则不能满足使用者的需求。为了解决上述类似问题,授权公告号为cn101288061b的中国专利公开了基于活动的电子邮件排序的方法和系统,其可以根据关于消息的用户动作所导出的量度对用户的消息做排名,还可以对消息的分组做排名,诸如会话或被确定为相似的一组消息。当接收新消息时,根据各消息的排名和所述新消息所涉及的消息分组的排名来估计用户对它的兴趣,根据所估计的用户兴趣来使新消息更突出或更不突出。但是上述技术方案仅仅基于用户对同类消息的历史操作判断用户对类似消息的兴趣度,即根据用户对某一类消息读取的比例而进行排名,并没有考虑用户在不同的时间段或不同的使用场景等多维度因素下,对同一种类型的消息的所采取的操作的差异性,因此,该仍然不能满足使用者对即时消息的排序要求。技术实现要素:本发明的目的在于提供即时通讯消息提示的全排序方法,其能够有效的融合环境,使用者习惯等因素,根据用户的行为习惯及使用场景进行消息的排序。本发明提供的即时通讯消息提示的全排序方法是通过以下技术方案实现的:即时通讯消息提示的全排序方法,包括行为分析和排序网络两个模块:行为分析,根据大数据统计和区分用户感兴趣的消息和不感兴趣的消息;排序网络,基于行为分析评估用户对接收到的消息的兴趣度,当新的通讯消息到达时,根据朴素贝叶斯网络获取兴趣度结果,并经排序网络输出。用户对某个消息感兴趣,其实是和消息本身的特性相关,如消息出现的时间点、消息内容的种类等因素,所以,对消息本身来说,其实是一个聚类问题,设置几个考察维度,通过行为分析把各维度相似度高的内容归集为一类,然后将用户接收到的消息放至对应的聚类,并通过朴素贝叶斯网络获取兴趣度结果,最后通过排序网络按照兴趣度的高低输出。在一些实施方式中,所述行为分析具体方法包括:s101:将消息定义为消息向量(a[1],a[2],…,a[n]),其中向量的坐标a[1]、a[2]、…、a[n]对应根据消息的特征定义分配的向量特征;s102:判断任意消息间的相似性,根据消息间的相似性得到消息的聚类。通过采用上述技术方案,将消息通过向量的方式表示,并根据向量的空间坐标的位置关系快速地得到消息的聚类,则相互靠近的向量对应的消息即为相似消息。在一些实施方式中,所述s101中,每个消息向量的坐标均包括接收时间、内容类型及点击频率三个向量特征,定义每个向量特征的区间为[0,100]。通过采用上述技术方案,将每个消息向量与多的维度的特征联系起来,从而得到消息与接收时间、内容类型及点击频率的关系。在一些实施方式中,时间特征按照24小时制时间段映射至区间,其中0代表0时,50代表12时,100代表24时;内容类型特征根据其分类映射至区间,其中类型ⅰ为0-100/n,类型ⅱ为100/n-100/n×2,…,类型n为100/n×(n-1)-100,其中n为容类型的总量;点击频率特征的频度数值越大代表越频繁。通过采用上述技术方案,使消息向量在空间上的位置取决于时间特征、内容类型特征及点击频率特征,明确了消息与接收时间、内容类型及点击频率的关系。在一些实施方式中,所述s102中,采用球面k均值的方式判断任意消息间的相似性,即采用两个向量之间余弦大小来度量,任意两个消息向量间余弦夹角越小则越相似。通过采用上述技术方案,能够更加便捷的得到消息向量的相似性。在一些实施方式中,所述排序网络包括步骤:s201:基于用户点击消息的行为,根据点击消息的时间、被点击消息的内容类型以及点击的频率,把点击的消息划分至具有对应向量特征的聚类,以实现消息的归类;s202:预测用户的点击倾向,得到用户在某个时间段内倾向于点击的消息的内容类型;s203:当新的消息来到时,根据朴素贝叶斯网络预测用户对该消息是否感兴趣;s204:根据对新消息预测的兴趣度对新消息进行排序输出。通过采用上述技术方案,通过用户点击消息的行为将用户接收到的消息放至对应的聚类,获取用户对单个特征的置信度以及通过朴素贝叶斯网络获取用户对多个特征的组合置信度,最后通过排序网络按照兴趣度的高低输出。在一些实施方式中,所述s202包括:s2021:按照时间段统计,用户在规定的时间段内未点击某一内容类型的消息,且未点击时长超出阀值t,则认为该用户对该内容类型的消息不感兴趣,具体公式为:ti:u(mi)∧(tn–tmi)>t其中,ti表示第i个统计时间段,u表示未点击mi类消息,tn表示当前时间,tmi表示该类消息的最新时间。通过采用上述技术方案,按照时间段统计,获取用户在不同时间段对某一内容类型的消息是否感兴趣,以列出不同内容类型的消息在不同时间段客户是否感兴趣的统计信息表。在一些实施方式中,所述s202还包括:s2022:把用户的点击行为按照时间特征和内容类型特征进行分解分别得到特征置信度:时间特征记为t,计算:p(t)=count(ti)/count(t)count表示数量统计运算,ti表示第i个时间段,其概率记为p(t);内容类型特征记为c,与时间特征一样的运算方式,其概率记为p(c);假设时间与内容类型是独立的概率关系,则可利用时间特征和内容类型特征作为特征置信度初始值,其组合置信度可直接采用乘法法则计算:p(tc)=p(t)p(c)p(t|c)=p(tc)/p(c)。通过采用上述技术方案,得到用户在一些实施方式中,所述s203中预测公式如下:其中p(c)表示用户兴趣度,p(d)表示特征置信度,p(d|c)表示组合置信度。通过采用上述技术方案,用户对单个特征的置信度以及通过朴素贝叶斯网络获取用户对多个特征的组合置信度。在一些实施方式中,对n条消息预测的结果生成一个兴趣度数组,记为f=(f1,f2,…,fn),对应用户对每条消息感兴趣的程度,排序网络对结果兴趣数组f输出,按照感兴趣的程度由高到低排序。通过采用上述技术方案,通过排序网络将接收到的消息按照感兴趣的程度由高到低排序。综上所述,本发明的有益技术效果为:通过将消息与时间、内容类型、频率等多维度特征采用向量的形式形成相互之间的联系,将消息以特征向量的形式在空间坐标中表示,距离相近的向量即为同一聚类的消息,从而得到消息的聚类,然后将用户接收到的消息放至对应的聚类,并通过朴素贝叶斯网络获取兴趣度结果,最后通过排序网络按照兴趣度的高低输出。附图说明图1为判断任意消息间的相似性的方法示意图。图2为根据朴素贝叶斯网络评估用户都消息的兴趣度的评估模型。图3为排序网络输出效果图。具体实施方式以下结合附图对本发明作进一步详细说明。本发明披露的即时通讯消息提示的全排序方法,包括行为分析和排序网络两个模块。行为分析,即根据大数据统计和区分用户感兴趣的消息和不感兴趣的消息。用户对某个消息感兴趣,其实是和消息本身的特性相关,如消息出现的时间点、消息内容的种类等因素,所以,对消息本身来说,其实是一个聚类问题,即设置几个考察维度,把各维度相似度高的内容归集为一类。因此,在本发明此实时方式中,行为分析具体方法包括:s101:将消息定义为消息向量(a[1],a[2],…,a[n]),其中向量的坐标a[1]、a[2]、…、a[n]对应根据消息的特征定义分配的向量特征,每个消息向量的坐标均包括接收时间、内容类型及点击频率三个向量特征。把每个向量特征的区间定义为[0,100],时间特征按照24小时制时间段映射至区间,其中0代表0时,50代表12时,100代表24时,其他时间根据此方式均匀分配,如25代表6时,75代表18时等;内容类型特征根据其分类映射至区间,其中类型ⅰ为0-100/n,类型ⅱ为100/n-100/n×2,…,类型n为100/n×(n-1)-100,其中n为容类型的总量,如娱乐性内容为0-10,餐饮性内容为10-20,实政性内容为20-30等;消息点击频率特征的频度数值越大代表越频繁。根据上述的映射过程,对于一条消息m,如可以表示为向量m(20,50,88),所以,对于任意消息m,都可以表示为向量(a[1],a[2],…,a[n])。s102:判断任意消息间的相似性,根据消息间的相似性得到消息的聚类。具体方法为:采用球面k均值的方式判断任意消息间的相似性,即采用两个向量之间余弦大小来度量,任意两个消息向量间余弦夹角越小则越相似,如图1所示,由于角度ɑ小于角度β,因此向量d1距离向量q的距离小于向量d2距离向量q的距离。因此,可根据消息间的相似性得到消息的聚类。在得到消息的聚类后,需要区分用户对某一类消息是否感兴趣,并安装兴趣度对消息进行排序,即进入排序网络模块。排序网络,基于行为分析评估用户对接收到的消息的兴趣度,当新的通讯消息到达时,根据朴素贝叶斯网络获取兴趣度结果,并经排序网络输出,如图2所示,具体包括以下步骤:s201:基于用户点击消息的行为,根据点击消息的时间、被点击消息的内容类型以及点击的频率,把点击的消息划分至具有对应向量特征的聚类,以实现消息的归类;s202:预测用户的点击倾向,得到用户在某个时间段内倾向于点击的消息的内容类型。包括:s2021:按照时间段统计,用户在规定的时间段内未点击某一内容类型的消息,且未点击时长超出阀值t,则认为该用户对该内容类型的消息不感兴趣,具体公式为:ti:u(mi)∧(tn–tmi)>t其中,ti表示第i个统计时间段,u表示未点击mi类消息,tn表示当前时间,tmi表示该类消息的最新时间。用户对某一个消息感兴趣则记为1,不感兴趣则记为0,则可得到统计信息表如下:点击行为消息分类1消息分类2消息分类3消息分类kc192019281011c001092911100c928718111011……………c930100180011得到上述统计信息表后,则可以预测用户的点击倾向,即预测用户在某个时间段内更倾向于点击哪一类型的消息,因此,s202还包括:s2022:把用户的点击行为按照时间特征和内容类型特征进行分解分别得到特征置信度:时间特征记为t,计算:p(t)=count(ti)/count(t)count表示数量统计运算,ti表示第i个时间段,其概率记为p(t);内容类型特征记为c,与时间特征一样的运算方式,其概率记为p(c);假设时间与内容类型是独立的概率关系,则可利用时间特征和内容类型特征作为特征置信度初始值,其组合置信度可直接采用乘法法则计算:p(tc)=p(t)p(c)p(t|c)=p(tc)/p(c)。然后进入下一步,s203:当新的消息来到时,根据朴素贝叶斯网络预测用户对该消息的兴趣度,其预测公式如下:其中p(c)表示用户兴趣度,p(d)表示特征置信度,p(d|c)表示组合置信度。最后进入s204:对n条消息预测的结果生成一个兴趣度数组,记为f=(f1,f2,…,fn),对应用户对每条消息感兴趣的程度,如图3所示,排序网络对结果兴趣数组f输出,按照感兴趣的程度由高到低排序。本具体实施方式的实施例均为本发明的较佳实施例,并非依此限制本发明的保护范围,故:凡依本发明的结构、形状、原理所做的等效变化,均应涵盖于本发明的保护范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1