一种序列化信息推荐方法_2

文档序号:9646599阅读:来源:国知局
ι,r2,r3,......,rk}。R中元素&的长度(权重)设为实际开多式为(ca,cb......crc),ca,cb...... (1彡a,b,rc彡n)为序列中的紧邻的点,ca为起始点,c"为结束点。为了控制序列长 度(权重)r。,r。取1到η的开平方之间的一个随机整数,即1彡rsqrt(η)。
[0016] 第二步,选择最优序列 计算每一条序列的潜在空载距离期望值,并在此基础上选择潜在空载距离期望值最小 者作为最优推荐序列。具体算法如下。
[0017] 算法1 :给出一条序列,计算从序列中给定位置开始到序列结束点的空载距离期 望值。
[0018] 输入:一条需要计算的序列,为一条有序的点集,其中每个点有一个特征点的利用 概率属性;给定开始位置在序列中的序号; 输出:空载距离期望值
算法2 :在序列集合中选择最优序列,即该序列的空载距离期望值最小。
[0019] 输入:潜在特征点集合、推荐序列集合、特征点的利用概率集合 输出:最优序列
第三步,方法优化 在算法1、算法2的基础上进行优化,优化过程如下。
[0020] 算法3 :给出一条序列,计算从序列中给定位置开始的空载距离期望值。
[0021] 输入:一条需要计算的序列,为一条有序的点集,其中每个点有一个特征点的利用 概率属性;给定开始位置在序列中的序号; 输出:序列的空载距离期望值
算法4 :在序列集合中选择最优序列,即该序列空载距离期望值最小。
[0022] 输入:潜在特征点集合、推荐序列集合、特征点的利用概率集合 输出:最优序列
本发明的实验效果描述: 使用随机生成的无向图模拟待解决问题,图中包含10000个点,100000条边,随机生成 5000条序列。假设边的长度(权重)都为1,节点的利用概率采用随机方法自动生成。
[0023]设定的实验效果判定准则是:使用本方法并作优化后,若每次向活动点使用者进 行序列推荐的平均时间低于0. 1秒,则本方法包括优化方法满足"用户体验好"这一指标。
[0024] 首先,根据算法1和算法2进行最优序列选择,在所进行的1000次推荐用时 51. 23s;使用优化后的方法进行最优序列选择,所进行1000次推荐用时10. 22s。使用优化 后的方法进行最佳序列选择,每次推荐平均用时为0. 00151562s。
[0025] 由上可知,本发明方法并优化后将每次推荐时间控制在了可以接受的范围(0.Is) 之内,满足较好的用户体验指标,解决了序列化信息推荐问题效率低下这一技术问题。
[0026] 结论分析: 第一,本发明的方法及其优化方法,其效率优势主要体现在:(1)从潜在特征点集合中 得出空载序列生成活动点序列,并依此构造活动点活动图;(2)结合活动点当前所在位置, 通过对计算空载距离期望值过程的优化,减少了计算次数。
[0027] 第二,对于算法2的时间复杂度分析:设生成序列集合中包含Μ个元素,每个元素 为一个序列。其中最长(权重之和最大)的序列包含S个潜在特征点。假设在计算序列的空 载距离期望值的过程中,每次迭代计算点的代价为1,那么minF函数的时间复杂度为。calF 遍历集合Μ中所有元素,所以calF的时间复杂度为。
[0028] 第三,对于算法3和算法4的综合分析:采用剪枝优化分析,算法3和4在算法1和 2的基础上设定了一个目标,使得之后每次计算逐渐向最优目标逼近,这样可以在计算过程 中将很多无效序列排除,在算法1和2的基础上降低了计算次数,提高了计算效率。
[0029] 第四,本方法中优化方法的有效性可用构造法加以证明:即在本发明中的方法计 算某一个序列rp时,在计算PoCab-cp,a-cp,b-......-cp, 的空载序列期望的过程中, 当计算到cP,q时,得到空载序列期望值大于min值时,舍去此结果,不再继续计算这个序列, 开始下一个序列的计算,此序列省去的计算次数为(h-q),若此序列一直计算完毕得到的 结果仍比min值小,则此序列省去的计算次数为(h-r。),即0次。若从第二条序列开始,每 个序列分别计算到qpq2,......,qk 1 (qi,q;!,......,qk通小于等于r。)点时计算终止,则本 发明方法总共减少次数为(1·。%+!·。%+......+re-qk丨)。
【主权项】
1. 一种序列化信息推荐方法,其特征在于该方法包括W下步骤: (1) 生成序列元素特征点;根据历史数据使用聚类方法得到N个簇,选取每个簇的几何 中屯、作为潜在的特征点集合;生成一个潜在的特征点集合C,用点表示特征点,C中包含η个 潜在特征点Ci,集合C中的元素为所有特征点{Ci,〇2,〇3,C4,……,C。}; (2) W历史数据作为样本集,生成序列元素特征点利用概率,作为推荐序列的评价基 础指标;特征点的利用概率计算方法为:首先对聚类结果进行分析,获得每个类簇的区域 点覆盖,然后根据覆盖中包含的点,统计该区域所包含的点的利用频数记为Q,设置所有区 域中所包含点的可能的利用总频数为归一化参数T,则该区域所对应簇的利用概率为Q/T, 对于每一个潜在特征点,把该特征点所代表的簇的利用概率近似作为该点的利用概率;根 据样本分析,赋予每个特征点一个不同的利用概率Pi,用浮点数表示利用概率,得到一个概 率集合P,P中元素Pi的值为0到1之间的一个随机小数,即P中的元素为{p1,P2,化......, Pn},〇《Pi《l (3) 生成序列信息,即序列活动图;序列活动图定义为Ξ元组:(C,P,E),其中C表示 特征点集合,P表示每个特征点对应的利用概率集合,E表示边集,E中包含m条边ei,即两 个特征点之间的序列^中元素6鹿义为(0。,叫,(11),其中0。,^(1《曰,13《11)为表示起 点和终点的两个特征点,di为边的长度,首先生成边的长度,边的长度由待解决问题所关注 的焦点结合实际情况来决定,然后结合步骤(1)、(2)所获得的特征点集和概率集构成序列 活动图; 根据序列活动图生成序列;生成序列集合R,R中包含k条完整的序列Γι,用点的集合形 式表示,即R中的元素为{γι,……,rj,R中元素的长度设为r。,实际形式为 (C。,Cb......Cfc),Ca,Cb......Cfc(1《a,bjc《η)为序列中的紧邻的点,Ca为起始点,crc为 结束点,为了控制序列长度rt,r。取1到η的开平方之间的一个随机整数,即1《rc《sqrt(η); (4) 计算序列活动图中潜在的空载序列距离期望值,结合活动点的当前位置选择并推 荐最优序列;最优序列的选择方法基于潜在的空载序列距离期望值,空载序列距离期望值 计算方法如下:假设点A到点Β之间有一条长度为dist的序列,A为活动点位置,点Β的 利用概率为Pb,若在B点可W得W应用,那么由A到B构成的序列可看作是有价值的,反之, 若B点没有得到利用,则需要前往下一个潜在特征点,那么由A到B构成的序列是无用的, 假设较坏的情况,即前往的下一个潜在特征点是无用的,将运段序列的消耗记为CostA,计 算方式如下: 。二二4 =二U-托? 即运段序列的消耗等于两点之间的长度乘WΒ点不利用的概率,对于点Β的选取,根 据A得到与之最近的k个点作为待判定点,对其预估的消耗为对应的CostA的值,选取其中 CostA值最小者向后构造后继序列,依此类推,建立一个消耗值为L的有向序列,作为所求 的推荐序列候选;将集合C中N个特征点依次作为活动点起始位置来生成Μ条消耗为L的 推荐序列候选集合,计算每一条序列的潜在空载距离期望值,并在此基础上选择潜在空载 距离期望值最小者作为推荐序列。2. 根据权利要求1所述的序列化信息推荐方法,其特征在于步骤(4)中所述的空载序 列距离期望值计算方法的优化方法,具体过程如下: 对于当前位置化C油,有k条完整的序列,分别为ri,。,。,……,rk,每条序列记为 Ll'a,L!,b 、L2,a, L2,b ^2,rc-^? ^ ^3, a> ^3,b ^3, rc-^? ? ^ ^k, a> ^k,b 曰 先计算序列PoC油一Cl,。一c1,b.......ci,r。的空载序列期望,并存放为最小值变量min 中;然后再依次计算其他序列,若计算得到的其他序列的空载序列期望小于当前min值时, 将此值存入当前min变量中,如此不断迭代,当出现在计算某一序列的过程中,其中间结果 值超过min值时,便不再继续计算,舍弃此序列进行剪枝。
【专利摘要】本发明涉及信息推荐领域,提供一种序列化信息推荐的方法,包括如下步骤:(1)生成序列元素特征点;(2)以历史数据作为样本集,生成序列元素特征点利用概率,作为推荐序列的评价基础指标;(3)生成序列信息,(4)计算序列活动图中潜在的空载序列距离期望值,选择潜在空载距离期望值最小者作为最优推荐序列。本发明方法针对序列元素的特征设定权重,根据序列特征约束进行个性化推荐,解决序列化信息推荐精度不高和效率低下等技术问题。
【IPC分类】G06F17/30, G06K9/62
【公开号】CN105404666
【申请号】CN201510770511
【发明人】叶俊民, 陈曙, 李超, 王继新, 左明章
【申请人】华中师范大学
【公开日】2016年3月16日
【申请日】2015年11月12日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1