一种融合季节销售信息与搜索行为信息的烟草销量预测方法

文档序号:8381409阅读:657来源:国知局
一种融合季节销售信息与搜索行为信息的烟草销量预测方法
【技术领域】
[0001] 本发明涉及产品销量预测领域,尤其涉及一种融合季节销售信息与搜索行为信息 的烟草销量预测方法。
【背景技术】
[0002] 随着烟草行业市场化程度的不断加深,如何准确预测烟草销量,进而把握市场需 求,为整个烟草行业的经营提供真实有效的参考和基础显得尤为重要。
[0003] 传统的烟草销量预测方模型采用定性预测或定量预测方法。定性预测主要依靠 从业人员的经验,将其对事物未来发展做出的性质和程度上的判断作为预测未来的主要依 据,具有较大的灵活性,包括业务主管人员预测法、销售人员综合意见预测法、消费者调查 预测法、德尔菲法等方法,但定性预测方法具有很强的主观局限性,人的经验和主观判断能 力会直接影响到预测结果的准确度。定量预测方法偏重于数量方面的分析,重视预测对象 的变化程度,能做出变化程度在数量上的准确描述,其利用历史统计数据和客观实际资料 作为预测的依据,运用数学方法进行处理分析,包括算数平均法、指数预测法、简单移动平 均法、加权移动平均法、因果预测分析法等方法,与定性预测方法相比,定量预测方法受主 观因素的影响较小,但比较机械,缺乏定性预测方法的灵活性,并且对信息资料的要求较 高。随着越来越多的人趋向于通过搜索引擎做购买前咨询,搜索查询量已经称为预测销售 趋势的重要指标,但是仅使用搜索查询量预测销售趋势的方法并没有充分利用搜索日志中 丰富的用户行为,也无法模拟复杂的季节性销售趋势。

【发明内容】

[0004] 本发明要解决的问题是如何在充分利用搜索日志信息中丰富用户行为的情况下 预测烟草季节性销售趋势。为了解决上述问题,本发明的目的是提供一种融合季节销售信 息与搜索行为信息的烟草销量预测方法,该方法通过分析搜索日志中的搜索行为信息及季 节性时间序列,基于回归建立烟草季节性销量预测模型。
[0005] 本发明基于商业搜索引擎的查询日志以及烟草销售历史数据,首先引入用户行为 模型,使用商业搜索引擎查询日志中的点击和查询再形成信息来对相关查询词进行聚类, 并以月为单位计算这些查询词出现的频率;其次引入基于动态平滑方法的指数加权移平均 模型来度量季节对烟草销售的影响;最后使用线性回归方法融合商业搜索引擎查询特征与 烟草销售季节性特征进行烟草销量预测。
[0006] 为了实现上述的目的,本发明采用了以下的技术方案:
[0007] -种融合季节销售信息与搜索行为信息的烟草销量预测方法,该方法包括以下步 骤:
[0008] -、对烟草销售相关查询的聚类阶段:
[0009] 步骤1,读取搜索引擎日志数据;
[0010] 步骤2,把网络搜索引擎日志划分为用户级的会话;
[0011] 步骤3,在搜索引擎日志中选择m个与烟草销售及知名烟草品牌相关的查询词; [0012] 步骤4,对于给定的查询,分别提取出点击率最高的前k个文档的集合、查询再形 成集合、查询共现集合;
[0013] 步骤5,利用步骤4提取出的数据集合构建有向图,该图是点击二分图与查询流图 的融合图,捕捉了用户的一系列查询再形成行为;
[0014] 步骤6,通过对有向图执行η阶随机游走,计算出每个查询结点的文档访问概率分 布向量;
[0015] 步骤7,使用文档访问概率分布向量间的余弦相似度来判断共现查询之间的相关 性;
[0016] 步骤8,如果余弦相似度大于阈值Θ并且查询不在相关查询集合内,则把查询加 入相关查询集合并作为新的查询中心,重复步骤4到步骤8,直至完成迭代;
[0017] 步骤9,输出与烟草销售相关的查询集合;
[0018] 二、特征提取阶段,包括提取搜索查询特征和提取季节特征两个子阶段:
[0019] 1)提取搜索查询特征
[0020] 步骤1,统计从对烟草销售相关查询的聚类阶段生成的相关查询集在历史时期以 月为单位出现的次数;
[0021] 步骤2,根据烟草历史销售数据中出现相关查询的次数对所有相关查询排序;
[0022] 步骤3,根据步骤2的排序结果,把前k个相关查询作为搜索查询特征;
[0023] 2)提取季节性特征
[0024] 步骤1,根据烟草历史销售数据初始化季节性调整销售数据;
[0025] 步骤2,根据烟草历史销售数据初始化线性趋势系数;
[0026] 步骤3,根据烟草历史销售数据初始化季节性影响的销售比例系数;
[0027] 步骤4,用指数加权移动平均模型对预测月进行销量预测,其预测结果作为季节性 特征;
[0028] 步骤5,根据步骤4中每次预测后的结果动态调整参数值来平滑季节性调整销售 数据、线性趋势系数、季节性影响的销售比例系数,选择与最近24个月真实销量最相关的 参数值,并把该值用于下一次预测;
[0029] 三、建立预测模型阶段:
[0030] 步骤1,提取搜索查询特征;
[0031] 步骤2,提取季节性特征;
[0032] 步骤3,用线性回归模型融合搜索查询特征与季节性特征;
[0033] 步骤4,输出融合模型的预测结果。
[0034] 作为进一步改进,所述的烟草销售相关查询的聚类阶段包括以下步骤:
[0035] 步骤1,读取搜索引擎日志数据;
[0036] 步骤2,把网络搜索引擎日志划分为用户级的会话,其中每个会话表示用户在时间 阈值内提交给搜索引擎的一个连续查询序列;
[0037] 步骤3,在搜索引擎日志中选择m个与烟草销售及知名烟草品牌相关的查询词 Qseed 5
[0038] 步骤4,对于给定的查询q e q_d,分别提取出以下信息:
[0039] a)提取k个点击率最商的文档集D (q),其中D (q)表不关于查询q的点击率最商 的前k个文档集;
[0040] b)提取查询再形成集合:
[0042] 其中#(q)表示会话
【主权项】
1. 一种融合季节销售信息与搜索行为信息的烟草销量预测方法,其特征在于该方法包 括以下步骤: 一、 对烟草销售相关查询的聚类阶段: 步骤1,读取搜索引擎日志数据; 步骤2,把网络搜索引擎日志划分为用户级的会话; 步骤3,在搜索引擎日志中选择m个与烟草销售及知名烟草品牌相关的查询词; 步骤4,对于给定的查询,分别提取出点击率最高的前k个文档的集合、查询再形成集 合、查询共现集合; 步骤5,利用步骤4提取出的数据集合构建有向图,该图是点击二分图与查询流图的融 合图,捕捉了用户的一系列查询再形成行为; 步骤6,通
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1