信息推送方法和装置的制造方法

文档序号:10725022阅读:466来源:国知局
信息推送方法和装置的制造方法
【专利摘要】本申请公开了信息推送方法和装置。所述方法的一【具体实施方式】包括:获取预设的全季节周期内每个单位时间的用户行为数据,用户行为数据是与第一实体集合相关联的用户行为的用户行为数据;针对所述全季节周期中的各个单位统计周期,利用单位统计周期内每个单位时间的用户行为数据得到第一实体集合在各个单位统计周期内的状态参数,形成与所述全季节周期对应的状态参数序列;使用所述状态参数序列以及从第三方平台获取的、对第二实体集合进行调研所形成的调研数据,构造用于预测行为参考信息的线性回归模型;利用所述线性回归模型生成行为参考信息,并将所述行为参考信息推送至终端设备进行展示。该实施方式实现了行为参考信息的高效生成与推送。
【专利说明】
信息推送方法和装置
技术领域
[0001] 本申请涉及计算机技术领域,具体涉及大数据技术领域,尤其涉及信息推送方法 和装置。
【背景技术】
[0002] 信息推送,又称为"网络广播",是通过一定的技术标准或协议,在互联网上通过推 送用户需要的信息来减少信息过载的一项技术。信息推送技术通过主动推送信息给用户, 可以减少用户在网络上搜索所花的时间。并且,信息推送前经过一系列分析和运算,可以使 所推送的信息可以更精准。
[0003] 然而,现有技术中在推送信息时,通常需要先进行人工收集原始数据,然后对人工 收集的数据进行进一步处理才能得到用户感兴趣的信息并推送给用户。这种方式过度依赖 人工收集原始数据,导致耗时较长,所推送的信息存在时效性不足、初始信息收集成本偏高 等问题。

【发明内容】

[0004] 本申请的目的在于提出一种改进的信息推送方法和装置,来解决以上【背景技术】部 分提到的技术问题。
[0005] 第一方面,本申请提供了一种信息推送方法,所述方法包括:获取预设的全季节周 期内每个单位时间的用户行为数据,所述用户行为数据是与第一实体集合相关联的用户行 为的用户行为数据;针对所述全季节周期中的各个单位统计周期,利用单位统计周期内每 个单位时间的用户行为数据得到所述第一实体集合在各个单位统计周期内的状态参数,形 成与所述全季节周期对应的状态参数序列;使用所述状态参数序列以及从第三方平台获取 的、对第二实体集合进行调研所形成的调研数据,构造用于预测行为参考信息的线性回归 模型;将所述线性回归模型生成的行为参考信息推送至终端设备进行展示。
[0006] 在一些实施例中,所述利用单位统计周期内每个单位时间的用户行为数据得到所 述第一实体集合在各个单位统计周期内的状态参数,包括:根据各个单位统计周期内每个 单位时间的用户行为数据获取各单位统计周期的周期用户行为数据;提取出所述周期用户 行为数据中的非季节性用户行为数据和季节性用户行为数据;根据所述周期用户行为数据 的季节变化率得到所述第一实体集合在该单位统计周期内的状态参数,所述季节变化率为 所述季节性用户行为数据与非季节性用户行为数据的比值。
[0007] 在一些实施例中,所述根据各个单位统计周期内每个单位时间的用户行为数据获 取各单位统计周期的周期用户行为数据,包括:对各个单位统计周期内每个单位时间的用 户行为数据进行对数运算,生成每个用户行为数据对应的对数数据;获取各个单位统计周 期内对数数据的平均值;线性变换所述平均值,得到所述周期用户行为数据。
[0008] 在一些实施例中,所述提取出所述周期用户行为数据中的非季节性用户行为数据 和季节性用户行为数据,包括:对所述周期用户行为数据在所述全季节周期内进行平滑处 理得到对应的非季节性用户行为数据。
[0009] 在一些实施例中,所述对所述周期用户行为数据在所述全季节周期内进行平滑处 理得到对应的非季节性用户行为数据,包括:将当前单位统计周期之前一个全季节周期内 各个单位统计周期的周期用户行为数据的平均值确定为所述当前单位统计周期的非季节 性用户行为数据。
[0010] 在一些实施例中,所述根据所述周期用户行为数据的季节变化率得到所述第一实 体集合在该单位统计周期内的状态参数,包括:获取相邻全季节周期中季节变化率的变化 率平均值;根据所述季节变化率与所述变化率平均值,获取与所述状态参数关联的特征系 数;将所述特征系数在至少两个单位统计周期内平滑后进行加权处理得到对应的状态参 数。
[0011] 在一些实施例中,所述根据所述季节变化率与所述变化率平均值,获取状态参数 序列的特征系数,包括:将所述季节变化率与所述变化率平均值的差值作为所述特征系数; 或者,根据所述非季节性用户行为数据和所述变化率平均值的增量获取季节增长量,并将 所述周期用户行为数据与所述季节增长量的差值与所述非季节性用户行为数据的比值作 为所述特征系数。
[0012] 在一些实施例中,所述将所述特征系数在至少两个单位统计周期内平滑后进行加 权处理得到对应的状态参数序列,包括:将至少两个单位统计周期内为正数的特征系数的 平均值进行线性加权处理后,得到对应的状态参数序列。
[0013] 在一些实施例中,所述使用所述状态参数序列以及从第三方平台获取的、对第二 实体集合进行调研所形成的调研数据,构造用于预测行为参考信息的线性回归模型,包括: 从所述调研数据中提取出优质时间序列;使用所述优质时间序列和所述状态参数序列进行 拟合,得到所述线性回归模型。
[0014] 在一些实施例中,所述使用所述状态参数序列以及从第三方平台获取的、对第二 实体集合进行调研所形成的调研数据,构造用于预测行为参考信息的线性回归模型,包括 以下至少一项:采用自回归积分滑动平均模型算法从所述试题调研数据中对应的一致指数 调查数据获取一致指数优质时间序列,并根据所述一致指数优质时间序列和所述状态参数 序列拟合得到所述一致指数的线性回归模型;采用自回归积分滑动平均模型算法从所述试 题调研数据中对应的先行指数调查数据获取先行指数优质时间序列,并根据所述先行指数 优质时间序列和所述状态参数序列拟合得到所述先行指数的线性回归模型;采用向量自回 归模型算法从所述试题调研数据中对应的生产者物价指数调查数据获取生产者物价指数 优质时间序列,并根据所述生产者物价指数优质时间序列和所述状态参数序列拟合得到所 述生产者物价指数的线性回归模型;采用向量自回归模型算法从所述试题调研数据中对应 的采购经理人指数调查数据获取采购经理人指数优质时间序列,并根据所述采购经理人指 数优质时间序列和所述状态参数序列拟合得到所述采购经理人指数的线性回归模型。
[0015] 第二方面,本申请提供了一种信息推送装置,所述装置包括:获取单元,用于获取 预设的全季节周期内每个单位时间的用户行为数据,所述用户行为数据是与第一实体集合 相关联的用户行为的用户行为数据;形成单元,用于针对所述全季节周期中的各个单位统 计周期,利用单位统计周期内每个单位时间的用户行为数据得到所述第一实体集合在各个 单位统计周期内的状态参数,形成与所述全季节周期对应的状态参数序列;构造单元,用于 使用所述状态参数序列以及从第三方平台获取的、对第二实体集合进行调研所形成的调研 数据,构造用于预测行为参考信息的线性回归模型;推送单元,用于将所述线性回归模型生 成的行为参考信息推送至终端设备进行展示。
[0016] 在一些实施例中,所述形成单元包括:获取子单元,用于根据各个单位统计周期内 每个单位时间的用户行为数据获取各单位统计周期的周期用户行为数据;提取子单元,提 取出所述周期用户行为数据中的非季节性用户行为数据和季节性用户行为数据;信息得到 子单元,用于根据所述周期用户行为数据的季节变化率得到所述第一实体集合在该单位统 计周期内的状态参数,所述季节变化率为所述季节性用户行为数据与非季节性用户行为数 据的比值。
[0017] 在一些实施例中,所述获取子单元进一步用于:对各个单位统计周期内每个单位 时间的用户行为数据进行对数运算,生成每个用户行为数据对应的对数数据;获取各个单 位统计周期内对数数据的平均值;线性变换所述平均值,得到所述周期用户行为数据。
[0018] 在一些实施例中,所述提取子单元进一步用于:对所述周期用户行为数据在所述 全季节周期内进行平滑处理得到对应的非季节性用户行为数据。
[0019] 在一些实施例中,所述提取子单元进一步用于:将当前单位统计周期之前一个全 季节周期内各个单位统计周期的周期用户行为数据的平均值确定为所述当前单位统计周 期的非季节性用户行为数据。
[0020] 在一些实施例中,所述信息得到子单元,包括:平均值获取模块,用于获取相邻全 季节周期中季节变化率的变化率平均值;系数获取模块,用于根据所述季节变化率与所述 变化率平均值,获取与所述状态参数关联的特征系数;加权处理模块,用于将所述特征系 数在至少两个单位统计周期内平滑后进行加权处理得到对应的状态参数。
[0021] 在一些实施例中,所述系数获取模块进一步用于:将所述季节变化率与所述变化 率平均值的差值作为所述特征系数;或者,根据所述非季节性用户行为数据和所述变化率 平均值的增量获取季节增长量,并将所述周期用户行为数据与所述季节增长量的差值与所 述非季节性用户行为数据的比值作为所述特征系数。
[0022] 在一些实施例中,所述加权处理模块进一步用于:将至少两个单位统计周期内为 正数的特征系数的平均值进行线性加权处理后,得到对应的状态参数序列。
[0023] 在一些实施例中,所述构造单元进一步用于:从所述调研数据中提取出时间序列; 使用所述优质时间序列和所述状态参数序列进行拟合,得到所述线性回归模型。
[0024] 在一些实施例中,所述构造单元进一步用于以下至少一项:采用自回归积分滑动 平均模型算法从所述试题调研数据中对应的一致指数调查数据获取一致指数优质时间序 列,并根据所述一致指数优质时间序列和所述状态参数序列拟合得到所述一致指数的线性 回归模型;采用自回归积分滑动平均模型算法从所述试题调研数据中对应的先行指数调查 数据获取先行指数优质时间序列,并根据所述先行指数优质时间序列和所述状态参数序列 拟合得到所述先行指数的线性回归模型;采用向量自回归模型算法从所述试题调研数据中 对应的生产者物价指数调查数据获取生产者物价指数优质时间序列,并根据所述生产者物 价指数优质时间序列和所述状态参数序列拟合得到所述生产者物价指数的线性回归模型; 采用向量自回归模型算法从所述试题调研数据中对应的采购经理人指数调查数据获取采 购经理人指数优质时间序列,并根据所述采购经理人指数优质时间序列和所述状态参数序 列拟合得到所述采购经理人指数的线性回归模型。
[0025] 本申请提供的信息推送方法和装置,通过大数据技术根据用户行为数据获取到第 一实体集合的状态参数序列,再将状态参数序列结合从第三方平台获取的调研数据结合生 成线性回归模型,从而可以基于线下预测模型生成行为参考信息并推送至终端设备进行 展示,实现了行为参考信息的自动化生成和推送,效率较高。
【附图说明】
[0026] 通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它 特征、目的和优点将会变得更明显:
[0027] 图1是本申请可以应用于其中的示例性系统架构图;
[0028] 图2是根据本申请的信息推送方法的一个实施例的流程图;
[0029] 图3是图2对应实施例中ARB1A模型下的最优参数计算结果示意图;
[0030]图4是图2对应实施例中ARIMA模型下的标准差诊断的诊断结果示意图;
[0031]图5是图2对应实施例中ARB1A模型下的自相关检验的检验结果示意图;
[0032]图6是图2对应实施例中ARB1A模型下的Ljung-Box检验的检验结果示意图;
[0033] 图7是图2对应实施例中AVR模型下的企业情况调查数据的时间序列示意图;
[0034] 图8是图2对应实施例中AVR模型下企业情况调查数据与状态参数的序列的相关性 示意图;
[0035] 图9是图2对应实施例中AVR模型下的测定系数计算结果示意图;
[0036] 图10是根据本申请的信息推送装置的一个实施例的结构示意图;
[0037] 图11是适于用来实现本申请实施例的终端设备或服务器的计算机系统的结构示 意图。
【具体实施方式】
[0038] 下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描 述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了 便于描述,附图中仅示出了与有关发明相关的部分。
[0039] 需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相 互组合。下面将参考附图并结合实施例来详细说明本申请。
[0040]图1示出了可以应用本申请的信息推送方法或信息推送装置的实施例的示例性系 统架构1〇〇。
[0041] 如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。 网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以 包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0042]用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发 送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应 用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
[0043] 终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包 括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携 计算机和台式计算机等等。
[0044] 服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的 网页提供支持的后台网页服务器。后台网页服务器可以对接收到的网页页面请求等数据进 行分析等处理,并将处理结果(例如网页页面数据)推送给终端设备。
[0045] 需要说明的是,本申请实施例所提供的信息推送方法一般由服务器105执行,相应 地,信息推送装置一般设置于服务器105中。
[0046] 应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需 要,可以具有任意数目的终端设备、网络和服务器。
[0047]继续参考图2,示出了根据本申请的信息推送方法的一个实施例的流程200。所述 的信息推送方法,包括以下步骤:
[0048]步骤201,获取预设的全季节周期内每个单位时间的用户行为数据。
[0049] 在本实施例中,信息推送方法运行于其上的电子设备(例如图1所示的服务器)可 以从本机或通过有线连接方式或者无线连接方式从存储有用户行为数据的其他设备中获 取数据,所获取的数据可以是预设的全季节周期内每个单位时间的用户行为数据。
[0050] 其中,用户行为数据可以是与第一实体集合相关联的用户行为的用户行为数据。 可选的,上述的第一实体集合,可以是一系列的中小企业。在网络推广系统或电子商务运营 平台中与这些实体关联的用户行为数据与这些实体的状态有较大联系,这些用户行为数据 可作为后续步骤的数据基础。这里所说的状态,从经济学上可以表达为第一实体集合(例如 中小企业)的景气指数。
[0051] 在获取用户行为数据时,可以直接通过网页数据抓取工具从网页中抓取,也可以 从网络推广系统的后台数据库或者从电子商务运营平台的后台数据库获取。这些网页、推 广系统或电子商务运营平台通常用于记录与第一实体集合相关联的用户行为数据,例如点 击搜索数据、点击消费数据等。其中,用户行为数据所关联的第一实体集合可以是指中小企 业群体。实践中,所记录的数据可以是第一实体集合中的某一些实体。所获取的用户行为数 据可以如表1所述。
[0052]
[0053]表1 一天的用户行为数据列表示意
[0054]表1中展现栏对应的数值4518是5月27日当消费者通过搜索引擎输入关键词(例如 焊接)进行搜索,推广系统向消费者展示的搜索结果页面中所展现的企业用户的产品的相 关条目的次数的统计数值。点击栏对应的数值88是当日消费者对相关条目点击的次数的统 计数值。消费栏对应的金额Y522.9是因为向消费者展现相关条目以及消费者点击相关条 目的行为对应的企业用户应该向A推广系统支付的金额,转化率是根据相关条目产生的线 上(网页)和线下(实体)交易金额相对于消费栏的金额的百分比。实践中,用户行为数据可 以是表1所列出的各种数据中的一种或多种,也可以是未列出的其他类型的用户行为数 据。
[0055]需要说明的是,本实施例中的全季节周期通常可以是指一个自然年,但也可以其 他类型的年度周期。相应的,单位时间通常可以是天,在某些情况下也可以是小时等其他时 间计量单位。
[0056]步骤202,针对全季节周期中的各个单位统计周期,利用单位统计周期内每个单位 时间的用户行为数据得到第一实体集合在各个单位统计周期内的状态参数,形成与全季节 周期对应的状态参数序列。
[0057]在本实施例中,基于步骤201中得到的用户行为数据,上述电子设备(例如图1所示 的服务器)可以针对全季节周期中的各个单位统计周期,利用单位统计周期内每个单位时 间的用户行为数据得到第一实体集合在各个单位统计周期内的状态参数,形成与全季节周 期对应的状态参数序列。其中,单位统计周期可以是周,也可以是月,还可以是其他时间长 度位于全季节周期和单位时间之间的时间周期。
[0058]可选的,步骤202中利用单位统计周期内每个单位时间的用户行为数据得到第一 实体集合在各个单位统计周期内的状态参数具体可以包括:根据各个单位统计周期内每个 单位时间的用户行为数据获取各单位统计周期的周期用户行为数据;提取出周期用户行为 数据中的非季节性用户行为数据和季节性用户行为数据;根据周期用户行为数据的季节变 化率得到第一实体集合在该单位统计周期内的状态参数,季节变化率为季节性用户行为数 据与非季节性用户行为数据的比值。
[0059] 可选的,上述根据各个单位统计周期内每个单位时间的用户行为数据获取各单位 统计周期的周期用户行为数据可以进一步包括:对各个单位统计周期内每个单位时间的用 户行为数据进行对数运算,生成每个用户行为数据对应的对数数据;获取各个单位统计周 期内对数数据的平均值;线性变换平均值,得到周期用户行为数据。
[0060] 其中,假设单位时间是天,单位统计周期为周,每周中第i天的用户行为数据是 datai(其中i是处于1到7的整数),则其进行对数运算后的对数数据为l〇g(dat ai),其中log 为自然对数运算,即等同于IN,底数为e。对应的,各个单位统计周期内对数数据的平均值是
[0061] 线性变化平均值,是为了将指数数据的平均值进行标准化处理。可选的,可以采用 现有的数据分析软件,包括但不限于统计产品与服务解决方案软件(Statistical Product and Service Solutions,SPSS)。以SPSS为例,可以在SPSS的"描述性"对话框里,将指数数 据的平均值放入右边的"变量"文本框里,选中左下角的"将标准化得分另存为变量"点击确 定,在数据视图的右边就会出现标准化(即线性变换)后的对数数据的平均值(即第二点击 消费数据)。优选地,还可以对对数数据的平均值进行筛选,具体的,可以求任一对数数据的 平均值的方差,并保留数值在[20,180]之间的对数数据的平均值;进一步的,由于有些行业 或者地区的第一点击消费数据较稀疏,即数据量少,对应的连续几周(单位统计周期)的指 数数据的平均值波动较大,这些波动较大的指数数据的平均值也可以去掉,不再参与后续 步骤。
[0062] 在本实施例的一些可选实现方式中,为了提高数据安全,还可以对线性变换前的 指数数据的平均值或者对线性变换后的指数数据的平均值进行数据加密的处理。
[0063]在本实施例的一些可选实现方式中,上述提取出周期用户行为数据中的非季节性 用户行为数据和季节性用户行为数据,可以具体包括:将当前单位统计周期之前一个全季 节周期内各个单位统计周期的周期用户行为数据的平均值确定为当前单位统计周期的非 季节性用户行为数据。
[0064]需要说明的是,全季节周期可以是单个全季节周期或连续多个全季节周期。例如, 一个单位统计周期可以选取为一周,一个全季节周期可以选取为一年(52周),周期(单个全 季节周期所包含的单位统计周期的数量)T = 52。全季节周期则可以是一年或连续几年。此 时,全季节周期内的周期用户行为数据可以表示为数据集合{Xl},其中 Xl是全季节周期内第 i周的周期用户行为数据。其中i = l,…,N,N为观测总数。其中,周期用户行为数据可以划分 为非季节性用户行为数据k和季节性用户行为数据两个部分,其中j是53到N之间的整 数。非季节性用户行为数据k可以通过按照式(1)对周期用户行为数据进行平滑处理得到 对应的非季节用户行为数据k:
[0066] 在本实施例的一些可选实现方式中,上述根据周期用户行为数据的季节变化率得 到第一实体集合在该单位统计周期内的状态参数,包括:获取相邻全季节周期中季节变化 率的变化率平均值;根据季节变化率与变化率平均值,获取与状态参数关联的特征系数;将 特征系数在至少两个单位统计周期内平滑后进行加权处理得到对应的状态参数。其中,该 特征系数是表征状态参数的系数,在经济学领域中可以表达为景气系数。
[0067] 可选的,季节变化率pj通过式(2)计算得到:
[0069]相邻全季节周期中季节变化率的变化率平均值q#』可以通过式(3)获取:
[0071]在本实施例的一些可选实现方式中,上述根据季节变化率与变化率平均值,获取 状态参数序列的特征系数,包括:将季节变化率与变化率平均值的差值作为特征系数;或 者,根据非季节性用户行为数据和变化率平均值的增量获取季节增长量,并将周期用户行 为数据与季节增长量的差值与非季节性用户行为数据的比值作为特征系数。
[0072]具体的,该特征系数^可以通过季节变化率W与季节变化率的平均值⑴生成,例如 通过式(4)生成:
[0073] rj = pj-qj j = 53,---N (4)
[0074] 上述特征系数^也可以首先根据非季节性用户行为数据k和季节变化率的变化率 平均值(^的增量获取季节增长量参见式(5);然后,将周期用户行为数据与季节增长量^ 的差值相比于非季节性用户行为数据k所得到的比值作为特征系数参见式(6)。
[0077]在本实施例的一些可选实现方式中,上述将特征系数在至少两个单位统计周期内 平滑后进行加权处理得到对应的状态参数序列可以包括:将至少两个单位统计周期内为正 数的特征系数的平均值进行线性加权处理后,得到对应的状态参数序列。例如,特征系数在 六个单位统计周期(周)内平滑后进行加权处理得到对应的状态参数。具体的,可以将六周 内为正数的特征系数的平均值进行线性加权处理后得到对应的状态参数,因为对于负数的 特征系数会抵消部分或者全部正数的状态参数,从而弱化状态参数的波动,影响信息的可 靠性。处理算法可以参见式(7)。
[0079] 其中,j为各个统计周期的序号,为所得到的各个状态参数序列。
[0080] 在本实施例的一些可选实现方式中,还可以将状态参数序列推送至终端设备进行 展示。在展示时,终端设备可以根据各个状态参数所对应的单位统计周期,绘制成曲线形式 进行展示。
[0081] 步骤203,使用状态参数序列以及从第三方平台获取的、对第二实体集合进行调研 所形成的调研数据,构造用于预测行为参考信息的线性回归模型。
[0082]在本实施例中,基于步骤202所生成的状态参数序列以及从第三方平台获取的、对 第二实体集合进行调研所形成的调研数据,电子设备利用状态参数序列和调研数据构造成 线性回归模型,该线性回归模型用于预测行为参考信息。其中,行为参考信息可以是数值形 式,可以表达为经济学中的宏观经济景气指数。调研数据可以从国家统计局获取或者从其 他经济预测平台获取的是企业情况调查数据。
[0083] 在本实施例的一些可选实现方式中,上述步骤203可以具体包括:从调研数据中 提取出优质时间序列;使用优质时间序列和状态参数序列进行拟合,得到线性回归模型。 [0084] 在本实施例的一些可选实现方式中,上述步骤203可以通过以下方式中的一种或 多种执行。方式一:采用自回归积分滑动平均模型算法从试题调研数据中对应的一致指数 调查数据获取一致指数优质时间序列,并根据一致指数优质时间序列和状态参数序列拟合 得到一致指数的线性回归模型;方式二:采用自回归积分滑动平均模型算法从试题调研数 据中对应的先行指数调查数据获取先行指数优质时间序列,并根据先行指数优质时间序列 和状态参数序列拟合得到先行指数的线性回归模型;方式三:采用向量自回归模型算法从 试题调研数据中对应的生产者物价指数调查数据获取生产者物价指数优质时间序列,并根 据生产者物价指数优质时间序列和状态参数序列拟合得到生产者物价指数的线性回归模 型;方式四,采用向量自回归模型算法从试题调研数据中对应的采购经理人指数调查数据 获取采购经理人指数优质时间序列,并根据采购经理人指数优质时间序列和状态参数序列 拟合得到采购经理人指数的线性回归模型。
[0085] 具体的,在上述第一种方式中,可以采用自回归积分滑动平均模型(Auto Regressive Integrated Moving Average,ARIMA)模型算法从企业情况调查数据中对应的 一致指数调查数据获取一致指数优质时间序列;对应的,上述使用优质时间序列和状态参 数序列进行拟合,得到线性回归模型可以是:根据一致指数优质时间序列和状态参数的序 列拟合得到一致指数的线性回归模型。
[0086] 在上述第二种方式中,可以采用自回归积分滑动平均模型算法从企业情况调查数 据中对应的先行指数调查数据获取先行指数优质时间序列;对应的,上述使用优质时间序 列和状态参数序列进行拟合,得到线性回归模型可以是:根据先行指数优质时间序列和状 态参数的序列拟合得到先行指数的线性回归模型
[0087] 在上述第三种方式中,可以采用向量自回归(Vector Auto Regressive,VAR)模型 算法从企业情况调查数据中对应的生产者物价指数调查数据获取PPI(Producer Price Index,生产者物价指数)优质时间序列;对应的,上述使用优质时间序列和状态参数序列 进行拟合,得到线性回归模型可以是:根据生产者物价指数优质时间序列和状态参数的序 列拟合得到生产者物价指数的线性回归模型。
[0088] 在上述第四种方式中,可以采用向量自回归模型算法从企业情况调查数据中对应 的采购经理人指数调查数据获取PMI (Purchasing Managers'Index,采购经理人指数)优质 时间序列;对应的,根据采购经理人指数优质时间序列和状态参数的序列拟合得到采购经 理人指数的线性回归模型。
[0089]在上述实现方式中,对一致指数和先行指数的预测采用AR頂A模型算法,其基本原 理包括:根据时间序列的散点图、自相关函数和偏自相关函数图以单位根检验其方差、趋势 及其季节性变化规律,对序列的平稳性进行识别。对非平稳序列进行平稳化处理,如果数据 序列是非平稳的,并存在一定的增长或下降趋势,则需要对数据进行差分处理,如果数据存 在异方差,则需对数据进行技术处理,直到处理后的数据的自相关函数值和偏相关函数值 无显著地异于零。根据时间序列模型的识别规则,建立相应的模型。若平稳序列的偏相关函 数是截尾的,而自相关函数是拖尾的,可断定序列适合自回归过程模型;若平稳序列的偏相 关函数是拖尾的,而自相关函数是截尾的,则可断定序列适合移动平均过程模型;若平稳序 列的偏相关函数和自相关函数均是拖尾的,则序列适合自回归移动平均过程模型。进行参 数估计,检验是否具有统计意义。进行假设检验,诊断残差序列是否为白噪声。利用已通过 检验的模型进行预测分析。
[0090] 在上述实现方式中,对PPI和PMI的预测采用VAR模型算法,其基本原理包括:基于 数据的统计性质建立模型,模型把数据系统中每一个内生变量作为系统中所有内生变量的 滞后值的函数来构造模型,从而将单变量自回归模型推广到由多元时间序列变量组成的向 量自回归模型。
[0091] 例如,在本实施例中,采用ARMA模型对一致指数进行预测包括模型定阶、参数估 计和模型诊断。
[0092] 其中,定阶过程先检验平稳性,并校验序列(即企业情况调查数据所组成的序列) 的序列自相关性和序列偏相关性,确定至少两组模型。之后,对至少两组模型进行参数估计 和模型诊断,筛选得到最优的模型。其中,参数估计和模型诊断所采用的方法可以包括但不 限于最小信息准则(Akaike Information Criterion,AIC)。可选的,进行模型诊断时可以 采用残差诊断结果,进行参数估计时可以考虑置信区间是否包含0等。该模型中包括的回归 项,其相关性就是计算目标变量和协整变量之间相关系数的高低。以预测一致指数为例,直 接使用R包auto .arima函数,该函数能够自动定阶,选出几组合适的模型,并筛选得到最优 的ARIMA模型,加入回归项序列(即状态参数的序列),得到如下参数:auto. arima中有参数 xregUreg为外部的回归量),得到的就是自相关时间序列加协变量时间序列的复合时间序 列;auto. arima自动选择最优参数p,d,q(p为自回归项,q为移动平均项数,d为时间序列成 为平稳时所做的差分次数),设置这几个参数最大取值,程序会在〇到最大值中选所有情况 遍历,得到最优结果,比如输入化=3,(1 = 2,(1 = 3)。参见图3,其示出本发明使用41?頂4模型 时的最优参数计算结果示意图,xreg参数可以是根据推广系统在一年内1月-12月的用户行 为数据获取的状态参数的序列。根据图3中的计算结果,可以得到式(8)所示的模型。
[0093] yt = yt-i+0.0219*xt+et (8)
[0094] 其中,yt是目标变量,xt是协变量,εt是随机项,AIC = 74.51。其中,图3中的圆圈301 指示计算出xt的系数值,圆圈301指示AIC的值。图3中的示意图中其它数据的含义可以通过 现有技术进行识别,这里不再赘述。可选的,图4是示出本发明在ARIMA模型下的标准差诊断 的诊断结果示意图;图5是本发在ARIMA模型下的自相关检验的检验结果示意图;图6是示出 本发明在ARIMA模型下的L jung-Box检验的检验结果示意图。
[0095]参见图4中,标准差诊断过程中,横坐标(每周)对应的数据的指数Iag0_lag40的残 差均无明显超过标准差线401,则可接受相应的模型。参见图5,自相关检验过程中,竖直线 501表明自相关只有lagO,也即跟后面的不相关,也就是模型最终是arima(0,l,0)。参见图 6,Ljung-Box检验过程中,图中圆圈602表示各参数对应的p值显著高于衡量线601,模型可 接受。因此残差诊断模型通过。
[0096] 例如,在本实施例中,采用VAR模型对PPI和PMI进行预测。VAR模型建模过程基本同 ARIMA模型。但在定阶过程使用的是交叉相关函数(Cross-Correlation Function,CCF)。 CCF通过给定阶数,计算在哪个阶数下AIC最小,从而得到VAR最优阶数。在R语言的VAR包中, 可以直接调用CCF函数。比较模型的标准是测定系数R2,各阶系数的显著性等。图7是示出本 发明中AVR模型下的企业情况调查数据的时间序列示意图。参见图7,首先从企业情况调查 数据中筛选出最好的相关序列,以预测PMI最终选择的协变量,图7中的第一曲线701和第二 曲线702表明两条曲线对应的时间序列有高度相关性。图8是示出本发明中AVR模型下企业 情况调查数据与状态参数的序列的相关性示意图。采用CCF计算图7中第一曲线701和第二 曲线702对应的时间序列的相关性,第一曲线701和第二曲线702对应的时间序列中的同期 数据对应的竖直线801、802、803、804、805和806的高度都超过自相关性标准线801,相关性 最高。图9是示出本发明中AVR模型下的测定系数计算结果示意图。根据企业情况调查数据 和状态参数的序列采用VAR模型计算出参数,参见图9,其中all的lagl(图9中的all. 11), lag2(图9中的all. 12),lag3(图9中的all. 13)都有较强显著性(显著性判断属于现有技术, 这里不再赘述),调整的拟合系数R2为62% (图9中圆圈901指示),这些评价指标相比其余的 模型均有更好的效果。图9中的示意图中其它数据的含义可以通过现有技术进行识别,这里 不再赘述。
[0097]在本实现方式中,对一致指数和先行指数的预测采用AR頂A模型算法,其基本原理 包括:根据时间序列的散点图、自相关函数和偏自相关函数图以单位根检验其方差、趋势及 其季节性变化规律,对序列的平稳性进行识别。对非平稳序列进行平稳化处理,如果数据序 列是非平稳的,并存在一定的增长或下降趋势,则需要对数据进行差分处理,如果数据存在 异方差,则需对数据进行技术处理,直到处理后的数据的自相关函数值和偏相关函数值无 显著地异于零。根据时间序列模型的识别规则,建立相应的模型。若平稳序列的偏相关函 数是截尾的,而自相关函数是拖尾的,可断定序列适合自回归过程模型;若平稳序列的偏相 关函数是拖尾的,而自相关函数是截尾的,则可断定序列适合移动平均过程模型;若平稳序 列的偏相关函数和自相关函数均是拖尾的,则序列适合自回归移动平均过程模型。进行参 数估计,检验是否具有统计意义。进行假设检验,诊断残差序列是否为白噪声。利用已通过 检验的模型进行预测分析。
[0098]在本实现方式中,对PPI和PMI的预测采用VAR模型算法,其基本原理包括:基于数 据的统计性质建立模型,模型把数据系统中每一个内生变量作为系统中所有内生变量的滞 后值的函数来构造模型,从而将单变量自回归模型推广到由多元时间序列变量组成的向量 自回归模型。
[0099]实践中,在除了AR頂A模型和/或VAR模型,还可以采用其他可以处理时间序列的模 型。
[0100]使用该实现方式的技术方案时,采用点击消费数据所预测的先行指数与国家统计 局实际公布的先行指数有79%的相关性,所预测的一致指数与国家统计局实际公布的一致 指数有91%的相关性,预测生成的参考信息可以以数字形式展示,给国家、企业以及个人的 决策行为提供全面客观的参考信息。
[0101] 步骤204,利用线性回归模型生成行为参考信息,并将行为参考信息推送至终端设 备进行展示。
[0102] 在本实施例中,基于步骤203所生成的线性回归模型,电子设备利用该线性回归模 型生成行为参考信息,并将所生成的行为参考信息推送至终端设备进行展示。实践中,线性 回归模型输出的行为参考信息可以是数值形式,电子设备可以将相应数值推送至终端设备 进行展示。通常,当所推送对应多个时间段的行为参考信息时,可以将表征各个时间段的行 为参考信息的数值绘制成曲线进行显示,以提高信息展示效果。
[0103] 本申请的上述实施例提供的方法通过大数据技术根据用户行为数据获取到第一 实体集合的状态参数序列,再将状态参数序列结合从第三方平台获取的调研数据结合生 成线性回归模型,从而可以基于线性回归模型生成行为参考信息并推送至终端设备进行展 示,实现了行为参考信息的自动化生成,效率较高。
[0104] 进一步参考图10,作为对上述各图所示方法的实现,本申请提供了一种信息推送 装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于 各种电子设备中。
[0105] 如图10所示,本实施例所述的信息推送装置1000包括:获取单元1001、形成单元 1002、构造单元1003和推送单元1004。其中,获取单元1001用于获取预设的全季节周期内每 个单位时间的用户行为数据,用户行为数据是与第一实体集合相关联的用户行为的用户行 为数据;形成单元1002用于针对全季节周期中的各个单位统计周期,利用单位统计周期内 每个单位时间的用户行为数据得到第一实体集合在各个单位统计周期内的状态参数,形成 与全季节周期对应的状态参数序列;信息选取单元1003用于使用状态参数序列以及从第三 方平台获取的、对第二实体集合进行调研所形成的调研数据,构造用于预测行为参考信息 的线性回归模型;而推送单元1004用于将线性回归模型生成的行为参考信息推送至终端设 备进行展示。
[0106] 在本实施例中,信息推送装置1000的获取单元1001、形成单元1002、构造单元1003 和推送单元1004的具体处理可以分别参考图2对应实施例的步骤201、步骤202、步骤203以 及步骤204,这里不再赘述。
[0107] 在本实施例的一些可选实现方式中,形成单元502包括:获取子单元(未示出),用 于根据各个单位统计周期内每个单位时间的用户行为数据获取各单位统计周期的周期用 户行为数据;提取子单元(未示出),提取出周期用户行为数据中的非季节性用户行为数据 和季节性用户行为数据;信息得到子单元(未示出),用于根据周期用户行为数据的季节变 化率得到第一实体集合在该单位统计周期内的状态参数,季节变化率为季节性用户行为数 据与非季节性用户行为数据的比值。
[0108] 在本实施例的一些可选实现方式中,上述获取子单元进一步用于:对各个单位统 计周期内每个单位时间的用户行为数据进行对数运算,生成每个用户行为数据对应的对数 数据;获取各个单位统计周期内对数数据的平均值;线性变换平均值,得到周期用户行为数 据。
[0109] 在本实施例的一些可选实现方式中,上述提取子单元进一步用于:对周期用户行 为数据在全季节周期内进行平滑处理得到对应的非季节性用户行为数据。
[0110] 在本实施例的一些可选实现方式中,上述提取子单元进一步用于:将当前单位统 计周期之前一个全季节周期内各个单位统计周期的周期用户行为数据的平均值确定为当 前单位统计周期的非季节性用户行为数据。
[0111] 在本实施例的一些可选实现方式中,信息得到子单元,包括:平均值获取模块,用 于获取相邻全季节周期中季节变化率的变化率平均值;系数获取模块,用于根据季节变化 率与变化率平均值,获取与状态参数关联的特征系数;加权处理模块,用于将特征系数在至 少两个单位统计周期内平滑后进行加权处理得到对应的状态参数。
[0112] 在本实施例的一些可选实现方式中,系数获取模块进一步用于:将季节变化率与 变化率平均值的差值作为特征系数;或者,根据非季节性用户行为数据和变化率平均值的 增量获取季节增长量,并将周期用户行为数据与季节增长量的差值与非季节性用户行为数 据的比值作为特征系数。
[0113] 在本实施例的一些可选实现方式中,加权处理模块进一步用于:将至少两个单位 统计周期内为正数的特征系数的平均值进行线性加权处理后,得到对应的状态参数序列。
[0114] 在本实施例的一些可选实现方式中,构造单元进一步用于,包括:从调研数据中提 取出优质时间序列;使用优质时间序列和状态参数序列进行拟合,得到线性回归模型。
[0115] 在本实施例的一些可选实现方式中,构造单元进一步用于以下至少一项:采用自 回归积分滑动平均模型算法从试题调研数据中对应的一致指数调查数据获取一致指数优 质时间序列,并根据一致指数优质时间序列和状态参数序列拟合得到一致指数的线性回归 模型;采用自回归积分滑动平均模型算法从试题调研数据中对应的先行指数调查数据获 取先行指数优质时间序列,并根据先行指数优质时间序列和状态参数序列拟合得到先行指 数的线性回归模型;采用向量自回归模型算法从试题调研数据中对应的生产者物价指数调 查数据获取生产者物价指数优质时间序列,并根据生产者物价指数优质时间序列和状态参 数序列拟合得到生产者物价指数的线性回归模型;采用向量自回归模型算法从试题调研数 据中对应的采购经理人指数调查数据获取采购经理人指数优质时间序列,并根据采购经理 人指数优质时间序列和状态参数序列拟合得到采购经理人指数的线性回归模型。
[0116] 下面参考图11,其示出了适于用来实现本申请实施例的终端设备或服务器的计算 机系统1100的结构示意图。
[0117] 如图11所示,计算机系统1100包括中央处理单元(CPU)llOl,其可以根据存储在只 读存储器(R0MH102中的程序或者从存储部分1108加载到随机访问存储器(RAM)1103中的 程序而执行各种适当的动作和处理。在RAM 1103中,还存储有系统1100操作所需的各种程 序和数据。CPU 110UR0M 1102以及RAM 1103通过总线1104彼此相连。输入/输出(I/O)接口 1105也连接至总线1104。
[0118] 以下部件连接至I/O接口 1105:包括键盘、鼠标等的输入部分1106;包括诸如阴极 射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1107;包括硬盘等的存储部分 1108;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1109。通信部分1109经 由诸如因特网的网络执行通信处理。驱动器1110也根据需要连接至I/O接口 1105。可拆卸介 质1111,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1110上,以便 于从其上读出的计算机程序根据需要被安装入存储部分1108。
[0119] 特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机 软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读 介质上的计算机程序,所述计算机程序包含用于执行流程图所示的方法的程序代码。在这 样的实施例中,该计算机程序可以通过通信部分1109从网络上被下载和安装,和/或从可 拆卸介质1111被安装。
[0120] 附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程 序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代 表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包含一个或多个 用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所 标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际 上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要 注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用 执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指 令的组合来实现。
[0121] 描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬 件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包 括获取单元、形成单元、构造单元和推送单元。其中,这些单元的名称在某种情况下并不构 成对该单元本身的限定,例如,获取单元还可以被描述为"获取预设的全季节周期内每个单 位时间的用户行为数据的单元"。
[0122] 作为另一方面,本申请还提供了一种非易失性计算机存储介质,该非易失性计算 机存储介质可以是上述实施例中所述装置中所包含的非易失性计算机存储介质;也可以是 单独存在,未装配入终端中的非易失性计算机存储介质。上述非易失性计算机存储介质存 储有一个或者多个程序,当所述一个或者多个程序被一个设备执行时,使得所述设备:获取 预设的全季节周期内每个单位时间的用户行为数据,所述用户行为数据是与第一实体集合 相关联的用户行为的用户行为数据;针对所述全季节周期中的各个单位统计周期,利用单 位统计周期内每个单位时间的用户行为数据得到所述第一实体集合在各个单位统计周期 内的状态参数,形成与所述全季节周期对应的状态参数序列;使用所述状态参数序列以及 从第三方平台获取的、对第二实体集合进行调研所形成的调研数据,构造用于预测行为参 考信息的线性回归模型;将所述线性回归模型生成的行为参考信息推送至终端设备进行展 不。
[0123]以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人 员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术 方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行 任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功 能的技术特征进行互相替换而形成的技术方案。
【主权项】
1. 一种信息推送方法,其特征在于,所述方法包括: 获取预设的全季节周期内每个单位时间的用户行为数据,所述用户行为数据是与第一 实体集合相关联的用户行为的用户行为数据; 针对所述全季节周期中的各个单位统计周期,利用单位统计周期内每个单位时间的用 户行为数据得到所述第一实体集合在各个单位统计周期内的状态参数,形成与所述全季节 周期对应的状态参数序列; 使用所述状态参数序列以及从第三方平台获取的、对第二实体集合进行调研所形成的 调研数据,构造用于预测行为参考信息的线性回归模型; 利用所述线性回归模型生成行为参考信息,并将所述行为参考信息推送至终端设备进 行展示。2. 根据权利要求1所述的方法,其特征在于,所述利用单位统计周期内每个单位时间的 用户行为数据得到所述第一实体集合在各个单位统计周期内的状态参数,包括: 根据各个单位统计周期内每个单位时间的用户行为数据获取各单位统计周期的周期 用户行为数据; 提取出所述周期用户行为数据中的非季节性用户行为数据和季节性用户行为数据; 根据所述周期用户行为数据的季节变化率得到所述第一实体集合在该单位统计周期 内的状态参数,所述季节变化率为所述季节性用户行为数据与非季节性用户行为数据的比 值。3. 根据权利要求2所述的方法,其特征在于,所述根据各个单位统计周期内每个单位时 间的用户行为数据获取各单位统计周期的周期用户行为数据,包括: 对各个单位统计周期内每个单位时间的用户行为数据进行对数运算,生成每个用户行 为数据对应的对数数据; 获取各个单位统计周期内对数数据的平均值; 线性变换所述平均值,得到所述周期用户行为数据。4. 根据权利要求3所述的方法,其特征在于,所述提取出所述周期用户行为数据中的非 季节性用户行为数据和季节性用户行为数据,包括: 对所述周期用户行为数据在所述全季节周期内进行平滑处理得到对应的非季节性用 户行为数据。5. 根据权利要求4所述的方法,其特征在于,所述对所述周期用户行为数据在所述全季 节周期内进行平滑处理得到对应的非季节性用户行为数据,包括: 将当前单位统计周期之前一个全季节周期内各个单位统计周期的周期用户行为数据 的平均值确定为所述当前单位统计周期的非季节性用户行为数据。6. 根据权利要求3所述的方法,其特征在于,所述根据所述周期用户行为数据的季节变 化率得到所述第一实体集合在该单位统计周期内的状态参数,包括: 获取相邻全季节周期中季节变化率的变化率平均值; 根据所述季节变化率与所述变化率平均值,获取与所述状态参数关联的特征系数; 将所述特征系数在至少两个单位统计周期内平滑后进行加权处理得到对应的状态参 数。7. 根据权利要求6所述的方法,其特征在于,所述根据所述季节变化率与所述变化率平 均值,获取状态参数序列的特征系数,包括: 将所述季节变化率与所述变化率平均值的差值作为所述特征系数; 或者,根据所述非季节性用户行为数据和所述变化率平均值的增量获取季节增长量, 并将所述周期用户行为数据与所述季节增长量的差值与所述非季节性用户行为数据的比 值作为所述特征系数。8. 根据权利要求6所述的方法,其特征在于,所述将所述特征系数在至少两个单位统计 周期内平滑后进行加权处理得到对应的状态参数序列,包括: 将至少两个单位统计周期内为正数的特征系数的平均值进行线性加权处理后,得到对 应的状态参数序列。9. 根据权利要求1-8之一所述的方法,其特征在于,所述使用所述状态参数序列以及从 第三方平台获取的、对第二实体集合进行调研所形成的调研数据,构造用于预测行为参考 信息的线性回归模型,包括: 从所述调研数据中提取出优质时间序列; 使用所述优质时间序列和所述状态参数序列进行拟合,得到所述线性回归模型。10. 根据权利要求1-8之一所述的方法,其特征在于,所述使用所述状态参数序列以及 从第三方平台获取的、对第二实体集合进行调研所形成的调研数据,构造用于预测行为参 考信息的线性回归模型,包括以下至少一项: 采用自回归积分滑动平均模型算法从所述试题调研数据中对应的一致指数调查数据 获取一致指数优质时间序列,并根据所述一致指数优质时间序列和所述状态参数序列拟合 得到所述一致指数的线性回归模型; 采用自回归积分滑动平均模型算法从所述试题调研数据中对应的先行指数调查数据 获取先行指数优质时间序列,并根据所述先行指数优质时间序列和所述状态参数序列拟合 得到所述先行指数的线性回归模型; 采用向量自回归模型算法从所述试题调研数据中对应的生产者物价指数调查数据获 取生产者物价指数优质时间序列,并根据所述生产者物价指数优质时间序列和所述状态参 数序列拟合得到所述生产者物价指数的线性回归模型; 采用向量自回归模型算法从所述试题调研数据中对应的采购经理人指数调查数据获 取采购经理人指数优质时间序列,并根据所述采购经理人指数优质时间序列和所述状态参 数序列拟合得到所述采购经理人指数的线性回归模型。11. 一种信息推送装置,其特征在于,所述装置包括: 获取单元,用于获取预设的全季节周期内每个单位时间的用户行为数据,所述用户行 为数据是与第一实体集合相关联的用户行为的用户行为数据; 形成单元,用于针对所述全季节周期中的各个单位统计周期,利用单位统计周期内每 个单位时间的用户行为数据得到所述第一实体集合在各个单位统计周期内的状态参数,形 成与所述全季节周期对应的状态参数序列; 构造单元,用于使用所述状态参数序列以及从第三方平台获取的、对第二实体集合进 行调研所形成的调研数据,构造用于预测行为参考信息的线性回归模型; 推送单元,用于利用所述线性回归模型生成行为参考信息,并将所述行为参考信息推 送至终端设备进行展示。12. 根据权利要求11所述的装置,其特征在于,所述形成单元包括: 获取子单元,用于根据各个单位统计周期内每个单位时间的用户行为数据获取各单位 统计周期的周期用户行为数据; 提取子单元,提取出所述周期用户行为数据中的非季节性用户行为数据和季节性用户 行为数据; 信息得到子单元,用于根据所述周期用户行为数据的季节变化率得到所述第一实体 集合在该单位统计周期内的状态参数,所述季节变化率为所述季节性用户行为数据与非季 节性用户行为数据的比值。13. 根据权利要求12所述的装置,其特征在于,所述获取子单元进一步用于: 对各个单位统计周期内每个单位时间的用户行为数据进行对数运算,生成每个用户行 为数据对应的对数数据; 获取各个单位统计周期内对数数据的平均值; 线性变换所述平均值,得到所述周期用户行为数据。14. 根据权利要求13所述的装置,其特征在于,所述提取子单元进一步用于: 对所述周期用户行为数据在所述全季节周期内进行平滑处理得到对应的非季节性用 户行为数据。15. 根据权利要求14所述的装置,其特征在于,所述提取子单元进一步用于: 将当前单位统计周期之前一个全季节周期内各个单位统计周期的周期用户行为数据 的平均值确定为所述当前单位统计周期的非季节性用户行为数据。16. 根据权利要求13所述的装置,其特征在于,所述信息得到子单元,包括: 平均值获取模块,用于获取相邻全季节周期中季节变化率的变化率平均值; 系数获取模块,用于根据所述季节变化率与所述变化率平均值,获取与所述状态参数 关联的特征系数; 加权处理模块,用于将所述特征系数在至少两个单位统计周期内平滑后进行加权处理 得到对应的状态参数。17. 根据权利要求16所述的装置,其特征在于,所述系数获取模块进一步用于: 将所述季节变化率与所述变化率平均值的差值作为所述特征系数; 或者,根据所述非季节性用户行为数据和所述变化率平均值的增量获取季节增长量, 并将所述周期用户行为数据与所述季节增长量的差值与所述非季节性用户行为数据的比 值作为所述特征系数。18. 根据权利要求16所述的装置,其特征在于,所述加权处理模块进一步用于: 将至少两个单位统计周期内为正数的特征系数的平均值进行线性加权处理后,得到对 应的状态参数序列。19. 根据权利要求11-18之一所述的方法,其特征在于,所述构造单元进一步用于: 从所述调研数据中提取出优质时间序列; 使用所述优质时间序列和所述状态参数序列进行拟合,得到所述线性回归模型。20. 根据权利要求11-18之一所述的装置,其特征在于,所述构造单元进一步用于以下 至少一项: 采用自回归积分滑动平均模型算法从所述试题调研数据中对应的一致指数调查数据 获取一致指数优质时间序列,并根据所述一致指数优质时间序列和所述状态参数序列拟合 得到所述一致指数的线性回归模型; 采用自回归积分滑动平均模型算法从所述试题调研数据中对应的先行指数调查数据 获取先行指数优质时间序列,并根据所述先行指数优质时间序列和所述状态参数序列拟合 得到所述先行指数的线性回归模型; 采用向量自回归模型算法从所述试题调研数据中对应的生产者物价指数调查数据获 取生产者物价指数优质时间序列,并根据所述生产者物价指数优质时间序列和所述状态参 数序列拟合得到所述生产者物价指数的线性回归模型; 采用向量自回归模型算法从所述试题调研数据中对应的采购经理人指数调查数据获 取采购经理人指数优质时间序列,并根据所述采购经理人指数优质时间序列和所述状态参 数序列拟合得到所述采购经理人指数的线性回归模型。
【文档编号】G06F17/30GK106095895SQ201610398826
【公开日】2016年11月9日
【申请日】2016年6月7日
【发明人】韩雷, 韩艳, 曹永创
【申请人】百度在线网络技术(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1