一种基于序列数据进行预测的方法及装置的制造方法_2

文档序号:9375995阅读:来源:国知局
起始位置不在所述第二基元序列模式的起始位置之 前,并且所述第一基元序列模式的终止位置不在所述第二基元序列模式的终止位置之后, 则所述第一基元序列模式被包含在所述第二基元序列模式中;
[0065] 若所述第一基元序列模式的起始位置在所述第二基元序列模式的终止位置之前, 且所述第一基元序列模式的终止位置在所述第二基元序列模式的终止位置之后,则所述第 一基元序列模式前向重叠于所述第二基元序列模式,所述第二基元序列模式后向重叠于所 述第一基元序列模式;
[0066] 若所述第一基元序列模式的起始位置等于所述第二基元序列模式的终止位置加 1,则所述第一基元序列模式前向相邻于所述第二基元序列模式,所述第二基元序列模式后 向相邻于所述第一基元序列模式。
[0067] 结合第二方面或第二方面的第一种可能的实现方式或第二方面的第二种可能的 实现方式,在第三种可能的实现方式中,所述匹配模块具体用于:
[0068] 遍历所述序列模式图,获取与所述序列模式匹配的第三基元序列模式;
[0069] 根据所述第三基元序列模式在所述序列模式图中的位置,获取符合预设条件的候 选元素;
[0070] 所述预测模块具体用于:
[0071] 确定所述候选元素为所述第一序列数据中即将产生的元素。
[0072] 结合第二方面的第三种可能的实现方式,在第二方面的第四种可能的实现方式 中,所述基元序列模式包括模式影响力和模式间关系强度;
[0073] 所述匹配模块具体用于:
[0074] 根据所述第三基元序列模式的模式影响力或模式间关系强度对所述第三基元序 列模式进行排序,获取排列顺序为第一的第三基元序列模式;
[0075] 根据所述排列顺序为第一的第三基元序列模式在所述序列模式图中的位置,确定 所述序列模式在所述序列模式图中的位置;
[0076] 根据所述序列模式在所述序列模式图中的位置,确定候选元素。
[0077] 结合第二方面的第三种可能的实现方式,在第二方面的第五种可能的实现方式 中,所述基元序列模式包括模式影响力和模式间关系强度;
[0078] 所述匹配模块具体用于:
[0079] 根据所述第三基元序列模式在所述序列模式图中的位置确定所述第三基元序列 模式所对应的第一候选兀素;
[0080] 当所述第一候选元素为至少两个时,根据所述第三基元序列模式的模式影响力或 模式间关系强度,对所述第一候选元素进行加权统计,获取所述第一候选元素的加权统计 结果;
[0081] 确定所述加权统计结果中的最大值所对应的所述第一候选元素为第二候选元 素;
[0082] 所述预测模块具体用于:
[0083] 确定所述第二候选元素为所述第一序列数据中即将产生的元素。
[0084] 结合第二方面的第五种可能的实现方式,在第二方面的第六种可能的实现方式 中,所述匹配模块还用于:
[0085] 按照预设的第一加分标准对所述第二候选元素所对应的第三基元序列模式的模 式影响力和模式间关系强度进行调整;
[0086] 按照预设的第二加分标准对与所述第二候选元素所对应的第三基元序列模式有 连接关系的基元序列模式的模式影响力和模式间关系强度进行调整。
[0087] 基于上述技术方案,本发明实施例中,利用序列模式图对从第一序列数据采样获 得的序列模式进行匹配,根据匹配的结果对第一序列数据即将出现的元素进行预测,建立 了序列数据之间的联系,能够根据相互关联的序列数据进行预测,提高了序列数据预测的 准确性。
【附图说明】
[0088] 图1为隐马尔科夫链示意图;
[0089] 图2为本发明实施例中基于序列数据进行预测的方法流程示意图;
[0090] 图3为本发明实施例中构建序列模式图的过程示意图;
[0091] 图4为本发明实施例中序列模式图结构示意图;
[0092] 图5为本发明实施例中序列模式图动态构建过程示意图;
[0093] 图6为本发明实施例中单用户未来行为预测示意图;
[0094] 图7为本发明实施例中多用户模型分析示意图;
[0095] 图8a为本发明实施例中基于序列数据进行预测的装置结构示意图;
[0096] 图8b为本发明实施例中另一基于序列数据进行预测的装置结构示意图;
[0097] 图9为本发明实施例中终端设备的结构示意图。
【具体实施方式】
[0098] 为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进 一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施 例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的 所有其它实施例,都属于本发明保护的范围。
[0099] 下面结合附图对本发明的实施方式进行详细说明。
[0100] 如图2所示,本发明实施例中,基于序列数据进行预测的详细方法流程如下:
[0101] 步骤201 :获取终端中存储的第一序列数据。
[0102] 其中,第一序列数据为一维或多维数据。例如,全球定位系统(GPS)的三维坐标数 据。
[0103] 其中,第一序列数据可以是各种应用场景下的数据,例如字符串、网页访问地址、 购物货品名称、基因标识等序列数据,其中每个元素代表一个状态或者类别,以第一序列数 据为用户移动行为中的地点签到序列为例,第一序列数据中的每个元素表示为在某时间点 上的状态。
[0104] 步骤202 :根据预设的采样方法,从第一序列数据中获取序列模式,该序列模式为 第一序列数据中满足预设条件的数据元素的组合。
[0105] 步骤203 :利用序列模式图对序列模式进行匹配,获取匹配的结果。
[0106] 步骤204 :根据匹配的结果,对第一序列数据中即将出现的元素进行预测。
[0107] 其中,序列模式图为根据历史序列数据中包含的各基元序列模式之间的关系构建 获得的,该历史序列数据与所述第一序列数据表示同一类型的事件,该序列模式图用于表 征基元序列模式的影响力以及基元序列模式之间的模式间关系强度。
[0108] 可选地,在执行步骤203之前,构建序列模式图,具体过程如下:
[0109] 获取预设数量的历史序列数据;
[0110] 其中,该历史序列数据与第一序列数据为同种类型数据;
[0111] 确定历史序列数据中包含的基元序列模式,该基元序列模式至少为两个,且该基 元序列模式为历史序列数据中满足预设条件的数据元素的组合;
[0112] 根据基元序列模式在历史序列数据中的起始位置确定基元序列模式之间的关 系;
[0113] 根据基元序列模式之间的关系构建序列模式图。
[0114] 其中,历史序列数据与第一序列数据为同种类型的数据,实际应用中有多种情况, 列举如下:历史序列数据与第一序列数据表示同一执行主体在不同时刻的动作或状态;或 者,历史序列数据与第一序列数据表示同一事物在不同时刻的状态;或者,历史序列数据与 第一序列数据表示同一场景下的不同事物或事件。
[0115] 具体实施中,采用现有的序列挖掘算法在历史序列数据中挖掘满足预设条件的数 据元素的组合,获得各基元序列模式。
[0116] 其中,预设条件包括但不限于:最长重复序列、最大非串联重复序列、特定元素组 合序列、特定长度序列等。根据特定条件的不同,采用的数据挖掘算法也不相同。本发明实 施例并不以采用何种数据挖掘算法为限,只要能够获得满足特定条件的数据元素的组合即 可应用于本发明。
[0117] 其中,各基元序列模式之间的关系,包括但不限于:
[0118] 拥有或被包含关系;
[0119] 前向重叠或后向重叠关系;
[0120] 前向相邻或后向相邻关系。
[0121] 可选地,基元序列模式包括第一基元序列模式和第二基元序列模式,根据基元序 列模式在序列数据中的起始位置确定基元序列模式之间的关系,具体过程如下:
[0122] 确定第一基元序列模式在序列数据中的所有起始和终止位置对,该起始和终止位 置对包括第一基元序列模式在序列数据中的一个起始位置和相应的终止位置;
[0123] 根据第一基元序列模式的各起始和终止位置对,确定与第一基元序列模式起始和 终止位置对关联的其它各基元序列模式的起始和终止位置对;确定第一基元序列模式和其 它各基元序列模式之间的关系。
[0124] 可选地,根据第一基元序列模式的各起始和终止位置对,与其它各基元序列模式 的第二基元序列模式的起始和终止位置对,确定第一基元序列模式和第二基元序列模式之 间的关系;
[0125] 若第一基元序列模式的起始位置不在第二基元序列模式的起始位置之前,并且第 一基元序列模式的终止位置不在第二基元序列模式的终止位置之后,则第一基元序列模式 被包含在第二基元序列模式中;
[0126] 若第一基元序列模式的起始位置在第二基元序列模式的终止位置之前,且第一基 元序列模式的终止位置在第二基元序列模式的终止位置之后,则第一基元序列模式前向重 叠于第二基元序列模式,第二基元序列模式后向重叠于第一基元序列模式;
[0127] 若第一基元序列模式的起始位置等于第二基元序列模式的终止位置加1,则第一 基元序列模式前向相邻于第二基元序列模式,第二基元序列模式后向相邻于第一基元序列 模式。
[0128] 可选地,步骤203中,利用序列模式图对序列模式进行匹配的具体过程为:遍历序 列模式图,获取与序列模式匹配的第三基元序列模式;根据第三基元序列模式在所述序列 模式图中的位置,获取符合预设条件的候选元素。相应地,步骤204中将步骤203中确定的 候选元素确定为第一序列数据中即将产生的元素。
[0129] 其中,根据第三基元序列模式在序列模式图中的位置,获取符合预设条件的候选 元素有以下两种具体实现方式:
[0130] 第一种具体实现方式中,序列模式图中的各基元序列模式包括模式影响力或模式 间关系强度,根据第三基元序列模式的模式影响力或模式间关系强度对第三基元序列模式 进行排序,获取排列顺序为第一的第三基元序列模式;根据排列顺序为第一的第三基元序 列模式在序列模式图中的位置,确定序列模式在序列模式图中的位置;根据序列模式在序 列模式图中的位置,确定候选元素。
[0131] 具体地,若序列模式与第三基元序列模式中的全部序列数据相匹配,在进行排序 时采用该第三基元序列模式的模式间关系强度;
[0132] 若序列模式与第三基元序列模式的部分数据相匹配,在进行排序时采用该第三基 元序列模式的模式影响力。
[0133]
当前第2页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1