利用用户交互的相似水文过程搜索方法

文档序号:8472986阅读:542来源:国知局
利用用户交互的相似水文过程搜索方法
【技术领域】
[0001] 本发明涉及信息处理技术,具体涉及一种利用用户交互的相似水文过程搜索方 法。
【背景技术】
[0002] 时间序列相似性查找就是在时间序列数据库中查找和发现与给定模式相似的时 间序列,查找相似子序列的过程在实际问题中经常遇到,例如,在人类的基因组计划中,从 DNA基因序列中查找出与给定的基因片段相似的子片段,根据遗传的相似性进行研宄;根 据各种商品的销售记录,找出具有相似的商品销售模式,根据相似产品的销售模式来制定 相似的销售策略等;找出自然灾害发生的相同前兆,从而对预报自然灾害进行决策研宄; 在水文领域,找出与当前洪水过程相似的历史洪水过程,回答防汛指挥中经常会想到的"当 前水文过程与历史上哪一时期的水文过程类似"等问题。
[0003] 相似性搜索在1993年由R.Agrawal首次提出,他是时间序列预测、分类、聚类以及 序列模式挖掘等等的重要基础。时间序列相似性查找与传统的精确查询不同,由于时间序 列在数值上具有连续性以及有不同的噪声影响,因此,大部分情况下不需要时间序列很精 确匹配。另一方面是时间序列相似性查询不是针对时间序列中的某个具体的数值,而根据 给定的查询序列来找查找是在一段时间内具有相似形态特征和变化趋势的时间序列。在时 间序列相似性搜索中,需解决的问题包括时间序列特征提取、时间序列索引以及相似度量 等。针对相似度量,研宄人员提出了各种度量方法,如欧氏距离及其基于Lp准则的变种、动 态时间弯曲距离(DynamicTimeWarping,DTW)、编辑距离(EditDistance,ED)、模式距离 (PatternDistance,PD)以及最长公共子串(LongestCommonSubsequence,LCSS)等。
[0004] 目前时间序列相似性搜索主要关注于找到适合具体数据特征的特征提取方法,以 及相应领域的相似度量方法。然而,由于"相似"是用户对序列的一种语义认知,而特征以 及相似度量都是基于序列底层的数据,这两者之间存在一定的差异。因此,找到一种不变的 特征提取方法和相似度量方法来适应所有用户对某时间序列的"相似"的认知是困难的。
[0005] 相关反馈的策略就是让用户参与到相似查询过程中,让用户对每次的查询结果进 行调整和标注,系统通过搜集用户对结果的调整和标注,从而调整特征提取或者相似度量 的方法,以学习用户对序列相似的语义认知,直到用户满意或放弃查询。相关反馈最早被用 在基于内容的图像检索中,将图像看做高维空间的矢量尺"J是从图像中提取的颜色、 纹理、形状等底层特征或者它们的组合,Rn通常被称为特征空间。在特征空间上可以定义矢 量间的距离函数以衡量图像之间的差异。由于特定特征空间中的距离并不能反映不同人对 不同图像的感受的差异,采用固定特征提取以及距离函数衡量图像间的相似程度在图像检 索中往往不能得到满意的结果。为改善查询结果,可以通过改变特征空间、改变距离的计算 方法以及相似度的衡量公式等使相似度更接近于人的感受,相关反馈技术便是通过与用户 交互得到以上目标。在时间序列的相似搜索方面,1998年,EamonnJ.Keogh等提出一个基于 相关反馈的时间序列探索框架,并能够分类和聚类,时间序列采用带权重的逐段线性拟合 (PLR)方式描述,每段拥有一个描述该段重要性的权重,在检索过程中通过用户的交互修正 权重,但是PLR计算复杂度较高,同时在计算两个子序列之间距离时,还需要进一步进行分 割对齐,同时PLR描述不能进行有效的索引。2002年,郑斌祥等利用离散傅里叶变换对时间 序列进行降维,并利用R树建立索引进行相似检索,用户对结果序列进行标注,并给出每个 结果序列的重要度,新的查询序列为旧查询序列和所有结果序列以重要度为系数的线性组 合,该方法不能考虑序列不同部分的重要程度,一般一段时间序列隐含的模式往往由序列 的一部分决定,而其他部分对序列的模式的影响相对较小。

【发明内容】

[0006] 发明目的:本发明的目的在于解决现有技术中存在的不足,提供一种提高水文时 间序列相似性分析准确率的利用用户交互的相似水文过程搜索方法,本发明以带权重的欧 式距离作为相似度量,对用户指定的查询序列进行相似搜索,用户对查询结果进行标注,根 据用户对查询序列模式的理解,对查询结果设置相似或不相似程度;算法将相似和不相似 的序列特征进行合并,并调整权重,产生更加符合用户要求的查询序列,并循环进行查询, 直到用户结束查询过程。。
[0007] 技术方案:本发明的一种利用用户交互的相似水文过程搜索方法,包括以下步 骤:
[0008] (1)对水文过程时间序列(如洪水水位过程等)进行小波变换,并进行重构形成小 波水文时间序列,初步过滤掉时间序列中存在的噪声数据;
[0009] (2)采用滑动窗口从小波水文序列中提取子序列;
[0010] (3)采用分段聚集近似法(PiecewiseAggregateApproximation,即PAA)对步骤 (2)所得子序列进行降维;
[0011] ⑷采用空间索引方法(如,R*-tree等)对步骤(3)中生成的子序列创建索引;
[0012] (5)对初始查询序列采用步骤(3)中的分段聚集近似法进行降维处理;
[0013] (6)进行k-近邻查询,并将查询结果按照与查询序列的相似程度高低排序展示给 用户;
[0014] (7)若用户对查询结果满意,则本次查询结果;否则,用户对查询结果进行标注, 识别出相似序列和不相似序列,并设置相似程度的高度,以及不相似程度的高低;
[0015] (8)系统获取用户标注的信息,进行反馈处理,利用用户对结果的重新标注,计算 出新的查询序列,并转至步骤(5)。
[0016] 进一步的,所述步骤(1)中,水文过程时间序列为以为时间序列,且过滤时间序列 中的噪声数据的具体步骤为:
[0017] (11)将水文过程时间序列进行小波分解;
[0018] (12)采用高频系数的阈值量化,即确定小波变换的尺度;
[0019] (13)重构形成小波水文时间序列。
[0020] 进一步的,所述步骤(3)中对子序列进行降维处理的具体过程为:
[0021] 将步骤(2)所得的子序列分成N段,每段的最终取值为该段内包含的数据项的均 值;一个长度为m的子序列,通过分段聚集近似法处理后,被描述成N维空间中的一个点,对 应的向量为Z=xi,...,m义的第i个元素为:
【主权项】
1. 一种利用用户交互的相似水文过程捜索方法,其特征在于:包括w下步骤: (1) 对水文过程时间序列进行小波变换,并进行重构形成小波水文时间序列,初步过滤 掉时间序列中存在的噪声数据; (2) 采用滑动窗口从小波水文序列中提取子序列; (3) 采用分段聚集近似法对步骤(2)所得子序列进行降维; (4) 采用空间索引方法对步骤(3)中生成的子序列创建索引; (5) 对初始查询序列采用步骤(3)中的分段聚集近似法进行降维处理; (6) 进行k-近邻查询,并将查询结果按照与查询序列的相似程度高低排序展示给用 户; (7) 若用户对查询结果满意,则本次查询结果;否则,用户对查询结果进行标注,识别 出相似序列和不相似序列,并设置相似程度的高度,W及不相似程度的高低; (8) 系统获取用户标注的信息,进行反馈处理,利用用户对结果的重新标注,计算出新 的查询序列,并转至步骤巧)。
2. 根据权利要求1所述的利用用户交互的相似水文过程捜索方法,其特征在于:所述 步骤(1)中,水文过程时间序列为W为时间序列,且过滤时间序列中的噪声数据的具体步 骤为: (11) 将水文过程时间序列进行小波分解; (12) 采用高频系数的阔值量化,即确定小波变换的尺度; (13) 重构形成小波水文时间序列。
3. 根据权利要求1所述的利用用户交互的相似水文过程捜索方法,其特征在于:所述 步骤(3)中对子序列进行降维处理的具体过程为: 将步骤(2)所得的子序列分成N段,每段的最终取值为该段内包含的数据项的均值;一 个长度为m的子序列,通过分段聚集近似法处理后,被描述成N维空间中的一个点,对应的 向量为X=三1,...Jw,方的第i个元素为:
上式中,子序列的段数N任意设置,每段包含的点数为"
4. 根据权利要求1所述的利用用户交互的相似水文过程捜索方法,其特征在于:所述 步骤(2)中,采用长度为W的滑动窗口沿小波水文序列按照步长为1进行滑动,提取子序 列,长度为n的小波水文序列总共提取子序列的个数为n-w+1。
5. 根据权利要求1所述的利用用户交互的相似水文过程捜索方法,其特征在于:所述 步骤巧)中,初始查询序列为任意长度。
6. 根据权利要求1所述的利用用户交互的相似水文过程捜索方法,其特征在于:所述 步骤(7)中,用户对每个结果序列进行标注,给每个序列设定一个影响值,且用正数影响值 表示某个结果序列S与用户期望的序列是相似的,用负数影响值表示某个结果序列S与用 户期望的序列不相似,同时用户采用影响值的数值大小来描述相似和不相似程度。
【专利摘要】本发明公开一种利用用户交互的相似水文过程搜索方法,以带权重的欧式距离作为相似度量,对用户指定的查询序列进行相似搜索,用户对查询结果进行标注,根据用户对查询序列模式的理解,对查询结果设置相似或不相似程度;算法将相似和不相似的序列特征进行合并,并调整权重,产生更加符合用户要求的查询序列,并循环进行查询,直到用户结束查询过程。本发明利用用户交互调整查询序列和权重,提高查询的准确性以及水文序列相似搜索的准确性。
【IPC分类】G06F17-30
【公开号】CN104794153
【申请号】CN201510099145
【发明人】王继民, 朱跃龙, 李士近, 张新华
【申请人】河海大学
【公开日】2015年7月22日
【申请日】2015年3月6日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1