移动O2O环境下的基于多医学因素的Skyline双过滤检索方法与流程

文档序号:12465637阅读:来源:国知局

技术特征:

1.一种移动O2O环境下的基于多医学因素的Skyline双过滤检索方法,其特征在于:

S1.使用医生终端进行O2O环境下的实时医学流数据采集,使用客户终端发起查询请求,该查询请求包括多个相关的医学属性、对医学属性的偏好程度、及输入的各属性的阈值;

S2.云端基于该医学流数据和查询请求,从全空间并行提取查询请求中的相关医学属性的k(k≤d)维子空间,其中d为全空间维数,k子空间数据维数,全空间F中提取用户感兴趣的字段(维)既是k。按照客户端对各医学属性的偏好程度对所述k维子空间进行排序以得到一个有序的k维网格索引;

S3.扫描数据到自定义空间不均等划分的k维网格中,按照每个所述属性的阈值,使用一个维度上的网格支配关系进行剪枝,减掉被Skyline支配掉的该维度的网格以及网格里的数据,实现对数据过滤;

S4.对剩余数据进行子空间Skyline查询以得到用户需求的医学属性的Skyline结果,在所述子空间Skyline查询过程中,对于并行流数据进行双向过滤与合并。

2.如权利要求1所述的移动O2O环境下的基于多医学因素的Skyline双过滤检索方法,其特征在于,所述步骤S2中排序的方法是:属性重要性的偏序关系定义为假定存在一个二元偏序关系>是在子空间F上的,偏序关系>表示在F中属性重要性的大于关系,f1,f2是F上的两个属性,f1,f2∈F,如果f1的重要性大于f2,那么它们的偏序关系表示为f1>f2

3.如权利要求1所述的移动O2O环境下的基于多医学因素的Skyline双过滤检索方法,其特征在于,所述步骤S3中的过滤,是具体为执行A-filtering过滤方法和ε-filtering过滤方法,其中:

A-filtering过滤方法步骤如下:多目标决策的优化函数被定义为min(f1(x),f2(x),...,fk(x)),其中x∈P,fi(x)是数据对象x在第i维属性上的取值;

<mrow> <msub> <mi>R</mi> <mn>1</mn> </msub> <mo>=</mo> <mi>arg</mi> <munder> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> <mrow> <mi>x</mi> <mo>&Element;</mo> <msub> <mi>R</mi> <mn>0</mn> </msub> </mrow> </munder> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mn>1</mn> </msub> <mo>(</mo> <mi>x</mi> <mo>)</mo> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3.1</mn> <mo>)</mo> </mrow> </mrow>

<mrow> <msub> <mi>R</mi> <mn>2</mn> </msub> <mo>=</mo> <mi>arg</mi> <munder> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> <mrow> <mi>x</mi> <mo>&Element;</mo> <msub> <mover> <mi>R</mi> <mo>~</mo> </mover> <mn>1</mn> </msub> </mrow> </munder> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mn>2</mn> </msub> <mo>(</mo> <mi>x</mi> <mo>)</mo> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3.2</mn> <mo>)</mo> </mrow> </mrow>

<mrow> <msub> <mi>R</mi> <mi>k</mi> </msub> <mo>=</mo> <mi>arg</mi> <munder> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> <mrow> <mi>x</mi> <mo>&Element;</mo> <msub> <mover> <mi>R</mi> <mo>~</mo> </mover> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </mrow> </munder> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>(</mo> <mi>x</mi> <mo>)</mo> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3.3</mn> <mo>)</mo> </mrow> </mrow>

<mrow> <msub> <mi>R</mi> <mi>i</mi> </msub> <mo>=</mo> <mo>{</mo> <mi>x</mi> <mo>|</mo> <msub> <mi>f</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>&GreaterEqual;</mo> <msub> <mi>&epsiv;</mi> <mi>i</mi> </msub> <mi>m</mi> <mi>a</mi> <mi>x</mi> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mi>i</mi> </msub> <mo>(</mo> <mi>x</mi> <mo>)</mo> <mo>)</mo> </mrow> <mo>,</mo> <mi>x</mi> <mo>&Element;</mo> <msub> <mover> <mi>R</mi> <mo>~</mo> </mover> <mrow> <mi>i</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>}</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3.4</mn> <mo>)</mo> </mrow> </mrow>

上述公式用来计算第一维属性上取值最偏离用户偏好的医学数据对象集合R1,R0表示初始化数据集P,由此获得第一维属性上取值相对优的医学数据集合接下来在第一维已经相对优的医学数据集合中,利用公式(3.2)获得第二维属性取值最差的医学数据对象集合,然后从医学数据集合中剔除掉,以此类推,最后得到k维属性取值都相对优的医学数据对象集合

ε-filtering过滤方法步骤如下:εi的取值根据用户对各医学属性的偏好程度设置,任意用户会为每个属性提供最大的阈值,如果数据对象在属性上的取值不满足相应阈值,那么该数据对象被过滤掉,任意用户被建模为εi由如下公式计算:

<mrow> <msub> <mi>&epsiv;</mi> <mi>i</mi> </msub> <mo>=</mo> <mfrac> <mrow> <msubsup> <mi>UP</mi> <mi>j</mi> <mi>i</mi> </msubsup> </mrow> <mrow> <mi>max</mi> <mo>{</mo> <msub> <mi>f</mi> <mi>i</mi> </msub> <mo>}</mo> </mrow> </mfrac> </mrow>

其中表示第j个用户对第i个属性的阈值,max{fi}表示数据集P上的数据在第i个属性上取值的最大值,使用阈值过滤掉在用户关注的属性上取值不满足用户要求的数据对象。

4.如权利要求1所述的移动O2O环境下的基于多医学因素的Skyline双过滤检索方法,其特征在于,所述步骤S4中对剩余数据进行子空间Skyline查询的方法是:假定一个d维的医疗数据空间S={s1,s2,...,sd},P是在数据空间S上的医学数据集,每个数据点pi∈P都是空间S上的d维数据点的一个维度上的医疗数据,F是医疗数据空间S上的子空间即|F|=k且k≤d,在数据空间S上的医疗数据对象pi,其在子空间F上的投影被表示为p′i是k元组,当且仅当子空间F上不存在点p′j支配p′i,p′i是子空间Skyline查询结果,并将该查询结果返回客户终端。

5.如权利要求1所述的移动O2O环境下的基于多医学因素的Skyline双过滤检索方法,其特征在于,所述步骤S1中的O2O环境下的实时医学流数据采集的具体方法是:医生使用基于移动网络的移动多媒体数据采集器,针对病人的多个因素采用同时并行的基于流数据的物联网多因素传感芯片定期采集病人个体状态,特征提取与过滤处理后的数据提交至云端;所述医学流数据和查询请求以流数据的方式,且通过使用时间窗口监测的方式以时间窗口为大小,以流的方式通过无线网络批量汇总发送至云端。

6.如权利要求1所述的移动O2O环境下的基于多医学因素的Skyline双过滤检索方法,其特征在于,所述步骤S4中的双向过滤与合并的方法是:在流合并处理器上,对先后到达的时间窗口内的数据流进行skyline过滤,如果同一时间窗口内的数据存在支配关系,进行过滤操作,因为在同一时间窗口中的数据进对等的,所以采用正向skyline过滤与反向skyline过滤两个过滤步骤,正向skyline过滤即为A-filtering过滤方法,用户使用客户终端发起查询请求后,其利用多目标决策的优化函数,最后得到k维属性取值都相对优的医学数据对象集合;反向skyline过滤即为ε-filtering过滤方法,其在通过正向skyline过滤后,根据用户对各医学属性的偏好程度设置最大的阈值,如果数据对象在属性上的取值不满足相应阈值,那么该数据对象被过滤掉。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1