1.一种为不确定图的决策查询清洗边的数据清洗方法,其特征在于,包括如下步骤:
步骤一:定义不确定图、可能子图、决策查询、查询结果质量及对于不确定图和多条边,计算每条边的
值;
步骤二:从所述不确定图中选取值最大的边;
步骤三:全图清洗单边,直至找到查询结果质量数学期望最大的边,获得使所述数学期望最大的边。
2.如权利要求1所述的为不确定图的决策查询清洗边的数据清洗方法,其特征在于,所述值以如下公式(1)表示:
式(1)中,e表示边,表示通过所述边的路径中至少有一条路径连通而所有不经过所述边的路径都不连通的概率,Pr(G)表示可能子图的概率,
表示所有满足以上这种条件的概率子图集合,p(e)表示边e存在的概率。
3.如权利要求1所述的为不确定图的决策查询清洗边的数据清洗方法,其特征在于,所述步骤二按如下步骤进行:
步骤2a:将边按存在概率p(e)升序排列;
步骤2b:上界U(e)按降序排列;
步骤2c:遍历这两个队列,计算
步骤2d:如果当前访问的边e的比
大,更新
和拥有最大
的边;停止条件是
。
4.步骤2f:按边的概率升序排列,将计算边的上界U(e)降序排列,同时遍历两个队列计算当前如果当前
大于
则更新
和拥有最大
的边,搜索的停止条件是
如权利要求1所述的为不确定图的决策查询清洗边的数据清洗方法,其特征在于,所述步骤三按如下步骤进行:
步骤3a.使用上界帮助剪枝,
步骤3b.对于每条边,计算清洗边之后全图质量提高的上界UQ;
步骤3c.将边根据上界UQ的值排序。对于每条被访问的边,使用蒙特卡洛计算全图质量提高的数学期望EQ,并且维护一个EQmax记录当前最大的数学期望EQ;
步骤3d.如果UQ小于EQmax,搜索停止。