一种基于黎曼几何先验的测地线学习方法

文档序号:37723571发布日期:2024-04-23 12:01阅读:8来源:国知局
一种基于黎曼几何先验的测地线学习方法

本发明涉及到机器学习,尤其涉及一种基于黎曼几何先验的测地线学习方法。


背景技术:

1、随着大数据时代信息的爆发式增长,如何对高维数据进行分析和分类变得至关重要。高维数据往往具有维度冗余特征,我们需要在降低数据维数的同时,识别和保留原始数据中的隐藏数据结构。

2、已有的研究证明,许多高维数据集实际上附着在更低维的黎曼流形空间上,所以如何将数据降维到更低的空间维度中,并且保证数据中隐藏的信息在降维过程中尽量无损,是流形学习面临的一个关键问题。使用自编码器降维后流形空间的“隐变量”编码来描述高维原始数据,可以让机器学习执行更加快速高效的优化计算。

3、距离度量是几何学中最重要也是最核心的概念之一,是所有几何学衍生出来的计算方法的基础。在机器学习中由于学习目标样本数据的统计学分布往往是不清晰的,因此须重视样本之间的距离问题,使用距离度量来确定样本点之间的相似性,从而进行分类以及表征学习的研究。而在黎曼空间中,点与点之间的最短距离不再是欧氏空间中“两点之间直线最短”,而是需要使用测地线来描述两点之间的局部最短距离。因此,如何在不可见的低维黎曼流形中寻找符合原始样本几何特征的测地线距离和路径是目前机器学习的关键问题之一。

4、公开号为cn106599909a,公开日为2017年04月26日的中国专利文献公开了一种随机梯度测地线马尔可夫链蒙特卡罗方法及装置,所述方法包括确定目标贝叶斯模型的隐变量的后验分布函数以及随机梯度函数;根据所述隐变量确定待采样的黎曼流形并确定所述流形的等距嵌入映射,并根据所述映射确定坐标空间与嵌入空间的变换关系;其中,所述待采样的黎曼流形为所述隐变量所在的黎曼流形;在所述等距嵌入映射所对应的嵌入空间中对由所述随机梯度函数确定的特定动力学系统进行多次模拟,以确定n个所述隐变量的样本;其中,所述n为用于估计隐变量后验分布的隐变量样本数量。

5、该专利文献公开的随机梯度测地线马尔可夫链蒙特卡罗方法,可以解除全局坐标系限制和内部迭代,提高处理大规模数据的效率。但是,在面对噪音或者分布不均匀的高维数据时,鲁棒性较差,测地线路径计算准确性差。


技术实现思路

1、本发明为了克服上述现有技术的缺陷,提供一种基于黎曼几何先验的测地线学习方法,本发明将测地线方程作为几何先验,调整生成测地线路径的贝塞尔曲线控制点集,使得在贝塞尔曲线上的任意采样点位能最大化满足黎曼流形上的测地线方程,在面对噪音或者分布不均匀的高维数据时具有更好的鲁棒性,并且能够更加准确的计算出测地线路径。

2、本发明通过下述技术方案实现:

3、一种基于黎曼几何先验的测地线学习方法,其特征在于,包括以下步骤:

4、a、初始化控制点集p、起点b和终点e,控制点集p由n个流形上的坐标点构成;

5、b、将控制点集p输入贝塞尔生成器中,贝塞尔生成器生成由参数t控制的贝塞尔曲线bp(t),其中t∈[0,1],bp(0)=b,bp(1)=e;

6、c、在贝塞尔曲线上根据采样间隔gap进行均匀采样,得到1/gap个采样参数集合s,带入贝塞尔曲线后得到在贝塞尔曲线上的采样点集合bp,gp(s);

7、d、将采样点集合bp,gp(s)带入训练好的自编码器的解码器中,计算求得所有采样点位置的黎曼度量g和黎曼联络

8、e、通过测地线方程求得所有采样点位置的测地线方程值作为网络输出,再将所有测地线方程值带入均方误差损失函数,最后通过梯度下降反向调整控制点集p中所有点的位置p+δp,最小化测地线方程值与0之间的差异。

9、所述步骤b中,贝塞尔生成器生成由参数t控制的贝塞尔曲线bp(t)具体是指通过式1完成;

10、

11、式中,b(t)为n阶贝塞尔曲线,pi为第i个控制点,bi,n(t)为第i个本斯坦基函数。

12、所述第i个本斯坦基函数通过式2计算获得;

13、

14、式中,为组合数,表示从n中选择i个方法数,t为参数。

15、所述组合数通过式3计算;

16、

17、所述步骤c中,采样间隔0<gap<1。

18、所述步骤d中,黎曼度量g通过式4计算;

19、

20、其中,为切向量微分量,du为u轴微分量,dv为v轴微分量。

21、所述步骤d中,黎曼联络通过式5计算;

22、

23、式中,g为黎曼度量的逆矩阵,g=g-1,为求偏导符号,为切向量,uj为uj轴,uk为uk轴,ui为ui轴,im为矩阵中第i行m列个元素。

24、所述步骤e中,测地线方程为式6;

25、

26、其中,d为求导数符合,um为um轴。

27、本发明所述δp是指调整步长。

28、本发明的基本原理如下:

29、在黎曼空间中只有局部坐标内的距离运算能够使用欧氏空间下的度量内积作为距离的描述单位,宏观下任意两个只要不在领域范围内的点都需要借助测地线来描述他们之间的最短距离。深度学习发展过程中,已有研究表明高维数据所处的空间也并非欧式空间,极有可能处在嵌入高维中的某个低维黎曼流形空间结构上,但是由于高维数据难以可视化,并且未知数据集的分布难以用一个概率分布公式统一描述,所以应该如何正确描述这些高维数据之间的距离关系是目前深度学习以及数据挖掘研究的难点。

30、本发明是一个具有普适性的可训练参数化模型。首先,在无监督条件下将高维数据同胚映射到一个低维的流形空间中,且能够通过对解码器求雅各布矩阵得到低维流形空间中的黎曼度量属性;其次,在此之上,设计一个新的可训练参数模型,加入黎曼测地线方程作为模型的先验知识,使得模型能够更加准确的计算出黎曼测地线路径。

31、本发明的有益效果主要表现在以下方面:

32、1、本发明,将测地线方程作为几何先验,调整生成测地线路径的贝塞尔曲线控制点集,使得在贝塞尔曲线上的任意采样点位能最大化满足黎曼流形上的测地线方程,在面对噪音或者分布不均匀的高维数据时具有更好的鲁棒性,并且能够更加准确的计算出测地线路径。

33、2、本发明,相较于传统的非线性测地线学习算法,当存在数据分布不均匀的稀疏区域,计算测地线时,算法会选择绕开稀疏区域偏向走数据稠密的区域,致使测地线路径被扭曲和拉长而言,由于使用了自编码器对高维数据进行无监督同胚映射,保证高维欧氏空间在宏观拓扑结构上与映射后的低维流形等价,并且自编码器可训练模型,具有一定的泛化学习效果,当面对数据分布不均匀或者存在一定噪音时也能够较好的重构出原始数据的主要特征分布,避免测地线路径被扭曲和拉长。

34、3、本发明,将离散化的近似测地线采样结果作为无监督测地线学习模型的初始化参数,从而缩短测地线学习模型的迭代周期,并将测地线方程作为模型的几何先验知识,进一步提升模型在无监督测地线学习中的准确性。

35、4、本发明,通过自编码器将欧氏空间中的空间编码信息映射到低维黎曼流形空间中,通过解码器可求得流形上任意空间位置的黎曼几何特征属性,再基于黎曼几何先验的测地线学习模型,从而能够更加准确的从低维流形中找出符合黎曼测地线方程的近似测地线路径采样。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1