用于数据重建的模型的制作方法

文档序号:29945213发布日期:2022-05-07 15:54阅读:131来源:国知局
用于数据重建的模型的制作方法

1.本技术实施例大体上涉及量子计算领域,更具体地,涉及用于数据重建的模型。


背景技术:

2.近年来,机器学习已在众多领域中得到了大量的应用。作为人工智能领域的研究热点,随着大数据时代各行业对数据处理、如数据重建,分析需求持续增加,如何基于机器学习对复杂多样的数据进行深层次的分析,更高效地利用信息成为当前大数据环境下机器学习研究的主要方向。为进一步优化传统机器学习,人们对利用量子线路辅助机器学习已开始有所研究。然而,目前基于量子线路的用于数据重建的模型仍比较少。
3.因此,本技术提出一种用于数据重建的模型。


技术实现要素:

4.本技术实施例的目的之一在于提供一种用于数据重建的模型,与传统模型相比,其可减少所使用的参数量,且所用的存储介质,即量子比特数目也大幅减少。
5.本技术的一实施例提供一种用于数据重建的模型,其包括:第一编码线路,其对第一数据进行编码以得到第一量子态;第二编码线路,其对第二数据进行编码以得到第二量子态;量子解码线路,其作用于所述第一输入及所述第二量子态以生成经重建的数据。
6.根据本技术的另一实施例,其中量子编码线路、量子解码线路中的至少一者为参数化量子线路,其中参数化量子线路包括:纠缠模块;以及旋转模块,其包括多个单量子比特任意旋转门。
7.根据本技术的另一实施例,该模型还包括使用量子判别线路,该量子判别线路经配置以生成第二输出和第三输出以与所述量子编码线路和所述量子解码线路进行对抗学习。
8.根据本技术的另一实施例,其中优化量子编码线路、量子解码线路及量子判别线路中的至少一者包括使用梯度下降法。
9.根据本技术的另一实施例,其中量子判别线路经配置以对第一输入和与第一输入相对应的正态分布数据进行判别。
10.根据本技术的另一实施例,其中对抗学习包括计算损失函数。
11.根据本技术的另一实施例,其中计算损失函数包括:使用量子态相似性度量计算第一输出和第一量子态之间的差异或使用第二输出和第一量子态。
12.根据本技术的另一实施例,其中计算损失函数包括使用第二输出和第三输出。
13.根据本技术的另一实施例,其中进行编码包括使用嵌入函数对相应的量子态数据进行降维,其中所述嵌入函数包括约化密度矩阵。
14.根据本技术的另一实施例,其中进行编码包括将相应的数据转化为半正定对称矩阵,以及对所述半正定矩阵进行范数正则化。
15.根据本技术的另一实施例,其中第一数据包括分子序列,所述第二数据包括基因
表达谱序列。
16.与现有技术相比,本技术实施例提供的用于数据重建的模型,利用量子计算对经典计算方式作为替换或补充,可有效提高数据处理速度与准确度。
附图说明
17.在下文中将简要地说明为了描述本技术实施例或现有技术所必要的附图以便于描述本技术的实施例。显而易见地,下文描述中的附图仅只是本技术中的部分实施例。对本领域技术人员而言,在不需要创造性劳动的前提下,依然可以根据这些附图中所例示的结构来获得其他实施例的附图。
18.图1为根据本技术一些实施例的用于数据重建的模型示意图。
19.图2为根据本技术的一些实施例的参数化量子线路的卷积层的结构示意图。
20.图3为根据本技术的一些实施例的参数化量子线路的池化层的结构示意图。
21.图4为根据本技术的一些实施例的优化量子线路的方法示意图。
22.图5和6为根据本技术一些实施例的对数据进行编码的方法示意图。
具体实施方式
23.为更好的理解本技术实施例的精神,以下结合本技术的部分优选实施例对其作进一步说明。
24.本技术的实施例将会被详细的描示在下文中。在本技术说明书全文中,将相同或相似的组件以及具有相同或相似的功能的组件通过类似附图标记来表示。在此所描述的有关附图的实施例为说明性质的、图解性质的且用于提供对本技术的基本理解。本技术的实施例不应该被解释为对本技术的限制。
25.另外,为便于描述,“第一”、“第二”、“第三”等等可在本文中用于区分一个组件或一系列组件的不同。“第一”、“第二”、“第三”等等不意欲描述对应组件。
26.在对本技术技术方案进行介绍之前,首先对本技术中涉及的一些关键术语进行解释说明:
27.1.量子计算:基于量子逻辑的计算方式,存储数据的基本单元是量子比特。
28.2.量子比特:量子计算的基本单元。传统计算机使用0和1作为二进制的基本单元。不同的是量子计算可以同时处理0和1,使得系统可以处于0和1的线性叠加态:|ψ》=α|0》+β|1》,这边α,β代表系统在0和1上的复数概率幅。它们的模平方|α|2,|β|2分别代表处于0和1的概率。
29.3.量子线路:量子通用计算机的一种表示,代表了相应量子算法/程序在量子门模型下的硬件实现。若量子线路中包含可调的控制量子门的参数,则被称为参数化的量子线路。
30.4.量子门:常使用矩阵表示,操作n个量子比特的门可以用2
n x 2n的酉矩阵表示。一个门输入跟输出的量子比特数量必须要相等。量子门的操作可以用代表量子门的矩阵与代表量子比特状态的向量作相乘来表示。
31.5.旋转门:旋转门是量子门的一种,是一组三个2
×
2的幺正厄米复矩阵(又称酉矩
阵)。其中,旋转x门为旋转y门为旋转y门为旋转z门为
32.6.量子经典混合计算:一种内层利用量子线路进行计算得出相应物理量或损失函数,外层用传统的经典优化器调节量子线路变分参数的计算范式,可以最大限度地发挥量子计算的优势,被相信是有潜力证明量子优势的重要方向之一。
33.本技术提出的数据重建的方法,通过使用量子线路,有效提高了模型学习能力和运行效率。
34.图1为根据本技术一些实施例的用于数据重建的模型示意图。
35.本技术的用于数据重建的模型包括第一编码线路,其对第一数据进行编码以得到第一量子态101;第二编码线路,其对第二数据进行编码以得到第二量子态102;量子编码线路110,其作用于第一量子态101以得到第一输入10;以及量子解码线路111,其作用于第一输入10及所述第二量子态102以生成经重建的数据。经重建的数据可对第一数据和第二数据中的相关信息进行更好地融合,从而方便进一步的处理。
36.与传统的电路相比,由于其运行需要消耗大量的计算资源,而传统的电路中的计算资源主要由电子集成电路制造的芯片提供,随着电子遂穿效应对制程接近纳米极限后的制约,算力很难再持续提升,而本技术提出的数据重建的方法,可使用量子-经典混合算法来处理数据,由于基于量子比特的数据表达能力更优,使得计算可在量子设备和量子芯片上高效地进行。
37.在一些实施例中,对数据进行编码可包括使用嵌入函数对相应的量子态数据进行降维,其中嵌入函数可包括约化密度矩阵。
38.在一些实施例中,进行编码包括将相应的数据转化为半正定对称矩阵,例如转化为gram半正定矩阵,然后可对该半正定矩阵进行范数正则化。
39.例如,在对第一数据进行编码时,可将长度为n的第一数据结构根据其数据库的长度m转化为n
×
m的特征矩阵u1,然后使用嵌入(embedding)函数对u1进行降维操作,得到n
×
m’的约化矩阵u2,其中m’为2n(n为量子线路中的比特数)。之后,将约化矩阵u2中的转置乘以u2,即u2
t
×
u2,得到一个m
’×
m’的gram半正定矩阵。对gram半正定矩阵进行l1-范数正则化,可以将m
’×
m’的gram半正定矩阵转换为m
’×
m’的量子态密度矩阵,即可将第一数据转化为对应的量子态编码数据,即第一量子态101,以用于后续的量子计算。
40.在对第二数据进行编码时,可将长度为n的第二数据直接转化为n
×
n的gram半正定矩阵u3,然后将gram半正定矩阵进行l1-范数正则化,可直接将其转化为第二数据对应的量子态密度编码,即第二量子态102。
41.在一些实施例中,量子编码线路、量子解码线路中的至少一者可为参数化量子线路。其中参数化量子变分线路可由卷积层和池化层构成,每层可包含两个子模块,一个是由单比特任意旋转门组成的单比特旋转模块,另一个是由n层纠缠层组成的纠缠模块。纠缠层的作用是在不同量子比特之间施加两比特门,比如受控非(cnot)门,从而生成纠缠。每个纠
缠层,又可分为两部分:参数化单比特旋转模块和结构固定的两比特操作模块(结构固定指的是没有可调的参数)。其中单比特旋转模块可由针对n个量子比特的n个单比特任意旋转门组成。任意旋转门可由3个分别绕着y轴、z轴、y轴的旋转操作组合而来,可调参数是旋转的角度。这是一种欧拉旋转角分解,这样的参数化的旋转可以组合成任意单比特旋转操作。
42.图2为根据本技术的一些实施例的参数化量子线路的卷积层的结构示意图。
43.如图2所示,该卷积层由单比特旋转模块及多比特旋转模块组成,其中第一模块201、第二模块202以及第三模块203分别为单比特旋转模块。
44.其中第一模块201包含多个参数r
xi
,其中,r
x
、ry、rz是分别针对n个量子比特对应于x、y、z的泡利旋转门,r
xi
表示r
x
(θi),i=1、4、7、10

3n-8、3n-5、3n-2,θ代表旋转角度。
45.类似地,第二模块202包含多个参数r
yj
,第三模块203包含多个参数r
zk
,其中,r
yj
表示ry(θj),j=2、5、8、11

3n-7、3n-4、3n-1,r
zk
表示rz(θk),k=3、6、9、12

3n-6、3n-3、3n。
46.第四模块204、第五模块205以及第六模块206分别为多比特旋转模块,其中,其中,为张量积运算符,σ
x
为与x轴对应的量子物理量。
47.该卷积层可对输入的量子态数据(任意量子线路的输入)进行单比特泡利旋转、多比特泡利旋转后输出经量子卷积操作后的量子态数据,以对输入数据进行特征提取。
48.图3为根据本技术的一些实施例的参数化量子线路的池化层的结构示意图。
49.该池化层可对输入的量子态数据进行单比特泡利旋转、多比特受控门,之后输出经量子池化操作后的量子态数据,以降低输入数据的尺寸。
50.在一些实施例中,构建量子编码线路110并作用于第一量子态101可通过如下步骤进行:
51.1.(输入至量子卷积层)根据量子态密度矩阵(m
’×
m’),确定量子线路比特数(第一个超参n=log2m’)。根据量子线路模块定义nc比特量子卷积,线路结构依次包含参数化泡利旋转门和受控门,并按一定的顺序摆放nc比特参数化量子线路的量子门;
52.2.(输入至量子池化层)根据量子线路模块定义np比特量子池化,线路结构依次包含参数化泡利旋转门和受控门,同理按照一定的顺序摆放量子门;
53.3.(通过约化密度矩阵算法进行量子态压缩,即偏迹运算,量子编码线路的输出)将第一量子态101输入n比特的参数化量子编码线路,该编码线路中将量子卷积和池化线路按顺序进行摆放,进行池化后的数据进行偏迹运算得到第一数据量子态编码后的数据,编码后的数据是和第二数据无关的数据,其表达形式是量子态密度矩阵,即得到了第一输入10。
54.在一些实施例中,构建量子解码线路111可包括:根据第二量子态102和第一输入10确定量子解码线路的比特数,按照一定方式的摆放量子卷积和池化模块组成量子解码线路,然后将数据同时混入量子解码线路中以重建第一数据。
55.其中,量子解码线路的作用是根据第二数据建立其与第一数据之间的关系,例如确定第一数据影响第二数据。
56.在一些实施例中,优化量子编码线路以及量子解码线路包括使用量子判别线路。
57.图4为根据本技术的一些实施例的优化量子线路的方法示意图。
58.在一些实施例中,如图4所示,量子判别线路412可经配置以生成第二输出43和第三输出44以与量子编码线路410和量子解码线路411进行对抗学习。例如,通过使用量子判别线路412可以对第一输入40和与其相对应的正态分布数据42进行判别,以与量子编码线路410和量子解码线路411进行对抗学习。
59.其中量子编码线路410可以从第一数据的第一量子态410中提取相关信息以得到第一输入40,量子解码线路411可通过融入第二数据的第二量子态402的信息以及接收量子编码线路410的输出,即第一输入40,来得到第一输出41,以进一步实现对相关数据的特征信息的提取。通过学习第一数据和第二数据之间的相互关联的信息,来实现对数据的分析与进一步处理以得到期望的效果。
60.量子判别线路412可根据第一输入40来构建,其可为上文所描述的参数化量子变分线路,可分别将nc(nc—卷积线路比特数)比特的量子卷积模块和np(np—池化线路比特数)比特的量子池化模块摆放于量子线路中,组成量子判别线路。量子判别线路的真数据和假数据输入分别是是经过量子编码线路的数据即第一输入40和根据第一输入40生成一个正态分布数据42,并对真数据和和假数据进行判别。
61.在一些实施例中,对抗学习可通过计算损失函数进行,比如交叉熵函数,可使用梯度下降法更新量子线路中的参数。
62.在一些实施例中,可通过量子态相似性度量方式使用第一损失函数(度量方式第一损失函数不唯一,常用的如保真度)计算第一输出41和第一量子态401两者之间的差异,再将该差异与第一输入40经过量子判别线路412所得到的输出43混合并使用第二损失函数运算得到计算结果,使用得到的计算结果对量子编码线路410和量子解码线路411进行优化。
63.在一些实施例中,第二输出43和第三输出44可使用第三损失函数进行对抗学习,根据结果优化量子判别线路的参数。
64.用于损失函数的计算是为了优化量子编码线路和量子解码线路,而这会使量子判别线路的优化性能下降,另一方面,优化量子判别线路会使量子编码线路和量子解码线路的性能相对下降,以此形成对抗学习逻辑。
65.上述基于参数化量子线路的优化方法由于使用了量子计算能更快收敛至稳定状态。
66.本技术的实施例还提供一种量子计算机,其包括上述用于数据重建的模型。
67.本技术的实施例还提供一种计算机可读存储介质,其上存储有计算机程序,其中处理器执行该计算机程序以时实现上述数据处理和/或数据重建的方法。
68.本技术提出的用于数据重建的模型适用于多种应用场景,如生物医药、材料、神经科学等。
69.例如,当将上述用于数据重建的模型应用于生物领域时,例如药物研发,可通过比较人类疾病与正常状态下的全基因组表达谱以及药物处理前后基因表达谱得到的差异表达基因,得到疾病表达信号以及药物表达谱,使药物分子能诱导的目的基因表达符合预期达到治疗的效果,同时可以根据药物对基因表达的影响对其副作用做出评估。基因表达谱对某一物种或特定状态下的细胞、组织用一系列的测序和收集手段,定性、定量分析mrna的表达量,从而描述特定状态下基因表达种类和丰度信息,揭示特定的生物学过程和疾病发
生发展的分子机制。在其基础上,引入有监督的量子对抗自编码生成模型可以学习分子结构与基因表达的分布概率和关联信息,从而有利于进行药物设计与研发的工作。
70.图5和6为根据本技术一些实施例的对数据进行编码的方法的示意图。
71.根据本技术的一个实施例,第一数据可以是药物分子序列,如图5中所示的长度为n的smile数据500,其经编码为相应的量子态密度矩阵501。
72.第二数据可以是与第一数据相应的数据,例如基因表达谱序列,如图6所示的长度为n的基因表达数据600,其经编码为相应的基因量子态密度矩阵601。
73.量子编码线路可从药物分子序列中压缩提取部分活性基因以作为第一输入,通过量子解码线路可融入基因表达信息,而量子判别线路可与量子编码线路和量子解码线路进行对抗学习,同时可使第一输入保持最初的基本特征。
74.以第二数据为a549(肺癌人类肺泡基底上皮细胞)细胞系的aars,abcb6,abcc5,abcf1这4个片段基因表达为例,对其进行编码可通过如下步骤:
75.1.输入基因表达数据:[0.4842,0.0714,-0.4062,-0.6985];
[0076]
2.将基因表达数据进行转置相乘,转化为对应的gram半正定矩阵:
[0077]
[0.2344,0.0346,-0.1967,-0.3382],
[0078]
[0.0346,0.0051,-0.0290,-0.0499],
[0079]
[-0.1967,-0.0290,0.1650,0.2837],
[0080]
[-0.3382,-0.0499,0.2837,0.4879]]
[0081]
3.对gram半正定矩阵进行l1-范数正则化操作:
[0082]
[0.2627+0.j,0.0387+0.j,0.2204+0.j,0.3790+0.j],
[0083]
[0.0387+0.j,0.0057+0.j,0.0325+0.j,0.0559+0.j],
[0084]
[0.2204+0.j,0.0325+0.j,0.1849+0.j,0.3179+0.j],
[0085]
[0.3790+0.j,0.0559+0.j,0.3179+0.j,0.5467+0.j]]
[0086]
得到基因表达数据的量子态编码如上。
[0087]
将基因表达差异的量子态信息和经过量子态编码器的药物分子量子态信息作为输入,进行量子解码,从而可根据基因表达差异生成或重建分子结构。
[0088]
应理解,虽然该实施例中的第一数据为药物分子结构,但是这仅只是用于说明本技术提供的一种用于数据重建的模型的示范性实施例,而不应理解为对本技术所保护范围的限制。根据本技术的另一些实施例,其它类似药物分子结构的数据的应用也可使用本技术提出的用于数据重建的模型。例如应用于材料领域,可实现对催化位点、吸附或反应位点的发现与分析。
[0089]
本技术的用于数据重建的模型使得需要优化的参数量大大减少,用到的存储介质,即量子比特数目也大大减少,从而使得基于量子计算的数据重建的方法更便捷、准确。
[0090]
本技术的技术内容及技术特点已揭示如上,然而熟悉本领域的技术人员仍可能基于本技术的教示及揭示而作种种不背离本技术精神的替换及修饰。因此,本技术的保护范围应不限于实施例所揭示的内容,而应包括各种不背离本技术的替换及修饰,并为本专利申请权利要求书所涵盖。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1