一种数据处理方法及其装置与流程

文档序号:36318459发布日期:2023-12-08 12:19阅读:53来源:国知局
本技术涉及人工智能领域,尤其涉及一种数据处理方法及其装置。
背景技术
::1、人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。2、stablediffusion(稳定扩散模型,可以简称为扩散模型)是一种生成模型,用于生成高保真度的图像、语音和视频等多媒体数据。扩散模型通过扩散过程来生成图像。该模型通过对噪声进行多次扩散和逆扩散操作,完成模型的训练及推理。这使得扩散模型的生成过程更加稳定,且不容易产生模式崩溃等问题。3、生成模型是通过模拟数据分布来生成新的近似服从目标分布数据的模型。扩散模型是近年来性能最好的生成模型之一,它定义了一个正向的马尔科夫链向数据中逐步加入噪声,然后学习它的逆过程从将噪声变为数据。4、为了使稳态分布接近噪声分布,扩散模型需要足够多的迭代次数t(一般t=1000)。扩散模型的原始采样方法等价于逆向采样t次马氏链,因此非常耗时间,阻碍了扩散模型在下游任务中的广泛应用。5、因此,亟需提供一种扩散模型的快速高质量采样方法。技术实现思路1、本技术提供了一种数据处理方法,可以在同样计算消耗的情况下减小采样误差,从而降低采样次数。2、第一方面,本技术提供了一种数据处理方法,所述方法包括:获取多个第一图像和随机噪声;不同的所述第一图像为通过所述扩散模型中的去噪模块在不同历史步长所预测的去噪后的图像;将所述多个第一图像和所述随机噪声进行融合,得到当前步长的去噪后的图像。3、本技术在预测去噪图像时,将在不同历史步长所预测的去噪后的图像进行融合,可以在同样计算消耗的情况下减小采样误差,从而降低采样次数。4、在一种可能的实现中,所述方法还包括:确定每个所述历史步长对应的第一权重,每个所述第一权重与通过目标映射方法对所述历史步长进行映射得到的数值有关,所述目标映射方法用于确定每个步长的随机性的大小;所述将所述多个第一图像和所述随机噪声进行融合,包括:根据多个所述第一权重,将所述多个第一图像和所述随机噪声进行融合。5、本技术实施例,可以应用方差控制函数τ(t),更好地控制采样过程中的随机性,与确定性采样方法相比引入了随机性提高采样质量,与现有随机采样方法相比使得采样过程中的随机性可控。6、在一种可能的实现中,每个所述第一权重具体为对通过所述目标映射方法对所述历史步长进行映射得到的数值进行随机亚当姆斯方法得到的。7、通过随机亚当姆斯方法,能够克服现有技术采用的数值格式效率低、收敛速度慢的问题。8、在一种可能的实现中,述方法还包括:确定所述随机噪声对应的第二权重,所述第二权重与通过目标映射方法对所述历史步长进行映射得到的数值有关,所述目标映射方法用于确定每个步长的随机性的大小;所述将所述多个第一图像和所述随机噪声进行融合,包括:根据所述第二权重,将所述多个第一图像和所述随机噪声进行融合。9、在一种可能的实现中,所述将所述多个第一图像和所述随机噪声进行融合,包括:将最近步长得到的去噪图像、所述多个第一图像和所述随机噪声进行融合。10、在一种可能的实现中,所述方法还包括:确定所述最近步长得到的去噪图像对应的第三权重,所述第三权重与通过目标映射方法对所述最近步长进行映射得到的数值有关,所述目标映射方法用于确定每个步长的随机性的大小;所述将最近步长得到的去噪图像、所述多个第一图像和所述随机噪声进行融合,包括:根据所述第三权重,将最近步长得到的去噪图像、所述多个第一图像和所述随机噪声进行融合。11、本技术实施例中,使用之前若干步的模型输出的线性组合,上一个状态的线性缩放与具有解析方差的高斯噪声之和得到下一个状态(也就是当前步长的去噪后的图像)。12、在一种可能的实现中,所述目标映射方法为常数分段函数。13、在一种可能的实现中,所述随机噪声为高斯随机噪声。14、在一种可能的实现中,所述将所述多个第一图像和所述随机噪声进行融合,得到当前步长的去噪后的图像,包括:将所述多个第一图像和所述随机噪声进行融合,得到当前步长的去噪后的图像的初始值;通过所述扩散模型中的去噪模块处理所述初始值,得到处理结果;将所述处理结果、所述多个第一图像和所述随机噪声进行融合,得到当前步长的去噪后的图像。15、在一种可能的实现中,所述方法还包括:确定所述处理结果对应的第四权重,所述第四权重与通过目标映射方法对所述当前步长进行映射得到的数值有关,所述目标映射方法用于确定每个步长的随机性的大小;所述将所述处理结果、所述多个第一图像和所述随机噪声进行融合,包括:根据所述第四权重,将所述处理结果、所述多个第一图像和所述随机噪声进行融合。16、相当于对将所述多个第一图像和所述随机噪声进行融合得到的结果进行矫正,进而提高预测的精度,从而可以降低采样的次数。通过引入了预测校正方法,在同样计算消耗的情况下减小采样误差。17、第二方面,本技术提供了一种数据处理装置,所述装置包括:18、获取模块,用于获取多个第一图像和随机噪声;不同的所述第一图像为通过所述扩散模型中的去噪模块在不同历史步长所预测的去噪后的图像;19、处理模块,用于将所述多个第一图像和所述随机噪声进行融合,得到当前步长的去噪后的图像。20、在一种可能的实现中,所述处理模块,还用于:21、确定每个所述历史步长对应的第一权重,每个所述第一权重与通过目标映射方法对所述历史步长进行映射得到的数值有关,所述目标映射方法用于确定每个步长的随机性的大小;22、所述处理模块,具体用于:23、根据多个所述第一权重,将所述多个第一图像和所述随机噪声进行融合。24、在一种可能的实现中,每个所述第一权重具体为对通过所述目标映射方法对所述历史步长进行映射得到的数值进行随机亚当姆斯方法得到的。25、在一种可能的实现中,所述处理模块,还用于:26、确定所述随机噪声对应的第二权重,所述第二权重与通过目标映射方法对所述历史步长进行映射得到的数值有关,所述目标映射方法用于确定每个步长的随机性的大小;27、所述处理模块,具体用于:28、根据所述第二权重,将所述多个第一图像和所述随机噪声进行融合。29、在一种可能的实现中,所述处理模块,具体用于:30、将最近步长得到的去噪图像、所述多个第一图像和所述随机噪声进行融合。31、在一种可能的实现中,所述处理模块,还用于:32、确定所述最近步长得到的去噪图像对应的第三权重,所述第三权重与通过目标映射方法对所述最近步长进行映射得到的数值有关,所述目标映射方法用于确定每个步长的随机性的大小;33、所述处理模块,具体用于:34、根据所述第三权重,将最近步长得到的去噪图像、所述多个第一图像和所述随机噪声进行融合。35、在一种可能的实现中,所述目标映射方法为常数分段函数。36、在一种可能的实现中,所述随机噪声为高斯随机噪声。37、在一种可能的实现中,所述处理模块,具体用于:38、将所述多个第一图像和所述随机噪声进行融合,得到当前步长的去噪后的图像的初始值;39、通过所述扩散模型中的去噪模块处理所述初始值,得到处理结果;40、将所述处理结果、所述多个第一图像和所述随机噪声进行融合,得到当前步长的去噪后的图像。41、在一种可能的实现中,所述处理模块,还用于:42、确定所述处理结果对应的第四权重,所述第四权重与通过目标映射方法对所述当前步长进行映射得到的数值有关,所述目标映射方法用于确定每个步长的随机性的大小;43、所述处理模块,具体用于:44、根据所述第四权重,将所述处理结果、所述多个第一图像和所述随机噪声进行融合。45、第三方面,本技术实施例提供了一种数据处理装置,可以包括存储器、处理器以及总线系统,其中,存储器用于存储程序,处理器用于执行存储器中的程序,以执行如上述第一方面及其任一可选的方法。46、第四方面,本技术实施例提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,当其在计算机上运行时,使得计算机执行上述第一方面及其任一可选的方法。47、第五方面,本技术实施例提供了一种计算机程序,当其在计算机上运行时,使得计算机执行上述第一方面及其任一可选的方法。48、第六方面,本技术提供了一种芯片系统,该芯片系统包括处理器,用于支持执行数据处理装置实现上述方面中所涉及的功能,例如,发送或处理上述方法中所涉及的数据;或,信息。在一种可能的设计中,所述芯片系统还包括存储器,所述存储器,用于保存执行设备或训练设备必要的程序指令和数据。该芯片系统,可以由芯片构成,也可以包括芯片和其他分立器件。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1