数据处理方法、服务器和存储介质与流程

文档序号:31076154发布日期:2022-08-09 21:44阅读:49来源:国知局
数据处理方法、服务器和存储介质与流程

1.本技术涉及计算机视觉领域,尤其涉及一种数据处理方法、服务器和存储介质。


背景技术:

2.随着城市的不断发展,人们对于城市内生活质量的需要日益增强。为了提高人们的生活质量,研究人员会使用智慧城市,对城市空间进行规划,智能分配城市公共资源,以提高人们的生活质量。
3.智慧城市的实质是以人工智能技术为支撑的公共系统。目前,智慧城市可以在获取大量的城市数据的基础上,完成对城市空间的规划和城市公共资源的分配。
4.然而,现有技术中,城市数据采集速度慢采集难度高的情况,容易导致智慧城市的分析准确率低的问题。


技术实现要素:

5.本技术提供一种数据处理方法、服务器和存储介质,用以解决现有技术中城市数据采集速度慢采集难度高的情况导致的智慧城市的分析准确率低的问题。
6.第一方面,本技术提供一种数据处理方法,包括:
7.获取目标地理区域的影像数据;
8.将所述影像数据输入预先训练的分析模型,预测得到所述影像数据对应的多个特征图像;
9.根据多个所述特征图像,生成所述目标地理区域的分析结果。
10.可选地,所述分析模型中包括一个编码器和多个解码器,所述将所述影像数据输入预选训练的分析模型,预测得到所述影像数据对应的多个特征图像,具体包括:
11.将所述影像数据输入到所述编码器中进行编码,得到编码特征;
12.将所述编码特征分别输入到多个解码器中,得到多个特征图像,每一所述解码器对应于一个所述特征图像。
13.可选地,所述特征图像包括人口密度分布图、城市交通分布图或者出行路径图中的至少一项,所述影像数据为遥感图像。
14.可选地,所述方法,还包括:
15.将所述训练样本集输入到所述分析模型中,预测得到每条影像数据样本对应的多个预测特征图像;
16.使用所述训练样本集中每条影像数据样本对应的多个样本特征图像、预测得到的每条影像数据样本对应的多个预测特征图像和每一特征图像对应的权重因子,计算得到所述分析模型的模型损失;
17.当所述模型损失小于损失阈值时,结束所述分析模型的训练;否则,使用所述模型损失优化所述分析模型中的参数,并循环执行上述步骤。
18.可选地,所述使用所述训练样本集中每条影像样本对应的多个样本特征图像、预
测得到的每条影像数据样本对应的多个预测特征图像和每一特征图像对应的权重因子,计算得到所述分析模型的模型损失,具体包括:
19.根据所述影像数据样本对应的多个样本特征图像和多个预测特征图像,确定所述影像数据样本的每一特征图像的特征损失;
20.统计当前迭代周期内每一所述预测特征图像的准确率,根据所述准确率,确定每一所述特征图像在当前迭代周期内的权重因子;
21.根据每一所述特征图像的所述特征损失和所述权重因子,确定所述分析模型的模型损失。
22.可选地,所述将所述训练样本集输入到所述分析模型之前,所述方法,还包括:
23.获取训练样本集,所述样本数据包括影像数据样本和所述影像样本对应的多个样本特征图像。
24.可选地,所述获取训练样本集,具体包括:
25.获取真实样本集,所述真实样本集中每条样本数据包括真实影像数据和所述真实影像数据对应的多个真实特征图像;
26.使用训练后的仿真模型生成仿真样本集,所述仿真样本集中每条样本数据包括仿真影像数据和所述仿真影像数据对应的多个仿真特征图像;
27.融合所述真实样本集和所述仿真样本集,得到训练样本集。
28.可选地,所述方法,还包括:
29.将真实样本集中的每一真实影像数据和其对应的多个真实特征图像,分别作为一个通道,组合得到所述仿真模型的输入数据;
30.在对所述输入数据进行三维卷积后,对每一所述通道进行特征提取,得到第一特征数据;
31.将所述第一特征数据输入所述仿真模型的生成器,生成仿真数据;
32.对所述仿真数据进行二维卷积后,进行整体特征提取,得到第二特征数据;
33.将所述第二特征数据输入所述仿真模型的判别器,对所述仿真数据进行分类;
34.根据所述仿真数据的分类结果,生成第一损失和第二损失;
35.使用所述第一损失反向优化所述生成器,以及使用所述第二损失反向优化所述判别器。
36.第二方面,本技术提供一种数据处理装置,包括:
37.获取模块,用于获取目标地理区域的影像数据;
38.处理模块,用于将所述影像数据输入预先训练的分析模型,预测得到所述影像数据对应的多个特征图像;根据多个所述特征图像,生成所述目标地理区域的分析结果。
39.可选地,所述分析模型中包括一个编码器和多个解码器,所述处理模块,具体用于:
40.将所述影像数据输入到所述编码器中进行编码,得到编码特征;
41.将所述编码特征分别输入到多个解码器中,得到多个特征图像,每一所述解码器对应于一个所述特征图像。
42.可选地,所述特征图像包括人口密度分布图、城市交通分布图或者出行路径图中的至少一项,所述影像数据为遥感图像。
43.可选地,所述数据处理装置,还包括第一模型训练模块,所述第一模型训练模块,用于:
44.将所述训练样本集输入到所述分析模型中,预测得到每条影像数据样本对应的多个预测特征图像;
45.使用所述训练样本集中每条影像数据样本对应的多个样本特征图像、预测得到的每条影像数据样本对应的多个预测特征图像和每一特征图像对应的权重因子,计算得到所述分析模型的模型损失;
46.当所述模型损失小于损失阈值时,结束所述分析模型的训练;否则,使用所述模型损失优化所述分析模型中的参数,并循环执行上述步骤。
47.可选地,所述第一模型训练模块,具体用于:
48.根据所述影像数据样本对应的多个样本特征图像和多个预测特征图像,确定所述影像数据样本的每一特征图像的特征损失;
49.统计当前迭代周期内每一所述预测特征图像的准确率,根据所述准确率,确定每一所述特征图像在当前迭代周期内的权重因子;
50.根据每一所述特征图像的所述特征损失和所述权重因子,确定所述分析模型的模型损失。
51.可选地,所述将所述训练样本集输入到所述分析模型之前,所述第一模型训练模块,还用于:
52.获取训练样本集,所述样本数据包括影像数据样本和所述影像样本对应的多个样本特征图像。
53.可选地,所述第一模型训练模块,具体用于:
54.获取真实样本集,所述真实样本集中每条样本数据包括真实影像数据和所述真实影像数据对应的多个真实特征图像;
55.使用训练后的仿真模型生成仿真样本集,所述仿真样本集中每条样本数据包括仿真影像数据和所述仿真影像数据对应的多个仿真特征图像;
56.融合所述真实样本集和所述仿真样本集,得到训练样本集。
57.可选地,所述数据处理装置,还包括第二模型训练模块,所述第二模型训练模块,用于:
58.将真实样本集中的每一真实影像数据和其对应的多个真实特征图像,分别作为一个通道,组合得到所述仿真模型的输入数据;
59.在对所述输入数据进行三维卷积后,对每一所述通道进行特征提取,得到第一特征数据;
60.将所述第一特征数据输入所述仿真模型的生成器,生成仿真数据;
61.对所述仿真数据进行二维卷积后,进行整体特征提取,得到第二特征数据;
62.将所述第二特征数据输入所述仿真模型的判别器,对所述仿真数据进行分类;
63.根据所述仿真数据的分类结果,生成第一损失和第二损失;
64.使用所述第一损失反向优化所述生成器,以及使用所述第二损失反向优化所述判别器。
65.第三方面,本技术提供一种服务器,包括:存储器和处理器;
66.所述存储器用于存储计算机程序;所述处理器用于根据所述存储器存储的计算机程序执行第一方面及第一方面任一种可能的设计中的数据处理方法。
67.第四方面,本技术提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,当服务器的至少一个处理器执行该计算机程序时,服务器执行第一方面及第一方面任一种可能的设计中的数据处理方法。
68.第五方面,本技术提供一种计算机程序产品,所述计算机程序产品包括计算机程序,当服务器的至少一个处理器执行该计算机程序时,服务器执行第一方面及第一方面任一种可能的设计中的数据处理方法。
69.本技术提供的数据处理方法,通过获取目标地理区域的影像数据。其中,该影像数据可以为遥感图像;将该影像数据输入预先训练的分析模型;通过该分析模型预测得到该影像数据对应的多个特征图像,其中,该分析模型可以为多任务学习模型;根据预设的判断规则,从这些特征图像中提取对应的分析结果;将特征图像转换为热点图后,将热点图作为分析结果输出。该分析结果即为目标地理区域的分析结果的手段,实现提高分析准确率的效果。
附图说明
70.为了更清楚地说明本技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
71.图1为本技术一实施例提供的一种城市人口问题分析的场景示意图;
72.图2为本技术一实施例提供的一种数据处理方法的流程图;
73.图3为本技术一实施例提供的一种分析模型结构示意图;
74.图4为本技术一实施例提供的一种数据处理方法的流程图;
75.图5为本技术一实施例提供的一种数据处理方法的流程图;
76.图6为本技术一实施例提供的一种仿真模型示意图;
77.图7为本技术一实施例提供的一种数据处理装置的结构示意图;
78.图8为本技术一实施例提供的一种服务器的硬件结构示意图。
具体实施方式
79.为使本技术的目的、技术方案和优点更加清楚,下面将结合本技术中的附图,对本技术中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
80.本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换。例如,在不脱离本文范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。
81.取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
82.再者,如同在本文中所使用的,单数形式“一”、“一个”和“该”旨在也包括复数形式,除非上下文中有相反的指示。
83.应当进一步理解,术语“包含”、“包括”表明存在的特征、步骤、操作、元件、组件、项目、种类、和/或组,但不排除一个或多个其他特征、步骤、操作、元件、组件、项目、种类、和/或组的存在、出现或添加。
84.此处使用的术语“或”和“和/或”被解释为包括性的,或意味着任一个或任何组合。因此,“a、b或c”或者“a、b和/或c”意味着“以下任一个:a;b;c;a和b;a和c;b和c;a、b和c”。仅当元件、功能、步骤或操作的组合在某些方式下内在地互相排斥时,才会出现该定义的例外。
85.随着城市的不断发展,人们对于城市内生活质量的需要日益增强。并且,随着城市化的不断推进,城市中的人口迁移、教育和住房资源分配不断发生着重大变化。例如,在城市中心地区工作的人们面临着公共交通拥挤、出租车等待时间过长等问题。为了提高人们的生活质量,研究人员提出了使用智慧城市对城市空间进行规划,以实现智能分配城市公共资源,提高人们的生活质量的效果。智慧城市的实质是以人工智能技术为支撑的公共系统。该公共系统可以基于大数据对整个城市进行全局实时分析,实现城市公共资源的智能分配、城市功能的合理利用。
86.智慧城市的研究可以包括方方面面。yigitcanar等人通过调查公众对人工智能技术及其在城市规划和发展中的应用如何在澳大利亚各州和地区的试验床案例中使用的看法,并通过社交媒体分析,对澳大利亚不同地区的twitter 消息进行情感分析,使研究人员更好地了解人工智能技术在当前城市规划中的具体应用,得出数字转型、创新和可持续性作为城市规划和发展中最热门的人工智能应用领域的研究成果。lieven等人指出,共同创造对城市规划非常重要。在线公民参与是获取公民对各种计划反馈的一种既定方式。本文报告了在数字研讨会的开发和测试中获得的经验和发现,并解释了开发基于人工智能的功能以支持用户输入和反馈评估的高度。suresh等人介绍了基于物联网的城市规划和智能城市交通解决方案及应用,指出物联网可以通过检测、跟踪、连接、跟踪和管理等过程实现一定的智能功能,从而完善智能城市规划策略。gu等人设计了一种多标准评价方法,即通风走廊规划模型,并结合地理信息系统(gis)确定通风环境的最佳位置,从而减少空气污染,缓解热岛问题。冯伟等基于原有课程的优势,将城乡规划与人文地理教学结合在大学课程中,对200名网络学生进行了问卷调查。用bp神经网络对结果进行处理和分析。结果表明,本文提出的方法可以进一步提高网络教学的效率。 fu等人指出,利用大数据和人工智能可以为城市综合防灾规划(ucdpp)提供智能决策。他通过人工智能、数据库等技术建立了ucdpp的决策生成系统。通过一个实际案例分析了该系统的可行性,结果表明该系统可以帮助城市规划师做出更合理的决策。
87.目前,智慧城市的使用以及准确率均建立在在获取大量的城市数据的基础。然而,现有技术中,城市数据采集速度慢采集难度高的情况,容易导致智慧城市的分析准确率低的问题。以往的城市规划研究由于缺乏传统的技术发展水平、获取数据设备的能力有限以及昂贵的研究成本而受到限制,城市规划研究中使用的大部分数据往往是以抽样的形式获取的。例如,本技术中计划中使用的数据包括城市遥感图像、人口密度分布图、城市交通分
布图和出行路径图等。如果使用传统的数据收集方法,这些数据的收集可能需要花费大量时间。即便是受益于当前的大数据时代,这些数据也很难完整且大量的实现快速的收集。例如,当数据中包括结构化数据和非结构化数据时,对这些数据进行整理通常需要耗费大量的时间。此外还存在一些其他问题,例如,当数据量较小时,模型在使用这些数据进行学习时,容易出现过拟合现象。又如,在使用多任务学习框架分析同时对多个问题进行分析时,如何提高多任务输出的准确率。
88.针对上述问题,本技术提出了一种数据处理方法。本技术的智慧城市主要通过结合了大数据和机器学习技术的城市规划算法实现。在实现过程中主要使用的算法模型为支持向量机(support vector machine,svm)。然而,现有的算法模型在处理复杂数据时可能存在泛化能力差的问题。因此,本技术通过模型优化,提高了现有算法模型的泛化能力,以更好的处理与城市规划相关的任务。同时,基于现有的单任务学习的研究方法,本技术引入了多任务学习的概念,组合多个数据进行联合学习,从而获得多个分析结果。该多任务联合学习的方法,可以充分考虑影响城市人口分布的多种因素,获得更符合实际情况的分析结果。并且,本技术还在多任务学习模型的训练过程中根据每一个任务的训练效果,调整每一个子任务模型能够自适应地改变学习过程中的训练比例,并增加训练效果较差的任务的训练比例,从而提高模型的完整性。此外,本技术还基于数据的特殊性,提出了一种基于生成对抗网络(generative adversarial network,gan)的数据增强方法。该gan网络模型的使用,不仅可以基于小样本数据生成大量的仿真数据,以满足大数据的需求。而且,该gan网络模型还可以根据分布不均匀的样本数据,实现数据的补充,使数据更加完整,以满足模型使用需求。例如,当模型需要使用的样本数据中需要包括遥感图像、人口密度分布图、城市交通分布图和出行路径图作为训练数据,而真实数据中,存在仅包括遥感图像、人口密度分布图、城市交通分布图和出行路径图中的至少一项时,本技术可以通过使用gan网络模型,补全缺失的数据。
89.在本技术中,多任务学习模型主要通过构建了一种单编码器以及多解码器的方式实现。由于在遥感影像、交通轨迹分布图、城市人口收入分布图和出行路径图中,遥感图像是最容易实时获取的,因此,本技术将该遥感图像作为该多任务学习模型的输入,将交通轨迹分布图、城市人口收入分布图和出行路径图作为该多任务学习模型的输出。根据交通轨迹分布图、城市人口收入分布图和出行路径图,研究人员可以更加准确的得到更具实用性的研究成果。此外,本技术的多任务学习模型的训练过程中,本技术可以结合不确定性因子计算该模型的损失,以便获得更加准确的训练结果。本技术通过使用该多任务学习模型,实现了将城市遥感影像、交通轨迹分布图、城市人口收入分布图和出行路径图结合起来研究城市人口问题。并且在该研究过程中,研究人员可以根据实际需要选择其中一个或者多个分析结果进行研究。
90.下面以具体地实施例对本技术的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
91.图1示出了本技术一实施例提供的一种城市人口问题分析的场景示意图。如图1中步骤11所示,研究人员可以采集得到的真实数据。该真实数据中可以包括遥感影像、交通轨迹分布图、城市人口收入分布图和出行路径图中至少一项。
92.服务器可以将该真实数据输入步骤12中的gan网络模型中,实现数据的扩充。其
中,gan网络模型自2014年由ian goodflow提出以来,越来越受到学术界和工业界的关注。随着gan理论和模型的快速发展,其在计算机视觉、自然语言处理、人机交互等领域的应用越来越深入,并不断扩展到其他领域。当前传统的数据扩充方法大多采用图像翻转、偏移、灰度变化等方法实现。然而,当这样的扩充方法用于小样本数据时,容易导致训练模型过拟合。因此,针对小样本数据,使用gan网络模型生成新的拟合数据,可以有效避免训练模型的过拟合。本本技术主要涉及的数据包括遥感影像、人口密度分布图、城市人口收入分布图、出行路径图等。这些数据通常可从当地政府数据统计网站获取。但实际上,这些数据在需要使用大数据进行训练的模型中显得十分有限。为了获得更好的模型训练结果,本技术可以在获得的真实数据的基础上,如步骤13所示,通过gan网络模型生成仿真数据。具体来说,gan网络模型可以分为生成器和鉴别器两部分。真实数据将被作为标准,以供生成器学习并模型生成。该真实数据中可以包括遥感影像、交通轨迹分布图、城市人口收入分布图和出行路径图,以及各个图像之间的内在联系。该生成器用于根据不同图像之间的联系来生成具有对应关系的组图。该gan网络模型可以将该组图输入鉴别器进行判别。当鉴别器无法区分生成器生成的组图和真实图片时,该gan网络模型完成训练。研究人员可以使用该完成训练的gan网络模型中的生成器批量生成仿真图片。
93.服务器可以将真实数据和仿真数据融合在训练样本集中。如步骤14所示,服务器可以使用该训练样本集训练分析模型。该分析模型是在单任务学习模型的基础上,对模型进行扩展得到的多任务学习模型。在机器学习领域,标准算法理论是一次学习一个任务,即单任务学习模型。在使用单任务学习模型解决复杂问题时,将该复杂问题分解为多个独立的子问题。其后,服务器可以针对每个子问题分别进行学习。最后,服务器可以通过结合多个子问题的学习结果,得到最终的分析结果。然而,多任务学习模型是一种联合学习方法。在多任务学习模型的训练过程中,多个任务的模型可以并行学习,并且他们的学习结果相互影响。相较于单任务学习模型融合使用分析结果,本技术更贴近于使用多任务学习模型,训练得到多个存在关联的分析结果。
94.该多任务学习模型是一种派生迁移的学习方法。该多任务学习模型的主要任务是利用相关的任务训练信号中包含的领域特定信息,通过推导偏差来提高泛化效果。本技术的分析模型通过结合多任务学习框架,实现了同时分析当前的社会经济状况、城市群的形成和发展程度等信息的可能。具体来说,本技术的分析模型以遥感图像为输入,以人口密度分布图、城市交通分布图和出行轨迹路线图作输出。如步骤15所示,该分析模型可以输出分析结果。该分析结果将被用于分析城市人口问题。
95.本技术中,以服务器为执行主体,执行如下实施例的数据处理方法。具体地,该执行主体可以为服务器的硬件装置,或者为服务器中实现下述实施例的软件应用,或者为安装有实现下述实施例的软件应用的计算机可读存储介质,或者为实现下述实施例的软件应用的代码。
96.图2示出了本技术一实施例提供的一种数据处理方法的流程图。在图1 所示实施例的基础上,如图2所示,以服务器为执行主体,本实施例的方法可以包括如下步骤:
97.s101、获取目标地理区域的影像数据。
98.本实施例中,服务器使用预先训练的分析模型,对目标地理区域的进行分析。该目标地理区域可以为一个城市、城市中的一个区、一个省等范围。该范围可以根据研究人员的
需要确定。或者,该范围还可以根据获取的真实数据确定。该真实数据中可以包括影像数据。可选地,该影像数据可以为遥感图像。例如,当该目标地理区域为城市时,该影像数据可以为该城市的城市遥感数据。
99.s102、将影像数据输入预先训练的分析模型,预测得到影像数据对应的多个特征图像。
100.本实施例中,服务器可以将该影像数据输入预先训练的分析模型。服务器可以通过该分析模型预测得到该影像数据对应的多个特征图像。可选地,当该分析模型为单任务学习模型时,该分析模型可以预测得到一个特征图像。可选地,本技术中所使用的分析模型为多任务学习模型,因此,预测得到多个特征图像。可选地,该多个特征图像中可以包括人口密度分布图、城市交通分布图或者出行路径图中的至少一项。
101.可选地,该分析模型中包括一个编码器和多个解码器。该分析模型可以如图3所示。如图所示,将影像数据输入预选训练的分析模型,预测得到影像数据对应的多个特征图像的过程具体可以包括:步骤1、服务器可以将影像数据输入到编码器中进行编码,得到编码特征。步骤2、服务器将编码特征分别输入到多个解码器中,得到多个特征图像,每一解码器对应于一个特征图像。例如,如图3所示,服务器将遥感图像输入编码器,得到编码特征。服务器可以在将该编码特征被输入到两个解码器后,分别解码得到人口分布图和交通路线分布图两个特征图像。
102.在编码器编码过程中,由于遥感影像不像自然影像一样每一处的像素信息都有用,因此,可以采用稀疏卷积作为特征提取层来提取编码特征。该稀疏卷积的使用不仅可以加快模型训练还可以获取更为相关的特征信息。此外,编码器结构中,还可以在每一卷积层中加入空间以及通道注意力机制。具体来说,在编码器中,特征将被输入到通道注意力机制以及空间注意力机制中,得到通道注意力特征和空间注意力特征。该通道注意力特征和空间注意力特征将通过平均池化以及最大池化操作进行降维。服务器可以将该池化过后的通道注意力特征和空间注意力特征结合在一起,实现在不显著增加计算量和参数量的前提下提升模型的特征提取能力。在解码器解码过程中,编码特征将被分别输入到不同的解码器中,并预测得到不同的特征图像。其中,每一个解码器将对应于一个特征图像。例如,如图3所示,当该特征图像包括人口分布图和交通路线分布图时,其输出数据实质为人口分布图的真值图和交通路线分布图的特征矩阵。
103.s103、根据多个特征图像,生成目标地理区域的分析结果。
104.本实施例中,服务器在获取多个特征图像后,可以对这些特征图进行进一步分析,从而得到目标地理区域的分析结果。例如,当特征图像为人口密度分布图时,服务器可以根据该人口密度分布图生成对应的热力图。研究人员可以根据该热力图获取其对应的分析结果。其中。人口密度越大的区域热力图颜色将约深。其中,特征图像除了可以包括人口密度分布图以外,还可以包括人口收入分布、轨迹规划图等。服务器可以根据预设的判断规则,从这些特征图像中提取对应的分析结果。例如,获取该人口密度分布图中人口密度大于预设值的区域。以及,服务器还可以根据预设的输出形式,将特征图像转换后输出,以便于研究人员查看。例如,可以将人口密度分布图转化为热点图。研究人员可以根据这些特征图像,实现综合分析,得到综合性的分析结果。例如,研究人员可以得到该目标地理区域的人口分布与该地区的交通轨迹、收入情况、收入情况等信息之间的关联,从而可以帮助城市规
划师进一步地进行城市规划并解决人口分布问题。
105.本技术提供的数据处理方法,服务器获取目标地理区域的影像数据。其中,该影像数据可以为遥感图像。服务器可以将该影像数据输入预先训练的分析模型。服务器可以通过该分析模型预测得到该影像数据对应的多个特征图像。其中,该分析模型可以为多任务学习模型。服务器可以根据预设的判断规则,从这些特征图像中提取对应的分析结果。服务器还可以将特征图像转换为热点图后,将热点图作为分析结果输出。该分析结果即为目标地理区域的分析结果。本技术中,通过使用多任务学习的分析模型,通过较为容易得到的遥感影像得到人口分布图、交通轨迹分布图、城市人口收入分布图和出行路径图等图,使研究人员可以获取更为丰富的特征图像,实现了智慧城市的分析准确率的提高。
106.图4示出了本技术一实施例提供的一种数据处理方法的流程图。在图1 至图3所示实施例的基础上,如图4所示,以服务器为执行主体,在执行图 2所示实施例之前需要完成分析模型的训练,本实施例中分析模型的训练方法可以包括如下步骤:
107.s201、获取训练样本集,样本数据包括影像数据样本和影像样本对应的多个样本特征图像。
108.本实施例中,服务器在训练模型之前,需要获取训练样本集。该训练样本集中可以包括大量的样本数据。每一样本数据中可以包括一张影像数据和该影像数据对应的多个样本特征图像。该样本数据中的影像数据将作为训练数据被输入分析模型中。该样本数据中该影像数据对应的多个样本特征图像将作为标签,与预测得到的预测特征图像进行比较。
109.可选地,服务器获取训练样本集的具体步骤可以包括:
110.步骤1、服务器获取真实样本集。该真实样本集中每条样本数据包括真实影像数据和真实影像数据对应的多个真实特征图像。在实际采集过程中,真实样本集中的每一条样本数据并不一定完全。例如,真实样本集中一条完整的样本数据中可以包括一张真实影像数据和4张真实特征图像。而实际获取的真实样本集中的一条样本数据中可能仅包括一张真实影像数据和一张特征图像。
111.步骤2、服务器使用训练后的仿真模型生成仿真样本集。该仿真样本集中每条样本数据包括仿真影像数据和仿真影像数据对应的多个仿真特征图像。该仿真样本集中包括两种仿真样本。一种仿真样本为全部数据均为仿真得到。例如,当仿真样本集中一条完整的样本数据中可以包括一张仿真影像数据和 4张仿真特征图像时,该仿真样本中的仿真影像数据和4张仿真特征图像均为仿真得到。另一种仿真样本中部分为真实数据,部分为仿真数据。例如,仿真样本集中一条完整的样本数据中可以包括一张仿真影像数据和4张仿真特征图像。该仿真样本中的影响数据可以为真实影响数据4张特征图像中一张为真实特征图像。同时,该仿真样本另外3张特征图像为仿真特征图像。
112.步骤3、服务器可以将采集得到的真实样本集和模型生成的仿真样本集打乱后存储到训练样本集。具体地,该训练样本集中还可以被分为训练数据和预测数据两类。其中,预测数据均为真实样本集中的样本数据。其中,训练数据可以为仿真样本集中的样本数据,也可以为真实样本集中的样本数据。
113.s202、将训练样本集输入到分析模型中,预测得到每条影像数据样本对应的多个预测特征图像。
114.本实施例中,服务器可以将训练样本输入到分析模型中,实现分析模型的训练。该
模型的训练过程为一个迭代的过程。在一个迭代周期中,服务器可以从训练样本集中随机选择部分样本数据作为该次迭代过程的训练数据。服务器可以将该次迭代的训练数据输入到分析模型中。分析模型可以预测得到该训练数据中每一条样本数据对应的多个预测特征图。
115.可选地,服务器在训练该分析模型时,可以使用在imagenet数据集上进行预训练后的卷积神经网络(convolutional neural network,cnn)作为初始模型。该模型训练过程相当于在获取初始模型的基础上,以知识转移的形式将预训练的模型参数转移到我们的多任务模型中,可以便于分析模型更加快速的获取更丰富的特征信息,提高模型训练效率。
116.s203、使用训练样本集中每条影像数据样本对应的多个样本特征图像、预测得到的每条影像数据样本对应的多个预测特征图像和每一特征图像对应的权重因子,计算得到分析模型的模型损失。
117.本实施例中,服务器可以通过该分析模型预测得到当前迭代周期内,训练数据中每一条影像数据样本对应的多个预测特征图像。服务器还可以直接从训练样本集中获取当前迭代周期内训练数据中每一条影像数据样本对应的多个样本特征图像。服务器可以比较该每一条影像数据样本对应多个预测特征图像和多个样本特征图像。服务器可以根据当前迭代周期内全部训练数据的全部预测特征图像和全部样本特征图像,确定该分析模型在该次迭代中产生的模型损失。
118.可选地,该模型损失的计算过程具体可以包括如下步骤:
119.步骤1、服务器获取每一条影像数据样本对应的一张样本特征图像和其对应的预测特征图像。例如,当预测特征图像为人口分布图时,其样本特征图像也是人口分布图。服务器可以根据该样本特征图像和预测特征图像计算该特征图像对应的特征损失。
120.步骤2、服务器可以统计当前迭代周期内每一预测特征图像的准确率。例如,当预测特征图像包括人口分布图和交通路线分布图两类时,服务器可以分别统计人口分布图的准确率和交通路线分布图的准确率。服务器可以根据准确率,确定每一特征图像在当前迭代周期内每一预测特征图的权重因子。该权重的设置不仅可以更好得权衡不同任务之间的重要性,而且可以通过将该权重作为不确定因子,实现模型参数训练的自适应改变。
121.步骤3、服务器可以根据每一特征图像的特征损失和权重因子,确定分析模型的模型损失。例如,当每一影像数据对应于n个特征图像时,特征图像的特征损失可以包括l1,l2,...,ln,权重因子可以包括λ1,λ2,...,λn。针对每一影像数据可以计算得到其损失为:
122.l
sum
=λ1l1+

+λnln123.根据该次迭代周期中全部训练数据的损失,可以计算得到模型损失为:
[0124][0125]
其中,x用于指示该训练数据中样本数据的数量。
[0126]
可选地,在该损失的计算过程中,针对不同的特征图像可以使用不同的损失函数进行特征损失的计算。例如,针对人口分布图等特征图像,可以使用感知损失(perceptual loss)作为损失函数进行计算。该感知损失函数的使用可以使得输出影像具有丰富的细节信息,使预测得到的分析结果更加精确。该人口分布图可以以热力分布图的方式进行展示。其公式可以如下所示:
[0127][0128]
其中,ci,hi,wi分别为该特征图像的通道数、长度和宽度。θi(y)为每一层网络输出的特征矩阵。i用于表示第i个特征图像,i=1,2,...,n。
[0129]
又如,当该特征图像为轨迹分布图时,可以使用交叉熵损失函数(cross entropy loss)作为损失函数。由于轨迹分布图的内容主要在于轨迹的分布情况,因此,使用交叉熵损失函数可以更好地提取出遥感影像中的轨迹路线。其公式可以如下所示:
[0130][0131]
其中,n用于表示每一影像数据对应于n张特征图像。k用于表示该张图像中需要分割的像素种类。例如,一张二值图中,该像素种类可以为2。y
i,k
可以为第i张特征图像中第k类像素点的集合。p
i,k
可以为第i张特征图像中第k 类像素点的集合。
[0132]
s204、当模型损失小于损失阈值时,结束分析模型的训练。否则,使用模型损失优化分析模型中的参数,并循环执行上述步骤。
[0133]
本实施例中,服务器可以在计算得到模型损失后,根据该模型损失和预设的损失阈值,判断该分析模型是否收敛。当该模型损失小于损失阈值时,服务器可以确定该分析模型收敛。当该分析模型收敛时,服务器可以结束该分析模型的迭代,并将当前的分析模型作为最终的分析模型。当该模型损失大于等于损失阈值时,服务器可以确定该分析模型需要继续训练。服务器可以根据计算得到的模型损失优化该分析模型中的参数。服务器可以返回步骤 s202,并继续执行下一次迭代。
[0134]
本技术提供的数据处理方法,服务器在训练模型之前,需要获取训练样本集。在一个迭代周期中,服务器可以从训练样本集中随机选择部分样本数据作为该次迭代过程的训练数据。服务器可以将该次迭代的训练数据输入到分析模型中。分析模型可以预测得到该训练数据中每一条样本数据对应的多个预测特征图。服务器可以通过该分析模型预测得到当前迭代周期内,训练数据中每一条影像数据样本对应的多个预测特征图像。服务器可以根据当前迭代周期内全部训练数据的全部预测特征图像和全部样本特征图像,确定该分析模型在该次迭代中产生的模型损失。当该模型损失小于损失阈值时,服务器可以结束该分析模型的迭代,并将当前的分析模型作为最终的分析模型。当该模型损失大于等于损失阈值时,服务器可以根据计算得到的模型损失优化该分析模型中的参数。本技术中,通过定义多任务学习的损失函数以及在损失函数计算中增加不确定因子,使分析模型可以根据每一个迭代周期中,各个任务的实际情况,动态调整损失函数的计算,提高分析模型的训练效率。此外,本技术还可以通过增加转换模块,提高不同任务之间的参数共享能力,从而提高模型的泛化能力。
[0135]
图5示出了本技术一实施例提供的一种数据处理方法的流程图。在图1 至图4所示实施例的基础上,如图5所示,以服务器为执行主体,在执行图 3所示实施例之前需要完成仿真模型的训练,本实施例中仿真模型的训练方法可以包括如下步骤:
[0136]
s301、将真实样本集中的每一真实影像数据和其对应的多个真实特征图像,分别作为一个通道,组合得到仿真模型的输入数据。
[0137]
本实施例中,服务器可以获取真实样本集。该真实样本集中可以包括多个样本数据。每一个样本数据中包括一真实影像数据和该真实影像数据对应的多个真实特征图像。服务器可以将该真实影像数据和多张真实特征图像作为多个通道,生成输入数据。该输入数据的深度、长度、和宽度可以分别表示为d、h、w。该输入数据的矩阵形状可以表示为d
×h×
w。其中,d为输入的图像种类。例如,当包括一张真实影像数据和人口密度分布图、人口收入分布图、轨迹规划图3张真实特征图像时,d为4。由于该真实影像数据和该真实特征图像均为处理后的图像,因此,这些图像具有相同的宽度和高度。在本步骤中得到的真实样本集中每一样本数据对应的输入数据应具有相同的深度、长度、和宽度。例如,输入数据的d可以为4,且该4个类型分别为真实影像数据、人口密度分布图、人口收入分布图和轨迹规划图。当一样本数据中仅包括真实影像数据和人口密度分布图时,该输入图像的后两个通道可以使用填充数据进行填充。
[0138]
可选地,该仿真模型可以为生成对抗网络。该生成对抗网络的网络结构图可以如图6所示。
[0139]
s302、在对输入数据进行三维卷积后,对每一通道进行特征提取,得到第一特征数据。
[0140]
本实施例中,该仿真模型中可以包括生成器。该生成器中可以使用三维卷积层作为网络的主要层来进行模型训练。该仿真模型的生成器还可以在每一层三维卷积以后加入通道注意力机制来获取每一种影像的细节特征。该通道注意力机制可以用于对每一通道进行特征提取,得到该输入数据的第一特征数据。
[0141]
s303、将第一特征数据输入仿真模型的生成器,生成仿真数据。
[0142]
本实施例中,服务器可以将该第一特征数据输入仿真模型的生成器。该生成器将根据该第一特征数据生成仿真数据。
[0143]
s304、对仿真数据进行二维卷积后,进行整体特征提取,得到第二特征数据。
[0144]
本实施例中,该仿真模型中可以包括判别器。该判别器可以使用二维卷积层作为主要层。该二维卷积层的使用可以很好地减少模型参数,从而加快模型训练速度,提高判别效果。该判别器的二维卷积层中还可以加入空间注意力机制。该空间注意力机制的添加可以更好地判别每一种影像并加强不同影像之间的关联性。该空间注意力的添加用于对该二维卷积后的仿真数据整体进行特征提取。该判别器可以通过特征提取得到第二特征数据。
[0145]
s305、将第二特征数据输入仿真模型的判别器,对仿真数据进行分类。
[0146]
本实施例中,服务器可以将该第二特征数据输入仿真模型的判别器的分类模块中执行分类。该判别器的分类模块可以为一个二分类。当该第二特征数据被输入该分类模块后可以被分为真和假两类。其中,真为判断该仿真数据为真实数据。其中,假为判断该仿真数据为仿真数据。
[0147]
s306、根据仿真数据的分类结果,生成第一损失和第二损失。
[0148]
本实施例中,服务器可以根据判断结果,统计得到该判别器的分类准确率。当该分类器的分类准确率高时,说明生成器生成的数据仿真度低,需要进一步对分类器进行训练。当该分类器的分类准确率低时,说明生成器生成的数据仿真度高。同时,当该分类器的分类准确率低时,说明该判别器判别损失较大,需要进一步训练。因此,服务器可以在统计得到分类结果后,确定分类准确率,并计算得到第一损失和第二损失。
[0149]
s307、使用第一损失反向优化生成器,以及使用第二损失反向优化判别器。
[0150]
本实施例中,当该第一损失和/或第二损失的值小于损失阈值时,服务器可以结束迭代,并将当前的仿真模型作为最终的仿真模型。否则,服务器可以使用该第一损失反向优化生成器,以提高生成器生成的仿真图像的真实度,降低被判别器识别为假的可能性。服务器可以使用第二损失反向优化判别器,以提高判别器的判断准确率,提高该判别器对仿真图像的识别准确率。服务器可以跳转到步骤s302执行下一迭代。
[0151]
本技术提供的数据处理方法,服务器将真实样本集中的每一真实影像数据和其对应的多个真实特征图像分别作为一个通道,组合得到仿真模型的输入数据。服务器在对输入数据进行三维卷积后,使用通道注意力机制对每一通道进行特征提取,得到第一特征数据。服务器将第一特征数据输入仿真模型的生成器,生成得到仿真数据。服务器对仿真数据进行二维卷积后,使用空间注意力机制对该仿真数据进行整体特征提取,得到第二特征数据。服务器将第二特征数据输入仿真模型的判别器,对仿真数据进行分类。服务器可以根据仿真数据的分类结果,生成第一损失和第二损失。服务器使用第一损失反向优化生成器。服务器使用第二损失反向优化判别器。本技术中,通过使用仿真模型,以及在仿真模型中加入通道注意力机制和空间注意力机制,实现该仿真模型的训练,得到大量的仿真数据,以提高分析模型训练效果。
[0152]
图7示出了本技术一实施例提供的一种数据处理装置的结构示意图,如图7所示,本实施例的数据处理装置10用于实现上述任一方法实施例中对应于服务器的操作,本实施例的数据处理装置10包括:
[0153]
获取模块11,用于获取目标地理区域的影像数据。
[0154]
处理模块12,用于将影像数据输入预先训练的分析模型,预测得到影像数据对应的多个特征图像。根据多个特征图像,生成目标地理区域的分析结果。
[0155]
可选地,分析模型中包括一个编码器和多个解码器,处理模块12,具体用于:
[0156]
将影像数据输入到编码器中进行编码,得到编码特征。
[0157]
将编码特征分别输入到多个解码器中,得到多个特征图像,每一解码器对应于一个特征图像。
[0158]
可选地,特征图像包括人口密度分布图、城市交通分布图或者出行路径图中的至少一项,影像数据为遥感图像。
[0159]
可选地,数据处理装置,还包括第一模型训练模块13,第一模型训练模块13,用于:
[0160]
将训练样本集输入到分析模型中,预测得到每条影像数据样本对应的多个预测特征图像。
[0161]
使用训练样本集中每条影像数据样本对应的多个样本特征图像、预测得到的每条影像数据样本对应的多个预测特征图像和每一特征图像对应的权重因子,计算得到分析模型的模型损失。
[0162]
当模型损失小于损失阈值时,结束分析模型的训练。否则,使用模型损失优化分析模型中的参数,并循环执行上述步骤。
[0163]
可选地,第一模型训练模块13,具体用于:
[0164]
根据影像数据样本对应的多个样本特征图像和多个预测特征图像,确定影像数据样本的每一特征图像的特征损失。
standard architecture,isa)总线、外部设备互连 (peripheral component interconnect,pci)总线或扩展工业标准体系结构 (extended industry standard architecture,eisa)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本技术附图中的总线并不限定仅有一根总线或一种类型的总线。
[0187]
通信接口24用于输出分析结果。
[0188]
本实施例提供的服务器可用于执行上述的数据处理方法,其实现方式和技术效果类似,本实施例此处不再赘述。
[0189]
本技术还提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,计算机程序被处理器执行时用于实现上述的各种实施方式提供的方法。
[0190]
其中,计算机可读存储介质可以是计算机存储介质,也可以是通信介质。通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。计算机存储介质可以是通用或专用计算机能够存取的任何可用介质。例如,计算机可读存储介质耦合至处理器,从而使处理器能够从该计算机可读存储介质读取信息,且可向该计算机可读存储介质写入信息。当然,计算机可读存储介质也可以是处理器的组成部分。处理器和计算机可读存储介质可以位于专用集成电路(application specific integrated circuits,asic)中。另外,该 asic可以位于用户设备中。当然,处理器和计算机可读存储介质也可以作为分立组件存在于通信设备中。
[0191]
具体地,该计算机可读存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(static random-accessmemory,sram),电可擦除可编程只读存储器(electrically-erasableprogrammable read-only memory,eeprom),可擦除可编程只读存储器 (erasable programmable read only memory,eprom),可编程只读存储器 (programmable read-only memory,prom),只读存储器(read-only memory, rom),磁存储器,快闪存储器,磁盘或光盘。存储介质可以是通用或专用计算机能够存取的任何可用介质。
[0192]
本技术还提供一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序存储在计算机可读存储介质中。设备的至少一个处理器可以从计算机可读存储介质中读取该计算机程序,至少一个处理器执行该计算机程序使得设备实施上述的各种实施方式提供的方法。
[0193]
在本技术所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0194]
其中,各个模块可以是物理上分开的,例如安装于一个的设备的不同位置,或者安装于不同的设备上,或者分布到多个网络单元上,或者分布到多个处理器上。各个模块也可以是集成在一起的,例如,安装于同一个设备中,或者,集成在一套代码中。各个模块可以以硬件的形式存在,或者也可以以软件的形式存在,或者也可以采用软件加硬件的形式实现。本技术可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
[0195]
当各个模块以软件功能模块的形式实现的集成的模块,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器执行本技术各个实施例方法的部分步骤。
[0196]
应该理解的是,虽然上述实施例中的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
[0197]
最后应说明的是:以上各实施例仅用以说明本技术的技术方案,而非对其限制。尽管参照前述各实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换。而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1