一种引种选址方法及装置与流程

文档序号:18081792发布日期:2019-07-06 10:08阅读:284来源:国知局
一种引种选址方法及装置与流程
本发明实施例涉及推广选址
技术领域
,尤其涉及一种引种选址方法及装置。
背景技术
:我国生产力的增强、经济的发展、食品结构的改善,在刺激畜牧业发展的同时,也刺激了饲料作物的发展。20世纪中叶,在发达国家玉米生产逐渐转为以饲料生产为主要目的,直至目前世界生产的玉米仍有70%作为饲料。国内玉米同样在满足畜牧业饲用需求中占主导地位。另外,随着化工业的发展和不可再生能源—石油—的紧张,玉米淀粉被作为最初原料,用于生产出一系列化工产品。因此,玉米需求总量稳步增加,发展玉米生产日益受到重视。玉米作物需求的增长促进了玉米作物产量的增加,而气候生态条件是作物生长的关键因素之一。根据玉米作物的生长习性选择主导气候因子及阈值,可以划分适宜玉米种植的气候类型区域。主导气候因子及阈值的选择可以直接依靠农业专家的经验,也可以结合玉米种植地理分布信息和历史气候数据对玉米作物在待预测地区的种植适宜性程度进行建模。上述方法通常是基于专家规则对玉米种植的气候适宜性区域进行大范围的划分,比如我国的玉米种植适宜区主要呈现东华北-西南的狭长带分析,最适宜区域多处于中温带、寒温带地区,如陕西、河北、河南、吉林等省区。传统的基于气候相似性分析的作物引种及市场推广选址方法,通常依据各气候因子的年平均值或月平均值来确定相似性,数据的时间分辨率较低可能会掩盖玉米作物在特定生长期种源地与引种推广地区之间的差异。此外,现有的研究往往只对小范围地区的少数农业气候站点进行分析,没有形成全国乃至全球范围内细颗粒度的引种推广适宜性地图。总之,目前缺少针对特定玉米品种的全球范围跨区域引种及市场推广选址方法。技术实现要素:针对现有技术中存在的技术问题,本发明实施例提供一种引种选址方法及装置。第一方面,本发明实施例提供一种引种选址方法,包括:获取引种地区和种源地的各个气候因子的相关数据;采用基于时间序列距离系数的相似性评价方法对所述引种地区的各个气候因子和所述种源地的各个气候因子的相关数据进行对比,得到所述引种地区和所述种源地的气候因子的相似性排序分值;根据所述各个气候因子的权重和所述相似性排序分值,计算得到气候相似性总分值,气候相似性总分值越小的所述引种地区与所述种源地气候相似度越高。第二方面,本发明实施例提供一种引种选址装置,包括:获取模块,用于获取引种地区和种源地的各个气候因子的相关数据;对比模块,用于采用基于时间序列距离系数的相似性评价方法对所述引种地区的各个气候因子和所述种源地的各个气候因子的相关数据进行对比,得到所述引种地区和所述种源地的气候因子的相似性排序分值;排序模块,用于根据所述各个气候因子的权重和所述相似性排序分值,计算得到气候相似性总分值,气候相似性总分值越小的所述引种地区与所述种源地气候相似度越高。本发明实施例提供的引种选址方法及装置,通过对不同作物生长习性进行分析,选择影响不同作物生长的主要气候因子并赋予相应的权重,综合计算各气候因子在不同地区的差异,进行相似性分析,最终可根据不同的作物种源地、育成地选择合理的市场推广地区,可有效提高引种推广成功率,避免盲目选择引种推广地区造成的资源浪费。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本发明实施例提供的引种选址的流程示意图;图2为本发明又一实施例提供的引种选址的流程示意图;图3为本发明一实施例提供的引种源地的地理位置示意图;图4为本发明实施例提供的引种候选地区的地理位置示意图;图5a-5f为本发明实施例提供的与各引种源地气候相似度排名靠前的引种候选地地理位置示意图;图6为本发明实施例提供的引种选址装置的结构示意图。具体实施方式为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。图1为本发明实施例提供的引种选址方法的流程示意图,如图1所示,所述方法包括:s101、获取引种地区和种源地的各个气候因子的相关数据;s102、采用基于时间序列距离系数的相似性评价方法对所述引种地区的各个气候因子和所述种源地的各个气候因子的相关数据进行对比,得到所述引种地区和所述种源地的气候因子的相似性排序分值;s103、根据所述各个气候因子的权重和所述相似性排序分值,计算得到气候相似性总分值,气候相似性总分值越小的所述引种地区与所述种源地气候相似度越高。气候环境对不同玉米品种生长的影响存在差异。针对特定玉米品种的跨区域引种及市场推广可以遵循农业气候相似性原理,作物市场推广地区与种源地气候条件是否相似直接影响引种作物的生长及产量。本发明实施例提供一种引种选址方法,根据国内外各地区的自然条件进行气候相似性计算,根据相似性结果指导不同玉米品种跨区域的引种推广选址工作,有效提高引种推广成功率,避免盲目选择引种推广地区造成的资源浪费。具体实施方案分为三个阶段进行,即数据准备、算法设计、结果验证三个阶段,如图2所示,具体为:首先,数据准备阶段。获取引种地区和种源地的各个气候因子相关数据。在获取数据过程中,应规划好数据类型(即气候因子类型),数据的时空范围,数据来源等方面。数据种类应考虑对作物生长有重要影响的关键气候;数据的时空范围及尺度应考虑引种候选地的可选范围和颗粒度;数据来源以全球范围的公开数据集为主,应同时包括引种源地和引种候选地范围类的相关数据类型。其次,算法设计阶段。气候相似理论目前已广泛应用于作物引种中,包括树木、蔬菜、水果、粮食等作物的引种。基于相似距离系数的模糊相似优先比方法常用于气候相似性的定量分析,在农业引种等问题领域已获得了广泛应用。本发明实施例采用距离系数模糊相似优先比法对特定种源地与多个引种地之间的各气候因子进行分析比较,可以得出引种地之间每个气候因子的相似优先比矩阵为引种地i区域、引种地j区域和种源地在气候因子k上的相似性优先比,越大,说明与引种地j相比,引种地i的气候因子k与种源地的相似性更高。通过由大而小地选取矩阵的λ水平截集可以获得引种地与种源地之间各气候因子的相似性排序分值(yik)。再次,再对上述得到的相似性分值进行标准化处理得到y’ik,并对气候因子赋予权重(∑wk=1),最后通过加权得到各个引种地区与种源地的玉米气候相似性总分值(y′i=∑wky′ik)。总分值越小,说明该站点与种源地的玉米种植气候越相似,反之,相似性越小。本发明采用了各气候因子的时间序列数据作为相似性距离度量的依据,并对每一个气候因子分别进行度量,再综合各气候因子的影响程度进行加权平均。相较于简单采用年均值作为单个特征,时间序列可以根据玉米实际播种和收获时间进行数据的截取,同时可以反映气候因子(如气温)在整个种植期的变化过程。本发明实施例提供的引种选址方法,通过对不同作物生长习性进行分析,选择影响不同作物生长的主要气候因子并赋予相应的权重,综合计算各气候因子在不同地区的差异,进行相似性分析,最终可根据不同的作物种源地、育成地选择合理的市场推广地区,可有效提高引种推广成功率,避免盲目选择引种推广地区造成的资源浪费。可选地,所述各个气候因子具体为:气温、日降水量、日太阳辐射量、日照时长和土壤湿度,其中,气温包括日平均温度、日最高温和日最低温。在上述实施例的基础上,依据玉米育种及种植专家经验,综合考虑数据来源及数据质量,本发明实施例选择了气温包括日平均及最高最低温、日降水量、日太阳辐射量、日照时长和土壤湿度等影响玉米生长的主导气候因子近年的全球历史数据。本发明实施例采用跨国家跨气候区域的引种推广选址实施方案选择了巴西的四个育种站(sorriso、jardinopolis、londrina)作为种源地,国内东华北及西南地区的607个玉米主要生产区县及气候观测站作为引种推广的候选地进行分析。种源地即巴西育种站的地理位置如图3所示,国内候选地区的地理位置如图4所示。选址方案的气温、风速数据选用美国国家气候数据中心(ncdc)的全球地面气象站点日值数据集(gsod);降水、太阳辐射总量、土壤湿度等数据选用美国国家海洋及大气管理局(noaa)发布的全球栅格化数据集,其中除土壤湿度是月均值以外,其余全是日值数据;日照时长数据采用的是东英吉利亚大学气候研究组(cru)发布的全球栅格化数据。以上数据均是公开可获取的。本发明实施例出于数据质量的考虑,gsod气象站点数据最终选用了距每个种源地和引种推广候选地最近站点的数据。由于部分气象站点数据的缺失程度较高,在选择最近站点数据之前剔除了20%以上数据缺失或有连续五天以上数据缺失的站点,缺失的日值数据采用了线性插值处理。noaa发布的栅格数据均选用的是最近五年的数据,cru的全球日照时长栅格数据选用1961~1990年数据。在时间尺度上,本发明实施例采用了所有年份按日期平均的候值数据(候值为每五天的日值平均数据,每月按6候计算)。这样可以一定程度降低年份差异及日值波动带来的异常噪声,反映每个地区的常规气候,同时可以涵盖玉米在不同生长阶段的气候变化信息。具体数据信息详表1。由于原始的土壤湿度数据是月均值数据,本发明实施例中采用了线性插值将月均值转化为候值数据。表1各气候因子数据信息可选地,所述方法还包括:根据所述各个气候因子,获得所述各个气候因子在种源地作物生育期间的候值序列。可选地,所述方法还包括:采用欧氏距离对所述候值序列的数据进行统计分析,采用模糊相似优先比方法或直接基于欧式距离系数进行排序得到所述各个气候因子的相似性排名。在上述各个实施例的基础上,作物引种常用两地主导气候因子的差异对气候相似性进行评估,并基于欧式距离系数及模糊相似优先比等评估方法对不同备选地区的引种适宜性进行排序。对于每个气候因子,可以获得其在种源地玉米生育期时间段内的候值序列。以平均温度为例,假设巴西某种源地玉米播种时间是2月初,生育期120天,国内某引种地的玉米播种时间是9月初,可以将种源地2月1号之后120天共24候值序列数据与国内9月1号之后的24候值序列作比较。对于这种需要比较整个时间段相似程度的单个气候因子,可以考虑采用欧氏距离对各观测点时间序列数据进行统计分析。对于有:经过计算和实验分析,直接基于欧氏距离进行排序得到各气候因子的相似性排名与通过构建相似优先比矩阵得到的相似性分值yik基本一致,而且时间和空间复杂度较低。由于未来可能要构建全球细颗粒度的引种推广气候适宜性地图,需要分析比较大量的引种推广地样本,本发明实施例也可选择直接基于欧氏距离进行排序获取相似性分值的方法。可选地,所述各个气候因子的权重是根据作物的生长特点、引种的主要限制性因素及对产量、品质的影响利用层次分析方法确定的。在上述实施例的基础上,在一组农业气候指标中各个气候因子所起的作用往往有所差异,本发明实施例中不同因子的权重值是根据玉米作物的生长特点、引种的主要限制性因素及对产量、品质的影响利用层次分析方法给定的。具体权重表2所示。表2各气候因子权重气候因子均温最高温最低温降水太阳辐射总量日照时长土壤湿度权重0.220.080.20.030.180.050.24可选地,所述方法还包括将最大风速作为辅助数据进行最终的选址定位。在上述实施例的基础上,有些气候因素更适合定性化分析,可以在进行相似性计算前后根据农业专家的经验和建议设置一定的规则化评价指标。比如引种地在玉米成长期中大风的强度和发生概率不应超过一定范围。依据这些规则化的评价指标可以除去不适宜的引种候选区域,以此得到更合理的结果。本发明实施例将最大风速等信息作为辅助数据提供给农业专家进行最终的选址定位。可选地,所述方法还包括将各个气候因子处理成候值数据,并采用hive进行结构化存储。在上述实施例的基础上,相比于以往研究,构建玉米全球跨区域引种的细粒度的气候相似性地图,需要全球范围的较高时空分辨率的历史气候数据,本发明实施例采用了hive、hdfs等hadoop大数据技术对全球气候数据进行了存储和处理,可以利用分布式集群实现数据的自动备份、高可用及快速检索查询。经过质量检查和数据清洗的气候数据集采用hive进行了结构化存储,每一条记录存储一个站点或栅格内特定日期或月份的气候因子数据。hive是基于hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql数据库查询功能,可以将sql语句转换为mapreduce任务进行运行。每个种源地和引种候选地各气候因子的多年历史数据从hive中检索得到,并最终转化为候值序列作为中间结果存储于hadoop的分布式文件系统(hdfs)中以便于后续的分布式计算。可选地,所述方法还包括采用时间滑窗对作物的种植时间进行匹配。在上述实施例的基础上,所述方法还包括采用时间滑窗对作物的种植时间进行匹配,例如实现玉米跨区域跨气候类型的引种推广选址需要与引种地的种植期进行匹配。比如部分巴西冬玉米品种当地的播种时间在1、2月份,但在中国广东部分地区则更适合9月中下旬播种。本发明实施例采用了一种时间滑窗的方法,通过设定不同的播种时间截取引种地的全年气候数据,实现与种源地种植期的最佳匹配。从种植时间来看,sorriso属于冬玉米区,播种时间为1月中旬,五月初收获,jardinopolis、和londrina在巴西中部,处于两季玉米区。其中jardinopolis育种站主要培育种植冬玉米,种植时间从2月初至5月末,与和londrina一致。londrina的夏玉米种植时间从10月初至1月末,uberlandia的夏玉米种植时间相较londrina晚15天。由于中国、巴西处于不同半球,种植期会存在明显差异。为了匹配最佳的种植时间,在实施过程中,本方发明实施例采用了一种时间滑窗的方式,根据具体巴西玉米品种的生长生育期划定时间窗口的大小,假设国内候选引种地的玉米播种时间即时间窗起始时间分别为1月1号、1月16号、2月1号……每半个月以此类推,最终可以得到24个时间窗口。可选地,所述方法还包括根据先验参照系对所述引种地区的气候的适应性进行判断。在上述实施例的基础上,传统的气候相似性分析方法具有一定的相对性,只能给出不同引种地与种源地之间相似性的相对排序,无法说明排名靠前的引种推广候选地区是否真正适宜。本发明实施例采用了一种基于先验参照系的方式判断实际的气候适宜性。比如可以基于先验知识,选择除种源地以外已经实际种植该玉米品种的地区以及明确无法引种的地区及时间段当做参考系,得到其在相似性分析中的相对排序作为筛选适宜引种推广地区的标准。比较引种地与种源地之间的气候相似性只能得到相对的结果,相似性排名靠前只能说明这一地区相比于其他候选地区和种源地之间的气候更相近,不能以相对排名直接评价引种推广的适宜性。本发明实施例在分析的过程中引入了部分具有先验信息的参照系作为适宜性的评价基准。以引种巴西londrina夏玉米为例,同样在夏玉米种植区的jardinopolis和uberlandia在种植的品种及玉米种植期有一定的重合,而sorriso不种植夏玉米。将这几个站点在夏玉米种植期的气候数据引入分析,可以作为参照,如果相似性排名比jardinopolis和靠前或相近,可以认为是比较适宜引种夏玉米品种的区域,相反,如果和sorriso排名相近或靠后,则说明不适宜引种。针对巴西不同种源地的玉米品种引种推广选址分析的结果中的每张工作表页代表以一个种源地和种植季为基准的分析结果,每一行为一个引种候选地样本,包括该候选地的经纬度、具体区县、最佳匹配的种植时间窗口(时间窗1代表1月1日播种,2代表1月16日播种,以此类推)以及相似性的排名。同时,每一张表页也包含巴西其他三个参照地在相同时间段内(即只考虑一个时间窗口)与该种源地相似性的排名。如图5a-5f所示,展示了每张表页中国内排名最靠前的15个引种推广推荐地结果。初步的结果可以根据农业专家的经验为主进行交叉验证。此外,还可以借助一些先验信息判断结果的合理性。比如方案在对巴西的某一个区域的气候进行匹配的时候,引入了巴西其他三个区域作为参考项参加气候相似性排名,以下几点说明结果比较符合真实情况:首先,四个区域都种植冬玉米,其中londrina、jardinopolis、uberlandia的种植期基本一致。从结果中可以看到对于冬玉米,这三个区域最为相似,以其中一个地区为种源地时,另两个地区的气候相似度排名最靠前。sorriso的冬玉米种植期稍早,所以在相同时间段进行比较时,sorriso与其他三个地区的气候相似度低于中国的几个地区。其次,sorriso不种植夏玉米,从结果来看,在夏玉米的种植时间段内sorriso与种源地之间的相似度排名较低,这也在一定程度上反映了真实情况。最后,针对巴西的四个地区和冬夏两季玉米种植期分别挑选了国内相似度排名靠前的几个地点。从结果中可以看到针对一个种源地和种植期,国内相似性排名靠前的地区相对集中,最佳匹配的时间窗口也相近。同时冬玉米和夏玉米的推荐地区各自在一定程度上重合,冬玉米的推荐地区以云南、贵州、广西三省为主,而夏玉米的推荐地区则以四川及陕西南部为主。采用上述玉米作物引种及市场推广方法可以根据具体玉米品种的种源地气候及玉米生长习性选择合理的引种推广地区及该地区气候最适宜的种植期。基于大数据技术可以对海量数据进行存储、自动备份和快速查询,这为快速构建全球跨区域不同作物品种引种推广选址提供了基础。实施方案中针对巴西冬夏两季玉米品种的选址结果获得了农业专家的认可。图6为本发明实施例提供的引种选址装置的结构示意图,如图6所示,所述装置包括:获取模块10、对比模块20和排序模块30,其中:获取模块10用于获取引种地区和种源地的各个气候因子的相关数据;对比模块20用于采用基于时间序列距离系数的相似性评价方法对所述引种地区的各个气候因子和所述种源地的各个气候因子的相关数据进行对比,得到所述引种地区和所述种源地的气候因子的相似性排序分值;排序模块30用于根据所述各个气候因子的权重和所述相似性排序分值,计算得到气候相似性总分值,气候相似性总分值越小的所述引种地区与所述种源地气候相似度越高。本发明实施例提供了引种选址装置,其中,获取模块10获取引种地区和种源地的各个气候因子的相关数据;对比模块20采用基于时间序列距离系数的相似性评价方法对所述引种地区的各个气候因子和所述种源地的各个气候因子的相关数据进行对比,得到所述引种地区和所述种源地的气候因子的相似性排序分值;排序模块30根据所述各个气候因子的权重和所述相似性排序分值,计算得到气候相似性总分值,气候相似性总分值越小的所述引种地区与所述种源地气候相似度越高。本发明实施例提供的引种选址装置,通过对不同作物生长习性进行分析,选择影响不同作物生长的主要气候因子并赋予相应的权重,综合计算各气候因子在不同地区的差异,进行相似性分析,最终可根据不同的作物种源地、育成地选择合理的市场推广地区,可有效提高引种推广成功率,避免盲目选择引种推广地区造成的资源浪费。可选地,所述装置还包括将各个气候因子处理成候值数据,并采用hive进行结构化存储。在上述实施例的基础上,相比于以往研究,构建玉米全球跨区域引种的细粒度的气候相似性地图,需要全球范围的较高时空分辨率的历史气候数据,本发明实施例采用了hive、hdfs等hadoop大数据技术对全球气候数据进行了存储和处理,可以利用分布式集群实现数据的自动备份、高可用及快速检索查询。经过质量检查和数据清洗的气候数据集采用hive进行了结构化存储,每一条记录存储一个站点或栅格内特定日期或月份的气候因子数据。hive是基于hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql数据库查询功能,可以将sql语句转换为mapreduce任务进行运行。每个种源地和引种候选地各气候因子的多年历史数据从hive中检索得到,并最终转化为候值序列作为中间结果存储于hadoop的分布式文件系统(hdfs)中以便于后续的分布式计算。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要确定其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1