一种大黄鱼刺激隐核虫病害程度的判别方法

文档序号:202693阅读:205来源:国知局
专利名称:一种大黄鱼刺激隐核虫病害程度的判别方法
技术领域
本发明涉及大黄鱼,尤其是涉及一种大黄鱼刺激隐核虫病害程度的判别方法。
背景技术
刺激隐核虫是目前严重威胁海洋鱼类的一种传播性极强的寄生虫,已被列为农业部2008年12月11日发布的新版《一、二、三类动物疫病病种名录》中的二类动物疫病。特别是该病给大黄鱼养殖产业带来了严重损失。例如,2005年起,刺激隐核虫病及细菌性继发感染每年给大黄鱼养殖产业带来了超过3亿元的经济损失。大黄鱼刺激隐核虫病的严重暴发流行与我国大黄鱼主产区这一动态、不稳定的开放复杂养殖生态系统密切相关,受养殖海域的水文、物理、化学及生物因子的多重影响明显。例如,刺激隐核虫病的季节性流行规律直接与气温和水温等气候条件的周年变化相关;盐度、溶解氧、水深、水流速度等水文物理条件以及COD、氨氮、亚硝酸盐和硝酸盐等水质因子直接反映着养殖海区的水环境质量, 并影响着刺激隐核虫感染附着、增殖暴发乃至流行进程。流行病学研究表明,大黄鱼刺激隐核虫病发生及其分布具有明显的时空差异,不同海域或同一海域不同养殖水环境时期,该病发生进程与严重程度明显不同。生产中,养殖户常在刺激隐核虫病发季节适时进行拖排作业,将渔排转移到低发病率的较安全海区, 在一定程度上可以避免刺激隐核虫病造成的重大损失。然而,养殖户自身对于环境因子与疾病发生关系的认知是感性而片面的、定性而非定量的、相对模糊和不精确的!如果能阐明养殖水环境因子与疾病发生的内在定量关系,准确理解刺激隐核虫病发生的时空变化规律,将有助于指导养殖户对大黄鱼宜养海域的选择,并在刺激隐核虫病高发期间适时移排、 适地安置、布局优化,具有重大的产业应用前景。虽然我国自上世纪90年代就开展了大黄鱼刺激隐核虫病相关的流行病学研究探索,2005年,我国系统开展了大黄鱼主产区的环境监测和疾病监测工作,迄今已积累了大量的水环境因子监测数据和疾病观测数据,但是至今仍主要偏重于定性解释,在大黄鱼刺激隐核虫病与环境因子之间的定量分析方面的研究工作十分缺乏,我国已有依据透明度、温度和平均风速对大黄鱼养殖疾病(所有疾病)的预测方法(中国专利200710068792. 6)。 但是,大黄鱼养殖疾病种类多样,流行特点各异,特别是同一时间点内多种疾病并发时所涉及的环境因子效应非常复杂,影响不同疾病的主效因子不完全相同,依据特定的水质因子对所有疾病实施预测难度较大。而且水质对疾病影响很可能是一种非线性的关系,上述专利采用的是线性模型的拟合,准确性较低,而且没有考虑到其他因子的影响,比较片面。用大量的因子来分析对疾病的影响,并筛选对疾病影响权重较大的因子,用这些因子来预测疾病的发生严重程度是个比较合理、周全的思路。而且目前用机器学习方法来分析非线性问题,分析大量因子对某些事件的影响并预测某些事件可能发生的等级比较先进、合理、准确性高,并且也有不少的专利报导,如西北电网有限公司所发明的《基于神经网络的风速预测方法》(中国专利200910219123.31);浙江大学发明的《一种风电场短期风速预测方法》 (中国专利201019146035.5);中国石油化工股份有限公司发明的《基于支持向量机的热裂解产物收率的预测方法》(中国专利200810225363.X);北京大学发明的《基于对比模式的随机森林分类方法和分类器》(中国专利201010265846.X)等等,而目前还没有报导用机器学习法分析并预测水质因子对水产动物疾病发生的影响,再者很多文献表明随机森林法在分类、预测性能上好过与其他方法。

发明内容
本发明的目的在于提供一种大黄鱼刺激隐核虫病害程度的判别方法。本发明包括以下步骤1)数据预处理,具体方法如下(1)将可能引发刺激隐核虫病的水环境因子分类,具体方法如下从水环境监测数据中选取14个可能影响刺激隐核虫病发生的水文、气候、物理、 化学、生物等影响因子年份、月份、监测站位、水温、透明度、溶解氧、COD、活性磷酸盐、 Ν03--Ν、Ν02—Ν、ΝΗ4+-Ν、石油类,并依次用数字1 14排序;(2)疾病严重程度赋值根据其严重程度分为正常、少量发病、中等程度发病、大面积发病4个等级,记录为1 4 ;(3)构建环境因子-疾病情况对应数据列表建立“环境因子-疾病情况.txt”文档,所述文档的特征是①纯数据文档只含序号、监测值、疾病严重程度值等纯数据不含各因子标题;②排序方式所有数据按照序号, 14个影响因子数据和1个疾病严重程度数据从左到右依次排列,即16列;2)全部14个影响因子数学方法构建将全部影响因子都用于构建数学方法,具体方法如下(1)数据随机分组数据分组所有的数据按用途被随机分为两大类①训练集用于构建数学方法; ②测试集用于评价所构建数学方法的准确率和可靠性;分组方式随机抽取初始数据组2/3的数据作为训练集,剩下1/3数据作为测试集;(2)构建数学判别方法用随机森林分类算法(以下简记为RF)分析训练集数据,建立14个影响因子对大黄鱼刺激隐核虫病发生情况的全因子判别方法,所用的程序是R软件环境中加载的随机森林程序包;(3)方法的准确性评价用所获测试集数据中的14个影响因子数据代入所建数学判别方法中,计算出疾病发生严重程度值,并与实测疾病严重程度赋值进行比较,分析准确率和可靠性;3)降维方法构建上述全因子判别方法需要采集14个水环境因子进行疾病判别,利用随机森林算法计算各个影响因子重要性,并选择部分较能反应方法效率的因子集合,构建维度较低的方法,具体步骤如下(1)权重因子排序对每个水环境因子效应进行评价,计算影响刺激隐核虫病发生的权重值,并选择出权重最大的5个影响因子;(2)低维疾病判别方法(降维方法)构建及筛选分别建立权重最大的3个影响因子(月份、水温、溶解氧)、4个影响因子(月份、 水温、溶解氧、NH4+-N)、5个影响因子(月份、水温、溶解氧、NH4+-N、C0D)对疾病情况的判别方法,降维方法构建方法同上述未降维(全因子)判别方法的构建方法,并分别进行准确性分析;确定因子维度合适的判别方法根据准确率(不低于90% )和因子数量(宜少), 筛选出判别大黄鱼刺激隐核虫疾病发生情况的理想因子,确定因子维度合适的判别方法;(3)降维方法准确性评价降维方法与全因子方法准确率比较及差异显著性分析分别将全因子方法与降维方法判别的疾病值输出,与原始的疾病值一一对应,用SPSS18.0中的相关性分析、配对样品T检验分析功能分别分析降维方法判别值-全因子方法判别值、降维方法判别值-原始疾病值及全因子方法判别值-原始疾病值之间显著性差异。本发明所提供的一种判别刺激隐核虫病与水环境因子相互关系的理想判别方法是基于月份、水温、溶解氧、NH4+-N这4个因子所构建的降维简化方法。本发明从14个水环境因子中筛选出对大黄鱼刺激隐核虫病发生影响权重最大的几个水环境因子,进而构建降维简化的数学方法,以便在保证较高准确率和可靠性的基础上,只需要采集较少的水环境数据信息,就能达到判别刺激隐核虫病发生程度的目的。本发明提供先进算法的数学方法,确保判别准确率和可靠性,本发明公开该数学方法的用途,表明它可通过水环境因子的测定,判别在某一特定海域养殖大黄鱼时刺激隐核虫病的可能发生状况及严重程度,方便指导大黄鱼刺激隐核虫病的有效防控。与现有技术相比,本发明具有以下优点1)定量判别本发明阐明了刺激隐核虫病与水环境因子的定量关系。现有技术对二者之间相互关系仅有定性的描述,尚无定量判别的公开报道。2)简单方便现有技术未能阐明影响刺激隐核虫病的主效因子。本发明从众多可能的影响因子中甄别和筛选出影响该病的4个主效因子,构建了维度较低的方法,不仅方便养殖户运用该方法判别疾病发生状况,而且简化了水环境因子的需测数据,大大减少了
工作量。3)准确率高本发明提供的降维方法判别准确率超过90%,与全因子方法的准确
率无显著差异。4)应用前景较好现有技术仅对刺激隐核虫病的定性描述,无法有力指导养殖户根据水环境质量判断养殖海区是否合适养殖大黄鱼,是否会暴发严重的刺激隐核虫病。本发明提供的判别方法不仅可解决上述问题,适用于判别大黄鱼刺激隐核虫病发生,而且还可为其它海水鱼类刺激隐核虫的发生提供重要参考。


图1为基于随机森林的全因子数学方法构建的步骤流程图。图2为随机森林算法中每棵树生长的流程图。图3为用生成的方法对测试集进行测试的原理图。
具体实施例方式下面结合实施例对本发明作进一步说明,但并不作为本发明对权利范围的限制。实施例11.数据预处理获取福建宁德三都湾、福州罗源湾、福鼎沙埕港3个海水网箱人工大黄鱼养殖最集中的海域的水质等环境因子的月监测数据(见表1),及其对应的刺激隐核虫病发生情况 (水质数据来自国家海洋局东海分局闽东海洋环境监测中心站,疾病数据来自福建省海洋水产技术推广总站病防科,数据采集、分析均按照国家规范标准),为计算方便,影响因子按表1中顺序分别记录为1 14 ;疾病情况根据其严重程度分为正常、少量发病、中等程度发病、大面积发病4个等级记录为1 4 ;月份按1 12月分别记为1 12 ;监测站位按三都湾、罗源湾、沙埕港分别记录为1 3 ;最后建立“环境因子-疾病情况.txt”文档,数据按照影响因子和疾病情况从左到右依次排列,即15列,且该文档只含数据不含各因子标题。表.1数据分析所用影响因子列表
权利要求
1. 一种大黄鱼刺激隐核虫病害程度的判别方法,其特征在于包括以下步骤1)数据预处理,具体方法如下(1)将可能引发刺激隐核虫病的水环境因子分类;(2)疾病严重程度赋值根据其严重程度分为正常、少量发病、中等程度发病、大面积发病4个等级,记录为1 4;(3)构建环境因子-疾病情况对应数据列表建立“环境因子-疾病情况.txt”文档,所述文档的特征是①纯数据文档只含序号、 监测值、疾病严重程度值等纯数据不含各因子标题;②排序方式所有数据按照序号,14个影响因子数据和1个疾病严重程度数据从左到右依次排列,即16列;2)构建全部14个影响因子数学方法将全部影响因子都用于构建数学方法,具体方法如下(1)数据随机分组数据分组所有的数据按用途被随机分为两大类①训练集用于构建数学方法;②测试集用于评价所构建数学方法的准确率和可靠性;分组方式随机抽取初始数据组2/3的数据作为训练集,剩下1/3数据作为测试集;(2)构建数学判别方法用随机森林分类算法,分析训练集数据,建立14个影响因子对大黄鱼刺激隐核虫病发生情况的全因子判别方法,所用的程序是R软件环境中加载的随机森林程序包;(3)方法的准确性评价用所获测试集数据中的14个影响因子数据代入所建数学判别方法中,计算出疾病发生严重程度值,并与实测疾病严重程度赋值进行比较,分析准确率和可靠性;3)构建降维方法全因子判别方法需要采集14个水环境因子进行疾病判别,利用随机森林算法计算各个影响因子重要性,并选择部分较能反应方法效率的因子集合,构建维度较低的方法,具体步骤如下(1)权重因子排序对每个水环境因子效应进行评价,计算影响刺激隐核虫病发生的权重值,并选择出权重最大的5个影响因子;(2)低维疾病判别方法构建及筛选分别建立权重最大的3个影响因子、4个影响因子、5个影响因子对疾病情况的判别方法,降维方法构建方法同上述未降维判别方法的构建方法,并分别进行准确性分析;确定因子维度合适的判别方法根据准确率和因子数量,筛选出判别大黄鱼刺激隐核虫疾病发生情况的理想因子,确定因子维度合适的判别方法;(3)降维方法准确性评价降维方法与全因子方法准确率比较及差异显著性分析分别将全因子方法与降维方法判别的疾病值输出,与原始的疾病值一一对应,用SPSS18. 0中的相关性分析、配对样品T检验分析功能分别分析降维方法判别值-全因子方法判别值、降维方法判别值-原始疾病值及全因子方法判别值-原始疾病值之间显著性差异。
2.如权利要求1所述的一种大黄鱼刺激隐核虫病害程度的判别方法,其特征在于在步骤1)第(1)部分中,所述将可能引发刺激隐核虫病的水环境因子分类的具体方法如下从水环境监测数据中选取14个可能影响刺激隐核虫病发生的水文、气候、物理、化学、 生物等影响因子年份、月份、监测站位、水温、透明度、溶解氧、COD、活性磷酸盐、NO3-N, N02--N、NH4+-N、石油类,并依次用数字1 14排序。
3.如权利要求1所述的一种大黄鱼刺激隐核虫病害程度的判别方法,其特征在于在步骤3)第(2)部分中,所述3个影响因子为月份、水温、溶解氧。
4.如权利要求1所述的一种大黄鱼刺激隐核虫病害程度的判别方法,其特征在于在步骤3)第⑵部分中,所述4个影响因子为月份、水温、溶解氧、NH4+-N。
5.如权利要求1所述的一种大黄鱼刺激隐核虫病害程度的判别方法,其特征在于在步骤3)第⑵部分中,所述5个影响因子为月份、水温、溶解氧、NH4+-N、COD。
全文摘要
一种大黄鱼刺激隐核虫病害程度的判别方法,涉及大黄鱼。先数据预处理,再构建全部14个影响因子数学方法,最后构建降维方法。具有定量判别、简单方便、高准确率和高可靠性等特点。随机抽样测试表明,通过所提供的方法,利用水环境因子实测数值能够准确判定大黄鱼刺激隐核虫病可能发生的严重程度,判别准确率可达90%以上。适用于判定大黄鱼刺激隐核虫病可能发生的海域及严重程度,指导大黄鱼刺激隐核虫病的有效防控。适用于判别大黄鱼刺激隐核虫病发生,而且还可为其它海水鱼类刺激隐核虫的发生提供重要参考。
文档编号A01K61/00GK102550455SQ201210009919
公开日2012年7月11日 申请日期2012年1月13日 优先权日2012年1月13日
发明者丁少雄, 吕伟航, 毛勇, 王军, 王洪杰, 苏永全, 蔡晓鹏 申请人:厦门大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1