基于大曲各成分理化指标与产酒量和酒质联系的测定方法与流程

文档序号:11214705阅读:2094来源:国知局
基于大曲各成分理化指标与产酒量和酒质联系的测定方法与流程

本发明属于自动控制技术领域,尤其涉及一种基于大曲各成分理化指标与产酒量和酒质联系的测定方法。



背景技术:

随着酿酒工艺的创新和发展,不同风格的白酒相继问世。大曲是一种富含多酶多菌的微生物发酵剂,大曲是大曲酒酿造生产中的重要物质,是酿酒生产的糖化、发酵、酒化和生香剂,含有多种微生物及其产生的多种酶类,是传统固态发酵蒸馏大曲酒的重要物质保障,其品质对曲酒的出酒率和优级品率有较大的影响。传统的大曲质量判定标准体系即是在这种背景下建立起来的,其意义在于:初步认识了大曲的主要酶系状况:淀粉酶、糖化酶、酒化酶、酯化酶、蛋白酶、脂肪酶等;初步认识了大曲在固态白酒发酵体系中的生化作用:产酒、产酯、产香等;初步认识了大曲的主要微生物类群:酵母菌、霉菌、细菌以及放线菌等。在制曲工艺条件确定的前提下,传统大曲的质量品质,就主要取决于制曲环境所处的地理条件、气候条件、水质条件等所滋生和孕育的微生物类群。传统大曲生产主要采用自然网罗自然界的微生物和人工制作曲坯及人工管理,不仅大曲因气候、环境等自然因素的影响而容易导致质量的不稳定性,而且人工制曲坯及人工管理的劳动量大、工作效率低,且大曲质量受工人工作经验的影响。强化大曲发酵技术可以解决大曲中某种微生物数量和酶系种类的不足,为大曲坯提供良好的微生物及酶系体系。大曲的质量对白酒品质的影响很大,因此稳定大曲品质是保证酒质的前提。大曲质量评定方法有感官评定法、理化特征指标评定法、微生物种群数量评定法。这些方法及有关标准对大曲质量的进一步规范化、标准化起到一定推动作用。由于影响酿酒生产的因素极其复杂,每种评定方法的可靠性、稳定性都存在一定的缺陷,其评定指标和方法也有待进一步完善。

综上所述,现有技术存在的问题是:目前测定大曲脂肪酸的检测方法存在没有合适的微生物传感器来检测大曲脂肪酸;大曲酒酒体中的呈香呈味物质含量仅占酒体总量的2%左右,所形成酒品的价值就远远超越食用酒精的价值;曲药的各理化指标由于生产季节、生产环境、工艺参数、取样方法和部位等因素差异,导致同一指标分析结果差异较大。具体如下:

(1)到目前为止,还没有测定大曲脂肪酸更好的检测方法。存在的主要问题是:原料中脂肪降解产物脂肪酸以及曲坯中的色素、固醇等均共同显示为粗脂肪含量,我们拟用脂肪酸含量的高低表征脂肪转化力。脂肪转化力虽是体现大曲复合曲香物质的重要指标之一,但到目前为止,由于没有合适的微生物传感器来检测大曲脂肪酸,大曲脂肪酸的测定方法将成为今后共同探讨的方向。(2)大曲中纷繁复杂的微生物区系和酶系,进入大曲酒发酵体系中又进一步彼消此长地繁殖代谢和生化演化,形成种类繁多的酒体呈香呈味物质,目前还未完全确定其种类(3)大曲酒酒体中的呈香呈味物质含量仅占酒体总量的2%左右,但所形成酒品的价值就远远超越食用酒精的价值。(4)制曲工艺有一定差异(5)曲药的各理化指标由于生产季节、生产环境、工艺参数、取样方法和部位等因素差异,导致同一指标分析结果差异较大。



技术实现要素:

针对现有技术存在的问题,本发明提供了一种基于大曲各成分理化指标与产酒量和酒质联系的测定方法。

本发明是这样实现的,一种基于大曲各成分理化指标与产酒量和酒质联系的测定方法,所述大曲各成分理化指标与产酒量和酒质联系的测定方法曲料成份采集分析系统和微生物快速检测系统;

曲料成份采集分析系统通过传感器模块能够实时检测曲料成份的变化和微生物群落的生长,根据其理化指标与数据库中的不同厂家的理化指标对比,寻求最佳制曲工艺,并可更新数据库;根据其理化指标将其控制参数应用于曲料发酵自动控制系统,初步实现制曲工业化;

所述微生物快速检测系统是通过低选择性交互敏感的多传感器阵列检测曲料样品的整体特征响应信号,检测培养基随着微生物生长的变化,通过检测取得特征值,再通过pca和神经网络等模式识别方法的数据处理来确定不同阶段培养基的不同特征。

进一步,所述曲料成份采集分析系统包括:

传感器阵列,由六个工作电极和一个辅助电极组成一个独立的单元机构并和一个参比电极(铂)共同组成一个完整的传感器阵列,通过检测大曲中的主要成分的理化指标来分析大曲的品质;

信号激励采集单元,由信号激励单元,信号采集单元和信号调理单元构成。测试平台为样品安置、检测提供严格的工作环境;信号激励单元和调理单元和数据分析模块通过串口协议实现通信,传感器上的信号经过调理电路由数据采集卡再次通过调理电路输出最终的传感器信号,并通过串口或usb传送至电脑pc,采用labview实现上位机的通信和分析软件;

应用软件单元,是在电脑上运行的用于控制智舌检测、分析数据、数据结果的应用程序;

数据分析模块,运用主成分析法模式识别和神经网络算法进行数据的分析处理。

进一步,所述理化指标智能分析方法是粗糙集理论结合神经网络、主成分分析法包括:

(1)模式识别,以各种传感器为信息源,以信息处理与模式识别的理论技术为核心,以数学方法与计算机为工具,对各种媒体信息进行处理、分类、理解;

(2)特征值提取,分别利用1hz、10hz、100hz三种脉冲脉冲频率作为激励信号扫描,以100μs作为采样频率,则在1hz、10hz、100hz的三个频段内的采集点的个数分别为200000、20000、2000个,对数据进行特征选择和特征提取;

(3)主成分分析,把原来多个变量划分为少数几个综合指标;

(4)dfa判别函数分析,根据已知观测对象的分类和若干表明观测对象特征的变量值,建立判别函数和判别准则和判别函数,并使其错判率最小;

(5)人工神经网络,利用输出后的误差来估计输出层的直接前导层的误差,然后利用此误差去估计更前一层的误差,如此反复训练一层层的反传,得到其他各层的误差估计。

所述主成分分析法进一步包括:

首先标准化处理,原始数据构成的矩阵为x,它是由行n行p列构成;

标准化处理:

则标准化后的相关系数的计算公式为:

经过主成分分析法的处理分解问特征值与载荷矩阵的相积,计算其相应的特征值和特征向量,得到即x=tl';根据t的得分矩阵做出图形来判断样品的归类效果图。

所述dfa判别函数分析进一步包括:

采用的判别准则主要是线性判别分析,取线性判别函数:

u(x)=atx=a1x1+a2x2+…+apxp;

各总体内离差平方和:

其中

不同总体间离差平方和:

其中

为满足式中各总体内离差平方和最小而式中各总体间离差平方和最大,则需要使最大;判别法则为:若则判x∈ξi;选择方法是使达到某一数值,取这数值在0.75~0.95。

所述人工神经网络进一步包括:

学习因子,根据输出误差大小利用变步长法自动调整学习因子,h=h+a·(ep(n)-ep(n-1))/ep(n),其中a为调整步长,取值在0~1;h为步长因子;

隐层节点数,当某节点出发指向下一层节点的所有权值和阈值均落在死区中时,死区的范围取±0.1、±0.5区间,则把该节点删除;

l=(m+n)1/2+c;

其中m为输入节点数,n为输出节点数,c为1~10之间的常数;

输入输出神经元的确定,利用多元回归分析法对神经网络的输入参数进行处理,将相关性强的输入参数删除;

算法优化,采用lm-bp神经网络算法:

其中能量方程为:

最后解得:δxk=[jt(xk)j(xk)+μi]-1jt(xk)e(xk);

当μ=0时,为牛顿法,而当μ接近于8时,则是steepestdecent法。

本发明的优点及积极效果为:利用多频脉冲法对传感器阵列信号的数值进行有效提取,大大减少了冗余信息,对后面分类定性和定量起指导作用。利用电子舌伏安法,运用采集方法是传感器阵列的电化学信号的采集。采集的电位范围-1v~+1v,以0.2v脉冲幅度递减,频率段是1,10,100hz这样的几个频段,采集频率位100微秒一个点,这样的采样频率在这三个段就可以采集222000个点,传感器阵列一般是由5,6个传感器组成,就会有很大数量的采集数据,大量的采集数据,虽然是有丰富的信息量,但是同是有可能会对计算机造成负荷,也会造成冗余。

本发明多频率脉冲法提取的特征点是顶点和拐点,顶点是与脉冲电流信号和溶液带电离子性质的特征有关联;而拐点则是脉冲电流信号和溶液中氧化还原组分性质相似,如图4所示。这样电位的变化范围—1v~+1v,以0.2v的幅度递减,图4中的片段只需要取40个特征值,对比222000,数据量就少了很多,这样就加快了数据的处理速度。

本发明利用改进的主成分分析法和粗神经网络方法对大曲的重要属性进行分析,从而能够得出决定大曲质量的理化指标;利用特异性传感器和人工智能的方法对微生物进行定性定量检测;采用开放式数据库,能够快速的查询、建立、分析不同厂家和企业的大曲质量。本发明能够对生产曲料的过程中对大曲品质进行实时检测,可以提高生产效率,也对品牌效益起到了保护作用;该技术的应用前景长远,对社会起到了推动的作用。微生物快速检测系统可应用于食品安全检测领域,对食源性细菌的检测可满足快速,简便,经济,可靠等要求,同时也对食品品牌保护和社会安全起保障作用。

附图说明

图1是本发明实施例提供的曲料品质分析与评价系统框图;

图2是本发明实施例提供的bp和神经网络相结合的培养基优化算法;

图3是本发明实施例提供的微生物快速检测系统。

图4是本发明实施例提供的多频率脉冲法提取的特征点是顶点和拐点示意图。

具体实施方式

为能进一步了解本发明的发明内容、特点及功效,兹例举以下实施例,并配合附图详细说明如下。

下面结合附图1附图2附图3对本发明的原理作详细的描述。

如图1所示曲料成份采集分析系统分为硬件和软件两部分系统。

硬件系统由传感器阵列模块、信号调理系统、数据预处理模块和数据分析模块。各组成部分功能如下:

(1)传感器阵列模块:传感器采用贵金属裸电极阵列,并采用多频脉冲作为激发信号。通过采集工作电机上的响应信号,利用多频脉冲原理提取有效信号特征值,结合模式识别方法对数据最后分析。

(2)信号调理系统:为了能够从中提取到传感器输出信号——激发电流,必须采用电流电压放大电路,使其信号的强度和幅值的大小能够在信号采集电路信号采集的范围之内。其次,电化学装置的电极系统本身的内阻非常大,所以系统的输入级需满足的基本条件是具有高的输入阻抗和低的输入电流。输入级放大信号后为了保持原有信号的信息需要通过的一定的电路进行滤波,使其噪声降到最小。每个工作极上设置单独的模拟开关,从而控制每个工作极上信号电放大和滤波处理。

(3)数据预处理模块和数据分析模块:多通道高精度数据采集器,将调理好的模拟信号转换为数字信号输入到计算机,系统软件会将庞大的数据通过进行分析、存储,并且可以完成数据库更新。

(4)系统为了增加可调式部分,预留多个接口(usb)。使电路模块实现灵活拔插或扩展,增加系统的扩展性。

所述曲料成份采集分析系统包括:

传感器阵列,由六个工作电极和一个辅助电极组成一个独立的单元机构并和一个参比电极(铂)共同组成一个完整的传感器阵列,通过检测大曲中的主要成分的理化指标来分析大曲的品质;

信号激励采集单元,由信号激励单元,信号采集单元和信号调理单元构成。测试平台为样品安置、检测提供严格的工作环境;信号激励单元和调理单元和数据分析模块通过串口协议实现通信,传感器上的信号经过调理电路由数据采集卡再次通过调理电路输出最终的传感器信号,并通过串口或usb传送至电脑pc,采用labview实现上位机的通信和分析软件;

应用软件单元,是在电脑上运行的用于控制智舌检测、分析数据、数据结果的应用程序;

数据分析模块,运用主成分析法模式识别和神经网络算法进行数据的分析处理。

软件系统需具备大曲监测成分实时显示、参数设置和调度的实时控制管理、综合信息管理、人工智能识别等功能。按照其功能主要包括数据库、模型方法库、知识库、在线数据采集子系统、实时控制管理、综合分析与决策支持子系统、综合信息管理子系统。

其中数据库是整个系统运转的基础,准确高效地收集和及时处理大量复杂的监测数据资料是整个系统设计和开发的重点。数据库及综合信息管理子系统是面向数据信息存储和信息查询的计算机软件系统。本系统的数据库内容包括:监测仪器特征库;原始监测数据库;整编监测数据库;在线数据实时分析库;人工巡视检查资料库;数据自动采集参数库;模型输入输出数据库;实时控制日志数据库等。

(1)模型库及其管理子系统

提供相应分析处理使用的处理模型和计算方法的例程库。包括各种时态和空间模型、在线数据可靠性分析算法等。包括大曲成分预报模型、大曲质量评价模型、大曲质量预测模型、酒质评价模型、酒质预测模型等。

(2)知识库及其管理子系统

是用于知识信息的存储及其使用管理的计算机软件系统。本系统的知识库内容包括:1.各监测工程的监测指标,2.各厂家企业的评判标准,3.监测数据误差限值,4.专业规律指标,5.专家知识经验,6白酒法律、法规,行业规程、规范的有关条款等。

如图3所示是本发明实施例提供的微生物快速检测系统。

通过低选择性交互敏感的多传感器阵列检测曲料样品的整体特征响应信号,检测培养基随着微生物生长的变化(把大的有机物分子转化成小的有机分子和离子),过程中培养基其本身的特性(电导、电阻、粘度等等)也发生了改变,通过对这一变化的检测取得特征值,再通过pca和神经网络等模式识别方法的数据处理来确定不同阶段培养基的不同特征。

(1)传感器阵列的确定

采用电化学的方法对微生物及其代谢产物检测,传感器是检测系统的核心部件。关键往往在于如何提高检测的灵敏度,以及从电信号中提取出和待测微生物指标呈良好线性关系的特征,通过氧化还原酶反应和适当的媒介,能将微生物的代谢氧化还原反应转换成可量化的电信号。

传感器阵列采用重金属铂,金,钯,钨,钛,银的电极构成,并利用相同的处理方法(主成分分析法或最小二乘法)来选取对微生物培养基检测的最佳电极和频率段。

(2)微生物检测池的设计

由于微生物的生长会产生很多气泡,导致检测的误差加大,所以不能采取传统将电极倒置插入培养基检测的方法。微生物检测池是一个密闭的空间,池体底部装有电极的设置可以避免外界对被检测培养基的污染,使检测的数据更加准确,传感器阵列位于检测池的底座还可以消除微生物在生长的时候产生的气泡对电极的影响,检测池池体内侧设有内螺纹,底座外周设有与该内螺纹相匹配的外螺纹,设置螺旋结构,可以使检测池池体与底座脱离,便于清洗电极表面。

(3)培养基优化设计

神经网络有很强的输入输出非线性映射能力,特别适用于微生物发酵这种高度非线性、非结构化的复杂模型中。而遗传算法又是一种有导向的全局随机搜索方法,它对于目标函数和搜索空间没有任何限制,因此非常适合神经网络模型等无明确分析函数形式的优化问题。实验培养基配比的组合被分成训练组和预测组,训练组用来训练bp神经网络,然后预测组用来对训练好的网络进行测试,由此构建神经网络模型。并以该模型的输出为ga的目标函数,通过遗传算法的全局寻优,找到最优培养基组合。

(4)定量检测微生物方法的建立

利用检测平台检测微生物不同种类,所具有的不同酶系,在特定液体培养基中培养一定时间后,所产生的不同代谢产物,导致培养基具有整体的特殊性,本发明根据这种特殊性为依据,对微生物建立生长预测模型。

根据微生物呈指数生长的特点,微生物数量的对数随时间的变化得到一条s形曲线,所绘制的生长曲线分别为延滞期、对数期、稳定器和衰老期。

用curveexpert软件分析智舌检测菌种的生长数据,拟合s曲线,建立生长模型,通过logistic、mmf、gompertz3种模型的标准差s和相关系数r的比较,确定最佳模型。从而确定检测该菌种的最合适培养基。

本发明的理化指标智能分析方法是粗糙集理论结合神经网络、主成分分析法,具体包括以下步骤:

1.1模式识别

模式识别是以各种传感器为信息源,以信息处理与模式识别的理论技术为核心,以数学方法与计算机为主要工具,探索对各种媒体信息进行处理、分类、理解并在此基础上构造具有某些智能特性的系统或装置的方法、途径与实现,以提高系统性能。本发明的电子舌系统的数据分析模块主要用到pca、dfa等模式识别算法。

1.2特征值提取

多频脉冲电子舌采用的是多频脉冲伏安法采集传感器阵列的电化学信号。在系统的操作中,对于传感器电压中的起始电压、结束电压以及步降电压一般分别设置为正向最大电位1.0v、负向最大电位-1v、0.2v。按照多脉冲测试方法中,分别利用1hz、10hz、100hz三种脉冲脉冲频率作为激励信号扫描,以100μs(最大极限值是10-6s)作为采样频率,则在1hz、10hz、100hz的三个频段内的采集点的个数分别为200000、20000、2000个。则所在的传感器阵列的一次采样中就可以获取点的个数达到m级,同时还存在了大量的冗余信息,这对常规的数据分析(采取直接分析的方法)带了不便,同时也给计算机带来了超负荷的运算。所以在进行数据分析之前需要采取一定的算法对大量丰富的数据进行特征选择和特征提取。

1.3主成分分析法

在解决实际问题时候,会遇到研究很多个变量的问题,而且在多数情况下,多个问题之间的具有相关性,这就增加了解决问题的难度。将多个变量用少数几个变量替代,且能够代表多个变量的信息,在少数几个变量组成的新的样本进行统计分析,这就是主成分分析法的目的。主成分分析是把原来多个变量划分为少数几个综合指标的一种统计分析方法。从数学角度看,这是一种降维处理技术。

1.3.1主成分分析法数学模型

简而言之,主成分分析法就是通过数学降维的处理,从多个变量中找出几个具有代表性且不相关的综合变量进行替代的方法。

假设具有n个样本,每个样本具有p个变量,构成一个n×p阶的矩阵:

当p较大的时,在p维空间中考察问题比较麻烦。为了克服这种困难,就需要降维处理,需要几个较少的综合指标代替原来的综合指标。使其尽量多的反映样本信息且彼此独立。现需要建立另一数学模型,fj=αj1x1+αj2x2+…+αjpxp(j=1,2,…,p)。xj=(x1j,x2j,x3j,...)t,(j=1,2,...p)为其组成元素。则构造的模型必须具有:变量之间不具有相关性,即fi,fj(i≠j,i,j=1,2,…,p)互不相关;新变量按照方差依次递减的顺序进行排列且保持变量的整体方差不变,即ak12+ak22+…+akp2=1k=1,2,…p.。第一变量具有最大方差,称为第一主成分,第二变量的方差次大,并且与前一变量不具有相关性,称为第二主成分,依次类推。

fj是p维的正交化变量,且fj之间互不相关且按其方差大小顺序排列。可以看出fj共有p个主成分。设其主成分系数aij构成系数矩阵a。矩阵x=(x1,x2,...,xp),则协方差矩阵为:

σ=(σij)p×p=e[(x-e(x))(x-e(x))t];

新建模型满足f=ax:

则σ必为半正定矩阵,用雅克比方法|λi-a|=0求特征值λi(按从大到小排序)及其特征向量:

由于需要满足||ai||=1,即其中aij表示向量ai的第j个分量。可以证明,λi所对应的正交化特征向量,即为第i个主成分fi所对应的系数向量ai。在选择重要的主成分时,主成分的方差是递减的,代表所含有样本信息量也是递减的,但并没有选择所有的主成分,而是按照其累计贡献率(指某个主成分的方差占全部方差的比重)的大小选取k个主成分来作为抽取样品。

其中贡献率为:贡献率越大代表所含有的信息量越大。

累计贡献率:一般要求累计贡献率达到85%以上,这样才能保证综合变量能包括原始变量的绝大多数信息。

在这里可以理解主成分是原来变量的一种线性组合,结合其系数的定性分析可知,系数的大小因有正负大小相当之分。所以不能理所当然的认为主成分是某个变量的属性作用。根据线性组合中系数绝对值的大小可以给主成分赋予实际意义,比如变量系数大小相当的情况下,则构成的主成分就是几个变量的总和。根据标准化的原始数据可以得到各主成分的得分矩阵为式为:

1.3.2pca在本发明中的应用

在特征值的提取中,三个频段(1hz、10hz、100hz)内经过预处理后的数据有40×3=120个,虽然脉冲法提取后大大减少了特征值的个数,但是直接对120个数据进行样本处理还是有相当大的难度,而且数据里面仍有大量的冗余信息。采用pca主成分分析法,用少数几个主成分值来代替这些特征值。按照主成分分析的计算步骤,首先标准化处理,假设原始数据构成的矩阵为x,它是由行n行p列构成。

标准化处理:

则标准化后的相关系数的计算公式为:

经过主成分分析法的处理可以将其分解问特征值与载荷矩阵的相积。计算其相应的特征值和特征向量,最后得到即x=tl'。根据t的得分矩阵做出图形来判断样品的归类效果图。

1.4dfa判别函数分析

判别分析适用于判断个体所属类别的一种统计方法。根据已知观测对象的分类和若干表明观测对象特征的变量值,建立判别函数和判别准则和判别函数,并使其错判率最小,对于一个未知分类的样本,将所测指标代入判别方程,从而判断它来自哪个总体。这种判别准则在某种意义上是最优的,但是局限于判概率最小或是损失最小的情况下。如果样本的总体均值差异很大,则不是最优选择。

判别分析与聚类分析的区别是,聚类分析预先不知道分类,需要对样品进行分类,是一种纯统计技术。而判别分析是在研究对象分类已知的情况下,根据样本数据推导出一个或一组判别函数,同时制定一种判别准则,用于确定待判样品的所属类别,使判错率最小。

1.4.1判别函数分析分类

从数学模型的角度来看,可以将判别问题描述为:对于n个样品,每个样品有p个指标,已知每个样品属于某一k类别(总体)g1,g2,...,gk,对于每一个类别其分布函数分别为f1(y),f2(y),...,fk(y)。给定一个样品y,需要判断来自于哪个总体。寻求一种最佳的判别方法或函数和建立一种最佳的判别准则的过程就是判别分析解决的主要问题。

判别分析的研究方法很多,根据研究对象的不同把判别分析方法分成不同的种类。目前主要有:

根据判别的组数不同划分,主要有两组判别分析和多组判别分析。

根据用不同的数学模型区分不同的总体划分,主要有线性判别分析和非线性判别分析。

根据判别对变量处理方法的不同有序判别分析和逐步判别分析。

根据判别准则的不同,目前主要成熟的有费歇尔判别(fisher)判别准则、贝叶斯判别准则、马氏距离最小准则、最小平方准则和最大似然准则。

1.4.2线性判别分析(lda)

在本发明采用的判别准则主要是线性判别分析,lineardiscriminantanalysis,lda是由ronaldfisher于1936年首次提出并由belhumeur于1996年引入了人工智能和模式识别领域,线性判别分析是模式识别中的经典算法,是一种快速学习算法(supervisedlearning)。

lda的工作原理从数学建模的角度看,就是利用投影的方法把带有标签的数据点从高维的空间投影到低维空间。要求投影后的点具有最佳矢量空间,即按簇类进行类别区分,使得相同类别的点在投影后具有最小距离,而类别不同型的点在投影后具有最大类间距离。使其投影后具有最佳分离性。即投影后的数据点类间散布矩阵最大而类内散布矩阵最小,是一种非常好的特征抽取方法。

线性判别分析的基本思想是将高维的模式样本投影到最佳鉴别矢量空间,以达到抽取分类信息和压缩特征空间维数的效果。投影后保证模式样本在新的子空间有最大的类间距离和最小的类内距离,即模式在空间中有最佳的可分离性。与距离判别法不同的是,lda判别法对变量的类型及其概率分布形式不需要明确的限定,对数据点构成的空间不进行直接划分,而是寻求一种最佳的投影方式将其从高维空间影射到低维空间进行分类,因此如何选择恰当的投影方式是fisher判别方法的关键所在。

取线性判别函数:

u(x)=atx=a1x1+a2x2+…+apxp;

各总体内离差平方和:

其中

不同总体间离差平方和:

其中

为满足式中各总体内离差平方和(ssr)最小而式中各总体间离差平方和(sse)最大,则需要使最大。判别法则为:若则判x∈ξi。选择方法是使达到某一数值,一般取这数值在0.75~0.95之间。

1.4.3pca和dfa应用区别

本发明中采取了主成分分析法(pca)和判别函数分析(dfa)两种模式识别算法。dfa中常用的方法就是lda,lda在给定训练数据后,将会得到一系列的判别函数。lda的输入数据就像是带了标签一样,具有可预知性,对于以后数据的输入,lda通过前面建立的判别方法就可以进行判断了。而pca具有不可预见性,降低数据的维数并使各自的数据的不具有相关性或减小相关性,即增大他们的方差。

两者都是通过降低维数进行特征提取,但是两者的处理过程不同。当类中的样本数据分布具有某一共同特征(如都服从高斯分布),则此时的lda优于pca。当都不服从时,则此时运用pca就是比较好的选择。两者各自有不同的长处和缺点,在处理具体问题时,需要选择相应的方法或是两者结合的方法是很好的。在设计中,增加了这样的算法组合供操作员选择。

1.5人工神经网络

人工神经网络(artificicalneuralnetworks,ann)是一种模仿生物神经网络的结构和功能的数学模型或计算模型。它主要是由大量的神经元节点相互连接构成,并且能根据外部环境的变化改变内部自身的结构,它经常被用来对输入输出间的关系建模来探索数据的模式,是一种自适应系统。因具有分布式信息存储、良好的自组织学习能力和大规模并行处理等特点而被广泛应用在模式识别和智能控制等多个领域。

bp(backpropagation)神经网络最早是由rumelhart和mccelland课题研究小组于1985年提出来的,误差反向后传bp学习算法是一种有监督的神经网络算法。bp网络是一种按误差逆向传播算法,它无需知道描述大量数据输入/输出信息的映射关系的数学方程,就可以自我学习和存储这些数据。

bp算法的基本原理是利用输出后的误差来估计输出层的直接前导层的误差,然后利用此误差去估计更前一层的误差,如此反复训练一层层的反传,就可以得到其他各层的误差估计。

传统bp算法的步骤总结为:

选定学习的数据,p=1,…,p,随机确定初始权矩阵w(0)

用学习数据计算网络输出

反下式向修正,直到用完所有学习数据。

误差反传算法是一个无约束的非线性最优化计算过程,在bp网络结构较大的情况下,容易出现计算时间长,甚至会陷入局部极小点而得不到最优结果。所以必须对bp网络进行优化,本发明从以下几个方面对其进行了优化:

学习因子优化

根据输出误差大小利用变步长法自动调整学习因子,减少迭代次数和加快收敛速度。h=h+a·(ep(n)-ep(n-1))/ep(n),其中a为调整步长,取值在0~1之间。h为步长因子。

隐层节点数优化

隐层节点数的多少决定了网络性能的好坏,当隐层节点数太少时,网络的容错能力较差;而当隐层节点数太大时,则网络学习时间太长导致不能收敛。利用逐步回归分析对参数的显著性进行检验,并删除一些线形相关的隐节点。其中最佳隐节点计算,当某节点出发指向下一层节点的所有权值和阈值均落在死区中时(死区的范围一般取±0.1、±0.5等区间),则把该节点删除。

l=(m+n)1/2+c;

其中m为输入节点数,n为输出节点数,c为1~10之间的常数。

输入输出神经元的确定

可以利用多元回归分析法对神经网络的输入参数进行处理,将相关性强的输入参数删除,减少输入节点数。

算法优化

采用lm-bp(levenbergmarquardtbackpropagation)神经网络算法,该算法在求解函数的最小应用方面能够加快收敛速度,其采用的方法与牛顿法类似。

其中能量方程为:▽e2(x)=jt(x)j(x)+s(x);

最后解得:δxk=[jt(xk)j(xk)+μi]-1jt(xk)e(xk);

当μ=0时,即为牛顿法,而当μ接近于8时,则是steepestdecent法。steepestdecent法可以使函数收敛较为稳定,但是时间较长,而牛顿法效率高,但是不稳定,所以选择适当的μ值,可以在较短的时间内达到收敛。

综合以上所述,相比现有技术,本发明具有以下优势:

(1)利用多频脉冲法对传感器阵列信号的数值进行有效提取,大大减少了冗余信息,对后面分类定性和定量起指导作用。

(2)有效的数学分析法方法,利用改进的主成分分析法和粗神经网络方法对大曲的重要属性进行分析。从而能够得出决定大曲质量的理化指标。

(3)利用特异性传感器和人工智能的方法对微生物进行定性定量检测。

(4)采用开放式数据库,能够快速的查询、建立、分析不同厂家和企业的大曲质量。

以上所述仅是对本发明的较佳实施例而已,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所做的任何简单修改,等同变化与修饰,均属于本发明技术方案的范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1