本发明涉及生物医学检测,具体涉及一种机器学习辅助的纸基芯片制备方法。
背景技术:
1、在生物检测领域,纸基芯片作为一种基于纸基材料的微型化检测工具,凭借其便携性、低成本、操作简便及可实现即时检测(poct)的显著优势,已成为临床诊断、食品安全监测、环境检测等领域的重要技术载体。例如,针对血红蛋白检测场景,此类试纸条通过在纸基材料上构建特异性识别反应区域,利用血红蛋白与检测试剂的显色反应,能够快速定量或定性分析样本中的血红蛋白含量,在贫血筛查、术中失血监测、妊娠相关贫血评估、牙周炎筛查、消化道疾病筛查等医疗场景中具有不可替代的应用价值。其独特的纸基结构不仅为化学反应提供了天然的多孔载体,便于样本的渗透与扩散,还可通过简单的剪裁与功能区域划分,实现多指标并行检测,契合现代医疗对高效、精准检测的需求。
2、目前,检测样品中血红蛋白浓度的试纸条常规包含特异性抗体(如抗血红蛋白单克隆抗体)、标记物(如胶体金、荧光微球)、显色剂(如四甲基联苯胺)及反应体系。如现有技术 cn111487420a公布了一种人血红蛋白的胶体金试纸条及其制备方法和用途,在所述试纸条上,从加样端开始依次形成有样本垫、金结合物垫、反应膜和吸收垫,所述金结合物垫含有第一鼠抗人血红蛋白单克隆抗体fit-mab 1,所述反应膜上还有第二鼠抗人血红蛋白单克隆抗体fit-mab 2。本技术制备的人血红蛋白胶体金试纸条,除了可以在医院完成常规检测外,还可以带至家中自行完成检测,可以准确定量,量化了样本检测指标,避免了人工判读的主观性,具有方便、有效的特点,更加适用于对下消化道出血性疾病及结直肠癌的临床诊断和疗效观察,降低癌症死亡率,提高人们生活质量。然而,现有技术仍然存在如下技术问题:(1)检测试剂包括多种抗体和胶体金,其制备成本较高;(2)试纸条结构比较复杂,多个结构层组合才能达到效果,其结构的设计和组合均会影响检测进行。
3、鉴于此,研发一款结构简单、成本低的机器学习辅助的纸基芯片制备方法,不仅有效弥补现有技术的不足,且还能快速、有效的对样本中的血红蛋白进行检测,对辅助筛查相关疾病具有重要意义。
技术实现思路
1、本发明意在提供一种机器学习辅助的纸基芯片制备方法,以解决现有检测血红蛋白的试纸条结构复杂、所用试剂成本高的技术问题。
2、为达到上述目的,本发明采用如下技术方案:一种机器学习辅助的纸基芯片制备方法,所述纸基芯片为纸基在由tmb、dip和缓冲体系组成的混合溶液中浸泡后烘干而成;包括如下步骤:
3、步骤一、优化缓冲体系:配置乙酸-乙酸钠缓冲体系的梯度ph溶液,加入唾液血红蛋白反应后测量吸光度值,得到优化后的缓冲体系ph;
4、步骤二、优化tmb与dip浓度:配置梯度tmb溶液和梯度dip溶液,调整溶液ph为步骤一中优化后的缓冲体系ph,加入唾液血红蛋白反应后测量吸光度值,得到优化后的tmb浓度和dip浓度;
5、步骤三、获得纸基芯片:根据检测需要绘制试纸芯片图形,切割试纸得到纸基,并将步骤一和步骤二中优化所得混合溶液固定到纸基上,获得纸基芯片;
6、步骤四、建立机器学习模型:建立计算机视觉分析模块,用于对试纸的检测结果进行图像分析;建立反向传播神经网络模型,对数据集进行训练和预测,并建立遗传算法模型,进行迭代寻优,获得纸基芯片的优化体系。
7、优选的,作为一种改进,所述缓冲体系中乙酸的浓度为0.05~0.15 m;乙酸钠的浓度为0.01~0.05 m;乙酸与乙酸盐的摩尔比为2:1~5:1,缓冲体系的ph值为3.5~4.5。
8、优选的,作为一种改进,所述混合溶液中dip的浓度为25~35mm、tmb的浓度为30~37.5mm。
9、优选的,作为一种改进,在步骤四中,建立计算机视觉分析模块,包括利用python建立计算机视觉分析模块,用于对试纸检测结果进行图像分析,步骤如下:
10、s101.利用python建立计算机视觉分析模块,模块的脚本从文件中遍历所有指定格式的图像文件,并读取为 opencv 的图像格式bgr;
11、s102.进行颜色空间转换和颜色检测,将图像从 bgr 转换为 hsv,设置颜色阈值,找到图像中符合该颜色范围的区域,并生成掩码;使用形态学操作去除小的噪声点,保留较大的目标区域;然后进行轮廓检测和定位标记识别,在原始图像上绘制红色矩形框凸显roi 区域;
12、s103.进行特征提取和结果存储,对于每个定位标记的 roi 区域,提取平均颜色值hsv、hls 和 bgr;将数据存储到字典中,将所有结果整理为表格,保存处理后的图像到指定输出文件夹,将特征值表格保存为 excel 文件,方便后续分析和可视化。
13、优选的,作为一种改进,在步骤四中,建立bp神经网络模型,包括利用matlabr2023b建立反向传播神经网络模型,对数据集进行训练和预测,步骤如下:
14、s201.利用matlab r2023b建立反向传播神经网络模型,在 matlab r2023b 中,使用 xlsread 提取数据;通过 randperm 随机划分数据,80% 为训练集,剩余20%为测试集;利用 mapminmax 对训练数据归一化,范围设为[-1,1];
15、s202.构建 bpnn,输入层与输出层节点基于数据列数设定,隐藏层设为 8~10;使用 newff,输入层和隐藏层用 tansig,隐藏层和输出层用 purelin,训练函数选 trainlm;参数配置如下:训练 1500~2000 次,学习率 0.01~0.05,目标误差 1e−5~1e−4,动量因子0.01,最小梯度 1e−6~1e−5,最高失败次数为6~10;
16、s203.以归一化训练数据训练网络,用 sim 预测测试集归一化输入;预测结果反归一化后,计算 mae、mse、rmse、mape 和 r2性能指标,并绘制对比图和误差图;bpnn 模型训练完成,保存网络、输入输出归一化参数,为后续预测提供支持。
17、优选的,作为一种改进,在步骤四中,建立遗传算法模型,包括利用matlab r2023b建立遗传算法模型,进行迭代寻优,步骤如下:
18、s301. 利用matlab r2023b建立遗传算法(genetic algorithm , ga),进行迭代寻优,将训练好的 bpnn 模型作为遗传算法的适应度函数,在遗传算法中,每个个体代表一组参数或输入变量,通过 bpnn 模型预测这些参数对应的输出值,从而计算其适应度;
19、s302. 初始化 ga 参数,包括进化代数、种群规模、交叉概率和变异概率;设定变量的编码长度和取值范围,初始化种群,并计算每个个体的适应度值,找到初始种群中适应度最佳的个体及其适应度值,记录平均适应度和最佳适应度;
20、s303. 重复s302中这一过程,通过多代的进化,种群中的个体逐渐向最优解靠近,从而输出最优纸基参数,获得纸基芯片的优化体系,包括浸泡纸基芯片所用混合溶液中试剂组成及用量。
21、优选的,作为一种改进,在步骤三中,向纸基上固定优化混合溶液时选用浸泡法,步骤如下:将纸基浸泡在由tmb溶液、dip溶液和缓冲体系组成的混合溶液中浸泡1~2min后,取出平铺在玻璃板上,以无纺布封装后放入烘箱中50~60℃干燥5~10min,并将其贴在pvc胶板上,获得纸基芯片。
22、优选的,作为一种改进,在步骤三中,切割试纸采用激光雕刻机完成,切割时激光雕刻机的参数设置为速度500~800mm/s,频率10~30khz,功率40~70%。
23、优选的,作为一种改进,本方案提供一种血红蛋白检测试纸在检测唾液中血红蛋白的应用,血红蛋白检测试纸采用上述方法制备而成,应用包括如下步骤:
24、步骤(一)、标准曲线的建立:将人标准血红蛋白用人工唾液配置为含有不同标准血红蛋白浓度的梯度样本溶液,将梯度样本溶液加入到纸基芯片上进行反应,拍照记录不同梯度样本溶液的显色照片;将显色照片输入计算机视觉分析模块,获得显色区域的rgb值与显色距离,并分别做出标准血红蛋白浓度和颜色强度、显色距离的线性关系图及对应的线性方程式;
25、步骤(二)、临床样本检测:在同等条件下,将待测样本加入到纸基芯片上进行反应,拍照记录其显色照片,输入计算机视觉分析模块,获得显色区域的rgb值与显色距离,根据步骤一所得线性方程式,计算得到待测样本中的血红蛋白浓度。
26、优选的,作为一种改进,在步骤(一)中,血红蛋白浓度和颜色强度、显色距离的线性方程式如下:
27、颜色强度 = -40.826 chb+ 192.929(1);
28、式(1)中 chb为血红蛋白浓度,取值范围为1.6~200 μg/ml,r2= 0.998;
29、显色距离 = 0.133 chb+ 10.782(2);
30、式(2)中 chb为血红蛋白浓度,取值范围为3~200 μg/ml , r2= 0.972;
31、显色距离 = 0.110 chb+ 33.752(3);
32、式(3)中 chb为血红蛋白浓度,取值范围为200~2000 μg/ml , r2= 0.992。
33、本方案的原理是:
34、本方案通过在纸基芯片中浸润tmb和dip,tmb(3,3',5,5'-四甲基联苯胺)和dip(二异丙基过氧化氢)两种物质组合后,在血红蛋白存在条件下反应显色,根据显色后试纸的颜色强度、显色距离,有效指示待测样本中血红蛋白的含量。其中,tmb(3,3',5,5'-四甲基联苯胺)和dip(二异丙基过氧化氢)与血红蛋白的显色原理如图1所示:血红蛋白(hb)中的亚铁血红素基团具有类似过氧化物酶的活性,可催化3,5-二异丙苯过氧化氢(dip)分解,生羟基自由基(·oh),从而将无色的3,3',5,5'-四甲基联苯胺(tmb)催化成氧化的3,3',5,5'-四甲基联苯胺(oxtmb),从而显蓝色。再根据计算机精确计算显色深浅和显色距离,即可获得待测样本中血红蛋白的浓度。
35、本方案的优点是:
36、1、创新融合:本发明将机器学习技术与纸基检测相结合,通过计算机视觉分析模块、bp 神经网络模型和遗传算法的联合优化策略,实现了对涉及样本中血红蛋白含量的早期检测试纸参数的精准优化,提高了检测性能。且整个过程和所用试剂相比于现有技术具有更低的成本和更高的性价比,便于推广应用于涉及血红蛋白检测的相关疾病的早期辅助诊断。
37、2、双信号输出:采用比色和流距双信号输出方法,通过计算机视觉分析模块提取颜色强度和显色距离两个特征信息,相较于单一信号输出,更全面地反映了样本中血红蛋白的含量,显著提高了检测的准确性和可靠性。
38、3、减少人工干预:本发明的方法通过自动化和智能化的优化过程,显著减少了人工干预的需求。研究人员无需手动调整和优化每个因素,节省了大量时间和成本,提高了实验效率,降低了人为误差的可能性,提升准确性。
39、4、简化流程:纸基芯片的制备和检测过程简单,无需复杂的仪器设备和繁琐的操作步骤,降低了检测成本和操作难度,便于在基层医疗机构和家庭环境中推广应用,提高了样本中血红蛋白含量的早期检测的可及性。
40、5、促进发展:本发明将机器学习与纸基检测技术相结合,为相关领域的技术创新和发展提供了新的方向和思路,有望推动更多基于机器学习的纸基检测方法和产品的研发,进一步拓展纸基检测技术的应用领域。