一种基于特征差异代谢物的绿豆产地溯源方法与流程

文档序号:34728061发布日期:2023-07-07 22:00阅读:46来源:国知局
一种基于特征差异代谢物的绿豆产地溯源方法与流程

本发明涉及农作物产地溯源领域,具体涉及一种绿豆产地溯源方法。


背景技术:

1、绿豆(vigna radiata l.)是一种豆科、蝶形花亚科豇豆属绿豆的种子,富含膳食蛋白质、必需氨基酸、膳食纤维、维生素和矿物质等营养物质,具有清热解毒、消肿等功效。研究表明,绿豆中还含有类黄酮、酚酸和多糖等活性成分,具有抗菌、消炎、抗氧化、保护神经等功能。迄今为止,我国已经保存了超过5000种绿豆种质资源,绿豆在我国多个省份都有种植,主要产地为河北、山西、安徽、内蒙古、吉林、山东、江苏、陕西、新疆、云南和河南等地。这些产地气候条件、地理条件差异大,各产地绿豆的品质存在明显差异,开展绿豆产地溯源研究对保护各产地绿豆品牌尤为重要,可以预防假冒伪劣产品进入市场,为消费者提供优质的绿豆和绿豆产品。

2、目前已有研究通过结合近红外光谱、拉曼光谱技术与化学计量学,对河北、广东、福建、甘肃等四个不同产区的绿豆进行了分类分析,然而这种方法不能获得绿豆中代谢物的整体轮廓信息。

3、非靶向代谢组学技术可以同时对上千种已知和未知代谢物进行分析,近年来越来越多的研究利用该技术进行食品和农产品产地溯源研究。目前尚未见基于非靶向代谢组学技术进行绿豆产地溯源的相关报道。为了弥补这一空白,本领域仍有必要建立一种基于特征差异代谢物的绿豆产地识别方法。


技术实现思路

1、本发明的目的在于提供一种基于特征差异代谢物的绿豆产地溯源方法,该方法基于非靶向代谢组学分析技术,利用超高效液相色谱-飞行时间质谱采集不同产地绿豆的代谢物数据,通过化学计量学筛选各产地绿豆特征差异代谢物,再利用机器学习分类算法构建绿豆产地溯源分类模型,以实现绿豆产地的精准溯源。

2、为了实现以上目的,本发明采取如下技术方案:

3、本发明的第一方面提供一种基于特征差异代谢物的绿豆产地溯源方法,包括以下步骤:

4、(1)收集不同产地的绿豆样品,分别去除杂质,冻干,研磨至粉末,加入提取液,提取后离心,收集上清液,氮气吹干,复溶后过滤,得到待测样品滤液;

5、(2)采用超高效液相色谱串联飞行时间质谱仪对步骤(1)得到的不同产地绿豆的待测样品滤液进行非靶向代谢组学分析,获得不同绿豆样本的代谢物数据,通过质谱数据分析软件对代谢物数据进行处理;

6、(3)采用正交偏最小二乘判别分析(opls-da)对不同产地绿豆样本的代谢数据进行分析,构建opls-da模型;根据opls-da模型的vip值以及anova的p值筛选出不同产地绿豆的特征差异代谢物,对筛选到的产地特征差异代谢物进行定性鉴别,利用软件进行分子预测,确定筛选出的特征差异代谢物结构;

7、(4)利用筛选出的绿豆特征差异代谢物数据,采取机器学习算法,建立绿豆产地预测模型,实现绿豆产地的精准溯源。

8、优选的,所述步骤(1)中的不同产地选自河北、山西、安徽、内蒙古、吉林、山东、江苏、陕西、新疆、云南和河南中的两种或两种以上。

9、更优选的,所述步骤(1)中的不同产地为河北、山西、安徽、内蒙古、吉林、山东、江苏、陕西、新疆、云南和河南共计11个产地。

10、优选的,所述步骤(1)中使用的提取液和复溶溶液均是体积比为60:40的甲醇/水混合溶剂。

11、优选的,所述步骤(2)中采用超高效液相色谱串联飞行时间质谱仪检测的色谱条件如下:色谱柱为phenomenex kinetex c18色谱柱;流动相a为含0.1%v/v甲酸的水溶液,流动相b为含0.1%v/v甲酸的乙腈溶液;梯度洗脱程序:0-13min,1%b→99%b;13-15min,99%b;15-16min,99%b→1%b;16-20min,1%b;流速为0.3ml/min。

12、优选的,步骤(2)中采用超高效液相色谱串联飞行时间质谱仪检测的质谱条件如下:采用电喷雾电离离子源esi,分别在正离子和负离子模式下采集数据,离子源温度550℃,碰撞能量为35ev,碰撞能量分布为15ev,正离子模式喷雾电压+5500v,负离子模式-4500v。

13、优选的,所述步骤(3)中根据opls-da模型的vip值以及anova的p值,选择vip>1及p<0.05的代谢物作为区分不同产地绿豆的特征差异代谢物。

14、更优选的,所述步骤(3)中选择vip>5及p<0.05的代谢物作为区分不同产地绿豆的特征差异代谢物。

15、进一步优选的,所述步骤(3)中选择vip>10及p<0.05的代谢物作为区分不同产地绿豆的特征差异代谢物。

16、优选的,所述步骤(3)中利用ms-finder软件和peakview软件进行分子预测。

17、优选的,所述步骤(3)中筛选出的特征差异代谢物选自9,10-二羟基十八烯酸,甘油磷酰胆碱,溶血磷脂酰胆碱1(c26h50no7p),溶血磷脂酰胆碱2(c24h50no7p),溶血磷脂酰胆碱3(c26h48no7p),溶血磷脂酰乙醇胺1(c23h44no7p),溶血磷脂酰乙醇胺4(c21h44no7p),溶血磷脂酰肌醇(c27h49o12p),异荭草素,牡荆素,异牡荆素,木犀草素-6-c-葡萄糖苷,吲哚,3-吲哚甲醛,3-吲哚丙烯酸,二氢吲哚,γ-谷氨酰亮氨酸,γ-谷氨酰-s-甲基半胱氨酸,精氨酸,色氨酸,半胱氨酸甲酯,n-乙酰色氨酸,柠檬酸,苹果酸,乌头酸,1-萘基异氰酸酯,1-甲萘胺,腺苷,黄嘌呤核苷,腺苷-3'-磷酸,奥昔嘌醇,胆碱,邻苯二甲酸酐,大豆皂苷ⅰ,四糖(c26h45no20)中的两种或两种以上。

18、更优选的,所述特征差异代谢物包含异牡荆素、3-吲哚丙烯酸、γ-谷氨酰-s-甲基半胱氨酸和柠檬酸。

19、进一步优选的,所述特征差异代谢物包含溶血磷脂酰胆碱1、溶血磷脂酰胆碱2、溶血磷脂酰肌醇、牡荆素、异牡荆素、吲哚、3-吲哚甲醛、3-吲哚丙烯酸、二氢吲哚、γ-谷氨酰-s-甲基半胱氨酸、柠檬酸和邻苯二甲酸酐。

20、进一步优选的,所述特征差异代谢物包含9,10-二羟基十八烯酸,甘油磷酰胆碱,溶血磷脂酰肌醇(c27h49o12p),异荭草素,牡荆素,异牡荆素,木犀草素-6-c-葡萄糖苷,吲哚,3-吲哚甲醛,3-吲哚丙烯酸,二氢吲哚,γ-谷氨酰亮氨酸,γ-谷氨酰-s-甲基半胱氨酸,精氨酸,色氨酸,半胱氨酸甲酯,n-乙酰色氨酸,柠檬酸,苹果酸,乌头酸,1-萘基异氰酸酯,1-甲萘胺,腺苷,黄嘌呤核苷,腺苷-3'-磷酸,奥昔嘌醇,胆碱,邻苯二甲酸酐,大豆皂苷ⅰ和四糖(c26h45no20)。

21、最优选的,所述特征差异代谢物包含9,10-二羟基十八烯酸,甘油磷酰胆碱,溶血磷脂酰胆碱1(c26h50no7p),溶血磷脂酰胆碱2(c24h50no7p),溶血磷脂酰胆碱3(c26h48no7p),溶血磷脂酰乙醇胺1(c23h44no7p),溶血磷脂酰乙醇胺4(c21h44no7p),溶血磷脂酰肌醇(c27h49o12p),异荭草素,牡荆素,异牡荆素,木犀草素-6-c-葡萄糖苷,吲哚,3-吲哚甲醛,3-吲哚丙烯酸,二氢吲哚,γ-谷氨酰亮氨酸,γ-谷氨酰-s-甲基半胱氨酸,精氨酸,色氨酸,半胱氨酸甲酯,n-乙酰色氨酸,柠檬酸,苹果酸,乌头酸,1-萘基异氰酸酯,1-甲萘胺,腺苷,黄嘌呤核苷,腺苷-3'-磷酸,奥昔嘌醇,胆碱,邻苯二甲酸酐,大豆皂苷ⅰ和四糖(c26h45no20)。

22、优选的,所述步骤(4)中的机器学习算法采用的编程语言为r语言,随机森林和支持向量机分别使用r包“randomforest”和“e1071”进行分析,所有绿豆样本被随机拆分成训练集和测试集,用于模型构建、调优和性能评估。

23、优选的,所述步骤(4)中通过建立和优化好的分类模型,随机森林和支持向量机模型的判别准确率均高于90%。

24、更优选的,所述步骤(4)中通过建立和优化好的分类模型,随机森林和支持向量机模型的判别准确率均高于93%。

25、进一步优选的,所述步骤(4)中通过建立和优化好的分类模型,随机森林和支持向量机模型的判别准确率分别高于93%和高于98%。

26、本发明的第二方面提供一种用于绿豆产地溯源的特征差异代谢物组合物,所述特征差异代谢物组合物选自9,10-二羟基十八烯酸,甘油磷酰胆碱,溶血磷脂酰胆碱1(c26h50no7p),溶血磷脂酰胆碱2(c24h50no7p),溶血磷脂酰胆碱3(c26h48no7p),溶血磷脂酰乙醇胺1(c23h44no7p),溶血磷脂酰乙醇胺4(c21h44no7p),溶血磷脂酰肌醇(c27h49o12p),异荭草素,牡荆素,异牡荆素,木犀草素-6-c-葡萄糖苷,吲哚,3-吲哚甲醛,3-吲哚丙烯酸,二氢吲哚,γ-谷氨酰亮氨酸,γ-谷氨酰-s-甲基半胱氨酸,精氨酸,色氨酸,半胱氨酸甲酯,n-乙酰色氨酸,柠檬酸,苹果酸,乌头酸,1-萘基异氰酸酯,1-甲萘胺,腺苷,黄嘌呤核苷,腺苷-3'-磷酸,奥昔嘌醇,胆碱,邻苯二甲酸酐,大豆皂苷ⅰ,四糖(c26h45no20)中的两种或两种以上。

27、更优选的,所述特征差异代谢物组合物包含异牡荆素、3-吲哚丙烯酸、γ-谷氨酰-s-甲基半胱氨酸和柠檬酸。

28、进一步优选的,所述特征差异代谢物组合物包含溶血磷脂酰胆碱1、溶血磷脂酰胆碱2、溶血磷脂酰肌醇、牡荆素、异牡荆素、吲哚、3-吲哚甲醛、3-吲哚丙烯酸、二氢吲哚、γ-谷氨酰-s-甲基半胱氨酸、柠檬酸和邻苯二甲酸酐。

29、进一步优选的,所述特征差异代谢物组合物包含9,10-二羟基十八烯酸,甘油磷酰胆碱,溶血磷脂酰肌醇(c27h49o12p),异荭草素,牡荆素,异牡荆素,木犀草素-6-c-葡萄糖苷,吲哚,3-吲哚甲醛,3-吲哚丙烯酸,二氢吲哚,γ-谷氨酰亮氨酸,γ-谷氨酰-s-甲基半胱氨酸,精氨酸,色氨酸,半胱氨酸甲酯,n-乙酰色氨酸,柠檬酸,苹果酸,乌头酸,1-萘基异氰酸酯,1-甲萘胺,腺苷,黄嘌呤核苷,腺苷-3'-磷酸,奥昔嘌醇,胆碱,邻苯二甲酸酐,大豆皂苷ⅰ和四糖(c26h45no20)。

30、最优选的,所述特征差异代谢物组合物包含9,10-二羟基十八烯酸,甘油磷酰胆碱,溶血磷脂酰胆碱1(c26h50no7p),溶血磷脂酰胆碱2(c24h50no7p),溶血磷脂酰胆碱3(c26h48no7p),溶血磷脂酰乙醇胺1(c23h44no7p),溶血磷脂酰乙醇胺4(c21h44no7p),溶血磷脂酰肌醇(c27h49o12p),异荭草素,牡荆素,异牡荆素,木犀草素-6-c-葡萄糖苷,吲哚,3-吲哚甲醛,3-吲哚丙烯酸,二氢吲哚,γ-谷氨酰亮氨酸,γ-谷氨酰-s-甲基半胱氨酸,精氨酸,色氨酸,半胱氨酸甲酯,n-乙酰色氨酸,柠檬酸,苹果酸,乌头酸,1-萘基异氰酸酯,1-甲萘胺,腺苷,黄嘌呤核苷,腺苷-3'-磷酸,奥昔嘌醇,胆碱,邻苯二甲酸酐,大豆皂苷ⅰ和四糖(c26h45no20)。

31、本发明的第三方面提供一种特征差异代谢物组合物在绿豆产地溯源方面的应用,所述特征差异代谢物组合物选自9,10-二羟基十八烯酸,甘油磷酰胆碱,溶血磷脂酰胆碱1(c26h50no7p),溶血磷脂酰胆碱2(c24h50no7p),溶血磷脂酰胆碱3(c26h48no7p),溶血磷脂酰乙醇胺1(c23h44no7p),溶血磷脂酰乙醇胺4(c21h44no7p),溶血磷脂酰肌醇(c27h49o12p),异荭草素,牡荆素,异牡荆素,木犀草素-6-c-葡萄糖苷,吲哚,3-吲哚甲醛,3-吲哚丙烯酸,二氢吲哚,γ-谷氨酰亮氨酸,γ-谷氨酰-s-甲基半胱氨酸,精氨酸,色氨酸,半胱氨酸甲酯,n-乙酰色氨酸,柠檬酸,苹果酸,乌头酸,1-萘基异氰酸酯,1-甲萘胺,腺苷,黄嘌呤核苷,腺苷-3'-磷酸,奥昔嘌醇,胆碱,邻苯二甲酸酐,大豆皂苷ⅰ,四糖(c26h45no20)中的两种或两种以上。

32、更优选的,所述特征差异代谢物组合物包含异牡荆素、3-吲哚丙烯酸、γ-谷氨酰-s-甲基半胱氨酸和柠檬酸。

33、进一步优选的,所述特征差异代谢物组合物包含溶血磷脂酰胆碱1、溶血磷脂酰胆碱2、溶血磷脂酰肌醇、牡荆素、异牡荆素、吲哚、3-吲哚甲醛、3-吲哚丙烯酸、二氢吲哚、γ-谷氨酰-s-甲基半胱氨酸、柠檬酸和邻苯二甲酸酐。

34、进一步优选的,所述特征差异代谢物组合物包含9,10-二羟基十八烯酸,甘油磷酰胆碱,溶血磷脂酰肌醇(c27h49o12p),异荭草素,牡荆素,异牡荆素,木犀草素-6-c-葡萄糖苷,吲哚,3-吲哚甲醛,3-吲哚丙烯酸,二氢吲哚,γ-谷氨酰亮氨酸,γ-谷氨酰-s-甲基半胱氨酸,精氨酸,色氨酸,半胱氨酸甲酯,n-乙酰色氨酸,柠檬酸,苹果酸,乌头酸,1-萘基异氰酸酯,1-甲萘胺,腺苷,黄嘌呤核苷,腺苷-3'-磷酸,奥昔嘌醇,胆碱,邻苯二甲酸酐,大豆皂苷ⅰ和四糖(c26h45no20)。

35、最优选的,所述特征差异代谢物组合物包含9,10-二羟基十八烯酸,甘油磷酰胆碱,溶血磷脂酰胆碱1(c26h50no7p),溶血磷脂酰胆碱2(c24h50no7p),溶血磷脂酰胆碱3(c26h48no7p),溶血磷脂酰乙醇胺1(c23h44no7p),溶血磷脂酰乙醇胺4(c21h44no7p),溶血磷脂酰肌醇(c27h49o12p),异荭草素,牡荆素,异牡荆素,木犀草素-6-c-葡萄糖苷,吲哚,3-吲哚甲醛,3-吲哚丙烯酸,二氢吲哚,γ-谷氨酰亮氨酸,γ-谷氨酰-s-甲基半胱氨酸,精氨酸,色氨酸,半胱氨酸甲酯,n-乙酰色氨酸,柠檬酸,苹果酸,乌头酸,1-萘基异氰酸酯,1-甲萘胺,腺苷,黄嘌呤核苷,腺苷-3'-磷酸,奥昔嘌醇,胆碱,邻苯二甲酸酐,大豆皂苷ⅰ和四糖(c26h45no20)。

36、本发明的有益效果:

37、本发明提供的基于特征差异代谢物的绿豆产地溯源方法,可以全面获得绿豆代谢物信息,利用正交偏最小二乘判别分析可以筛选不同产地绿豆的特征差异代谢物,基于特征差异代谢物的机器学习分类模型可以实现绿豆产地的精确溯源。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1