网站导航

新闻资讯

当前位置:主页 > 新闻资讯 >
《食品科学》:江南大学许正宏教授等:基于GC-MS指纹图谱和XGBoost机器学习的泸型基酒贮存时间鉴别
时间:2023-08-29 03:22 点击次数:115

  国外葡萄酒、白兰地、威士忌等酒类产品的等级概念与年份酒密不可分,20世纪末,白酒中开始出现“年份酒”的概念。白酒酿造技术多元化,但一般的流程可以概括为3 个基本步骤:发酵、蒸馏和陈酿,陈酿是白酒品质提升的重要环节之一。白酒价格与贮存时间的关系逐渐密切,其年份鉴定对于保障消费者和酒企权益、维持市场健康发展、促进白酒科学研究均具有重要价值。

  白酒是蒸馏酒,绝大多数物质为挥发性化合物,因此,目前挥发性化合物仍然是白酒物质基础解析的重要对象,主要采用气相色谱-质谱(GC-MS)联用技术及其相关高配升级设备进行分析,具有信息量大、特异性好、进样量少、定性定量准确、适应范围广等优点。其前处理方法包括直接进样、液液萃取、固相微萃取、搅拌棒吸附萃取、同时蒸馏萃取、静态顶空等,各有优劣。其中顶空固相微萃取(HSSPME)技术,操作简便、处理速度快,有利于白酒鉴定技术的推广,因此本研究以其为数据采集方法。

  江南大学生物工程学院的刘青茹、许正宏*等采用HS-SPME-GC-MS技术采集白酒挥发性指纹图谱,联合极端随机森林(Extra-Trees)的变量重要性排序、sklearn特征选择模块中的单变量线性回归测试(F_regression)以及连续目标变量的互信息(mutual_info_regression),寻找合适的时间指示化合物,通过XGBoost算法建立回归模型对白酒贮存时间进行预测,旨在为白酒乃至其他乙醇类饮料的贮存时间预测提供新思路。

  采用GC-MS法进行白酒样品测定,总离子流图如图4所示。经过定性去噪后贮存2 a的白酒基酒中共分离鉴定得到98种挥发性化合物(图5),其中醇类物质6种、醛类物质9种、酸类物质7种、酯类物质68种、酮类物质3种、其他物质5种,在这些化合物中酯类物质数量最多(约70%),这一结果与前人的研究一致。化合物相对含量变化存在非简单线性增减的规律,且变化不显著的噪音物质较多,因此,特征筛选和机器学习对贮存时间判别十分重要。

  根据Extra-Trees重要性评估结果(图6a)可以看出,油酸乙酯是最重要的特征变量,其次是2,6-二叔丁基-4-甲基苯酚和亚油酸乙酯,这一结果与本实验室前期研究发现的时间指示性化合物吻合。根据F_regression结果(图6b)可以看出,油酸乙酯是筛选到的最关键特征,其次是亚油酸乙酯和2-十五烷酮,进一步证实了油酸乙酯作为时间指示性化合物的有效性。mutual_info_regression结果(图6c)可以看出,己酸-2-苯乙酯被认为是最重要的化合物,这一物质也是前期筛选到的时间指示性化合物之一,其次是乙酸辛酯和己酸异戊酯。

  取每种方法前25~80种特征变量的交集,采用10折交叉验证评估所建模型的拟合程度。从图7a可以看出,最有效的建模特征为3种筛选方法前59 个特征中共有的特征。将3种方法的前59 个特征变量进行Venn分析可得到共性化合物32种(图7b、表2),其被认为是最有效的建模特征,以此特征变量交集建立最终的XGBoost分类预测模型。该32种特征化合物列表和在3种筛选方法的最终得分如表2所示。

  对于使用32种特征化合物建立的回归模型,采用MSE和R2值评估模型性能,结果如图8所示,模型R2可达到0.987,MSE为1.044,该结果说明该模型稳定可靠,具有预测白酒贮存时间的能力。

  采用HS-SPME-GC-MS技术分离鉴定白酒基酒的挥发性指纹图谱,70 个不同贮存时间的基酒共鉴定出98种挥发性成分,其中醇类6种、醛类9种、酸类7种、酯类68种、酮类3种、其他类5种。基于XGBoost算法,联合Extra-Trees、F_regression、mutual_info_regression 3种特征值筛选手段,最终采用以油酸乙酯为首的32种特征化合物作为建模变量,建立回归模型对白酒贮存时间进行临时性鉴别,模型的R2评估结果为0.987,表明该模型可靠,为白酒酒龄的判断提供了新思路。

  许正宏,江南大学教授、博士生导师,现任生物工程学院院长,荣获国家级特支计划中青年领军人才、科技部中青年科技创新领军人才、江苏省有突出贡献中青年专家、江苏省五一劳动奖章等荣誉称号。长期从事发酵食品微生物和现代发酵工程方向的前沿研究,以现代分子生态学技术解析复杂微生物发酵体系的结构、功能,并实现其优化调控,培养毕业研究生/博士后近200名。先后主持或参与完成了包括国家重点研发计划、国家自然基金、科技部863重大项目课题、宁夏东西部科技合作重大项目、江苏省重大成果转化等在内的国家、省部级及企业委托科研项目30余项;联合发表论文200余篇,其中SCI收录论文120余篇,授权国际PCT及国家发明专利119项;受聘为中国生物工程学会理事,中国科学院天津工业生物技术研究所学术委员会委员,中国生物工程学会糖生物工程专业委员会委员,中国微生物学会分子微生物学与生物工程委员会委员、酿造分委会委员,中国调味品协会感官评价专业委员会主任委员、科学技术委员会副主任委员、标准化委员会委员等;担任Food Microbiology、Frontiers in Microbiology、Systems Microbiology and Biomanufacturing期刊编委;主编或参编《Green Biocatalysis》、《食醋酿造原理与技术》等国内外专著或教材5部;获得江苏科学技术奖一等奖、天津市科学技术进步特等奖、教育部技术发明二等奖、中国轻工业联合会科技进步一等奖、江苏省生物技术科技创新奖等在内的省部级或行业协会奖励12项。

  刘青茹,助理研究员,江南大学生物工程学院发酵工程专业2019级博士研究生,导师为许正宏教授,指导老师为张晓娟教授。杭州市“131”中青年人才(第三层次),初级茶园管理师,中级评茶员,高级茶艺师。从事茶、白酒、果汁等饮品的生产加工、品质监控及标准化生产体系构建的相关研究。博士课题方向:白酒年份鉴定及陈酿机制解析。参与科研项目10余项,例如浙江省“三农六方”科技协作项目《富硒茶生产技术研究与示范》,浙江省科技特派员项目《樟溪绿茶标准化加工与示范》,杭州市科研院所专项补助资金项目《桑茶资源活性物质研究及产业化加工技术开发》等。在国内外学术期刊上发表论文20余篇,申请发明专利9项(授权2项)。

  本文《基于GC-MS指纹图谱和XGBoost机器学习的泸型基酒贮存时间鉴别》来源于《食品科学》2022年43卷24期310-317页,作者:刘青茹,孟连君,张晓娟,翟伟绩,柴丽娟,陆震鸣,许泓瑜,王松涛,张宿义,沈才洪,史劲松,许正宏。DOI:10.7506/spkx1129-354。点击下方阅读原文即可查看文章相关信息。

  Food Science of Animal Products(ISSN: 2958-4124, e-ISSN : 2958-3780)是一本国际同行评议、开放获取的期刊,由北京食品科学研究院、中国肉类食品综合研究中心主办,中国食品杂志社《食品科学》编辑团队运营,属于食品科学与技术学科,旨在报道动物源食品领域最新研究成果,涉及肉、水产、乳、蛋、动物内脏、食用昆虫等原料,研究内容包括食物原料品质、加工特性,营养成分、活性物质与人类健康的关系,产品风味及感官特性,加工或烹饪中有害物质的控制,产品保鲜、贮藏与包装,微生物及发酵,非法药物残留及食品安全检测,真实性鉴别,细胞培育肉,法规标准等。

如果您有任何问题,请跟我们联系!

联系我们

Copyright © 2028 门徒娱乐注册 TXT地图 HTML地图 XML地图