木本油料产品掺假和品质评估的近红外光谱及成像检测研究进展

袁伟东,姜洪喆,鞠皓,李兴鹏,周宏平

(南京林业大学 机械电子工程学院,江苏 南京,210037)

民以食为天,粮油品质安全关系着人类的健康和生命安全。我国人均耕地少,随着我国人口不断增多,居民粮油消费需求不断增涨,粮油供给形势依然严峻,因此粮油安全问题一直以来受到我国政府高度重视[1]。我国木本油料种植历史悠久,发展潜力大,且不占用耕地资源,促进我国木本油料产品产业化是一项利国利民的民生工程,是维护我国油料产品品质安全的重要途径[2]。我国木本油料主要以油茶、油橄榄和核桃等种植为主,木本油料产品富含脂肪酸、植物甾醇、生育酚和角鲨烯等多种营养物质,具有提高人体免疫力、延缓衰老等作用[3]。木本油料产品的价格是市场上普通食用油的3~6倍,因此一些非法商家在木本油料产品中掺杂低价、劣质食用油来谋取利润。目前依靠传统的理化检测和仪器分析技术对油料产品掺假鉴别检测和品质评估,如气相色谱法[4]、液相色谱法[5]和核磁共振[6]等,这些检测方法虽然具有较好的检测精度,但具有破坏性、效率低等缺陷,且大量化学试剂的使用对实验人员健康构成一定威胁。近年发展起来的光谱分析技术在快速检测油料产品掺假和品质评估中表现出巨大潜力,比如近红外光谱[7]和高光谱成像技术[8]等。近红外光谱(near-infrared spectroscopy,NIRS)技术由于其成本低、快速和无损等特性,并结合化学计量学方法已广泛应用于食品与农产品种类鉴别和安全指标检测[9-11]。高光谱成像(hyperspectral imaging,HSI)技术优势在于结合光谱信息和图像信息,可提供试验对象的材料化学特性及其空间分布信息。高光谱成像技术的应用代表了传统近红外光谱技术得到了进一步延伸[12]。

近年来,国内外大量文章报道了谷物品质、水果内外部品质和水产品质量等方面的近红外光谱和高光谱成像检测研究进展,但对木本油料产品掺假鉴别和品质评估报道较少。本文着重阐述近红外光谱和高光谱成像技术的应用原理,油料产品掺假鉴别、品质评估的研究现状,分析目前油料产品检测手段的优势和不足,并对今后近红外光谱及成像技术在木本油料产品应用中进行了展望。

1.1 近红外光谱与高光谱成像技术

近红外光谱是一种分子振动光谱,是基频分子振动的倍频与合频。有机物以及部分无机物分子中化学键结合的各种基团的运动(伸缩、振动和弯曲等)都有它固定的振动频率。当分子受到红外线照射时,被激发产生共振,同时光的能量一部分被吸收,通过测量其吸收度,可得到极为复杂的图谱,这种图谱可用于表示被测物质的特征。不同的物质在红外区域有丰富的吸收光谱,每种成分都有特定的吸收特征,这为近红外光谱定性、定量分析提供了理论基础[13]。

高光谱成像技术概念形成于20世纪80年代初,美国宇航局喷气推进实验室和福尼亚州帕萨迪纳市的喷气推进实验室联合开发出航空成像光谱仪,并第一次绘制出高光谱图像[14]。高光谱成像技术是将光谱与二维成像技术有机融合为一体,具有图谱合一、多波段和高分辨率的优势。高光谱图像是三维的,其中二维是图像的空间像素坐标信息,以x,y表示,第三维波长信息以λ表示。一个空间分辨率为x×y像素的图像检测器阵列在波长处获得的光谱数据结构是x×y×λ的三维阵列。

1.2 近红外光谱及成像技术的采集与校正

近红外光谱技术是基于样品所选区域单点检测,而高光谱图像采集有3种方法,如图1所示分别为点扫描、线扫描和区域(平面)扫描[15]。点扫描是逐点(像素)获取图像,常用于显微成像;
线扫描是沿一个轴逐行扫描获取图像,且特别适合用于传送带系统,因此被广泛应用于食品质量和品质检测中[16];平面扫描是一次以单一波长获取整个物体区域的图像,该扫描方法只有在波长数量有限的情况下使用。目前线扫描是应用最为广泛的一种方式。

a-点扫描;
b-线扫描;
c-面扫描图1 高光谱图像采集的3种方式[16]Fig.1 Three approaches to generate hyperspectral image[16]

根据光源和光学单元(镜头、光谱仪和探测器)之间的布置位置,近红外光谱和高光谱成像技术通常以3种模式(漫反射、透射和漫透射)之一进行,如图2所示。检测样品与接收光的不同模式对所采集光谱数据质量有很大的影响,光谱数据中承载着大量的检测样品内外品质、化学和物理成分信息,根据这些信息可以对蔬果和木本油料产品等作物的安全和品质进行无损检测[14,17]。

a-漫反射;
b-透射;
c-漫透射图2 高光谱图像3种采集模式的示意图[14]Fig.2 Schematic representations of the three acquisition modes of hyperspectral images[14]

近红外光谱及成像技术采集的过程中存在仪器的背景光谱响应和相机暗电流的影响,并且不同的采集系统对检测光的敏感程度不同,即使在相同的外界条件下采集同一个样品,采集的光谱信息也会存在差异。因此,需要进行校准来保证提取的光谱信息的可靠性。常借助黑白校正对原始图像数据进行处理,校正方法如公式(1)所示:

(1)

式中:Rnorm是校正后的光谱图像数据;Rraw是原始高光谱图像数据;Rdark是暗图像数据;Rwhite是全白板参考图像数据。

1.3 光谱数据预处理

光谱数据采集过程中还会引入随机误差和噪声,为了消除这些因素的影响,提高光谱数据信噪比,优化增强光谱信息。因此,在建模之前需要对原始光谱进行预处理,从而提高校准模型的稳健性[18]。目前在油品安全与品质方面光谱检测技术中常用到预处理方法包括标准正态变量变换法(standard normal variate transformation,SNV)、多元散射校正法(multiplicative scatter correction,MSC)、SG卷积平滑法(savitzky-Golay Smoothing)和导数法等。标准正态变量变换法和多元散射校正法作用基本相似,主要是消除样品颗粒不均匀导致的光谱散射影响[19]。SG卷积平滑法通常用于去除光谱数据中的随机噪声,提高数据的信噪比和模型的精度[20]。导数法用来减少光谱基线偏移和斜率等附加效应,提高光谱数据的分辨率和灵敏度[21]。一般情况下,需要根据光谱数据的特点和具体应用来选择合适的预处理方法。

1.4 特征波长的选择

经过预处理校正后的全光谱数据仍携带大量的冗余信息,储存空间要求大,运算时间长。在大多数情况下,全光谱范围内仅有少数波长与待测定物质信息有关[22]。某些波长可能具有相同的光谱信息,导致了光谱数据中的共线性问题。因此,有必要提取特征波长,消除冗余信息,从而简化了计算和建模过程,提高检测模型的鲁棒性和准确性。常用的选择特征波长方法包括遗传算法(genetic algorithm,GA)、连续投影算法(succesive projections algorithm,SPA)、随机蛙跳(random frog,RF)、竞争性自适应重加权采样算法(competitive adaptive reweighted sampling,CARS)和主成分分析法(rincipal component analysis,PCA)等。由于光谱数据的复杂性,不同的波长选择算法可能会产生不同的结果。因此,在选择特征波长时往往比较几种不同的算法以获得最佳的一种。如周宏平等[23]利用900~1 700 nm高光谱图像结合化学计量学方法测定油茶籽含油率,采用7种不同的特征变量选择方法,结果显示GA提取波长结合偏最小二乘(partial least squares,PLS)模型性能最好。MARTNEZ等[24]利用高光谱成像技术测定橄榄油样品中的酸度、水分和过氧化物含量,结果显示SPA提取特征波长结合多元线性回归建模预测集相关系数依次为0.93、0.99 和0.99。

1.5 模型的建立与评价

由于光谱数据携带大量冗余信息,因此需要结合化学计量学方法建立分析模型,模型主要为分类判别模型和回归预测模型。分类模型也称定性分析模型,常用的建模方法包括支持向量机(support vector machine,SVM)、线性判别分析(linear discriminant analysis,LDA)和人工神经网络(artificial neural network,ANN)等;
回归预测模型也称定量分析模型,常用的建模方法包括偏最小二乘回归(partial least squares regression,PLSR)、多元线性回归(multivariable linear regression,MLR)和主成分回归(principle component regression,PCR)等。所建的定性、定量分析模型,其性能优异往往借助于真实值和预测值之间的相关系数(R)、决定系数(R2)和均方根误差(RMSE),通常情况下认为预测模型的相关系数和决定系数越接近于1,均方根误差越小,总体模型的预测能力越强,性能越好[25]。如万毅等[26]利用NIRS结合PLSR建立橄榄油中过氧化值、酸价和ΔK预测模型,取得满意的结果预测相关系数均大于0.99。孙通等[27]利用近红外光谱技术结合线性判别分析法建立定性分析模型,对于山茶油掺入2%以上的菜籽油识别准确率达100%。翁欣欣等[28]采用近红外光谱结合化学计量学方法建立PCA-ANN检测橄榄油掺伪定性分析模型,正确率为100%。

2.1 木本油料产品掺假检测

随着我国经济的快速发展和人们的生活物质水平不断地提高,对粮油安全问题更加重视。目前市场上高营养物质的山茶油、橄榄油和核桃油等木本油料产品存在诸多问题,如以次充好、掺杂低价油。对于此类诸多问题,国内外研究人员采用近红外光谱及成像技术对木本油料产品掺假鉴别展开了广泛的研究。

褚璇等[29]采集了山茶油掺入不同质量分数(以1%、5%、10%为梯度)的葵花油近红外吸收光谱(1 000~2 500 nm),通过PCA提取光谱数据前4个主成分结合SVM建立PCA-SVM判别模型,该判别模型的训练集和验证集总体判别准确率达96.38%和94.2%。进一步,采用前四个主成分结合原始光谱提取5个特征波长建立掺假判别模型,其训练集和验证集总体判别准确率达94.2%和92.75%。张菊华等[30]采用近红外透射光谱和近红外透反射光谱技术结合化学计量学法对油茶籽油进行掺假鉴别,基于原始光谱结合判别分析(discriminant analysis,DA)建立分类模型,模型识别准确率均大于92%。WANG等[31]将不同质量分数(5%~25%)的大豆油掺入山茶油中,采用衰减全反射红外光谱和光纤漫反射近红外光谱鉴别山茶油掺假行为,2种方法均取得满意的结果。王传现等[32]采用近红外光谱结合PCA对初榨橄榄油中掺入不同质量分数的芝麻油、大豆油和葵花油进行定性判别,结果显示正确率达100%。

目前市场上存在很多商家在木本油料产品中同时掺入多种食用油来迷惑消费者,一些非法商家甚至在标签中并未说明掺杂成分,因此木本油料产品掺假检测需要一种快速、准确和高效的检测方法,从而满足市场监管部门的需要,可以及时地反映木本油料产品掺假信息,保护广大消费者的权益。温珍才等[33]对油茶籽油掺杂大豆油、菜籽油二元、三元体系掺假行为进行近红外光谱采集分析,结果表明CARS提取特征波长结合PLS建立模型优于SPA-PLS和UVE-PLS模型,CARS-PLS预测模型相关系数分别为0.950、0.928和0.980,说明CARS方法进行波长变量选择效果很好,可以剔除冗余波长变量。YUAN等[34]采用近红外光谱技术分析山茶油中掺入不同质量分数的大豆油和玉米油二元、三元体系的掺伪行为,结果显示NIRS结合PLSR建模校正相关系数R均超过0.99。莫欣欣等[35]利用近红外光谱(350~1 800 nm)采集了油茶籽油中掺入不同质量分数的菜籽油和花生油三元体系图像数据,基于3种不同的最优波段比较了PCR、PLSR和最小二乘支持向量机(least square support vector machine,LS-SVM)3种不同的建模方法,结果显示MSC处理光谱数据结合LS-SVM为最优模型,其预测模型的相关系数均超过0.96。翁欣欣等[28]将芝麻油、葵花油和大豆油按不同质量分数掺入初榨橄榄油中,采用近红外光谱技术结合PLS建立橄榄油掺假定性检测模型,并取得满意的结果。彭星星等[36]利用近红外光谱技术对核桃油中掺入菜籽油、玉米油和大豆油的四元掺假体系进行定量分析,所建PLS定量分析预测模型的相关系数均大于0.99。通过国内外大量研究表明,近红外光谱技术结合化学计量学方法可以准确、快速和高效地检测出多元体系木本油料产品掺假行为。

为了模型性能更加稳定、准确和可靠,近年来很多学者比较多种算法提取特征波长,并建立定量、定性分析模型。郭文川等[37]采用833~2 500 nm红外光谱技术结合化学计量学方法对油茶籽油掺入玉米油、花生油、菜籽油和大豆油进行分类识别,采用SPA、UVE和CARS对预处理后的光谱信息进行特征波长选择,分别建立SVM和RF判别模型,结果显示SPA提取波长结合RF建模判别准确率达99.34%。庄小丽等[38]将纯橄揽油中掺入不同质量分数的菜籽油、玉米油和花生油等低价食用油,对近红外光谱数据进行最佳波长选择,基于最佳波长建立PLS定量分析模型,结果显示该模型具有良好的预测性能,预测相对误差范围在-5.67%~5.61%。进一步地利用判别分析法建立定性分析模型,将所有样品分为普通橄榄油和特级初榨橄榄油,正确率达100%。LI等[39]利用近红外光谱采集了115份山茶油样品,基于4种评估方式对样本数据进行鉴定,并通过平滑、一阶导数和自动缩放组合预处理,4种判别模型准确率均达到98.3%。原姣姣等[40]采用近红外透射光谱技术获取茶油籽油掺入不同质量分数(0%~50%)的大豆油光谱数据,比较不同预处理方法和建模方法,发现二阶导数+平滑处理结合PLSR为最佳定量分析模型,校正相关系数为0.999 9,校正标准差为0.057 7;
经外部验证NITS预测值和15份验证集之间存在良好的线性关系,R2为0.998。孙通等[41]利用近红外光谱技术对山茶油掺假进行检测,比较了SPA、UVE和CARS 3种不同的变量选择对模型的影响,结果显示经SPA筛选变量后结合PLS-LDA为最优建模方法,预测集样本准确率为100%。

检测限(limit of detection,LOD)是指某一分析方法在可靠程度内从样品中检测出待测物质的最小浓度,LOD值是评价近红外光谱及成像技术结合化学计量学方法所建模型的灵敏度[42]。韩建勋等[43]利用傅里叶变换近红外光谱采集722~1 464 nm山茶油掺杂不同质量分数的大豆油、菜籽油和玉米油光谱数据,并结合PLSR建立山茶油掺假检测定量分析模型,其校正集和预测集的相关系数均能达到0.99,最低LOD达1%。郭文川等[37]对油茶籽油掺入玉米油、花生油、菜籽油和大豆油的近红外光谱数据进行分析,研究发现SVM的灵敏度较高,LOD为3%。许朋[44]采用近红外光谱结合化学计量学对山茶油掺杂菜籽油、大豆油和花生油的二元、三元体系进行定性分析,建立MSC-PLS和MSC-SVM定性分析模型,发现各模型判别效果非常好,预测准确率均大于97%,对于山茶油掺假质量分数在5%~50%模型判别率高达100%。贡东军等[45]对橄榄油中掺入玉米油的样品进行近红外光谱检测,对近红外光谱数据进行一阶导数和平滑处理,并采用PCA对光谱数据特征波长选择,基于特征波长结合PLS建立玉米油相对含量的定量分析模型,LOD为0.5%。目前市场上商家为了谋取更大的利益,一般掺杂比例均高于5%。表1总结了近红外光谱在木本油料产品掺假检测中的应用。

综上所述,面对市场上木本油料产品掺入不同质量分数、多元体系的劣质油,近红外光谱技术识别木本油料产品掺假准确率较高,且具有高效、无损、环保等特点,在无损检测技术中表现出巨大的潜力。但大量的试验样品是基于研究者模拟掺假,试验样品掺假过程相较于市场上油料产品掺假行为较为简单,难以满足实际应用中的复杂油料产品掺假检测。试验样品制备是否具有代表性,这关系到近红外光谱及成像技术能否实际应用于木本油料产品掺假无损检测,有望成为下一阶段的研究重点。

表1 近红外光谱在木本油料产品掺假检测中的应用Table 1 Application of near-infrared spectroscopy in adulteration detection of woody oil products

2.2 木本油料产品品质评估

木本油料产品富含多种脂肪酸、油酸、维生素、亚油酸和角鲨烯等营养成分,这些营养成分对人体具有良好的保健功能。由于木本油料产品价格相对昂贵,市场上很多商家常掺入低价食用油、以次充好来降低成本,谋取更多的利润,这些低价或劣质的食用油在色泽、脂肪酸组成等方面与油料产品非常接近,但营养成分相差巨大。这不仅对消费者的健康造成一定的威胁,还增加粮油监管部门的负担。因此,建立准确、实用的木本食用植物油特征品质安全快速鉴别技术,促进木本食用植物油品质安全鉴别体系规范化、标准化,是国民健康安全和执行市场监管部门法律的重要保障。

郝勇等[46]将不同质量分数的棕榈油和菜籽油掺入山茶油中,利用近红外光谱技术测定混合油中的油酸和亚油酸相对含量,结果显示变量组合集群分析进行特征波长选择优选结合PLSR建立油酸和亚油酸定量分析模型精度最高,其亚油酸和油酸预测集相关系数分为别0.982和0.981。蒋琦等[47]采用近红外光谱结合PLS测定山茶籽油的碘值、酸价和过氧化值相对含量,结果显示一阶导数+平滑进行光谱预处理结合PLS所得的模型效果最佳,模型预测集的相关系数分别为0.999 2、0.997 7和0.996 9。张菊华等[48]采用近红外透反射光谱采集97个油茶籽油样品,结合PLS建立油茶籽油的油酸、饱和脂肪酸和亚油酸相对含量的校正模型,预测集相关系数分别为0.999、0.996和0.999。进一步地,张菊华等[49]采用近红外透反射光谱采集114个油茶籽油样品,利用CARS提取波长结合PLS建立油茶籽油中棕榈酸、硬脂酸、油酸、亚油酸及亚麻酸5种脂肪酸相对含量的预测模型,其中棕榈酸、硬脂酸、油酸和亚油酸模型效果较好,预测集相关系数分为别0.936、0.968、0.986和1。ARMENTA等[50]采用近红外光谱技术测定食用油中酸度和过氧化值的相对含量,光谱信息经预处理(一阶导数、归一化和标准正态变量变换等)后结合PLSR建立定量分析模型。结果显示橄榄油酸度模型效果较好,预测集相关系数R为0.971 2,但是预测橄榄油的过氧化值效果并不理想,相关系数R仅为0.655 8。NOGALES-BUENO等[51]采用高光谱成像技术对核桃中的总脂肪酸和脂肪酸含量进行测定,预测样本饱和脂肪酸、单不饱和脂肪酸和多不饱和脂肪酸的平均值分别为9.52%、14.23%和76.22%,这些值非常接近通过化学分析法获得的值(分别为9.40%、14.43%和76.16%)。廖敦军[52]采用高光谱成像技术测定油茶籽油脂肪酸中油酸、亚油酸和棕榈酸相对含量,图谱信息结合径向基神经网络(radial basis function,RBF)建模交叉验证相关系数依次为0.940 9、0.902 2和0.859 8。表2总结了近红外光谱及成像技术在木本油料产品品质检测中的应用。基于上述研究对光谱范围内的特征波长、特征波段进行归属分析发现,其均与木本油料产品中主要理化指标或官能团的运动(伸缩、振动、弯曲)有关。表3总结了近红外光谱及成像技术在木本油料产品掺假和品质检测中光谱范围内特征吸收峰归属。

由于木本油料产品的营养价值远高于普通食用油,以次充好现象层出不穷,而木本油料产品调和用油在色泽、脂肪酸组成和理化性质方面非常相近,面对木本油料产品的油酸、脂肪酸等质量指标检测,利用传统化学方法难以实现高效、快速、无损品质检测,基于上述研究表明近红外光谱及成像技术的快速检测是可行的。

表2 近红外光谱及成像技术在木本油料产品品质检测中的应用Table 2 Application of near-infrared spectroscopy and imaging technology in quality detection of wood oil products

表3 近红外光谱及成像技术在木本油料产品掺假和品质检测中光谱范围内特征吸收峰归属Table 3 Attribution of characteristic absorption peaks in the spectral range of near-infrared spectroscopy and imaging techniques for adulteration and quality detection of woody oilseed products

面对木本油料产品市场掺杂掺假、以次充好现象,大量研究表明基于近红外光谱和高光谱成像技术的快速、无损检测是可行的,且识别准确率较高,但是用于油料产品检测商业化还需进一步优化。基于目前研究存在较多问题主要体现在:(1)采集检测样本量较少会致使建立的模型不够稳定,个别存在欠拟合或过拟合现象;
(2)大量的试验研究基于研究者模拟掺假,且掺假过程相对简单,而企业在高品质木本油料产品中掺入低价油、劣质油过程较为复杂,代表性较差;
(3)现阶段研究开发出的近红外光谱及成像技术检测指标过于单一,不能满足实际应用中的多指标快速检测;
(4)从国内外报道上发现基于高光谱成像技术检测油料产品研究较少,主要归因于高光谱图像信息冗余复杂处理缓慢,且油品近乎于均质,获取各点光谱信息不是十分必要。因此,须以上述问题为主要研究线索,致力使近红外光谱及成像技术快速、便捷、可靠和高效应用于木本油料产品掺假检测与品质评估。

由于近红外光谱及成像技术具有快速、无损和准确等特点,必将成为应用于食品与农产品无损检测最具有发展前景的分析技术之一。对于食品与农产品无损检测中出现的问题,以木本油料产品为研究对象,基于目前的发展趋势,未来近红外光谱及成像技术结合化学计量学方法检测木本油料产品掺假检测与品质评估可以从下面几个方面深入研究:(1)近红外光谱及成像技术可结合深度学习等算法,开发出具有高稳定性的光谱数据处理方法,进一步提高检测精度;
(2)重点研究光谱数据的分析方法,面对冗余复杂光谱数据开发出新的预处理方法、选择特征变量和建模方法,从而得到准确、易操作的木本油料产品最优建模方法;
(3)增加检测样本的多样性(从油料作物的产地和年份),有助于提高模型的稳定性和鲁棒性;
(4)研发出配套的大型设备或者小型便携设备,加快健全近红外光谱及成像技术在木本油料产品检测方面标准化、规范化和体系化。

猜你喜欢 木本油料波长光谱 基于三维Saab变换的高光谱图像压缩方法北京航空航天大学学报(2022年8期)2022-08-31高光谱遥感成像技术的发展与展望空间科学学报(2021年1期)2021-05-22衢江区成立木本油料产业协会浙江林业(2020年8期)2020-09-21湖南省林科院“南方木本油料利用科学国家林业局重点实验室”通过审批林业与生态(2018年4期)2018-05-14基于频域分析方法的轨道高低不平顺敏感波长的研究中南大学学报(自然科学版)(2016年2期)2017-01-19我国木本油料家族再添新成员绿色中国(2016年11期)2017-01-07日本研发出可完全覆盖可见光波长的LED光源中国照明(2016年4期)2016-05-17星载近红外高光谱CO2遥感进展中国光学(2015年5期)2015-12-09RP—HPLC波长切换法同时测定坤泰胶囊中6个成分的含量中国当代医药(2015年26期)2015-03-012020年建成800个木本油料重点县现代企业(2015年1期)2015-02-28

推荐访问:掺假 木本 研究进展