運(yùn)用高光譜成像和多變量分析實(shí)現(xiàn)藏茶高效質(zhì)量檢測與分級
應(yīng)用方向:
該論文在高光譜成像技術(shù)(HSI)上的應(yīng)用方向主要集中在茶葉質(zhì)量的非破壞性檢測與評估。通過結(jié)合高光譜成像和化學(xué)計(jì)量學(xué)方法,研究實(shí)現(xiàn)了對藏茶中關(guān)鍵質(zhì)量參數(shù)(如總酚類物質(zhì)(TPs)和游離氨基酸(FAAs))的快速、精準(zhǔn)預(yù)測和分級研究。該研究能推動(dòng)藏茶質(zhì)量控制和標(biāo)準(zhǔn)化管理,提高了產(chǎn)業(yè)效率,并為其他食品領(lǐng)域提供了新的非破壞性檢測思路。
背景:
隨著藏茶產(chǎn)業(yè)的逐步發(fā)展,準(zhǔn)確、快速地評估其質(zhì)量成為了一個(gè)重要問題。傳統(tǒng)的茶葉質(zhì)量評估方法主要依賴于感官評定和化學(xué)分析,這些方法不僅具有主觀性,還存在一定的破壞性。為了克服這些限制,研究者開始探索了基于現(xiàn)代技術(shù)的非破壞性檢測方法。近年來,HSI在食品質(zhì)量檢測中得到了廣泛應(yīng)用,因其能夠提供豐富的光譜信息并進(jìn)行非破壞性檢測。高光譜成像結(jié)合多變量分析技術(shù)能夠有效提取樣品的化學(xué)成分和物理特征,從而實(shí)現(xiàn)快速、準(zhǔn)確的質(zhì)量評估。本研究聚焦于藏茶的質(zhì)量檢測,旨在利用高光譜成像技術(shù)和化學(xué)計(jì)量學(xué)方法(如多變量分析)對藏茶的主要質(zhì)量指標(biāo)(TPs和FAAs)進(jìn)行定量分析以及對藏茶進(jìn)行分級研究。該研究提供一種新的茶葉質(zhì)量評估方式,以滿足日益增長的藏茶產(chǎn)業(yè)對高效、精準(zhǔn)檢測技術(shù)的需求。
實(shí)驗(yàn)設(shè)計(jì)
1.1材料與方法
(1)樣品制備
從四川雅安茶廠有限公司購買了三個(gè)等級的藏茶。藏茶的等級主要取決于茶葉的厚度。一級為毛尖,選用最嫩的茶葉;二級為雅西,通常是一芽一葉或一芽兩葉;三級為金尖,通常每芽有三葉或四葉。茶葉被分為106個(gè)樣本,其中一級樣本33個(gè),二級樣本35個(gè),三級樣本38個(gè),每個(gè)樣本重6克。根據(jù)國家標(biāo)準(zhǔn)茶葉感官評價(jià)方法GB/T 23776-2018,邀請了專業(yè)茶葉評審員對茶葉等級進(jìn)行感官評定。在確認(rèn)樣本后,實(shí)驗(yàn)分為兩個(gè)步驟。第一步是將茶葉樣本均勻地放入一個(gè)方形容器中(6.5 × 6.5 cm2),獲取高光譜圖像,并在圖像采集后迅速將茶葉樣本封裝入密封袋。第二步是將樣本送至四川農(nóng)業(yè)大學(xué)茶葉專業(yè)實(shí)驗(yàn)室,進(jìn)行TPs和FAAs的檢測。圖1為藏茶檢測流程圖。
圖1.藏茶的檢測流程圖
(2)高光譜成像采集
高光譜圖像由江蘇雙利合譜科技有限公司生產(chǎn)的Gaia Sorter高光譜分選儀獲得。高光譜系統(tǒng)由成像光譜儀和CCD相機(jī)組成。該系統(tǒng)的光譜采集范圍為387 ~ 1035 nm,光譜分辨率為2.8 nm,具有256個(gè)光譜通道。由于光譜采集開始和結(jié)束時(shí)暗電流的影響,僅保留420~1010 nm波段的信息作為原始光譜數(shù)據(jù)。所有茶葉樣品都測量了3次。采樣臺(tái)移動(dòng)速度設(shè)置為4.0 mm/s,采樣距離設(shè)置為170 mm,相機(jī)曝光時(shí)間設(shè)置為16 ms。通過高光譜相機(jī)獲取圖像后,對獲取的圖像進(jìn)行黑白校正。采集圖像后,通過分析軟件從圖像中提取光譜數(shù)據(jù)。該軟件選擇一個(gè)矩形(面積為100 × 100像素)作為感興趣的區(qū)域。然后提取感興趣區(qū)域每個(gè)像元的光譜數(shù)據(jù),并計(jì)算所有像元的平均光譜作為樣本的代表性光譜。
(3)化學(xué)成分測定
TPs的含量采用國家標(biāo)準(zhǔn)GB/T 8313-2018中的Folin-Ciocalteu比色法進(jìn)行測定。FAAs的測定方法參照GB/T 8314-2013,采用茚三酮比色法。
(4)統(tǒng)計(jì)分析
所有實(shí)驗(yàn)均進(jìn)行三次重復(fù),并以均值 ± 標(biāo)準(zhǔn)差的形式呈現(xiàn)。統(tǒng)計(jì)分析使用SPSS軟件進(jìn)行,采用單因素方差分析加事后Duncan檢驗(yàn),P < 0.05被定義為具有統(tǒng)計(jì)學(xué)顯著性。使用Origin 軟件進(jìn)行繪圖。
(5)光譜預(yù)處理
除了樣本的化學(xué)成分信息外,高光譜數(shù)據(jù)還包含一些不良影響,包括樣本、工作環(huán)境和設(shè)備引起的隨機(jī)噪聲干擾,這些因素與研究對象無關(guān),但可能影響模型的評估指標(biāo)。因此,在建立模型之前,使用了Savitzky-Golay(SG)、SG-乘法散射校正(MSC)和SG-標(biāo)準(zhǔn)正態(tài)變量(SNV)方法進(jìn)行預(yù)處理,以減少干擾信息的影響。
(6)特征提取
光譜共有256個(gè)波段,可能存在大量冗余信息,在一定程度上增加了數(shù)據(jù)處理時(shí)間,不利于建模。采用PCA算法對原始和預(yù)處理的光譜數(shù)據(jù)進(jìn)行主成分分析,提取關(guān)鍵特征。
(7)機(jī)器學(xué)習(xí)建模
在藏茶含量預(yù)測中,采用AdaBoost、梯度增強(qiáng)決策樹(Gradient Boosting Decision Tree,GBDT)和Extratree模型檢測藏茶中TPs和FAAs含量。使用決策樹(DT)、隨機(jī)森林分類器(RFC)、K近鄰(KNN)和支持向量機(jī)(SVM)等分類算法建立分類模型。通過準(zhǔn)確度、精密度和召回率來評估分類模型的性能,計(jì)算決定系數(shù)(R2)、均方根誤差(RMSE)和殘差預(yù)測偏差(RPD)來評估回歸模型的性能。
1.2.結(jié)果與討論
(1)統(tǒng)計(jì)結(jié)果
圖2(a、b)為藏茶中TPs和FAAs的分布。TPs和FAAs的中位數(shù)和范圍值因等級而異。TPs和FAAs的含量通常隨著茶葉等級的增加而增加,因此,茶葉等級中TPs和FAAs的差異有統(tǒng)計(jì)學(xué)意義(P < 0.05)。雖然G1和G2在TPs分布圖上的差異很小,但中位數(shù)不同。G1的TPs含量為8.42±0.61%,F(xiàn)AAs含量為1.4±0.36%。G2的TPs含量為8.22±0.48%,F(xiàn)AAs含量為1.05±0.17%。G3的TPs含量為4.99±0.51%,F(xiàn)AAs含量為0.36±0.09%。
不同品級的藏茶內(nèi)部成分差異顯著。這些含量可以作為評價(jià)藏茶品級的可靠依據(jù)。
圖2.(a)不同等級的TPs值(%);(b)不同等級的FAAs值(%)。圖中G1、G2、G3分別代表茶葉的三個(gè)等級
(2)光譜數(shù)據(jù)特征描述、樣本劃分和數(shù)據(jù)降維
圖3(a)為茶葉樣品的原始光譜,圖3(b-d)為各種預(yù)處理方法后的光譜。圖3(e)顯示了三個(gè)等級茶葉的平均光譜。采用SG和聯(lián)合預(yù)處理方法處理后的光譜數(shù)據(jù)更加平滑,并且減少了噪聲和來自環(huán)境和高光譜系統(tǒng)的某些不確定干擾。根據(jù)平均光譜,發(fā)現(xiàn)三個(gè)等級茶葉的光譜不相交,等級越高(G1為最高等級),茶葉的光譜反射越低。
圖3.茶葉樣品的光譜,(a)原始光譜;(b) SG后的光譜;(c) SG-MSC后的光譜;(d) SG-SNV后的光譜;(e)三個(gè)等級茶葉的平均光譜
不同品級的茶葉樣品屬于同一種,化學(xué)成分相同,因此在不同波長區(qū)域之間具有相似的光譜趨勢。茶葉樣品的光譜趨勢相似,但不同等級茶葉樣品的反射率不同,茶葉的等級越好,光譜反射率越低。前面部分的統(tǒng)計(jì)分析結(jié)果表明,茶葉等級越高(G1為最高等級),茶葉中TPs和FAAs的含量越高,因此茶葉中這兩種成分的含量與之前的光譜反射率呈反比關(guān)系,也為使用HSI來區(qū)分藏茶的等級,為后續(xù)的建模和分析提供依據(jù)。
獲得的高光譜圖像波長范圍為420 ~ 1010 nm。光譜區(qū)域的變化與有機(jī)分子中含氫基團(tuán)(如C-H、N-H、O-H和S-H)的振動(dòng)頻率與不同水平的乘法吸收區(qū)域的組合一致。690 nm處的吸收峰較低,茶葉在該波段吸收紅光較多,綠光較少,這可能與茶葉的葉綠素含量有關(guān)。在700-1010 nm范圍內(nèi),由于葉片對近紅外波段吸收較少,光譜上升明顯,該波段差異較大可能是由于不同等級的內(nèi)部成分差異較大。
PCA在模型中起到特征降維的作用,將原始光譜壓縮為低維數(shù)據(jù),壓縮后的數(shù)據(jù)相互獨(dú)立、正交。圖4為三個(gè)等級(G1、G2、G3)的三維PCA分布圖。圖4(a),對應(yīng)原始數(shù)據(jù)集的PCA得分,其中PC1占94.37%,PC2占4.44%,PC3占0.96%。累積信息方差貢獻(xiàn)達(dá)到99.77%,表明新數(shù)據(jù)在保證譜所含信息量可靠有效的前提下,可以最大限度地發(fā)揮原始數(shù)據(jù)的特征,也減少了后續(xù)模型構(gòu)建的輸入量。此外,G2和G3之間存在重疊。根據(jù)以上分析,PCA無法*全分離數(shù)據(jù)集,這可能是由于兩種等級的茶葉之間存在細(xì)微的差異。圖4(b)是訓(xùn)練集和測試集隨機(jī)分割數(shù)據(jù)集的PCA分布圖。數(shù)據(jù)集的分布非常均勻,訓(xùn)練集和測試集的分布重疊,并且測試集中的樣本包含了所有訓(xùn)練集樣本的特征,從而保證了樣本預(yù)測的可能性。
圖4. 三維PCA散點(diǎn)圖,(a)三個(gè)不同等級的劃分;(b)訓(xùn)練集和測試集的劃分
(3)TPs和FAAs的定量測定
為了預(yù)測藏茶中的TPs和FAAs以及建立藏茶等級的判別模型,將樣本按2:1的比例隨機(jī)分為訓(xùn)練集和測試集。表1(a、b)顯示了三種回歸方法結(jié)合不同預(yù)處理方法對TPs和FAAs的預(yù)測結(jié)果,并對所有數(shù)據(jù)進(jìn)行PCA降維處理。
在TPs預(yù)測中,測試集中的Rp2都在0.9左右,RMSEP在0.43到0.58之間。在所有模型中,Extratree在訓(xùn)練集上的R2最高,Rc2 = 1, RMSEC= 0表明該模型能夠準(zhǔn)確預(yù)測,模型具有較高的學(xué)習(xí)能力。在FAAs預(yù)測中,測試集的Rp2范圍為0.79 ~ 0.87,模型的RMSEP范圍為0.16 ~ 0.20。所有模型的RPD均大于2,具有較高的信度,可用于模型分析。在保證訓(xùn)練集上的訓(xùn)練情況后,經(jīng)過組合預(yù)處理,發(fā)現(xiàn)模型在測試集上得到了改進(jìn)。SG- SNV-Extratree對TPs的預(yù)測Rp2 = 0.9248,RMSEP= 0.4842,RPD= 3.646,優(yōu)于單一預(yù)處理SG的評價(jià)指標(biāo)。在預(yù)測FAAs時(shí),Adaboost、GBDT和Extratree中Rp2和RMSEP在聯(lián)合預(yù)處理后的作用大多大于單一預(yù)處理方法。與Extratree相比,SG-MSC和SG-SNV的Rp2分別為0.8736和0.8565。結(jié)果表明,預(yù)處理方法的結(jié)合有助于提高模型的預(yù)測能力。圖5為TPs和FAAs預(yù)測模型的散點(diǎn)圖。Extratree能提供較好的預(yù)測結(jié)果。TPs含量預(yù)測的最大誤差為1%,F(xiàn)AAs含量預(yù)測的最大誤差約為0.25%。SG-SNV-PCA-Extratree對TPs的預(yù)測效果*好。模型具有較高的R2、RPD和較低的RMSE (Rc2 =1,RMSEC=0,Rp2 =0.9248,RMSEP=0.4842,RPD=3.6460)。在FAAs的預(yù)測中,SG-MSCPCA-Extratree的預(yù)測效果*好,Rc2 = 1,RMSEC= 0,Rp2 = 0.8736, RMSEP= 0.1590,RPD= 2.8130。
圖5. 用于茶葉樣品的預(yù)測的模型散點(diǎn)圖(a)為TPs的預(yù)測結(jié)果;(b)為FAAs預(yù)測結(jié)果
(4)檢測茶葉等級分類模型的結(jié)果
在建立模型時(shí),關(guān)鍵因素是選擇*優(yōu)的分類模型。在確定分類器之后,我們優(yōu)化了參數(shù),以獲得最佳的分類模型。通過比較原始光譜和結(jié)合了三種預(yù)處理方法與PCA的模型,以及表2中的四種分類模型,最終得出了分類結(jié)果。
關(guān)于預(yù)處理方法,在沒有預(yù)處理的分類方法中,結(jié)果并不理想。SG-SNV和SG-MSC結(jié)合PCA-SVM的結(jié)果優(yōu)于單獨(dú)使用SG。這表明,預(yù)處理模型的組合不僅使光譜更加平滑,而且改善了訓(xùn)練效果,更有利于建模。
關(guān)于分類模型。RFC和SVM下的測試結(jié)果優(yōu)于DT和KNN。為了確定*優(yōu)參數(shù),采用遺傳算法確定SVM中的參數(shù)值。結(jié)果表明,SVM的最佳參數(shù),選擇核函數(shù)的RBF,gamma= 0.6952, degree = 1,C= 1.2341。在此基礎(chǔ)上,得到了基于*優(yōu)參數(shù)的分類結(jié)果。SG-SNV-PCA-SVM模型效果*好,訓(xùn)練集和測試集的準(zhǔn)確率、查全率和精密度均為100%,能夠準(zhǔn)確預(yù)測藏茶的品級。
結(jié)論
本研究通過化學(xué)計(jì)量學(xué)方法確定了藏茶中的TPs和FAAs,并通過高光譜成像(HSI)和多變量分析對其進(jìn)行了預(yù)測。結(jié)果表明,藏茶中的TPs和FAAs含量存在顯著差異(p < 0.05)。研究表明,HSI能夠?qū)崿F(xiàn)茶葉質(zhì)量參數(shù)的非破壞性檢測。本研究將茶葉檢測從外部特征的評估轉(zhuǎn)變?yōu)橥獠亢蛢?nèi)部特征的綜合評估,這將有助于提高藏茶行業(yè)的檢測效率,促進(jìn)雅安藏茶產(chǎn)業(yè)的發(fā)展,推動(dòng)藏茶經(jīng)濟(jì)的增長,并為其他食品領(lǐng)域提供一種快速、非破壞性的檢測方法。
作者簡介
通訊作者:康志亮 教授,四川農(nóng)業(yè)大學(xué),博導(dǎo)
參考文獻(xiàn)
論文引用自二區(qū)文章:Yan Hu , Peng Huang , Yuchao Wang , Jie Sun , Youli Wu , Zhiliang Kang. Determination of Tibetan tea quality by hyperspectral imaging technology and mu*tivariate analysis. Journal of Food Composition and Analysis 117. (2023) 105136
相關(guān)產(chǎn)品
免責(zé)聲明
- 凡本網(wǎng)注明“來源:化工儀器網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-化工儀器網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來源:化工儀器網(wǎng)”。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。
- 本網(wǎng)轉(zhuǎn)載并注明自其他來源(非化工儀器網(wǎng))的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé),不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個(gè)人從本網(wǎng)轉(zhuǎn)載時(shí),必須保留本網(wǎng)注明的作品第一來源,并自負(fù)版權(quán)等法律責(zé)任。
- 如涉及作品內(nèi)容、版權(quán)等問題,請?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。