應(yīng)用方向:
本研究結(jié)合高光譜成像技術(shù)和連續(xù)小波變換(CWT),聚焦于霉變花生的精準識別,通過提取光譜敏感特征區(qū)分健康與霉變樣本。這一方法展示了高光譜技術(shù)在食品質(zhì)量與安全檢測中的重要應(yīng)用價值,尤其在霉變與真菌感染監(jiān)測、農(nóng)產(chǎn)品自動分選和在線監(jiān)控等方面具有廣泛潛力。相比傳統(tǒng)檢測方法,高光譜技術(shù)實現(xiàn)了非接觸、快速、綠色環(huán)保的檢測方式,為食品安全監(jiān)管及智能農(nóng)業(yè)提供了高效解決方案。
背景:
花生作為全球廣泛種植和消費的重要油料作物,具有很高的營養(yǎng)價值。然而,由于其特殊的組成成分,花生極易受到真菌(如黃曲霉)的感染,進而產(chǎn)生強致癌性的黃曲霉毒素(AFB1)。這種毒素不僅對人類和牲畜健康構(gòu)成嚴重威脅,還可能導(dǎo)致農(nóng)民、加工商及分銷商的經(jīng)濟損失。
現(xiàn)有的黃曲霉毒素檢測方法(如薄層色譜、高效液相色譜等)盡管準確,但存在耗時、操作復(fù)雜、依賴專業(yè)人員等局限性,不適用于自動化檢測場景。而近紅外光譜及高光譜成像技術(shù)因其非接觸性及高效性,逐漸成為食品質(zhì)量評估領(lǐng)域的重要工具。然而,高光譜成像數(shù)據(jù)的高維特性給實時檢測系統(tǒng)帶來了計算負擔(dān),特征降維成為后續(xù)數(shù)據(jù)處理的必要步驟。
連續(xù)小波變換(CWT)作為一種有效的特征提取方法,可在不同波長和尺度上分解光譜數(shù)據(jù),從而識別出細微的光譜特征。盡管CWT在某些領(lǐng)域已顯示出其優(yōu)*性,但其在谷物和油料作物真菌感染檢測中的應(yīng)用仍較少。本研究旨在結(jié)合CWT和高光譜成像技術(shù),開發(fā)一種高效、可靠的霉變花生識別方法。具體的研究目標為:(1)探索霉變花生的光譜特性;(2)確定適用于霉變花生檢測的最佳CWT特征;(3)比較CWT提取的小波特征與傳統(tǒng)波段選擇方法的分類性能。
實驗設(shè)計
1.1材料與方法
(1)花生樣品制備
從市場上購買了三種花生品種:花育(HY)、四粒紅(SLH)和小白沙(XBS)。手工挑選出完好無損的健康花生,并將其分成兩部分:一部分妥善保存作為健康樣本,另一部分用于獲取霉變花生樣本。為了獲得霉變花生樣本,將花生放入容器中,并置于37°C的恒溫箱中,相對濕度設(shè)定在85~90%,持續(xù)10天以促進曲霉菌屬的快速繁殖。從第11天起,溫度調(diào)整至30°C,相對濕度保持不變。分別在第20天和第30天取出花生作為不同霉變階段的霉變樣本。然后,對于HY品種的花生,隨機選取8個健康、霉變20天和霉變30天的樣本,并使用黃曲霉毒素B1(AFB1)快速檢測試紙進行評估。對于另外兩種花生品種,每種隨機選取10個健康、霉變20天和霉變30天的樣本,并使用AFB1快速檢測試紙進行評估。AFB1快速檢測試紙*低檢測限為5 ppb。該產(chǎn)品采用競爭性抑制金免疫層析法原理。當(dāng)樣本溶液中的 AFB1 濃度超過檢測限*,檢測線不會顯現(xiàn)顏色反應(yīng),結(jié)果判定為陽性;當(dāng)樣本溶液中的 AFB1 濃度低于檢測限*,檢測線呈現(xiàn)紫色反應(yīng),結(jié)果判定為陰性。在實驗過程中,健康花生樣本經(jīng) AFB1 快速檢測試紙檢測,其 AFB1 含量均低于 5 ppb,據(jù)此假設(shè)所有健康花生樣本均為健康。相反,霉變花生樣本經(jīng)檢測發(fā)現(xiàn) AFB1 含量均超過 5 ppb,因此假設(shè)所有霉變花生均為霉變。為排除水分含量對實驗結(jié)果的干擾,健康與霉變的花生仁分別在 60°C 的干燥箱中干燥 24 小時。
對于每種花生品種,我們獲取了七張高光譜圖像(三張用于訓(xùn)練,四張用于測試)。圖1展示了用于獲取這七張高光譜圖像的花生樣本(HY)的照片。前三張圖像顯示了用作訓(xùn)練數(shù)據(jù)的花生樣本,第一張展示了健康的花生樣本,第二張展示了第20天獲得的霉變花生樣本,最后一張展示了第30天獲得的霉變花生樣本。后四張圖像展示了用作測試數(shù)據(jù)的花生樣本;其中前兩張是健康花生和第20天獲得的霉變花生的混合物,另外兩張是健康花生和第30天獲得的霉變花生的混合物。最終,共成像了547個花生樣本(HY:154個,XBS:175個,SLH:218個),包括252個健康花生樣本和295個霉變花生樣本。在這些樣本中,232個花生樣本,包括79個健康樣本和153個霉變樣本,被用作訓(xùn)練數(shù)據(jù);315個花生樣本,包括173個健康樣本和142個霉變樣本,被用作測試數(shù)據(jù)。
圖1.用于獲取七張高光譜圖像的花生樣本(HY)照片:頂部三張圖像用于訓(xùn)練數(shù)據(jù)集,底部四張圖像用于測試數(shù)據(jù)集
(2)高光譜成像系統(tǒng)與圖像采集
高光譜圖像采集使用的是GaiaSorter(江蘇雙利合譜科技有限公司)設(shè)備。它由四個部分組成:一個光譜成像系統(tǒng)、一個照明系統(tǒng)、一個傳送臺和一個計算機。光譜成像系統(tǒng)由一個高光譜相機(Image-λ-N25E-HS)組成,其光譜范圍為920至2530納米,該相機連接到一個標準的C口變焦鏡頭(F/2, f = 22.5 mm, HSIA-OLES22)。照明系統(tǒng)由四個200瓦的溴鎢燈(HSIALS-T-200W)組成。傳送臺由一個樣品臺和集成的電動精密傳送臺(HSIAT500)構(gòu)成。計算機安裝了SpecVIEW系統(tǒng)控制軟件。
花生樣本被放置在一個10厘米×10厘米的黑色托盤中以獲取高光譜圖像,如圖1所示。所獲得的圖像共有288個波段,光譜分辨率為5.6納米。此外,為了校正所采集的高光譜圖像,我們收集了一張白參考圖像,并通過完*關(guān)閉相機光圈記錄了一張黑參考圖像。
(3)高光譜圖像預(yù)處理與光譜提取
圖像采集完成后,將所得到的高光譜圖像使用黑參考圖像和白參考圖像進行校正。另外,在捕獲高光譜圖像時,隨機噪聲是不可避免的,因此在進行進一步數(shù)據(jù)處理之前需要對數(shù)據(jù)進行了濾波。在本研究中,采用了五點平滑濾波器來處理高光譜數(shù)據(jù)。
非花生像素不僅在后續(xù)數(shù)據(jù)處理中無用,甚至可能對分析結(jié)果產(chǎn)生干擾,因此被標記為背景并賦予零值。為了提取緊密相連且無法通過簡單閾值分割的花生區(qū)域,采用了標記控制的水洗算法生成掩模圖像。隨后,利用該掩模圖像有效去除背景信息。在此基礎(chǔ)上,進一步進行了預(yù)處理操作,包括圖像裁剪以及低信噪比波段的移除。最終,篩選出波長范圍為1000-2486nm的 265個波段用于分析
在圖像空間分割上,采用了區(qū)域生長算法,其本質(zhì)是將具有相似屬性的像素組合在一起。對于每個區(qū)域,指*一個種子點作為生長的起點;然后,比較周圍的像素點以確定它們是否包含在區(qū)域內(nèi)。在本研究中,應(yīng)用了四鄰域區(qū)域生長算法到掩模圖像上,以連接同一核區(qū)域內(nèi)的像素,并為它們分配一個序列號。然后,每個花生仁都可以通過序列號輕松追蹤,這有利于實現(xiàn)花生分選的工業(yè)自動化。
對于健康的花生樣本,我們從每種花生的訓(xùn)練圖像中隨機選取了100個像素。對于發(fā)霉的花生,首先從訓(xùn)練圖像中手動選擇發(fā)霉的像素作為感興趣區(qū)域(ROI);然后,從每種花生的ROI中隨機選取50個像素。因此,共計獲得了600個花生像素樣本,其中包括300個健康花生像素和300個不同程度真菌感染的發(fā)霉花生像素。所選取的花生像素樣本如圖2所示。
圖2.選定花生像素樣本的分布情況
(4)方法
特征波長提取:
連續(xù)小波變換(CWT)是一種強大的方法,用于在不同尺度和分辨率下檢測和分析高光譜數(shù)據(jù)中的微弱信號。本質(zhì)上,CWT是一種線性操作,通過使用母小波函數(shù)在不同的波長和尺度上,可以將高光譜反射光譜轉(zhuǎn)換為一系列系數(shù)。在本研究中,由于吸收特征的形狀類似于準高斯函數(shù),因此選擇了墨西哥帽作為母小波基。為了減輕計算負擔(dān),僅保留了二進制尺度(21, 22, 23, …, 和 27)上的小波功率;因為總波段數(shù)為267,所以大于27 = 128的尺度上的分解分量不再攜帶有意義的光譜信息。
杰弗里斯-馬圖西塔(J-M)距離是一種靈活直觀的特征可分性指數(shù),用于衡量兩個不同類別之間的特征,并廣泛用于指導(dǎo)特征選擇。杰弗里斯-馬圖西塔距離(J-M距離)的范圍是0到2,它提供了兩個類別之間可分性的一般度量。J-M距離越大,意味著兩個類別之間分離的概率越高,反之亦然。在本研究中,J-M距離被用來評估不同尺度和波長下的小波系數(shù),以進行小波特征(WF)的選擇。
為了識別發(fā)霉花生仁,需要一種特征選擇方法來識別最重要的特征,因為許多WFs由于連續(xù)分解是冗余的,因此要選擇有意義的小波特征。首先,使用Mexican Hat作為母小波,通過CWT對每個花生仁的原始高光譜反射數(shù)據(jù)進行分解,分解尺度為21、22、23,……,27。這樣,原始光譜就被轉(zhuǎn)換成了在不同波長和尺度上的一組小波系數(shù)。其次,通過計算健康和發(fā)霉花生樣本之間的J-M距離,構(gòu)建了J-M距離尺度圖。最后,根據(jù)J-M距離降序排列特征,并應(yīng)用一個閾值J-M距離來劃分前1%的特征。由閾值劃分的特征在J-M距離尺度圖上形成了一個分散的特征區(qū)域。理論上,所有在特征區(qū)域內(nèi)的特征都是被選擇的小波特征。然而,它們攜帶了冗余的光譜信息,因為同一區(qū)域內(nèi)的特征是在連續(xù)的波長位置和尺度上產(chǎn)生的。因此,對于每個特征區(qū)域,使用具有最大J-M距離的特征來代表該特征區(qū)域捕獲的光譜信息。
SPA是一種前向變量選擇算法,通常用于減少模型中的變量數(shù)量,提高建模的速度和效率。它從單一波長開始,然后在每次迭代中加入一個新的波長,直到達到指*的波長數(shù)量。新選擇的變量是在之前選擇的變量正交子空間上具有最大投影值的變量。因此,SPA提取的有用變量子集具有最小的共線性。*優(yōu)的變量數(shù)量通過均方根誤差(RMSE)來確定。在我們的研究中,SPA被用來選擇*優(yōu)的波段以與WFs進行比較。
分類模型:
我們將健康花生標記為1,發(fā)霉花生標記為2。為了評估WFs以及SPA選擇的*優(yōu)波段的性能,我們使用了兩種分類模型:偏最小二乘判別分析(PLS-DA)和支持向量機(SVM)。通過計算健康花生和發(fā)霉花生的整體分類準確率來評估WFs的性能。在PLSR中,由于預(yù)測響應(yīng)很少直接產(chǎn)生等于1和2的二元結(jié)果,而是接近1或2的結(jié)果,因此使用了1.5作為分類的閾值。此外,PLS-DA模型中理想的潛在變量數(shù)量是通過五折交叉驗證下RMSE的值來確定的。在SVM中,徑向基函數(shù)(RBF)核被用作SVM分類框架的核。在評估方法中,通過計算靈敏度、特異性和總體準確性(OA)來評估分類模型的性能。
為了更清晰地說明圖像處理步驟,圖3展示了一個流程圖。虛線框中的部分專門針對訓(xùn)練數(shù)據(jù),用于確定最佳波段和特征權(quán)重。驗證圖像則跳過此部分,直接使用與訓(xùn)練圖像相同的最佳波段和特征權(quán)重。
圖3.圖像處理流程圖
1.2.結(jié)果與討論
(1)花生的光譜反射率
圖4展示了健康和霉變花生的反射光譜,這些光譜是通過計算不同類別樣本光譜的平均值得出的。在健康花生的反射光譜中可以看到六個顯著的吸收峰,分別位于大約1208納米、1472納米、1747納米、1938納米、2145納米和2329納米(用黑點標記),主要可以歸因于與花生中的水分、蛋白質(zhì)和油脂成分相關(guān)的CH、NH和OH的吸收。在1000-1500納米的波長范圍內(nèi),健康和霉變花生的光譜曲線形狀明顯不同。當(dāng)花生發(fā)生霉變時,1118納米處的反射率降低,導(dǎo)致吸收峰減弱。在1365-2486納米的波長區(qū)域,霉變花生的反射值高于健康花生,這可能歸因于真菌污染引起的散射和吸收特性。真菌的侵入可以使花生仁胚乳變得多孔,這可能導(dǎo)致霉變花生比健康花生散射更多的光線,這種散射會導(dǎo)致在反射模式下吸收更少的近紅外輻射。
圖4.健康與霉變花生的光譜響應(yīng):黑點表示健康花生的吸收峰,垂直虛線表示由SPA選擇的最佳波長變量。
(2)用于識別霉變花生的波長特征(WFs)
在不同波長和尺度下,計算了每個樣本光譜的小波系數(shù),圖 5 展示了健康與霉變花生樣本的平均光譜結(jié)果。隨后,通過計算不同類別小波系數(shù)之間的 J-M 距離,生成了一張指示W(wǎng)Fs光譜敏感性和區(qū)分能力的尺度圖(圖 6)。在本研究中,頂部 1% 元素的閾值 J-M 值為 1.70,基于該閾值篩選出五個對霉變花生高度敏感的小波特征區(qū)域(圖 6 中的橙色區(qū)域)。如圖 6 所示,這些敏感特征區(qū)域主要集中在 1000–1500 納米的波長范圍內(nèi)。該波長區(qū)域的光譜曲線形狀在健康與霉變花生之間表現(xiàn)出顯著差異(圖 4)。在每個特征區(qū)域中,選取 J-M 距離最大的點,最終選擇了五個用于區(qū)分霉變與健康花生的小波特征。它們的具體波長和尺度見表 1 。
1005納米、1045納米和1410納米的波段分別與花生中的纖維素、油脂和水分有關(guān),這些是花生的主要組成部分。在其他波段中,1422納米和1518納米與1430納米和1510納米相似,與總真菌感染有關(guān)。1430納米波段可以歸因于蔗糖/淀粉的O?H伸縮第一泛音,而1510納米對應(yīng)于O?H變形羥基和C?O伸縮的第三泛音,這可以歸因于角質(zhì)層和β-葡聚糖。
圖5.不同尺度下健康與霉變花生平均光譜的小波系數(shù)
圖6.用于提取WFs的連續(xù)小波分析的J-M距離尺度圖
(3)通過SPA進行最佳波段選擇
每個類別的樣本按照2:1的比例被隨機分為校準和驗證數(shù)據(jù),并根據(jù)RMSE選擇最佳波段的數(shù)量。校準和驗證數(shù)據(jù)的隨機分割導(dǎo)致了在不同實現(xiàn)中選擇的波長有所變化;因此,為了選擇最佳波段,樣本分割和SPA程序被重復(fù)執(zhí)行。在進行了五次樣本分割和SPA程序后,比較了產(chǎn)生的五組波長,并選擇了至少有3組共同認同的波長。最終,確定了七個波長(1005納米、1208納米、1450納米、1927納米、2078納米、2190納米和2251納米)作為識別霉變花生的最佳波段,如圖4所示。我們可以看到,在最佳波段和WFs之間只有一個共同的波段(1005納米)。這主要是由于兩種方法的選擇標準不同,CWT主要捕捉光譜形狀的差異,而SPA主要選擇具有最小共線性的波段。在其他波段中,1208納米對應(yīng)于淀粉分子吸收相關(guān)的C?H第一泛音和第二泛音以及C?H組合;1450納米波段可以歸因于花生中的蛋白質(zhì)含量;1927納米波段,與1930納米相似,可能歸因于淀粉的O?H伸縮/HOH變形組合;2078納米波段,與2090納米相似,與總真菌感染有關(guān)。其他波段,2190納米和2251納米,更接近2200納米和2270納米,可能分別歸因于?CHO的C–H伸縮/C=O伸縮組合和纖維素的O?H伸縮/C?O伸縮組合。
(4)WFs性能評估
使用五個WFs和七個最佳波段作為輸入變量,結(jié)合PLS-DA和SVM建立了分類模型。對于WFs和最佳波段,PLS-DA的理想LVs數(shù)量分別為3和6。對于SVM參數(shù)(C,σ),采用了基于網(wǎng)格的方法和五折交叉驗證進行優(yōu)化,WFs和最佳波段的*優(yōu)SVM模型對應(yīng)的(C,σ)分別為(1,0.5)和(100,0.5)。然后,對花生仁中的每個像素進行了分類,使用SVM對HY(健康與霉變)的分類結(jié)果可見于圖7。
圖7.使用SVM對訓(xùn)練數(shù)據(jù)集進行逐像素分類的結(jié)果,其中(a)使用最佳波段,(b)使用WFs;對測試數(shù)據(jù)集進行逐像素分類的結(jié)果,其中(c)使用最佳波段,(d)使用WFs
在逐像素分類后,使用受真菌污染的像素數(shù)量與總花生像素數(shù)量的比率來確定花生仁是否受到污染。比率低于0.05、0.1和0.15的閾值分別被認為是健康花生。圖8顯示了β=0.15和SVM時HY的核尺度分類結(jié)果,定量結(jié)果如表2所示。從圖8中我們可以看到,對于訓(xùn)練數(shù)據(jù),無論使用WFs還是最佳波段,兩種分類器和閾值都能正確識別健康和霉變花生。相比之下,對于測試數(shù)據(jù),如表2所示,WFs在使用兩種分類器的三個閾值上的整體準確度上都優(yōu)于最佳波段。此外,使用WFs的靈敏度和特異性高于或等于使用*佳波段,表明WFs在健康和霉變花生分類中的性能更佳。CWT能夠在不同尺度上分離吸收特征,將狹窄和寬的吸收特征分別分離到低尺度和高尺度。這種特性的好處是可以實現(xiàn)對WFs的全面調(diào)查,從而能夠選擇最佳的光譜特征。
圖8.使用SVM對訓(xùn)練數(shù)據(jù)集進行核尺度分類的結(jié)果,其中(a)使用最佳波段,(b)使用WFs;對測試數(shù)據(jù)集進行核尺度分類的結(jié)果,其中(c)使用最佳波段,(d)使用WFs。白色圓圈表示被誤分類的花生仁
在此,我們使用了一個閾值來確定花生仁是否霉變。理論上,較小的閾值更好,因為它可以避免將霉變的花生誤判為健康的花生。相反,較小的閾值可能會增加將健康花生仁誤判為霉變的風(fēng)險,這可能會導(dǎo)致因錯誤丟棄而造成的經(jīng)濟損失。因此,確定閾值至關(guān)重要??紤]到使用0.05、0.1和0.15的不同分類器的整體分類結(jié)果,本文推薦使用0.1作為折中的閾值。但是,未來應(yīng)該探索一種可靠的閾值確定方法。此外,盡管本研究表明,通過結(jié)合CWT和高光譜成像技術(shù),有可能以相對較高的準確度識別霉變花生,但本研究得到的特征和模型可能仍不適合實際應(yīng)用于多樣化的花生。不過,本研究中描述的特征提取和建模方法可以作為開發(fā)核心算法的參考。
結(jié)論
健康和霉變的花生在對短波紅外光的光譜響應(yīng)上表現(xiàn)出顯著差異。在本研究中, CWT被應(yīng)用于高光譜分類框架中,以提取特征來識別霉變花生。確定了五個WFs用于將花生分類為健康或霉變。本文展示的結(jié)果表明,WFs結(jié)合PLS-DA或SVM有希望識別出花生仁上的霉變——測試數(shù)據(jù)的準確度至少為96.19%。這比使用由SPA獲得的最佳波段進行分類的性能更好。未來的研究應(yīng)包括更多樣化和不同種類的花生樣本,建立霉變嚴重程度評估方法,對不同霉菌的霉變花生進行分類,并建立更可靠的閾值確定方法。這些改進可以增強所選WFs的魯棒性。
作者簡介(人名+單位+博導(dǎo)/碩導(dǎo))
通訊作者:蔣金豹,中國礦業(yè)大學(xué),博士生導(dǎo)師
參考文獻
論文引用自二區(qū)文章:Xiaotong Qi, Jinbao Jiang, Ximin Cui, Deshuai Yuan (2019). Moldy Peanut Kernel Identification Using Wavelet Spectral Features Extracted from Hyperspectral Images. Food Analytical Methods.
相關(guān)產(chǎn)品
免責(zé)聲明
- 凡本網(wǎng)注明“來源:化工儀器網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-化工儀器網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來源:化工儀器網(wǎng)”。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。
- 本網(wǎng)轉(zhuǎn)載并注明自其他來源(非化工儀器網(wǎng))的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責(zé),不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個人從本網(wǎng)轉(zhuǎn)載時,必須保留本網(wǎng)注明的作品第一來源,并自負版權(quán)等法律責(zé)任。
- 如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。