產(chǎn)品推薦:氣相|液相|光譜|質(zhì)譜|電化學(xué)|元素分析|水分測定儀|樣品前處理|試驗(yàn)機(jī)|培養(yǎng)箱


化工儀器網(wǎng)>技術(shù)中心>解決方案>正文

歡迎聯(lián)系我

有什么可以幫您? 在線咨詢

案例分享:雙利合譜高光譜與多技術(shù)融合的應(yīng)用研究

來源:江蘇雙利合譜科技有限公司   2025年01月21日 11:23  

應(yīng)用方向:

高光譜成像技術(shù)憑借其強(qiáng)大的空間和光譜信息獲取能力,已成為植物產(chǎn)品地理來源識別與質(zhì)量控制的前沿工具。根據(jù)研究,高光譜技術(shù)結(jié)合深度學(xué)習(xí)模型,可以實(shí)現(xiàn)枸杞的地理來源精準(zhǔn)分類,準(zhǔn)確率高達(dá)95.63%。通過特征波長提取,不僅顯著提高了分析效率,還增強(qiáng)了數(shù)據(jù)的科學(xué)解釋性。此外,高光譜與化學(xué)分析(如NMR)的結(jié)合,能夠進(jìn)一步揭示樣品化學(xué)成分與光譜特征的關(guān)聯(lián),為復(fù)雜樣品的快速、非破壞性檢測提供創(chuàng)新解決方案。

背景:

枸杞以其卓*的營養(yǎng)價值和顯著的藥用功效享譽(yù)*球,尤其是在抗氧化、抗炎、免疫調(diào)節(jié)和抗腫瘤等方面表現(xiàn)突出。這些特性與其地理來源密切相關(guān),地理來源不僅決定了其化學(xué)成分和藥用效果,還顯著影響市場價值。因此,快速、準(zhǔn)確地識別枸杞的地理來源對于質(zhì)量控制和市場調(diào)節(jié)至關(guān)重要。傳統(tǒng)的地理來源識別方法主要依賴于物理化學(xué)特性或感官評價,但這些方法通常依賴專家經(jīng)驗(yàn),缺乏客觀性和精確性。近年來,現(xiàn)代分析技術(shù)(如近紅外光譜、超高光譜成像(HSI)、核磁共振(NMR)和液相色譜-飛行時間質(zhì)譜)在地理來源鑒定中顯示出強(qiáng)大優(yōu)勢。其中,HSI提供了豐富的光譜和空間信息,NMR在成分識別與定量分析中表現(xiàn)突出。然而,這些方法單獨(dú)使用時存在一定局限性,如數(shù)據(jù)復(fù)雜性高、維度大,導(dǎo)致傳統(tǒng)機(jī)器學(xué)習(xí)模型難以有效處理。

為克服上述挑戰(zhàn),深度學(xué)習(xí)技術(shù)被引入到分析過程。這些方法能夠從高維數(shù)據(jù)中自動提取特征,能夠有效利用光譜與空間特征,從而顯著提升地理來源的分類精度。同時,SHAP解釋模型的引入解決了深度學(xué)習(xí)的“黑箱”問題,增強(qiáng)了結(jié)果的可解釋性。因此,該研究通過將HSI和NMR技術(shù)與深度學(xué)習(xí)技術(shù)相結(jié)合,用于識別枸杞的地理來源。具體目標(biāo)包括:(i) 通過將HSI數(shù)據(jù)與SHAP方法相結(jié)合,改進(jìn)ResNet-34模型,實(shí)現(xiàn)枸杞地理來源的判定;(ii) 利用NMR技術(shù)識別枸杞的地理來源及其特定地理標(biāo)記(GI);(iii) 建立枸杞地理標(biāo)記物與HSI數(shù)據(jù)中提取的特征波長之間的關(guān)聯(lián)。

實(shí)驗(yàn)設(shè)計(jì)

1.1材料與方法

(1)樣品制備

干燥后的枸杞樣品由中國寧夏農(nóng)業(yè)產(chǎn)品質(zhì)量標(biāo)準(zhǔn)與檢測技術(shù)研究所下屬的農(nóng)業(yè)產(chǎn)品質(zhì)量監(jiān)測中心提供。所有枸杞樣品均采自四個主要產(chǎn)區(qū)的當(dāng)?shù)剞r(nóng)場,包括寧夏同心縣(TX)和寧夏中寧縣(ZN,品種分別為ZN1和ZN2)、青海諾木洪(NMH)以及青海德令哈(DLH)。

寧夏地區(qū)的枸杞樣品于2022年6月下旬至7月上旬采收,青海地區(qū)的樣品則于2022年9月完成采收。不同產(chǎn)地和品種的枸杞均采用人工手工采摘的方式,從每棵枸杞樹的東、南、西、北四個方向分別采摘,以保證采樣的全面性。為確保數(shù)據(jù)分析的一致性并減少潛在偏差,每個產(chǎn)地的樣品經(jīng)過嚴(yán)格篩選,盡量保持大小均勻。采摘完成后,枸杞在自然條件下日曬干燥數(shù)日。最終共獲得525份樣品(每個產(chǎn)地n=105)。樣品的兩面分別標(biāo)記為A面和B面,其RGB圖像如圖1所示。隨后,所有樣品均迅速冷凍保存于-80°C環(huán)境中,以保持其生化和物理特性。

img1 

圖1. 不同地理和品種產(chǎn)地的代表性枸杞樣品的RGB圖像

(2)HSI和1H核磁共振(NMR)采集和數(shù)據(jù)預(yù)處理

HSI數(shù)據(jù)采集及光譜預(yù)處理:HSI數(shù)據(jù)在可見光-近紅外(VNIR)高光譜成像系統(tǒng)(GaiaField-V10E,江蘇雙利合譜科技有限公司,江蘇無錫,中國)上獲取。該系統(tǒng)由高光譜成像儀(GaiaField-V10E)、透鏡(HSIA-OL23)、光源(HSIA-LS-T-200 W)、標(biāo)準(zhǔn)漫射參考板(HSIA-CT-400×400,雙利合譜,中國)和安裝有SpecView軟件的計(jì)算機(jī)組成。將枸杞樣品放置在離透鏡35 cm的工作臺上。分別采集枸杞兩側(cè)的HSI數(shù)據(jù),記為A面和B面。然后對枸杞的高光譜數(shù)據(jù)進(jìn)行黑白校正。為了減少光譜外圍噪聲波動的影響,校正后的高光譜圖像中初始6個波長被消除。隨后,對枸杞高光譜數(shù)據(jù)進(jìn)行了準(zhǔn)確的分割處理。每個枸杞被*定為一個*特的興趣區(qū)域,以方便深入分析。

1H NMR采集及光譜預(yù)處理:在完成所有枸杞樣品的HSI數(shù)據(jù)采集后,從每個地理產(chǎn)地和品種中隨機(jī)挑選30個枸杞樣品,迅速在液氮中冷凍,并使用研缽和研杵將其研磨成細(xì)粉。每個樣品中取100 mg的粉末,溶解于甲醇-氯仿-水的混合溶劑中,體積比為4:4:6?;旌弦和ㄟ^渦旋混合1分鐘以確保充分混勻,然后在冰浴中冷卻15分鐘以促進(jìn)相分離。冷卻后,溶液在4°C條件下離心10分鐘。小心將上清液轉(zhuǎn)移至5 mL的Eppendorf管中,并使用樣品濃縮器蒸發(fā)30分鐘后,進(jìn)行24小時的冷凍干燥,以去除殘留的甲醇和水。干燥殘?jiān)?00μL的氘化磷酸鹽緩沖液(100 mM,pH = 5.7)重新溶解,該緩沖液中含有0.05%的TSP(鈉鹽3-(三甲基硅基)丙酸-2,2,3,3-d4)。混合液再渦旋混合5分鐘后,在10,000 g × 4 °C條件下離心10分鐘。最后,將550 μL的上清液轉(zhuǎn)移至5 mm NMR管中,用于采集1H NMR光譜數(shù)據(jù)。

所有枸杞樣品的1H NMR光譜均使用850 MHz的Bruker AVANCE III核磁共振波譜儀(Bruker公司,德國卡爾斯魯厄)采集,配備CPTCI探頭,工作頻率為850.32 MHz。1H NMR光譜通過ZGPR脈沖序列采集,參數(shù)設(shè)定如下:溫度為298 K,譜寬為14 KHz,數(shù)據(jù)點(diǎn)數(shù)為32 K,弛豫延遲為4.0秒,采集時間為1.9秒,共64次掃描。

所有枸杞樣品的1H NMR光譜數(shù)據(jù)均通過MestReNova軟件(V14.0.0,Mestrelab Research,西班牙)進(jìn)行預(yù)處理。處理步驟包括傅里葉變換、相位和基線校正,以及利用TSP的單峰信號(δ0)對光譜進(jìn)行對齊。在δ0-10范圍內(nèi),將光譜分割為寬度為0.002 ppm的區(qū)間,并移除殘留甲醇峰(δ3.35-3.37)和水峰(δ4.75-4.90)的干擾信號。對TSP峰(δ0)進(jìn)行歸一化處理,使其峰強(qiáng)值為9,便于后續(xù)的定量分析。最終,將積分?jǐn)?shù)據(jù)導(dǎo)入SIMCA 14.1軟件進(jìn)行全面的多變量統(tǒng)計(jì)分析。

(3)枸杞的地理來源鑒定

傳統(tǒng)機(jī)器學(xué)習(xí):采用邏輯回歸(LR)和采用基于徑向基函數(shù)核函數(shù)的非線性支持向量機(jī)(SVM)進(jìn)行枸杞產(chǎn)地的識別。為了優(yōu)化SVM模型的性能,使用網(wǎng)格搜索方法調(diào)整懲罰因子(C)和核參數(shù)(γ)。具體來說,懲罰因子C從20.1變化到250,核參數(shù)γ從2 - 15調(diào)整到2 - 10。

改進(jìn)的ResNet-34:與傳統(tǒng)機(jī)器學(xué)習(xí)算法相比,深度學(xué)習(xí)模型在分類任務(wù)中表現(xiàn)出更高的準(zhǔn)確性,這主要?dú)w因于其能夠自動從高維數(shù)據(jù)中提取更全面的特征。這種優(yōu)勢在高精度地理來源識別中得到了驗(yàn)證。如今,ResNet被廣泛應(yīng)用于各種分類任務(wù)??紤]到HSI數(shù)據(jù)的復(fù)雜性和高維性,以及模型的性能要求,本研究選擇了一種改進(jìn)版的ResNet-34架構(gòu)。

表1展示了改進(jìn)版ResNet-34的架構(gòu),說明其由五個模塊組成,每個模塊包含36個卷積層,最終連接至一個全連接層。與原始ResNet相比,*顯著的區(qū)別在于初始卷積層Conv1_x的修改。傳統(tǒng)的2D卷積層被替換為3D卷積層,以更好地適應(yīng)枸杞HSI數(shù)據(jù)的復(fù)雜性。Conv1_x層包含三個3D卷積子層和一個2D卷積子層,各自配備不同尺寸的卷積核:3 × 3 × 17、3 × 3 × 11、3 × 3 × 7(3D卷積)和3 × 3(2D卷積)。每次卷積操作均應(yīng)用修正線性單元(ReLU)激活函數(shù)。這一架構(gòu)調(diào)整的動機(jī)是利用HSI數(shù)據(jù)中固有的多波段圖像特性,這不僅提供了豐富的空間和光譜信息,也顯著增加了數(shù)據(jù)的復(fù)雜性和體量。整個枸杞HSI數(shù)據(jù)集(包括A面和B面)隨機(jī)分為訓(xùn)練集(占70%)和測試集(占30%)。訓(xùn)練集用于優(yōu)化改進(jìn)版ResNet-34模型的參數(shù),測試集則用于評估模型的預(yù)測性能。在本研究中,學(xué)習(xí)率、批量大小、訓(xùn)練周期數(shù)、損失函數(shù)和優(yōu)化器分別設(shè)置為0.001、16、200、交叉熵?fù)p失和Adam。這些參數(shù)的選擇旨在有效處理具有64 × 64像素空間維度和114個光譜波段的圖像。

img2 

特征波長提取:雖然HSI提供了豐富的光譜和空間信息,但其高維性和共線性以及冗余性對計(jì)算效率和模型魯棒性構(gòu)成了重大挑戰(zhàn)。此外,深度學(xué)習(xí)模型的“黑箱”性質(zhì)(其特征是缺乏固有的可解釋性)進(jìn)一步使其應(yīng)用復(fù)雜化。為了解決這些問題,有必要對預(yù)處理后的光譜進(jìn)行特征提取,以盡量減少非相關(guān)變量的影響,消除冗余信息,從而提高模型的計(jì)算效率和性能。

利用SHAP技術(shù)對模型輸出進(jìn)行解析,提取了400 - 1040 nm光譜范圍內(nèi)的特征波長。計(jì)算SHAP值,得到各光譜波段各數(shù)據(jù)點(diǎn)的貢獻(xiàn)分?jǐn)?shù),這些SHAP值代表各光譜波段對模型的重要程度。該方法不僅揭示了HSI數(shù)據(jù)中每個光譜波段對全球范圍內(nèi)預(yù)測結(jié)果的重要性,而且還描繪了其在每個HSI區(qū)域內(nèi)的影響。在本研究中,迭代選取貢獻(xiàn)率最高的5%以內(nèi)的光譜波段圖像作為模型的訓(xùn)練數(shù)據(jù),每一步遞增5%,直到模型的預(yù)測精度接近于原始模型。

(4)統(tǒng)計(jì)分析

所有NMR積分?jǐn)?shù)據(jù)隨后通過SIMCA 14.1軟件進(jìn)行多變量統(tǒng)計(jì)分析。在此之前,數(shù)據(jù)進(jìn)行了單位方差縮放,以突出微量成分的差異。使用偏最小二乘判別分析(PLS-DA)來揭示不同產(chǎn)地之間的組成差異,隨后應(yīng)用正交偏最小二乘判別分析(OPLS-DA)以識別枸杞的地理或品種標(biāo)志物。PLS-DA和OPLS-DA模型的性能通過模型參數(shù)R2X、R2Y和Q2進(jìn)行評估。此外,為了檢測潛在的過擬合,模型進(jìn)行了200次置換檢驗(yàn)。

枸杞中各成分的定量通過比較每種成分特征峰的積分與內(nèi)標(biāo)物(TSP)的積分實(shí)現(xiàn),濃度以平均值 ± 標(biāo)準(zhǔn)偏差(SD)表示,基于三次重復(fù)實(shí)驗(yàn)獲得。在本研究中,構(gòu)建了一個四維火山圖以展示倍數(shù)變化、p值、絕對相關(guān)系數(shù)(r)和投影變量重要性(VIP)。枸杞的地理標(biāo)志(GI)標(biāo)志物基于以下嚴(yán)格標(biāo)準(zhǔn)進(jìn)行識別:倍數(shù)變化不在0.8–1.2范圍內(nèi),p < 0.05,|r| > 0.90,且VIP值位于前5%。

為了分析同一枸杞樣品中NMR數(shù)據(jù)與HSI數(shù)據(jù)之間的相關(guān)性,計(jì)算了它們的Pearson相關(guān)系數(shù)。此外,使用精度評估了LR、SVM和改進(jìn)的ResNet-34模型在識別枸杞地理起源方面的性能。

1.2.結(jié)果與討論

(1)基于HSI數(shù)據(jù)的枸杞產(chǎn)地識別

圖2顯示了不同地理產(chǎn)地的枸杞樣品A面和B面的平均反射率。不同產(chǎn)地的枸杞樣品中相似的光譜趨勢表明相似的化學(xué)成分,而光譜強(qiáng)度的差異表明不同成分的濃度不同。同時,圖2a和b顯示了枸杞樣品的A面和B面光譜差異很小,這一發(fā)現(xiàn)意味著從單側(cè)采集HSI數(shù)據(jù)是一種可行的方法,因?yàn)楸M管樣本兩側(cè)的外部和內(nèi)部特征存在潛在變化,但它不會引入重大誤差。在400 - 560nm的可見光光譜中,枸杞樣品的光譜反射率明顯較低,曲線重疊,這可能是由于枸杞的紅色表面在該波長范圍內(nèi)反射的光較少。相反,在560 - 850nm波長范圍內(nèi),枸杞表面的反射率逐漸增加,光譜曲線呈現(xiàn)出微小的差異。雖然不同產(chǎn)地的枸杞樣品的反射率曲線開始出現(xiàn)差異,但差異仍然很小。枸杞在922 nm和985 nm處有小谷,在963 nm處有小峰,這些特征表明了O-H拉伸的第二和第一泛音。

img3 

圖2.來自不同地理和品種產(chǎn)地的枸杞樣品的(a)A面和(b)B面平均反射光譜 

盡管不同地理來源或品種的枸杞在光譜上存在差異,但不能通過視覺比較來有效區(qū)分。此外,相似的顏色和形狀增加了視覺區(qū)分的難度。因此,選擇合適的分類策略對其進(jìn)行準(zhǔn)確分類就變得至關(guān)重要。為了獲得更好的分類結(jié)果,本研究采用了機(jī)器學(xué)習(xí)技術(shù)。表2顯示了線性(LR)和非線性(SVM)模型對枸杞地理來源識別的分類結(jié)果。在A側(cè)和B側(cè)的測試數(shù)據(jù)集上,LR和SVM模型對枸杞產(chǎn)地的分類準(zhǔn)確率均未超過90%,但當(dāng)使用一側(cè)數(shù)據(jù)訓(xùn)練的模型對枸杞產(chǎn)地進(jìn)行識別時,LR模型和SVM模型的預(yù)測準(zhǔn)確率分別達(dá)到95.24%和99.43%。總體結(jié)果表明,機(jī)器學(xué)習(xí)結(jié)合HSI技術(shù)有效地識別了枸杞的起源。此外,通過從枸杞的任何一側(cè)收集HSI數(shù)據(jù),可以實(shí)現(xiàn)可靠的地理來源追溯。

img4 

考慮到LR和SVM模型的分類準(zhǔn)確率不足90%,引入深度學(xué)習(xí)對高維HSI數(shù)據(jù)進(jìn)行進(jìn)一步分析。正如之前的研究所指出的那樣,深度學(xué)習(xí)模型需要大量的訓(xùn)練數(shù)據(jù)集。因此,我們將來自枸杞兩側(cè)的HSI數(shù)據(jù)納入了包含730個樣本的訓(xùn)練數(shù)據(jù)集和包含320個樣本的測試數(shù)據(jù)集。為了避免同一枸杞樣品的A面或B面被分配至不同的數(shù)據(jù)集(從而影響驗(yàn)證結(jié)果的完整性),同一樣品的兩面被策略性地分配至相同數(shù)據(jù)集?;赗GB圖像和全光譜HSI數(shù)據(jù)構(gòu)建的ResNet-34與改進(jìn)版ResNet-34模型的混淆矩陣分別展示于圖3a和b及圖3c和d中。矩陣對角線上的值表示正確分類的樣本數(shù)和真實(shí)陽性率,而非對角線上的值則對應(yīng)誤分類樣本數(shù)和假陰性率。值得注意的是,當(dāng)以HSI數(shù)據(jù)為輸入時,改進(jìn)版ResNet-34模型在所有產(chǎn)地(TX、NMH、DLH、ZN1和ZN2)中實(shí)現(xiàn)了95.63%的最高分類準(zhǔn)確率。這一結(jié)果較傳統(tǒng)機(jī)器學(xué)習(xí)方法(LR和SVM)提高了6.26%。這一性能提升歸因于HSI數(shù)據(jù)提供的豐富空間和光譜信息。改進(jìn)版ResNet-34模型中3D和2D卷積層的結(jié)合,能夠有效利用光譜和空間特征圖,從而*大化模型的預(yù)測準(zhǔn)確性。

img5 

圖3.在測試數(shù)據(jù)集上使用ResNet-34模型(a和b)和改進(jìn)的ResNet-34模型(c和d)對五種枸杞樣品進(jìn)行地理來源識別的混淆矩陣

總的來說,改進(jìn)的ResNet-34模型在基于起源的五種不同類型的枸杞分類中顯示出較高的準(zhǔn)確性。然而,通過3D卷積運(yùn)算利用全譜HSI數(shù)據(jù)增加了計(jì)算需求和復(fù)雜性。此外,深度學(xué)習(xí)模型固有的“黑箱”特征在可解釋性方面提出了挑戰(zhàn)。為了減少信息冗余并提高模型的可解釋性,我們使用SHAP來識別HSI數(shù)據(jù)中對地理起源識別貢獻(xiàn)最大的光譜帶區(qū)域。SHAP值代表了每個光譜波段對模型預(yù)測能力的貢獻(xiàn)。對枸杞地理來源分類有重要貢獻(xiàn)的光譜波段主要從633 nm延伸到1040 nm。隨著光譜波段的增加,該模型對枸杞地理來源的識別精度逐漸提高(圖4)。實(shí)際上,在保留35%的光譜波段(n = 39)的情況下,該模型的分類精度仍然保持在95.63%的高水平,與全光譜HSI數(shù)據(jù)的分類精度相當(dāng)。光譜波段的減少也導(dǎo)致運(yùn)行時間減少29.9%。該方法不僅有效地提高了處理速度,而且提高了產(chǎn)地識別的效率,在準(zhǔn)確性和計(jì)算效率之間取得了平衡。

img6 

圖4.利用改進(jìn)的ResNet-34對不同波段子集的枸杞產(chǎn)地識別數(shù)據(jù)集精度進(jìn)行測試

(2)枸杞的地理來源及標(biāo)記物的NMR鑒定

枸杞樣品的一維1H NMR提供了詳細(xì)的光譜分布,通過分析峰強(qiáng)度和化學(xué)位移來辨別成分組成和濃度的差異,有助于識別地理來源。在δ0.8 ~ δ3.5的高場區(qū),主要與氨基酸和有機(jī)酸有關(guān),但差異不大。但在丙氨酸(δ1.48)和一種未知成分(δ1.51)濃度上存在顯著差異,其中寧夏枸杞(TX、ZN1和ZN2)含量顯著高于青海枸杞(NMH和DLH)。δ3.5 ~ δ5.5的中低場區(qū)以各種糖類為主,δ6.0 ~ δ10.0的低場區(qū)以芳香族化合物為主。通過比較化學(xué)位移和耦合常數(shù)與數(shù)據(jù)庫中的條目,包括FooDB和HMDB,以及與先前報(bào)告的相關(guān)性,從枸杞的核磁共振光譜中確定了62個組分。

對枸杞的化學(xué)成分分析顯示其含有豐富的氨基酸、有機(jī)酸、糖類、核苷和其他生物活性化合物。枸杞的氨基酸和有機(jī)酸含量特別豐富,十幾種氨基酸和五種有機(jī)酸的濃度在0.1至1mg /g之間。這些成分可能提供各種健康益處,例如產(chǎn)生免疫刺激作用,增強(qiáng)抗氧化能力,并保持健康的代謝率。具體而言,異亮氨酸是一種支鏈氨基酸,已被證明可以通過影響器官、細(xì)胞和反應(yīng)性物質(zhì)來增強(qiáng)免疫系統(tǒng),并可能上調(diào)宿主防御肽(如β-防御素)的表達(dá),這對先天免疫和適應(yīng)性免疫至關(guān)重要。甜菜堿是枸杞的一種*特標(biāo)記物,已被證明可以通過增強(qiáng)抗氧化活性和減少炎癥介質(zhì)來減輕四氯化碳(CCl4)誘導(dǎo)的肝損傷。有機(jī)酸,包括羥基丁酸、乙酸、蘋果酸和檸檬酸,對枸杞的感官特性(如味道、風(fēng)味和顏色)有重要影響。枸杞是一種久負(fù)盛名的中草藥和滋補(bǔ)食品,其主要成分是枸杞多糖,尤其是枸杞多糖是枸杞中最有價值的功能成分之一。最近的研究表明,LBP具有一系列的生物活性,包括眼神經(jīng)保護(hù)、抗衰老特性、抗氧化作用和免疫調(diào)節(jié)作用。在本研究中,LBP由半乳糖、鼠李糖、α-木糖、β-木糖、α-葡萄糖和β-葡萄糖組成,其濃度差異很大,在不同地理產(chǎn)地的濃度范圍為0.19 ~ 103.95 mg/g。此外,盡管咖啡酸、肉桂酸和維生素B6等芳香化合物的濃度很低(含量超過0.1 mg/g),但它們對人體健康起著至關(guān)重要的作用,包括抗氧化和抗菌特性,以及減少焦慮和增強(qiáng)視覺功能。雖然不同產(chǎn)地的枸杞在成分上存在顯著差異,但不能僅僅通過目測比較來確定其地理來源。因此,采用多元統(tǒng)計(jì)分析來確定每個起源的*特GI標(biāo)記。

圖5展示了基于枸杞NMR數(shù)據(jù)的OPLS-DA得分圖和對應(yīng)的火山圖,分別針對不同產(chǎn)地的枸杞樣品進(jìn)行成對比較,并附上模型參數(shù),包括R2X、R2Y和Q2值。圖5a展示了不同中國省份枸杞樣品的比較分析。其中,OPLS-DA得分圖(圖5a左圖)顯示寧夏和青海樣品沿預(yù)測成分(橫軸)呈現(xiàn)顯著分離。模型的高擬合度(R2Y = 0.871)和預(yù)測能力(Q2 = 0.833)表明該模型在區(qū)分地理來源方面的有效性?;鹕綀D(圖5a右圖)用于探索寧夏和青海枸杞的地理標(biāo)記物(GI標(biāo)記)。根據(jù)“材料與方法”部分中詳細(xì)描述的篩選標(biāo)準(zhǔn),地理標(biāo)記物被篩選出來(見圖5a右圖)。結(jié)果表明,青海枸杞的谷氨酸(Glu)、蘋果酸(MA)和脯氨酸(Pro)含量分別是寧夏樣品的1.96倍、1.91倍和1.68倍。而寧夏枸杞則以二羥基丙酮(DHA)含量顯著較高,其水平是青海枸杞的2.7倍。

其中,谷氨酸(Glu)以其多方面的生理作用而被廣泛認(rèn)可,包括抗氧化、應(yīng)對脅迫以及作為內(nèi)源性抗癌劑的作用,其衍生物在癌癥治療中的潛力也備受關(guān)注。脯氨酸(Pro)不僅是蛋白質(zhì)的重要組成部分,還顯著參與細(xì)胞對滲透壓和脫水脅迫的響應(yīng)。此外,脯氨酸是枸杞中*豐富的游離氨基酸,既作為滲透調(diào)節(jié)劑,也作為抗氧化劑發(fā)揮作用。青海枸杞中顯著較高的谷氨酸和脯氨酸濃度將增強(qiáng)其抗氧化和滲透調(diào)節(jié)功能

img7 

圖5. 基于枸杞NMR數(shù)據(jù)的OPLS-DA評分圖(左圖)和相應(yīng)的火山圖(右圖)

圖5b和圖5c分別展示了寧夏和青海省內(nèi)不同縣域枸杞樣品的比較分析。OPLS-DA得分圖(圖5b和圖5c左圖)顯示TX和ZN以及NMH和DLH樣品在預(yù)測成分(橫軸)上呈現(xiàn)出顯著分離。模型參數(shù)表明區(qū)分地理來源的有效性:TX與ZN的R2Y = 0.967,Q2= 0.936,NMH與DLH的R2Y = 0.966,Q2= 0.936,進(jìn)一步驗(yàn)證了模型的預(yù)測能力和可靠性?;鹕綀D(圖5b右圖)及統(tǒng)計(jì)數(shù)據(jù)揭示,ZN枸杞中包括1-甲基尿酸、膽堿、甜菜堿、咖啡酸、谷氨酸(Glu)、鳥苷、核糖內(nèi)酯、蘇糖醇和絲氨酸在內(nèi)的多種營養(yǎng)成分濃度顯著高于TX樣品,而蔗糖、甲酸和3-甲基黃嘌呤在ZN樣品中的濃度顯著低于TX。豐富的營養(yǎng)成分及*特的香氣賦予ZN枸杞更強(qiáng)的抗氧化活性、減少炎癥介質(zhì)及神經(jīng)保護(hù)作用,這在以往研究中也得到了驗(yàn)證。NMH與DLH樣品的火山圖(圖5c右圖)分析發(fā)現(xiàn)了17種顯著差異的成分,包括乙醛酸、蘋果酸、α/β-半乳糖醛酸、異亮氨酸、1-磷酸半乳糖、異丁酸、蔗糖、α/β-木糖、鼠李糖、肉桂酸、麥芽糖、古羅糖酸內(nèi)酯、麥芽三糖、精氨酸和氨基葡萄糖6-硫酸酯。其中,有13種成分在NMH枸杞中的濃度顯著高于DLH樣品。尤其是乙醛酸、異亮氨酸和異丁酸在NMH樣品中的濃度分別是DLH樣品的4.0倍、2.09倍和2.64倍。研究表明,異亮氨酸在調(diào)節(jié)先天免疫和適應(yīng)性免疫中起重要作用。異丁酸作為一種短鏈脂肪酸,由異亮氨酸等支鏈氨基酸發(fā)酵產(chǎn)生,已被證明可緩解DSS誘導(dǎo)的慢性結(jié)腸炎。這種作用主要?dú)w因于其增強(qiáng)腸道屏障功能的能力,從而突顯NMH枸杞在胃腸健康領(lǐng)域的潛在治療優(yōu)勢。

寧夏中寧縣因其*特的地理和氣候條件,為枸杞的高品質(zhì)種植提供了得天獨(dú)厚的自然環(huán)境。然而,不同品種的枸杞在化學(xué)和營養(yǎng)成分上存在差異。OPLS-DA模型清晰地將ZN1與ZN2沿橫軸分離(圖5d左圖),并表現(xiàn)出穩(wěn)健的模型參數(shù)(R2Y = 0.898,Q2= 0.846)。通過四項(xiàng)篩選標(biāo)準(zhǔn),火山圖(圖5d右圖)中鑒定出5種顯著差異成分。葡萄糖胺6-磷酸和古羅糖酸內(nèi)酯在ZN1中的濃度高于ZN2,而賴氨酸、綠原酸和肉桂酸則表現(xiàn)出相反趨勢。其中,葡萄糖胺6-磷酸作為葡萄糖胺的衍生物,在針對中度至重度膝骨關(guān)節(jié)炎患者的臨床試驗(yàn)中,被證明能夠顯著緩解疼痛并改善功能活動。賴氨酸是人體必需氨基酸,無法由人體自身合成,具有廣泛的健康益處,包括促進(jìn)正常生長、幫助肉堿生成以及減輕焦慮。此外,賴氨酸在癌癥治療中的潛力也備受關(guān)注。研究表明,賴氨酸的代謝影響組蛋白短鏈化,這是一種表觀遺傳修飾,從而調(diào)控癌癥免疫。

(3)地理標(biāo)志與HSI特征波長相關(guān)性分析

HSI和NMR都證明了在確定枸杞的地理起源方面的有效性。NMR,特別是與多元統(tǒng)計(jì)分析相結(jié)合,成為識別GI標(biāo)記物的有力工具。它提供了可以用來區(qū)分不同來源的化學(xué)信息的深度。然而,盡管在HSI中通常采用特征波段選擇的做法,但這些特征波長與樣品中特定成分之間的相關(guān)性通常仍未被探索。這一差距可能會限制HSI數(shù)據(jù)在潛在化學(xué)變化方面的可解釋性。此外,雖然NMR提供了豐富的生化見解,但它面臨著挑戰(zhàn),例如食品基質(zhì)樣品制備的復(fù)雜性,以及相關(guān)成本可能令人望而卻步。這些因素可能會阻礙快速、無損、高通量分析的實(shí)施,而這對于高效、可擴(kuò)展的枸杞原產(chǎn)地溯源過程至關(guān)重要。為了解決這些限制,開發(fā)結(jié)合這兩種技術(shù)的優(yōu)點(diǎn),同時盡量減少各自缺點(diǎn)的策略是至關(guān)重要的。該綜合方法為枸杞產(chǎn)地鑒定提供了一種更全面、更有效的方法。

通過HSI-NMR Pearson相關(guān)分析,成功地揭示了枸杞特征波長與GI標(biāo)記之間的相關(guān)性(圖6)。不同產(chǎn)地枸杞的GI標(biāo)記在單個光譜波段上表現(xiàn)出顯著的相關(guān)性,p值<0.001,Pearson相關(guān)系數(shù)(R)在自由度為150時超過0.264。在633 ~ 768 nm范圍內(nèi),大部分物質(zhì)與枸杞的紅色光譜具有明顯的相關(guān)性,這與枸杞的天然紅色相一致。對于不同省份的枸杞,以633.6 nm、665.6 nm和980 nm為中心的HSI波段與GI標(biāo)記物呈極顯著相關(guān)(p < 0.001)。其中,633.6 nm的HSI波段與脯氨酸(δ1.98)、蘋果酸(δ2.37)和咖啡酸(δ7.33)密切相關(guān)。665.6 nm處與谷氨酸(δ2.08)密切相關(guān),980 nm處與二羥丙酮(δ4.44)和葫蘆巴堿(δ9.13)相關(guān)。研究表明,以643 nm為中心的波段與氨基酸的第三和第四泛音區(qū)域有關(guān),包括脯氨酸和谷氨酸。此外,976 nm至987 nm的波長范圍對應(yīng)于油營養(yǎng)物中C-H(CH/CH2/CH3)鍵的第三泛音區(qū)域和O-H鍵的第三泛音區(qū)域。隨后,利用663.6 nm、665.6 nm和980 nm三個*顯*相關(guān)波段的圖像,利用改進(jìn)的ResNet-34建立了枸杞起源分類模型。僅使用三個波長的光譜圖像來區(qū)分寧夏和青海枸杞樣品的準(zhǔn)確率達(dá)到95%。在不同縣域的枸杞 GI標(biāo)記物(TX-ZN和NMH-DLH)中,特定生物標(biāo)記物與HSI波段之間存在顯著正相關(guān)(p值<0.001)。異亮氨酸(δ0.96)、精氨酸(δ1.68)、蘋果酸、膽堿(δ3.21)、1-甲基尿酸(δ3.33)、絲氨酸(δ3.96)、果糖(δ4.12)、綠原酸(δ7.19)和咖啡酸作為GI標(biāo)記與以633.6 nm為中心的HSI波段相連。谷氨酸(665.6 nm)、蘇糖醇(δ3.64)、硫酸氨基葡萄糖(δ4.91)和α-木糖(δ5.19)均與980 nm處的譜帶相對應(yīng)。對于不同品種的枸杞(ZN1 ~ ZN2),賴氨酸和綠原酸在633.6 nm處與HSI波段呈顯著相關(guān)(p值<0.001)。古洛內(nèi)酯(δ4.73)和葡萄糖胺6磷酸(δ5.45)在801 nm和719.3 nm處與HSI波段的相關(guān)性較弱(p < 0.05)。ZN1和ZN2品種的鑒定準(zhǔn)確率較低,為93.75%,主要是由于其種植地點(diǎn)較近。當(dāng)比較全光譜HSI數(shù)據(jù)和SHAP提取的特征波長時,使用與GI標(biāo)記物高度相關(guān)的光譜圖像,運(yùn)行時執(zhí)行時間分別顯著降低46.26%和33.99%。這表明有針對性的光譜圖像分析方法可以在不影響精度的情況下提高效率。

img8 

圖6.枸杞地理標(biāo)志標(biāo)記的HSI-NMR Pearson系數(shù)相關(guān)圖

本研究結(jié)果表明,GI標(biāo)記物與HSI特征波長的相關(guān)性有效地闡明了光譜波段與枸杞化學(xué)成分之間的聯(lián)系。這種相關(guān)性不僅增強(qiáng)了我們對枸杞光譜特征的理解,而且強(qiáng)調(diào)了開發(fā)便攜式多光譜設(shè)備的潛力。該裝置可提供一種無創(chuàng)、低成本、高通量的地理來源鑒定方法。

結(jié)論

本研究提出了一種將HSI和NMR技術(shù)與深度學(xué)習(xí)相結(jié)合,用于準(zhǔn)確識別枸杞的地理來源及其GI的新方法。改進(jìn)的ResNet-34模型通過整合3D和2D卷積層,在利用HSI數(shù)據(jù)進(jìn)行產(chǎn)地識別中實(shí)現(xiàn)了95.63%的分類準(zhǔn)確率。此外,采用SHAP方法選擇特征波長,與使用全光譜HSI數(shù)據(jù)的分類準(zhǔn)確率相當(dāng),但運(yùn)行時間縮短了29.9%。研究還表明,基于枸杞不同側(cè)面數(shù)據(jù)訓(xùn)練的模型具有魯棒性,且模型性能未受到顯著影響。通過NMR分析,研究識別并定量分析了62種成分,并通過多變量統(tǒng)計(jì)分析確定了各地理來源的GI標(biāo)記。通過皮爾遜相關(guān)系數(shù)評估GI標(biāo)記與HSI特征波長的相關(guān)性,增強(qiáng)了HSI數(shù)據(jù)的可解釋性,從而獲得了更準(zhǔn)確且有意義的科學(xué)洞察。相比SHAP模型,本研究的方法進(jìn)一步將運(yùn)行時間縮短了33.99%。這些研究結(jié)果對于開發(fā)便攜式多光譜設(shè)備具有重要意義,可提供一種快速、準(zhǔn)確且經(jīng)濟(jì)高效的解決方案,用于枸杞產(chǎn)地的識別,從而促進(jìn)植物產(chǎn)業(yè)中的質(zhì)量控制和溯源管理。

推薦產(chǎn)品

GaiaField-V10E

作者簡介(人名+單位+博導(dǎo)/碩導(dǎo))

通訊作者:馮江華,廈門大學(xué)電子科學(xué)與技術(shù)學(xué)院,博導(dǎo)

參考文獻(xiàn)

論文引用自一區(qū)文章:Chengcheng He , Xin Shi , Haifeng Lin , Quanquan Li , Feng Xia, Guiping Shen,Jianghua Feng , The combination of HSI and NMR techniques with deep learning for identification of geographical origin and GI markers of Lycium barbarum L. (2024) Food Chemistry 461.140903

免責(zé)聲明

  • 凡本網(wǎng)注明“來源:化工儀器網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-化工儀器網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來源:化工儀器網(wǎng)”。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。
  • 本網(wǎng)轉(zhuǎn)載并注明自其他來源(非化工儀器網(wǎng))的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé),不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個人從本網(wǎng)轉(zhuǎn)載時,必須保留本網(wǎng)注明的作品第一來源,并自負(fù)版權(quán)等法律責(zé)任。
  • 如涉及作品內(nèi)容、版權(quán)等問題,請?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。
企業(yè)未開通此功能
詳詢客服 : 0571-87858618