背景
水分含量(Moisture content, MC)在海參醃製過程中起著重要作用。較高的MC會導致膠原纖維斷裂,使海參在儲存過程中更容易受損,較低的MC會降低海參的口感和營養價值。準確控製海參醃製過程中MC的含量,對海參的口感品質和商品價值具有重要意義。
大量研究使用高光譜成像(Hyperspectral imaging, HSI)和低場核磁共振(Low field nuclear magnetic resonance, LF-NMR)研究水的遷移和變化並預測MC。HSI是一種用於探測淺水表麵物理和化學性質的快速、無損監測技術。LF-NMR是另一種流行的無創檢測技術,用於監測食品中水分狀態的變化和水分遷移。低頻核磁共振之所以有效,是因為當電磁脈衝(Electromagnetic pulse, EMP)在垂直方向輻射時,氫質子由於能量從低能級到高能級的轉變而處於不穩定狀態,而當EMP消失時,這一過程是可逆的。對於海參淺層表麵複雜的棘皮結構和內部複雜的腔體、體壁等結構,HSI和LF-NMR聯合檢測可以更準確地預測MC。
深度學習(Deep learning, DL)網絡可以減少模型對人類經驗的依賴,提高模型的泛化能力。CS(Cuckoo search)優化算法通過提取數據的顯著特征實現降維,可以有效提高基於小樣本空間和低類間差異數據的模型性能。因此,本研究基於HSI和LF-NMR數據,采用DL網絡和CS優化算法聯合構建預測模型,對鹽漬海參的MC進行預測分析。
具體研究目標如下:(1)分別針對HSI和LF-NMR數據構建基於變種CS算法的MC深度學習預測模型;(2)通過探索模型的性能,確定了HSI和LF-NMR的*優模型;(3)根據*優模型和核磁共振成像(Magnetic resonance imaging, MRI),分別基於HSI和LF-NMR數據可視化MC分布;(4)構建基於融合數據的MC的Fusion-net DL(FDL)預測模型,並與以往基於單一數據的模型進行比較,選擇最終的*優模型。
試驗設計
大連工業大學王慧慧教授團隊利用Image-λ-N17E近紅外高光譜成像係統(江蘇雙利合譜公司)獲取了510個不同醃製處理下的海參高光譜影像(圖1a)。高光譜數據由350張640×803像素的單波段光譜圖像組成,波長範圍為934.8 ~ 1710.6 nm。如圖1e所示,將鹽漬海參樣品置於核磁共振分析儀(Niumag電氣公司)中進行LF-NMR測,得到如圖1f所示的橫向鬆弛曲線。每個醃製周期取同一樣品進行MRI分析,通過自旋回波成像序列獲得MC在不同醃製時間的氫質子MRI(圖1g)。
數據的強相關性可能導致“維度詛咒”,有必要對冗餘的高維信息進行降維處理。使用CS算法選擇特征,如圖1h所示。針對不同的應用領域,CS有不同的變體,本研究使用的三個變體分別為Traditional-CS(TCS)、Binary-CS(BCS)和Chaotic-CS(CCS)。
將降維後的數據輸入到相應的模型中進行訓練,選擇*優模型(圖1i),實現MC分布變化的可視化(圖1j)。在本文中,MC的預測模型包括基於高光譜數據的單獨DL模型、基於LF-NMR數據的單獨DL模型和基於HSI和LF-NMR數據的FDL模型。對於HSI數據,DL框架中使用了兩個1D卷積層,分別包含32個和64個卷積核,大小為1×3(圖2a)。
對於LF-NMR數據,DL框架的總體結構與上述HSI相同。但對於LF-NMR曲線,除了縱向數值差異外,吸收峰也有明顯的橫向位移。因此,LF-NMR數據比HSI數據更複雜,需要更多的卷積核來提取潛在特征來解決這種複雜的情況。因此,如圖2b所示,將大小為1×3的64、128和256個卷積核組成的三個卷積層應用於LF-NMR預測模型。對於HSI和LF-NMR,分別建立了基於整體和降維數據(W和DR)的MC預測深度學習模型,並討論了它們之間的性能差異。
圖2c給出了MC融合預測模型的融合策略。將約簡後的兩種特征分別放入相應的DL框架中,在flatten層和dense層之間添加concatenate層,將兩種特征合並。

圖1 研究流程圖

圖2 多種深度學習模型。基於光譜的深度學習模型(a);基於LF-NMR的深度學習模型(b);融合深度學習模型(c)。
結論
圖3為不同醃製階段樣品的光譜反射率變化圖。在圖3a中,不同醃製時間樣品的光譜反射率變化趨勢大致一致。但在1100 nm之前,0 h樣品的反射率值與其他樣品相差很大。可以得出結論,醃製過程的持續時間將是導致反射率變化的重要因素。在960 nm、1190 nm和1430 nm處可以觀察到三個明顯的吸收峰。在圖3b中,平均光譜反射率呈現出與醃製時間相關的變化規律,在960 nm左右,隨著醃製時間的延長,反射率顯著增加,說明樣品內部水分有所降低。在1190 nm左右,反射率逐漸增大,說明海參樣品中的脂質和蛋白質含量在醃製過程中損失較慢。

圖3 不同醃製階段海參樣品的平均光譜反射率曲線
海參樣品在各醃製周期的CPMG弛豫衰減曲線和T2弛豫光譜如圖4所示。如圖4a所suo示shi,樣yang品pin中zhong質zhi子zi的de衰shuai變bian速su率lv隨sui著zhe醃yan製zhi時shi間jian的de延yan長chang而er增zeng加jia,在zai前qian三san個ge醃yan製zhi階jie段duan變bian化hua較jiao大da。由you此ci可ke以yi推tui斷duan,在zai醃yan製zhi初chu期qi,樣yang品pin中zhong大da量liang水shui分fen流liu失shi,樣yang品pin中zhong氫qing質zhi子zi的de含han量liang同tong時shi下xia降jiang,導dao致zhi質zhi子zi衰shuai變bian速su率lv明ming顯xian增zeng加jia。在zai醃yan製zhi過guo程cheng後hou期qi,樣yang品pin的de內nei部bu和he外wai部bu幾ji乎hu接jie近jin滲shen透tou壓ya平ping衡heng,導dao致zhiMC變化很小。如圖4b所示,在未醃製(0 h)的海參弛豫曲線上存在3個質子弛豫峰,分別為束縛水(T21)、不動水(T22)和遊離水(T23)。醃製處理後,T21先減少後消失,T22和T23逐zhu漸jian減jian少shao。隨sui著zhe醃yan製zhi時shi間jian的de增zeng加jia,海hai參can樣yang品pin中zhong的de束shu縛fu水shui向xiang右you遷qian移yi,逐zhu漸jian變bian為wei不bu動dong水shui。不bu動dong水shui向xiang左zuo移yi動dong並bing壓ya實shi。隨sui著zhe時shi間jian的de推tui移yi,遊you離li水shui也ye會hui轉zhuan移yi到dao剩sheng餘yu的de地di方fang,很hen容rong易yi丟diu失shi,從cong而er創chuang造zao了le一yi個ge抑yi製zhi微wei生sheng物wu活huo動dong的de環huan境jing,這zhe有you利li於yu海hai參can的de儲chu存cun。

圖4 LF-NMR數據
結合CS降維算法和1D-CNN DL框架,構建了基於HSI、LF-NMR信息的MC預測模型。圖5為基於全部特征的MC估測模型精度圖。證明了DL框架適用於基於HIS以及LF-NMR數據的MC預測。將HSI中所有波長和LF-NMR中時間點對應的數據輸入到FDL框架中進行MC計算。預測效果如圖5e和圖5f所示,可以看到W-FDL具ju有you明ming顯xian的de優you勢shi。這zhe表biao明ming兩liang類lei數shu據ju在zai訓xun練lian中zhong是shi相xiang輔fu相xiang成cheng的de,即ji在zai單dan一yi數shu據ju類lei型xing中zhong,不bu可ke避bi免mian的de會hui出chu現xian個ge別bie數shu據ju的de異yi常chang導dao致zhi某mou一yi樣yang本ben的de預yu測ce失shi敗bai,但dan同tong一yi樣yang本ben的de兩liang類lei數shu據ju幾ji乎hu不bu可ke能neng同tong時shi出chu現xian異yi常chang,這zhe為wei預yu測ce模mo型xing的de準zhun確que性xing提ti供gong了le保bao證zheng。

圖5 HSI-W-DL模型在校準集(a)和預測集(b)、LF-NMR-WDL模型在校準集(c)和預測集(d)、W-FDL模型在校準集(e)和預測集(f)的模型精度。
圖6為三種不同降維算法在HSI數據集中選擇的具體波段,用虛線表示。TCS選擇的20個波段如圖6a所示,在整個波長範圍內分散,既提供了豐富的信息,又降低了相關性。圖6b為BCS算法選取的159個波段,雖然在1000-1050 nm、1200-1250 nm和1500-1600 nm波長範圍內所選波段的密度高於其他地區,但其分布基本覆蓋了整個波長範圍。這意味著所有的特征都包含在選擇的波段中,BCS通過大幅減少數據量來降低計算成本,而不是消除非顯著特征,這可能不利於提高模型的泛化能力,並可能導致過擬合現象。圖6c顯示了CCS選擇的20個特定波段,所選波段在全波長範圍內的分布比TCS更加離散。在優化過程中,前20次迭代HSI-TCS-DL和HSI-CCS-DL的MSE遠小於HSI-BCS-DL,50次迭代後HSI-BCS-DL的MSE沒有減小。同時,自第10次迭代以來,HSI-CCS-DL的MSE約為HSI-TCS-DL的一半,證明混沌映射算法在尋找*優解方麵優於隨機算法。

圖6 選自HSI-TCS-DL(a)、HSI-BCS-DL(b)、HSI-CCS-DL(c)模型的具體波段以及HSI-TCS-DL(d)、HSI-BCS-DL(e)、HSI-CCSDL(f)模型的MSE衰減。
圖7顯示了HSITCS-DL、HSI-BCS-DL和HSI-CCS-DL模型的性能。與全數據模型相比,特征約簡後的數據點更收斂於45°直線,對較低MC值的預測效果提高最為顯著。與HSI-W-DL相比,HSI-TCS-DL模型的準確性和穩定性得到了顯著提高,表明降維後的數據更具代表性。雖然HSI-BCS-DL的性能比HSI-W-DL略有提高,但在數據適應性和預測精度方麵不如HSI-TCS-DL。與HSI-TCS-DL模型相比,HSI-CCS-DL的性能有所提升,這是因為在CCS降維算法中使用混沌序列初始化種群,有效地解決了模型因隨機初始化而陷入局部*優解的問題。根據上述對比,在HSI數據中,選擇CCS作為*優降維算法,確定HSI-CCS-DL模型為*優模型。
基於HSI-CCS-DL的MC可視化如圖8所示。可以清晰地顯示樣品淺表麵同一階段內不同點的MC差異以及不同階段間的變化規律。海參沒有醃製時,基本呈藍色,說明其MC最高。隨著醃製時間的延長,中間區域的顏色由藍色變為綠色,最終變為黃色,同時黃色區域逐漸向邊緣擴展。

圖7 HSI-TCS-DL模型在校準集(a)和預測集(b)、HSI-BCS-DL模型在校準集(c)和預測集(d)、HSI-CCS-DL模型在校準集(e)和預測集(f)的模型精度。

圖8 基於HSI-CCS-DL模型的海參醃製過程MC分布可視化
圖9詳細描述了LF-NMR-TCS-DL、LF-NMR-BCS-DL和LF-NMR-CCS-DL的特征選擇以及MSE衰減結果。CCS算法是*優的,BCS算法提前收斂,但三種算法的結果差異減小。對於LF-NMR數據,選擇CCS作為*優降維算法,並確認LF-NMR-CCS-DL為*優模型,這與HSI數據的結果一致。

圖9 利用LF-NMR-TCS-DL(a), LF-NMR-BCS-DL(b), LF-NMR-CCS-DL(c)模型選擇的波段以及其MSE衰減(d)。
結合HSI和LF-NMR數據的FDL框架用於海參MC預測。由於前文確定CCS降維算法效果*好,因此選擇CCS和FDL框架構建CCS-FDL模型。如圖10所示,校正集和預測集的R2均達到0.99。在數據點的分布上,圖10a中的訓練集的數據點更加緊湊,更接近真實值,圖10b中的預測集也出現了同樣的情況。FDL框架的優異性能可能是由於HSI和LF-NMR數據之間的互補優勢,即在檢測過程中,同時使用HSI和LF-NMR數據可以大大減少單個數據不準確造成的預測偏差。各模型的比較分析結果見表1。可以看出,對於FDL框架,基於HSI和LF-NMR數據的模型的性能都得到了顯著提高,特別是在整個數據模型中,並且CCS-FDL模型使用40個特征輸入實現了*佳性能。

圖10 在HSI和LF-NMR數據集中使用CCS提取特征的FDL模型的預測結果
表1 基於FW、TCS、BCS和CCS的深度學習模型性能

作者信息
王慧慧,博士,大連工業大學機械工程與自動化學院教授,博士生導師。
主要研究方向:基於機器視覺的智能檢測研究、裝備數字化設計。
參考文獻:
Zeng, F., Shao, W., Kang, J., Yang, J., Zhang, X., Liu, Y., & Wang, H. (2022). Detection of moisture content in salted sea cucumbers by hyperspectral and low field nuclear magnetic resonance based on deep learning network framework. Food Res Int, 156.
https://doi.org/10.1016/j.foodres.2022.111174
地址:無錫市梁溪區南湖大道飛宏路58-1-108
電話:
郵箱:
地址:北京市海澱區中關村大街19號
電話:
郵箱:
地址:陝西省西安市高新區科技一路40號盛方科技園B座三層東區
電話:
郵箱:
地址:成都市青羊區順城大街206號四川國際大廈七樓G座
電話:
郵箱:
地址:深圳市龍華區民治梅龍路
電話:
郵箱: