隨sui著zhe食shi品pin安an全quan問wen題ti的de日ri益yi受shou到dao重zhong視shi,不bu合he格ge食shi品pin可ke能neng導dao致zhi嚴yan重zhong的de健jian康kang風feng險xian,因yin此ci在zai食shi品pin加jia工gong中zhong對dui質zhi量liang的de嚴yan格ge把ba控kong尤you為wei重zhong要yao。中zhong國guo浙zhe江jiang與yu安an徽hui交jiao界jie的de天tian目mu山shan地di區qu是shi核he桃tao的de重zhong要yao產chan區qu,但dan目mu前qian在zai核he桃tao破po殼ke和he篩shai選xuan過guo程cheng中zhong仍reng主zhu要yao依yi賴lai人ren工gong目mu視shi檢jian測ce,工gong人ren需xu在zai核he桃tao仁ren篩shai選xuan階jie段duan識shi別bie並bing剔ti除chu諸zhu如ru黑hei斑ban仁ren、油變仁、幹癟仁及碎殼等內源雜質。這種人工方式不僅效率低、成本高,而且容易出現誤判與漏檢,給消費者健康及企業信譽帶來潛在威脅。
近年來,隨著人工智能與高光譜傳感技術的發展,近紅外高光譜成像(NIR-HSI)已在食品檢測領域展現出顯著優勢。該技術結合光譜信息與空間成像特征,能夠實現樣品化學組成的定量分析與無損檢測,在肉類紋理、棗類糖分及果仁黴變識別等方麵均取得良好效果。相比傳統化學檢測方法,高光譜成像具有操作簡便、快速無損的特點,為實現核桃雜質的在線檢測提供了可能。
然而,現有研究多集中於食品成分分析與種類分類,對核桃中潛在風險雜質的檢測仍研究不足。針對這一問題,本文提出利用NIR-HSIjiehechuantonghuaxuejiliangxuefangfayushenduxueximoxing,shixianhetaopokeyangbenzhongneiyuanzazhidekuaisufenleishibie。yanjiubujinyanzhenglegaoguangpujishuzaihetaozazhijiancezhongdekexingxing,yeweishipingongyezhongshixianzhinenghua、自動化質量控製提供了新的思路與技術路徑。
作者信息:戴丹,浙江農林大學,碩導
期刊來源:Journal of Food Composition and Analysis
核桃製品中的雜質會對人體健康造成嚴重威脅,而傳統人工篩選效率低、準(zhun)確(que)率(lv)不(bu)足(zu),因(yin)此(ci)本(ben)研(yan)究(jiu)開(kai)發(fa)一(yi)種(zhong)基(ji)於(yu)近(jin)紅(hong)外(wai)高(gao)光(guang)譜(pu)成(cheng)像(xiang)技(ji)術(shu)的(de)核(he)桃(tao)內(nei)源(yuan)雜(za)質(zhi)快(kuai)速(su)檢(jian)測(ce)方(fang)法(fa)。首(shou)先(xian),通(tong)過(guo)生(sheng)化(hua)實(shi)驗(yan)驗(yan)證(zheng)了(le)不(bu)同(tong)類(lei)型(xing)核(he)桃(tao)仁(ren)在(zai)總(zong)酚(fen)含(han)量(liang)與(yu)黃(huang)酮(tong)含(han)量(liang)上(shang)的(de)差(cha)異(yi)。隨(sui)後(hou),基(ji)於(yu)蝶(die)群(qun)優(you)化(hua)算(suan)法(fa)改(gai)進(jin)構(gou)建(jian)了(le)支(zhi)持(chi)向(xiang)量(liang)機(ji)(SVM)分類模型,並利用核桃內源雜質的近紅外數據進行訓練。此外,研究提出了引入注意力機製的深度神經網絡模型 WT-NIRSNet,通過與傳統方法的係統對比,驗證深度學習結合 NIR-HSI 在核桃內源雜質快速檢測中的優勢與可行性,旨在為核桃加工過程中的安全質量控製提供技術支撐。
核he桃tao樣yang品pin於yu從cong中zhong國guo杭hang州zhou臨lin安an區qu道dao石shi的de一yi家jia核he桃tao廠chang采cai購gou,秋qiu季ji是shi核he桃tao廠chang作zuo業ye的de主zhu要yao季ji節jie,確que保bao樣yang品pin采cai集ji光guang譜pu與yu生sheng產chan線xian要yao求qiu一yi致zhi,采cai用yong物wu理li方fang法fa將jiang完wan整zheng核he桃tao破po殼ke後hou,從cong核he桃tao破po殼ke材cai料liao中zhong,根gen據ju外wai觀guan和he形xing態tai,篩shai選xuan出chu具ju有you代dai表biao性xing的de樣yang品pin1022個,涵蓋黑斑仁、油脂仁、萎縮仁、碎殼及正常仁 5 類(示於圖 1)。所有樣品均置於陰涼幹燥處密封保存,以確保品質穩定。並測定其黃酮類化合物和總酚類化合物含量。

圖1 破殼核桃物料示例
(a) 油脂仁 (b) 正常仁 (c) 碎殼 (d) 萎縮仁 (e) 黑斑仁
采用 NIR-HSI 係統(Gaia-Field-N17E,雙利合譜)對核桃破殼樣本進行高光譜采集,波段覆蓋 855–1705 nm,共 512 個連續波長。係統由成像光譜儀、四組 50 W 鹵素燈、升降平台、控製電腦及配套軟件(Optiplex 7080MT / SpecView)組成。圖 2 所示為核桃仁的偽彩色高光譜立方體(x × y × λ),其中 x、y 為空間維,λ 為光譜維。借助 ENVI 5.3 在圖像上勾畫感興趣區域(ROI),並提取區域內平均反射率生成光譜庫。

圖2 核桃仁高光譜圖像偽彩色示意圖
為減輕光散射的影響,本研究通過SNV和SG方法提升信噪比(SNR)。此外,采用了去趨勢(DT)預處理方法,通過對光譜進行二項線性擬合並扣除趨勢線,消*了(le)基(ji)線(xian)漂(piao)移(yi)對(dui)光(guang)譜(pu)的(de)影(ying)響(xiang)。此(ci)外(wai),光(guang)譜(pu)數(shu)據(ju)通(tong)常(chang)具(ju)有(you)高(gao)維(wei)性(xing),這(zhe)種(zhong)冗(rong)餘(yu)數(shu)據(ju),會(hui)增(zeng)加(jia)分(fen)類(lei)模(mo)型(xing)的(de)計(ji)算(suan)量(liang),並(bing)且(qie)不(bu)同(tong)波(bo)長(chang)之(zhi)間(jian)可(ke)能(neng)存(cun)在(zai)一(yi)定(ding)的(de)相(xiang)關(guan)性(xing),主(zhu)成(cheng)分(fen)分(fen)析(xi)(PCA)算法能夠提取出原始特征波長的主要成分,並保留足夠的有用信息。因此,采用PCA對原始光譜數據進行特征降維。
在機器學習方法中,作者開發了一個BOA-PCA-SVM的光譜分類模型。BOA為蝶形優化算法,通過模擬蝴蝶在覓食過程中的行為來尋求目標函數的*優解。SVM模型使用徑向基函數(RBF)作為核函數。
在深度學習方法上,作者對ResNet18進行了改進,典型 ResNet18由 7×7 首層卷積、八個殘差塊(每塊含兩層 3×3 卷積)及末端全連接層構成。為使其適配一維近紅外數據,作者在第 4、第 8 殘差塊後嵌入高*通道注意力(ECA)模塊。該模塊可動態重標定通道權重,強化有效特征、抑製冗餘信息,最終得到的改進網絡命名為 WT-NIRSNet,其架構如圖 3 所示。深度網絡的超參數統一設定為:Adam優化器、學習率調度器ReduceLROnPlateau、初始學習率1×10⁻⁴、訓練輪數50、批量大小32。

圖3 WT-NIRSNet 網絡結構。當特征層尺寸發生變化時,選用 BasicBlock_1;否則采用 BasicBlock_2。
受實驗環境與光譜設備限製,掃描首尾波段易引入固有噪聲。據此,本研究截取 900–1650 nm 範圍內的 450個波長作為原始數據。圖 4 給出了該片段的光譜曲線,可見部分類別走勢高度趨同、五類樣本吸光度相互交疊,為核桃內源雜質的精準判別帶來顯著挑戰。

圖4 破殼核桃樣本的原始光譜曲線
1022 份樣本按 8:1:1 比例劃分為訓練、驗證與測試集,其中訓練集 817 份,驗證集 102 份,測試集 103 份。本研究對核桃仁的總酚與總黃酮含量進行了測定。每份樣品均設 3 次重複。萎縮仁的兩種活性成分含量最高,可能與其單粒質量小有關:稱(cheng)取(qu)等(deng)量(liang)樣(yang)品(pin)時(shi)需(xu)投(tou)入(ru)更(geng)多(duo)粒(li)數(shu),而(er)酚(fen)類(lei)和(he)黃(huang)酮(tong)主(zhu)要(yao)富(fu)集(ji)於(yu)種(zhong)皮(pi)。油(you)脂(zhi)仁(ren)與(yu)黑(hei)斑(ban)仁(ren)的(de)含(han)量(liang)則(ze)低(di)於(yu)正(zheng)常(chang)仁(ren),推(tui)測(ce)源(yuan)於(yu)脂(zhi)質(zhi)過(guo)氧(yang)化(hua)消(xiao)耗(hao)及(ji)抗(kang)病(bing)代(dai)謝(xie)損(sun)失(shi)。
以 SVM 模型為基準,對比不同預處理效果。SNV 可有效抑製背景噪聲與環境擾動,提升識別精度;而 DT 處理反而顯著降低準確率,不適用於本任務。SG 與 SNV 聯合策略表現*優,測試集準確率可達 95.15%。經該組合處理後的光譜(圖 5)在吸收峰處放大了不同雜質類別的差異,削弱了設備因素與小樣本帶來的弱變異幹擾。

圖5 經SG+SNV預處理後的破殼核桃物料光譜曲線
本研究引入 PCA 將海量光譜變量壓縮為少量主成分。經 SG+SNV 預處理後的前 5 個主成分的累計貢獻率已突破 98%,足以囊括光譜的絕大部分信息。因此,後續建模將保留這 5 個主成分作為 SVM 的輸入,實現降維後的精準分類。
本節通過混淆矩陣與測試集準確率對模型性能進行評估。BOA的智能優化算法迭代地選擇參數的*佳組合:c = 7.7,σ = 0.2。BOA-PCA-SVM模型的測試集準確率達到96.12%,優於PCA-SVM模型。圖6為模型的混淆矩陣:hengzuobiaoweimoxingyucebiaoqian,zongzuobiaoweiceshijizhenshibiaoqian。tuzhongkejian,heibanrenyuyouzhirendewupanlvjiaogao,zhekenengshiyinweitamendeneibuchengfenxiangsi。tongguozheyiguanchatuice,houxushiyanxuzhongdiankuochongzheliangleiyangben,yibianmoxingxuexigengjupanbielidetezheng。

圖6 不同SVM改進模型的混淆矩陣示意 NP:未預處理;SS:SG+SNV預處理
本研究采用多種人工神經網絡對核桃內源雜質的近紅外光譜數據進行定性分析,多層感知(MLP)模型由三個完全連接的層堆疊在一起組成,Conv3Net是一種人工設計的CNN,由三個卷積層組成,卷積核的大小分別為1 × 21、1 × 19。考慮到光譜數據可以被視為序列數據,因此也采用了在各種應用中廣泛用於處理序列的長短時記憶(LSTM)模型來對核桃破殼材料進行分類。此外,作者還研究了AlexNet和VGG16模型,這兩種模型是對經典Conv2D結(jie)構(gou)的(de)改(gai)進(jin),具(ju)有(you)更(geng)深(shen)的(de)網(wang)絡(luo)層(ceng)。選(xuan)取(qu)驗(yan)證(zheng)集(ji)損(sun)失(shi)最(zui)低(di)的(de)權(quan)重(zhong)文(wen)件(jian)用(yong)於(yu)計(ji)算(suan)測(ce)試(shi)集(ji)的(de)各(ge)項(xiang)評(ping)估(gu)指(zhi)標(biao)。所(suo)有(you)模(mo)型(xing)的(de)曲(qu)線(xian)在(zai)迭(die)代(dai)後(hou)期(qi)均(jun)趨(qu)於(yu)平(ping)穩(wen),表(biao)明(ming)訓(xun)練(lian)已(yi)收(shou)斂(lian)。
實驗結果彙總如下表所示。MLP、AlexNet 與 VGG16 的識別準確率均不足 90 %;三者的核心差異在於網絡深度,單純堆疊卷積層並不能提升近紅外判別性能。LSTM、Conv3Net 與本文提出的 WT-NIRSNet 表現優異,其中 WT-NIRSNet 在未對光譜做任何預處理的情況下,測試集準確率即達 99.03 %。殘差結構有效緩解了深度網絡在近紅外定性分析中深層網絡信息丟失的問題,從而提高了模型的識別精度,顯著優於BOA-PCA-SVM模型。充分證明 WT-NIRSNet 對背景噪聲具有強魯棒性,可從複雜數據集中精準提取關鍵特征並完成分類。

為進一步驗證 WT-NIRSNet 的泛化能力與魯棒性,本研究引入獨立外部數據集開展實驗。該批光譜數據采集自不同時間,本文提出的兩種模型(BOA-PCA-SVM和WT-NIRSNet)均保持高識別準確率;其中 WT-NIRSNet 僅將 5 例樣本誤判(圖 7),其餘均正確分類。綜上,NIR-HSI 在核桃內源雜質識別中展現出巨大潛力。

圖7 獨立實驗混淆矩陣
本研究構建了一套基於近紅外高光譜成像(NIR-HSI)與深度學習的無損檢測體係,用於精準識別核桃內部雜質。首先,將SVM與近紅外光譜數據耦合,建立定性判別模型;經 SG+SNV 預處理後,光譜信噪比顯著提升,再結合 PCA 降維以壓縮信息冗餘。進一步引入BOA對 PCA-SVM 的超參數空間進行全局尋優,最終模型在測試集上對 5 類核桃破殼樣本的識別準確率達 96.12%。為再度提升雜質檢出精度,本研究在 ResNet 圖像分類框架中嵌入高*通道注意力模塊(ECA),強化對微弱缺陷特征的捕捉能力。改進後的網絡在測試集上實現 99.03% deshibiezhunquelv,bingzaiwaibuyanzhengjizhongwenjiandidingweilejuedaduoshuneiyuanxingzazhi,yanzhenglefangfadefanhuaxingnengyugongchengluodiqianli。zongshangsuoshu,zaibenyanjiurenwuzhong,shenduxuexiquan*優you於yu傳chuan統tong化hua學xue計ji量liang學xue方fang法fa。憑ping借jie對dui高gao維wei特te征zheng的de卓zhuo越yue提ti取qu能neng力li,深shen度du學xue習xi尤you其qi擅shan長chang麵mian向xiang大da規gui模mo近jin紅hong外wai數shu據ju集ji的de定ding性xing判pan別bie。近jin紅hong外wai高gao光guang譜pu成cheng像xiang(NIR-HSI)技術可精準分類破殼核桃物料,驗證了其工業落地可行性,也彰顯了模型在真實生產場景中的廣闊前景。
地址:無錫市梁溪區南湖大道飛宏路58-1-108
電話:
郵箱:
地址:北京市海澱區中關村大街19號
電話:
郵箱:
地址:陝西省西安市高新區科技一路40號盛方科技園B座三層東區
電話:
郵箱:
地址:成都市青羊區順城大街206號四川國際大廈七樓G座
電話:
郵箱:
地址:深圳市龍華區民治梅龍路
電話:
郵箱: