應用方向:
高光譜成像技術在農業領域,特別是作物種子識別與分類中具有重要應用價值。通過獲取種子在多個連續波段下的光譜與空間信息,高光譜成像可實現對外觀差異微小的種子品種進行無損、高精度識別。結合化學計量學和機器學習方法,高光譜技術不僅適用于實驗室研究,還具備向自動化、智能化農業生產流程中推廣的潛力,為精準農業、種子分選與農業產品質量控制提供了有效的技術支持。
背景:
玉米作為全球三大主糧作物之一,品種繁多,種植面積廣泛。隨著育種技術的發展,市場上玉米種子的品種日益豐富,但不同品種種子在外觀上差異微小,導致在收獲和流通過程中容易混雜,降低品種純度,影響種子質量和作物產量。因此,開展高效、準確的玉米種子品種識別研究具有重要意義。高光譜成像技術融合了圖像與光譜信息,能夠實現非破壞性、高分辨率的數據獲取,在玉米種子分類方面,已有研究表明,高光譜數據結合化學計量學方法可有效提升分類精度。然而,目前仍需進一步優化光譜預處理方法、波段選擇策略及建模算法,以實現更高效的種子品種識別系統?;诖?,本文旨在探索高光譜反射成像與化學計量學方法結合的可行性,用于三種玉米種子品種的分類,并對不同建模方法的分類效果進行比較,為種子分選與品種純度保障提供技術支持。
作者信息:成芳,浙江大學生物系統工程與食品科學學院,博士生導師
期刊來源:An ASABE Meeting Presentation
研究內容
基于高光譜反射成像技術,結合化學計量學方法,實現對三種玉米種子品種的準確分類。研究首先利用高光譜成像系統采集玉米種子在400–1000 nm范圍內的光譜數據,并通過多種預處理方法(如標準正態變換、平滑處理等)提升數據質量;然后采用主成分分析(PCA)進行特征降維與數據可視化;進一步利用隨機蛙跳算法(RFA)篩選有效波段,減少冗余信息。在建模方面,論文比較了支持向量機(SVM)和極限學習機(ELM)兩種分類模型在全波段與有效波段下的性能差異。最終結果表明,結合波段選擇的SVM模型在玉米種子品種分類中表現最佳,驗證了高光譜成像與化學計量學融合方法在農作物種子識別中的有效性與實用性。
實驗設計
在中國吉林省長春市當地農民處購買了三種新鮮的玉米種子品種,為春華201、佳玉538和千峰258三個品種,共挑選了1500個樣本(每個品種各500粒玉米種子)。每個品種的數據集被隨機劃分為校準集和驗證集(校準集:驗證集 = 2:1)。因此,校準集中有1000個樣本,驗證集中有500個樣本。三種不同的玉米種子品種被標記為類別1、2、3。
圖1展示了高光譜成像系統(江蘇雙利合譜科技有限公司)的示意圖。該系統由以下部分組成:一臺CCD相機,一個成像光譜儀,一個鏡頭,線性光源及其控制器,樣品臺以及一個移動臺控制器。高光譜圖像采集軟件Spectracube 2.75b被用于圖像的采集和校正。玉米種子被放置在黑色樣品臺上,物距為28.5厘米,曝光時間為6毫秒,移動臺速度為2.6毫米/秒。高光譜圖像的采集光譜范圍為400-1000納米,共有477個波長。為了克服光源強度在每個波長上的不均勻性以及采集傳感器暗電流的影響,所收集的高光譜圖像均進行黑白校正。
圖1.高光譜成像系統:1. CCD相機,2. 可見光/近紅外成像光譜儀,3. 鏡頭,4. 暗箱,5. 線性光源,6. 可升降樣品臺,7. 移動平臺,8. 位移平臺控制器,9. 計算機,以及10. 0.5毫米延伸管
研究方法
在本研究中,為了突出研究樣本之間的差異,對光譜數據進行了預處理。應用了5-3平滑(5點和3次多項式擬合,平滑時間為2000)以提高信噪比并消除隨機噪聲。采用SPA算法用于在光譜數據分析處理中提取特征波長。
在模型分析方面,本研究建立了K最近鄰(KNN)和支持向量機(SVM)模型,用于不同玉米種子品種的分類。KNN通過測量不同特征值之間的距離進行分類,本文采用了歐幾里得距離。SVM是一種重要的分類方法,在解決小樣本集、非線性和高維模式識別問題方面具有許多獨*優勢。它從有限的訓練樣本中建立模型,并為獨立的測試集獲得小誤差。在本文中,應用了徑向基函數(RBF)核函數,并且在模型開發和更新階段,通過網格搜索算法結合十折交叉驗證對c(懲罰因子)和g(核函數的徑向寬度)進行了優化。
結果
在本研究中,基于SPA選定的波長數據以及光譜的全部波長視為輸入建立了KNN和SVM分類模型。無論是通過SPA算法獲得的特征波長還是全部波長,SVM模型的準確率都優于KNN??梢钥闯?,SPA算法提取的特征波長并沒有使建模效果更佳。在使用SVM對全部波長進行建模的情況下,獲得了最高的準確率,校準集的準確率為89.0%,驗證集的準確率為94.2%。
下表展示了經過5-3平滑處理后,KNN和SVM方法在校準集和驗證集上的分類準確率。從表中的校準集和驗證集的準確率可以明顯看出,當使用SPA算法提取的特征波長進行建模時,與使用全部波長相比,建模效果有了顯著提升。當使用SVM對特征波長進行建模時,校準集的準確率提升至91.6%,驗證集的準確率提升至96.8%。此時,特征波長的優勢得以顯現。僅使用9個波長,不僅減少了計算的數量和時間,還獲得了更好的結果。
結論
在本研究中,將高光譜反射成像技術和化學計量學方法相結合,對三種不同的玉米種子品種(春華201、佳玉538和千峰258)進行分類。根據結果,無論是否使用預處理方法,以及是否采用SPA算法獲得的特征波長或全部波長進行建模,SVM模型的準確率都優于KNN模型。當使用適當的預處理方法時,通過特征提取算法獲得的特征波長的建模效果可能優于全部波長的效果。本文中的最佳結果是5-3平滑-SPA算法,9個特征波長可以獲得校準集91.6%的準確率和驗證集96.8%的準確率。