應用方向
在我國煙草生產必須嚴格執(zhí)行上級下達的計劃產量的背景下,準確且穩(wěn)定的產量估算對生產管理具有重要意義。本文提出多源數據融合策略,構建煙草產量估算模型:數據包括無人機(UAV)機載高光譜特征(HF)、田間采集的生物物理參數(BPP)以及實驗室測定的生化參數(BCP)。考慮不同生育期的作物狀態(tài)共同影響最終產量,模型采用兩類典型循環(huán)神經網絡(RNN)——LSTM與GRU,并以隨機森林(RF)作為基線。針對跨年度數據時間維度不一致問題,設計一維卷積自編碼器(AEC1D)以統(tǒng)一輸入維度。結果表明,多源融合優(yōu)于任一單源特征;其中采用HF+BCP+BPP的GRU模型精度最高(
=0.705)。同時,LSTM與GRU整體優(yōu)于RF;特征貢獻約為HF45%、BPP32%、BCP23%。該研究驗證了多源融合與 RNN 在煙草產量估算中的優(yōu)勢,可為精準化田間管理提供支持。
關鍵詞:多源數據融合;RNN;產量估算;HF+BCP+BPP;AEC1D
背景
我國煙草屬于重要經濟作物,為調控市場供給、保持產品與價格穩(wěn)定,行業(yè)主管部門對企業(yè)下達年度生產計劃,產量超出計劃通常需要額外審批,因此企業(yè)急需“準確、穩(wěn)定"的產量估算以支撐生產決策與過程管理。傳統(tǒng)產量估算主要依賴田間調查,存在耗時、成本高且誤差大的問題。近年來,以高光譜成像為代表的無損監(jiān)測技術在農業(yè)中得到廣泛應用,但高光譜數據波段多、信息冗余強,若僅構建植被指數易受土壤背景與冠層結構影響且可能出現飽和,光譜信息利用率也有限。另一方面,產量與 LAI、株高、葉氮等生物物理/生化指標密切相關,但將“高光譜特征(HF)+生物物理參數(BPP)+生化參數(BCP)"三類信息聯合用于煙草產量建模的研究仍相對不足?;诖耍疚奶岢龆嘣慈诤喜⒁肽軐W習時序依賴的 RNN(LSTM/GRU),同時設計 AEC1D處理跨年觀測次數不一致,以構建更全面、可用于生產管理的煙草產量估算框架。
實驗與數據采集
(1)實驗設置
本研究在云南省大理州彌渡縣(MD)與祥云縣(XY)開展兩年田間試驗,覆蓋多地塊與多品種情景。試驗以氮肥梯度為主開展處理設計,其中 N100 為當地常規(guī)施肥量,N0 為不施氮,N150 為 1.5 倍常規(guī)量,其余處理按比例推算;整體采用隨機區(qū)組設計,每小區(qū)不少于 80 株,株行距為 1.2 m×0.5 m,其余田間管理措施按照當地規(guī)范執(zhí)行。觀測安排選擇關鍵生育期開展:2022 年在蓮座期、現蕾期與打頂期共觀測 3 次,而 2023 年受天氣條件限制僅在蓮座期與打頂期觀測 2 次,導致跨年度樣本的時間步(time step)不一致。

圖1研究區(qū)域的地理位置及實驗樣地的布置
(2)數據采集
本研究構建了“無人機高光譜-田間生物物理-實驗室生化指標-實測產量"的多源數據體系。無人機端采用DJI M600搭載江蘇雙利合譜科技有限公司的GaiaSky-mini2-VN高光譜相機獲取400~1000 nm(175波段)的冠層光譜數據,飛行通常安排在10:00~15:00的晴朗無風時段,航高約80 m,起飛前使用灰板進行輻射定標,影像在ENVI平臺完成后續(xù)處理。田間同步采集生物物理參數(BPP),包括株高(PH)、株幅(PW)與葉面積指數(LAI);生化參數(BCP)則包括葉氮含量(LNC)與葉綠素相對含量(LCC,SPAD)。其中LNC以小區(qū)中心隨機抽取2株植株、每株取上中部各2片葉送實驗室測定;LCC 使用SPAD-502Plus在同一批測量株上選擇完*展開葉多點測量并取平均得到小區(qū)代表值。產量標簽以烘烤后煙葉重量為準:收獲前每小區(qū)選取5株代表植株標記,煙葉烘烤約1周后稱重(剔除未完*轉黃葉片),并以5株烘烤葉總重Yinit按Yield = 3.33×Yinit換算為單位面積產量(t/ha)。數據集最初為231個樣本,剔除病害與影像質量不佳小區(qū)后保留189個有效樣本;每個生育期樣本包含PH、PW、LAI、LNC、LCC以及175個高光譜波段等特征。
研究結果
(1)多源特征體系構建與對比
研究在高光譜基礎上分別疊加BCP(LNC、LCC)與BPP(PH、PW、LAI)進行對比,結果在RF、LSTM、GRU三類算法下均一致:多源融合顯著優(yōu)于單一HF,且HF+BCP+BPP始終取得最高或*穩(wěn)定的精度;同時HF+BPP通常略優(yōu)于HF+BCP,說明結構/群體生長狀態(tài)信息對葉產量更直接。僅用HF時精度*低,體現“光譜必要但不充分",需要生物物理/生化信息補足對生長與營養(yǎng)狀態(tài)的刻畫。

(a)不同特征組合下RF的產量估算

(b)不同特征組合下LSTM的產量估算

(c)不同特征組合下GRU的產量估算
圖2基于多種模型構建的產品估計模型散點圖對比
(2)煙草高光譜特征重構與降維
從提升煙草估產可用光譜信息與可學習性的角度,本研究引入SFI將整條光譜曲線按一階導數的5個穩(wěn)定極值分段,對各段進行擬合并求定積分,把全譜壓縮為5維特征。該重構顯著降低維度與冗余,并保留了光譜曲線形態(tài)與全譜響應信息,相比僅依賴少數植被指數更充分利用高光譜數據,并增強對外界因素與參數擾動的魯棒性,為后續(xù)多源融合與RNN時序學習提供更穩(wěn)定、緊湊的光譜輸入。
(3)跨年觀測時序維度統(tǒng)一
本研究針對跨年度樣本的聯合時序建模對2022年三期觀測與2023年兩期觀測導致的輸入時間維不一致問題,引入一維卷積自編碼器(AEC1D)作為時序對齊模塊。該模型在編碼端利用1×2卷積核(stride=1)在相鄰生育期之間提取局部時序關聯,并將2022年的3個時間步壓縮映射為2個時間步;隨后經解碼重構得到與2023一致的輸入形狀,從而在統(tǒng)一維度的同時盡量保留生育期動態(tài)信息。重構結果顯示,不同特征組合下測試集R2仍保持較高且與訓練集差異較小,表明該方法具有較好的泛化能力,并優(yōu)于簡單padding補零對齊,為后續(xù)LSTM/GRU產量估算提供穩(wěn)定一致的時序輸入。
圖3設計的AEC1D編碼器組件

圖4不同特征組合下的重建結果對比
結論
本文面向煙草生產計劃管理對“準確、穩(wěn)定"產量估算的需求,構建了融合無人機高光譜特征(HF)、田間生物物理參數(BPP)與生化參數(BCP)的多源估產框架,并引入循環(huán)神經網絡(LSTM/GRU)刻畫多生育期時序信息。結果表明,多源融合顯著優(yōu)于任一單源輸入,*優(yōu)組合為HF+BCP+BPP;在該組合下GRU取得最高精度(
=0.705,RMSEV=0.554 t/ha,MAPEV=16.41%),LSTM次之且整體優(yōu)于RF等傳統(tǒng)方法。同時,針對跨年度觀測次數不一致(2022三期、2023兩期)導致RNN輸入形狀不統(tǒng)一的問題,提出一維卷積自編碼器AEC1D進行時序維度對齊,相比padding補零對齊獲得更優(yōu)的建模表現。結果分析顯示三類特征對精度提升的平均貢獻約為HF 45%、BPP32%、BCP23%。本研究驗證了“多源融合+RNN"的煙草估產優(yōu)勢,并指出未來可進一步融合氣候、土壤、水分等影響因素以完*模型適用性。
來源
Zhang M ,Zhang B ,Zhao C , et al.Tobacco yield estimation via multi-source data fusion and recurrent neural networks[J].International Journal of Applied Earth Observation and Geoinformation,2025,144104925-104925.
立即詢價
您提交后,專屬客服將第一時間為您服務