應(yīng)用方向:
在本研究中,高光譜成像技術(shù)被應(yīng)用于茶樹(shù)扦插苗的生長(zhǎng)監(jiān)測(cè)與建模,展現(xiàn)出在農(nóng)業(yè)育種與智能管理中的廣闊應(yīng)用前景。通過(guò)對(duì)葉片和嫩梢的高光譜反射數(shù)據(jù)采集,結(jié)合深度學(xué)習(xí)可以在不破壞樣本的前提下實(shí)現(xiàn)茶苗地上部和根系生物量的快速、精準(zhǔn)預(yù)測(cè),解決根系難以直接測(cè)量的問(wèn)題,為替代傳統(tǒng)耗時(shí)且破壞性的稱(chēng)重方法提供了有效途徑。因此,高光譜技術(shù)不僅能夠?yàn)椴铇?shù)優(yōu)良品種的篩選和扦插苗的生長(zhǎng)監(jiān)測(cè)提供可靠手段,還可為苗圃精細(xì)化管理和智能化育苗奠定技術(shù)基礎(chǔ)。
背景:
茶樹(shù)是全球重要的經(jīng)濟(jì)作物,具有龐大的消費(fèi)市場(chǎng),但茶苗的繁育與生長(zhǎng)受到不良?xì)夂驐l件等因素的限制,導(dǎo)致茶樹(shù)扦插苗生長(zhǎng)緩慢、成本高昂,從而制約了優(yōu)良品種的推廣與產(chǎn)業(yè)化水平。扦插苗的地上部和根系生物量是衡量其生長(zhǎng)發(fā)育質(zhì)量的重要指標(biāo),因此,如何快速、準(zhǔn)確地監(jiān)測(cè)其生長(zhǎng)過(guò)程對(duì)于提高成活率和苗木管理水平具有重要意義。
傳統(tǒng)的人工稱(chēng)重方法在測(cè)定茶樹(shù)扦插苗生物量時(shí)具有破壞性且效率低,難以滿(mǎn)足高通量、無(wú)損檢測(cè)的需求。近年來(lái),高光譜成像技術(shù)因其能夠同時(shí)獲取樣品的結(jié)構(gòu)和化學(xué)信息,被廣泛應(yīng)用于作物性狀監(jiān)測(cè)。已有研究表明,光譜信息與植物的生理、生化特征存在緊密聯(lián)系,可用于反映植株的養(yǎng)分含量、激素水平及生理狀態(tài)。結(jié)合機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的方法,能夠進(jìn)一步提升高光譜數(shù)據(jù)的建模精度與穩(wěn)定性。
因此,該研究提出利用高光譜成像技術(shù)結(jié)合深度學(xué)習(xí)方法,對(duì)茶樹(shù)扦插苗的地上部和根系生物量進(jìn)行快速、無(wú)損預(yù)測(cè),以解決傳統(tǒng)方法耗時(shí)、破壞性強(qiáng)的問(wèn)題,為茶樹(shù)優(yōu)良品種的高效篩選和精細(xì)化育苗管理提供新的技術(shù)途徑和數(shù)據(jù)支撐。
作者信息:丁兆堂;山東省農(nóng)業(yè)科學(xué)院
期刊來(lái)源:Scientia Horticulturae
研究?jī)?nèi)容
本研究旨在利用高光譜成像技術(shù)結(jié)合深度學(xué)習(xí)模型,實(shí)現(xiàn)對(duì)茶樹(shù)扦插苗地上部和根系生物量的快速、無(wú)損與精準(zhǔn)預(yù)測(cè),以解決傳統(tǒng)人工稱(chēng)重方法破壞性強(qiáng)、效率低的問(wèn)題。研究過(guò)程中,首先采集不同生長(zhǎng)階段茶樹(shù)扦插苗葉片與嫩梢的高光譜反射數(shù)據(jù),并對(duì)光譜數(shù)據(jù)進(jìn)行預(yù)處理,以去除噪聲和散射效應(yīng)并增強(qiáng)光譜與生理指標(biāo)的相關(guān)性。隨后,提取關(guān)鍵光譜特征波段,減少冗余信息并突出與生物量密切相關(guān)的變量。在建模環(huán)節(jié),利用 Mask R-CNN 網(wǎng)絡(luò)對(duì)扦插苗進(jìn)行圖像與光譜特征融合,構(gòu)建CNN-GRU生物量預(yù)測(cè)模型。研究建立了一種高效可靠的檢測(cè)方法,為茶樹(shù)優(yōu)良品種的篩選、扦插苗的生長(zhǎng)監(jiān)測(cè)以及智能化育苗管理提供了新的技術(shù)途徑與數(shù)據(jù)支撐。
實(shí)驗(yàn)設(shè)計(jì)
茶樹(shù)扦插苗選用了三個(gè)品種:‘玉金香(YJX)’、‘中白1號(hào)(ZB)’和‘中茗6號(hào)(ZM)’。為了獲取不同生長(zhǎng)期的茶扦插苗,實(shí)驗(yàn)每25天進(jìn)行一次,共進(jìn)行了10次。每次試驗(yàn)1個(gè)穴盤(pán)(含32株扦插苗),共收獲扦插苗960株(3個(gè)品種× 32株扦插苗× 10個(gè)試驗(yàn))。
為了測(cè)定扦插苗的生長(zhǎng)情況,對(duì)960條扦插苗的枝條和根系進(jìn)行破壞性分析,并采集高光譜數(shù)據(jù),將枝條和根系置于105 ℃烘箱中20 min,然后將烘箱溫度調(diào)至90 ℃干燥至恒重,最后用電子秤記錄重量
本研究采用了高光譜成像技術(shù)來(lái)監(jiān)測(cè)茶扦插苗從扦插到成長(zhǎng)為幼苗過(guò)程中生物量的變化(見(jiàn)圖1a)。高光譜成像采集系統(tǒng)包括成像光譜相機(jī)(Gaia field pro-v10,江蘇雙利合譜技術(shù)有限公司),四個(gè)鹵素?zé)?、電腦、校正白板、黑色背景。高光譜相機(jī)所拍攝圖像的光譜范圍在可見(jiàn)-近紅外波段(391-1010 nm),光譜范圍為1101 × 960像素,可測(cè)量360個(gè)波段的光譜反射率。為了避免光譜相機(jī)內(nèi)部暗電流的影響,提高高光譜圖像的信噪比,對(duì)獲取的原始高光譜圖像進(jìn)行黑白白色校正。利用高光譜相機(jī)采集了960株扦插苗的高光譜數(shù)據(jù),每幅高光譜圖像包含8株扦插苗作為一個(gè)模型樣本,得到包括120個(gè)高光譜圖像的總數(shù)據(jù)集。通過(guò)結(jié)合成熟葉片和莖葉的光譜信息以及深度學(xué)習(xí)和機(jī)器學(xué)習(xí)算法,對(duì)莖葉和根系的生物量進(jìn)行了評(píng)估(見(jiàn)圖1b)。

圖1. 圖像采集與流程圖的結(jié)合。(a) 圖像采集 (b) 數(shù)據(jù)處理流程圖
研究方法
為了增加模型訓(xùn)練的數(shù)據(jù)量,120張圖像通過(guò)兩種不同的數(shù)據(jù)增強(qiáng)方法進(jìn)行處理:旋轉(zhuǎn)(90°、180°和270°)和翻轉(zhuǎn)(水平和垂直),圖像數(shù)量增加到720張。這些圖像通過(guò)Labelme軟件進(jìn)行手動(dòng)標(biāo)注。首先,對(duì)成熟葉片和莖葉區(qū)域分別用不同顏色的標(biāo)簽進(jìn)行標(biāo)注和分類(lèi),其中綠色代表莖葉,紅色代表成熟葉片。未標(biāo)注的區(qū)域被視為背景。圖2展示了成熟葉片和莖葉的標(biāo)注圖像。隨后,將這些標(biāo)注圖像輸入到Mask R-CNN中進(jìn)行訓(xùn)練。

圖2. 標(biāo)注圖像 (a) 標(biāo)注成熟葉片和莖葉的圖像;(b) 標(biāo)注完成的成熟葉片和莖葉圖像
Mask R-CNN網(wǎng)絡(luò)被用于獲取莖葉和成熟葉片的面積。圖3展示了Mask R-CNN網(wǎng)絡(luò)的結(jié)構(gòu)圖。Mask R-CNN 網(wǎng)絡(luò)主要分為五個(gè)結(jié)構(gòu):Backbone、區(qū)域建議網(wǎng)絡(luò)(RPN)、感興趣區(qū)域?qū)R(ROI Align)、邊框回歸(Box Regression)以及分類(lèi)與掩膜(Classification and Mask)。通過(guò)5折交叉驗(yàn)證將標(biāo)記的圖像劃分為訓(xùn)練集和測(cè)試集。所采用的學(xué)習(xí)率為0.001,Epoch為20,Batch大小為1。

圖3. Mask R-CNN的結(jié)構(gòu)圖。
由于高光譜采集儀器及環(huán)境因素的影響,在成熟葉片和嫩梢的光譜中存在散射效應(yīng)、隨機(jī)噪聲和系統(tǒng)噪聲。因此,本研究對(duì)其光譜數(shù)據(jù)進(jìn)行了 MSC、S-G 和一階導(dǎo)數(shù)(1-D)預(yù)處理。另外為了減少數(shù)據(jù)計(jì)算量并提高后續(xù)建模的準(zhǔn)確性,本研究采用了連續(xù)投影算法(SPA)、競(jìng)爭(zhēng)自適應(yīng)重加權(quán)采樣算法(CARS)和不確定性變量消除算法(UVE)來(lái)選擇具有代表性的光譜波段作為特征波段。
在模型的建立方面,構(gòu)建了卷積神經(jīng)網(wǎng)絡(luò)與門(mén)控循環(huán)單元(CNN-GRU)網(wǎng)絡(luò)模型和傳統(tǒng)機(jī)器學(xué)習(xí)模型。CNN-GRU模型網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示。首先,為了更好地提取數(shù)據(jù)的底層特征,使用CNN來(lái)提取數(shù)據(jù)特征。然后,數(shù)據(jù)被輸入到一個(gè)5×5的濾波器中進(jìn)行卷積。經(jīng)過(guò)4次卷積、平均池化、序列擴(kuò)展和展平后,數(shù)據(jù)被輸入到GRU網(wǎng)絡(luò)中。在這里,一維光譜數(shù)據(jù)與莖葉和根系生物量數(shù)據(jù)被GRU網(wǎng)絡(luò)結(jié)合,用于回歸預(yù)測(cè)。此外,在CNN網(wǎng)絡(luò)中,步長(zhǎng)為1,填充為“same"(填充值由算法根據(jù)卷積核大小內(nèi)部計(jì)算),輸入數(shù)據(jù)通道為1。經(jīng)過(guò)3次門(mén)控循環(huán)后,預(yù)測(cè)數(shù)據(jù)被輸入到全連接層,并通過(guò)回歸器輸出。

圖4. CNN-GRU的結(jié)構(gòu)圖。
為了進(jìn)一步驗(yàn)證CNN-GRU網(wǎng)絡(luò)的性能,使用了SVR、RFR和PLSR三種機(jī)器學(xué)習(xí)方法和CNN、LSTM兩種深度學(xué)習(xí)方法作為對(duì)比模型,CNN和LSTM網(wǎng)絡(luò)的層數(shù)均設(shè)置為16層。為了防止模型的過(guò)擬合,在訓(xùn)練過(guò)程中確定了超參數(shù),支持向量回歸機(jī)的核函數(shù)為多項(xiàng)式核函數(shù),RFR的樹(shù)的數(shù)量為200,PLSR的隱變量為18。在本研究中,用6種方法分別建立了以地上部、成熟葉和地上部、根系生物量為指標(biāo)的回歸模型。
為了進(jìn)一步保證算法的準(zhǔn)確性,本研究采用五重交叉驗(yàn)證,將數(shù)據(jù)集分成五部分,依次取其中4個(gè)作為訓(xùn)練數(shù)據(jù),1個(gè)作為測(cè)試數(shù)據(jù),重復(fù)五次,然后對(duì)結(jié)果進(jìn)行平均,為了更準(zhǔn)確地評(píng)價(jià)回歸模型的性能,使用決定系數(shù)(R2)、均方根誤差(RMSE)、歸一化均方根誤差(NRMSE)和相對(duì)百分比偏差(RPD)來(lái)評(píng)價(jià)模型的性能。為了評(píng)估Mask R-CNN模型的光譜信息提取性能,使用精度,召回率和F1得分來(lái)評(píng)估模型的性能。
結(jié)果
通過(guò)實(shí)驗(yàn)室方法測(cè)定了茶扦插苗的莖葉和根系生物量。結(jié)果顯示,三種品種的扦插苗莖葉萌發(fā)時(shí)間相同,均在第25天開(kāi)始萌發(fā)。然而,中茗6號(hào)(ZM)的生根時(shí)間最早,從第125天開(kāi)始生根;中茗6號(hào)的莖葉和根系生長(zhǎng)量最大,莖葉生長(zhǎng)量約為1.7克,根系生長(zhǎng)量約為0.6克。在200–225天期間,莖葉和根系的生長(zhǎng)速度最快;中白1號(hào)(ZB)的生根時(shí)間最晚,從第175天開(kāi)始生根;玉金香(YJX)的莖葉和根系生長(zhǎng)量最小,莖葉生長(zhǎng)量約為0.8克,根系生長(zhǎng)量約為0.1克。
對(duì)成熟葉片和莖葉的分割結(jié)果進(jìn)行了比較和分析,結(jié)果顯示,Mask R-CNN能夠以高精度分割成熟葉片和莖葉。其中,成熟葉片光譜的提取效果優(yōu)于莖葉光譜,提取精度達(dá)到97.8%。莖葉光譜的提取精度為91.5%。成熟葉片和莖葉光譜的提取精度均超過(guò)90%。因此,Mask R-CNN模型能夠準(zhǔn)確且高效地從茶扦插苗圖像中提取成熟葉片和莖葉的光譜信息。
對(duì)Mask R-CNN模型提取的成熟葉片和枝條原始光譜分別采用MSC、1-D和S-G算法進(jìn)行預(yù)處理,如圖5所示,與原始光譜相比,MSC、1-D和S-G聯(lián)合預(yù)處理后光譜曲線的波峰和波谷更加突出,提高了光譜的分辨率和靈敏度,有利于提高后期建立回歸模型的準(zhǔn)確性。

圖5. 原始光譜與MSC、1D和S-G預(yù)處理后的光譜對(duì)比。(a) 莖葉光譜 + 莖葉生物量;(b) 莖葉光譜 + 根系生物量;(c) 成熟葉片光譜 + 莖葉生物量;(d) 成熟葉片光譜 + 根系生物量。
為了消除無(wú)關(guān)波段對(duì)模型準(zhǔn)確性的影響,在基于莖葉光譜選擇莖葉生物量特征波段的方法中,UVE選擇的特征波段數(shù)量最多,達(dá)到212個(gè)波長(zhǎng),而SPA選擇的特征波段數(shù)量最少,僅為8個(gè)波長(zhǎng);在基于莖葉光譜選擇根系生物量特征波段的方法中,UVE選擇的特征波段數(shù)量最多,為135個(gè)波長(zhǎng),SPA選擇的特征波段數(shù)量最少,為6個(gè)波長(zhǎng);在基于成熟葉片光譜選擇莖葉生物量特征波段的方法中,UVE選擇的特征波段數(shù)量最多,為69個(gè)波長(zhǎng),SPA選擇的特征波段數(shù)量最少,為14個(gè)波長(zhǎng);在基于成熟葉片光譜選擇根系生物量特征波段的方法中,UVE選擇的特征波段數(shù)量最多,為90個(gè)波長(zhǎng),SPA選擇的特征波段數(shù)量最少,為17個(gè)波長(zhǎng)。
在基于莖葉光譜評(píng)估莖葉生物量時(shí),UVE算法的建模效果優(yōu)于CARS和SPA,UVE+CNN-GRU提供了最佳的估算模型(Rp2=0.90,RMSEP=0.12,RPD=2.43)。CARS算法的建模效果較差,CARS+PLSR模型的效果最差(Rp2=0.50,RMSEP=0.32,RPD=1.36)。
在基于成熟葉片光譜評(píng)估莖葉生物量時(shí),UVE算法的建模效果優(yōu)于CARS和SPA,UVE+CNN-GRU提供了最佳的估算模型(Rp2=0.78,RMSEP=0.16,RPD=2.13)。SPA算法的建模效果較差,SPA+PLSR模型的效果最差(Rp2=0.48,RMSEP=0.29,RPD=1.00)。在基于成熟葉片光譜評(píng)估根系生物量時(shí),SPA算法的建模效果優(yōu)于UVE和CARS,SPA+LSTM提供了最佳的估算模型(Rp2=0.65,RMSEP=0.05,RPD=1.67)。CARS算法的建模效果較差,CARS+PLSR模型的效果最差(Rp2=0.39,RMSEP=0.10,RPD=1.22)。圖6展示了四種最佳估算模型的預(yù)測(cè)值與實(shí)際值的散點(diǎn)圖。

圖6. 四種最佳估算模型的預(yù)測(cè)值與實(shí)際值的散點(diǎn)圖。(a) 莖葉光譜 + UVE + CNN-GRU;(b) 成熟葉片光譜 + UVE + CNN-GRU;(c) 莖葉光譜 + SPA + CNN;(d) 成熟葉片光譜 + SPA + LSTM。
結(jié)論
本研究提出了一種利用高光譜成像技術(shù)監(jiān)測(cè)茶扦插苗莖葉生長(zhǎng)和根系生長(zhǎng)的方法。首先,通過(guò)Mask R-CNN提取茶扦插苗成熟葉片的光譜和莖葉的光譜。隨后,利用MSC、S-G濾波和1-D對(duì)光譜進(jìn)行預(yù)處理,并通過(guò)UVE、CARS和SPA篩選特征波段。最后,采用CNN-GRU網(wǎng)絡(luò)構(gòu)建莖葉和根系生物量的預(yù)測(cè)模型。研究結(jié)果表明:(1)Mask R-CNN能精確提取成熟葉片(精確率=97.8%)和嫩梢(精確率=91.5%)的光譜特征;(2)通過(guò)UVE方法篩選獲得的嫩梢(212個(gè))和根系(105個(gè))生物量特征波段,較CARS和SPA方法更具豐富性;(3)基于嫩梢光譜構(gòu)建的UVE+CNN-GRU模型(Rp2=0.90,RMSEP=0.12,RPD=2.43)對(duì)嫩梢生物量的估算效果*優(yōu),表明該模型預(yù)測(cè)結(jié)果可靠,與實(shí)際值誤差較??;(4)基于成熟葉片光譜構(gòu)建的SPA+LSTM模型(Rp2=0.65,RMSEP=0.05,RPD=1.67)對(duì)根系生物量的估算效果*佳,證明該模型可用于茶樹(shù)扦插苗根系狀況評(píng)估,為根系生長(zhǎng)監(jiān)測(cè)提供了有效手段。