返回當(dāng)前位置:主頁(yè)>應(yīng)用案例>環(huán)境監(jiān)測(cè)
來源:賽斯拜克 發(fā)表時(shí)間:2023-10-13 瀏覽量:760 作者:awei
吉林查干湖是我國(guó)重要的湖泊之一,水體葉綠素A含量是評(píng)價(jià)湖泊水質(zhì)和生態(tài)環(huán)境狀況的重要指標(biāo)。傳統(tǒng)的葉綠素A含量檢測(cè)方法通常涉及到水樣采集和實(shí)驗(yàn)室分析,這種方法雖然準(zhǔn)確但耗時(shí)且費(fèi)用較高。因此,利用高光譜相機(jī)進(jìn)行水體葉綠素A含量的無損快速檢測(cè),具有重要的研究?jī)r(jià)值和應(yīng)用前景。
研究方法:
數(shù)據(jù)收集:在吉林查干湖不同區(qū)域和時(shí)間段,使用高光譜相機(jī)獲取水體的反射光譜數(shù)據(jù)。同時(shí),通過傳統(tǒng)方法采集水樣,測(cè)定葉綠素A的實(shí)際含量。
數(shù)據(jù)分析:對(duì)收集到的光譜數(shù)據(jù)進(jìn)行預(yù)處理,提取與葉綠素A含量相關(guān)的特征波長(zhǎng)。這些特征可能包括特定波長(zhǎng)處的反射率、吸收峰等。
模型建立:利用化學(xué)計(jì)量學(xué)和機(jī)器學(xué)習(xí)算法,建立吉林查干湖水體葉綠素A含量與光譜特征之間的定量模型??梢圆捎镁€性或非線性回歸、支持向量機(jī)等算法進(jìn)行建模。通過訓(xùn)練和優(yōu)化模型,確定模型參數(shù)并評(píng)估模型的性能。
模型驗(yàn)證:使用獨(dú)立的驗(yàn)證數(shù)據(jù)集對(duì)建立的模型進(jìn)行驗(yàn)證。通過比較模型預(yù)測(cè)值與實(shí)測(cè)值之間的相關(guān)性、均方誤差等指標(biāo),評(píng)估模型的準(zhǔn)確性和可靠性。
為了探討高光譜相機(jī)在水體葉綠素A含量的模型研究中的應(yīng)用,本文以吉林省查干湖水體為例進(jìn)行了研究。葉綠素A是水體中重要的成分,其濃度與水體中藻類的種類、數(shù)量以及水質(zhì)狀況密切相關(guān)。通過測(cè)定葉綠素A含量可以在一定程度上反映水質(zhì)狀況。然而,葉綠素遙感監(jiān)測(cè)存在著許多困難,比如水體中其他物質(zhì)的光學(xué)影響,以及藻類和其他污染物質(zhì)的差異等。這導(dǎo)致了在提取光譜特征時(shí)無法建立整體分析模型。
1實(shí)驗(yàn)材料與方法
1.1研究區(qū)概況
查干湖主體處于前郭縣境內(nèi),小部分水體跨大安市和乾安縣.地處嫩江與霍林河交匯的水網(wǎng)地區(qū),屬內(nèi)陸半咸水湖泊,是吉林省最重要的漁業(yè)基地,也是松遼平原第一大湖、查干湖地處大陸性季風(fēng)型半干旱
氣候區(qū),年均氣溫4.5℃,≥14℃的水溫日數(shù)145d;日照時(shí)數(shù)2880h,年均輻射量4429 MJ/m2,5月-9月份輻射量為2319MJ/m2;年均降雨量為450.8mm,蒸發(fā)量為1063.5mm;春季多大風(fēng),其中風(fēng)速≥17m/s的日數(shù)年均29d;冰封期130d左右,結(jié)冰期日數(shù)150d左右,冰厚0.8-1.1m.該湖正常運(yùn)行水位130m時(shí),水域面積3.72×10?hm2,平均水深2.52m,水體容積5.98×10?m3;集水區(qū)內(nèi)均為鹽堿化農(nóng)田和牧場(chǎng);湖底平坦,粉沙質(zhì)土壤,周圍土壤為白鈣堿土;湖泊水質(zhì)為蘇打型鹽堿水,多泥沙懸浮,透明度在20~50 cm之間,葉綠素a濃度7月份較高,在40μg/L左右,采樣期間其它月份一般在5-30μg/L左右(表1),屬富營(yíng)養(yǎng)型湖泊.查干湖主要補(bǔ)給來源為引松工程,其次還有霍林河、洮兒河、嫩江、天然降水和地下水等為查干湖補(bǔ)給水源[,12]
1.2數(shù)據(jù)獲取方法
為研究查干湖水質(zhì),2004年5月到2005年6月,共進(jìn)行了7次野外采樣,對(duì)研究區(qū)內(nèi)代表點(diǎn)位分別用GPS進(jìn)行定位導(dǎo)向,同步測(cè)量各點(diǎn)水體透明度和反射光譜,并采集水樣,用以實(shí)驗(yàn)室分析其他水質(zhì)參數(shù).7次采樣共計(jì)95點(diǎn),隨機(jī)選取其中50個(gè)作為建模數(shù)據(jù),其余用以模型驗(yàn)證.葉綠素a濃度的測(cè)定在采樣后,立即返回實(shí)驗(yàn)室過濾,然后用丙酮萃取,蔽光24h后,采用分光光度計(jì)法測(cè)定.反射光譜測(cè)量采用用廣東賽斯拜克產(chǎn)品SineSpecSCX系列-成像高光譜相機(jī)進(jìn)行相關(guān)研究。可在350-1050nm波長(zhǎng)范圍內(nèi)進(jìn)行連續(xù)測(cè)量,采樣間隔為1.4nm,光譜分辨率3nm,視場(chǎng)角25°,共有512個(gè)采樣值.
光譜測(cè)量時(shí)間為北京時(shí)10:00~14:00,7次采樣當(dāng)時(shí)天氣晴朗無風(fēng),湖面基本平靜.光譜測(cè)量在距水面上方1m處進(jìn)行,光譜儀傳感器探頭方向基本垂直于水面.在每個(gè)點(diǎn)位,進(jìn)行20次反射光譜測(cè)量,最后取其平均值作為該點(diǎn)的光譜反射值,每個(gè)樣點(diǎn)測(cè)定前都進(jìn)行白板定標(biāo).實(shí)驗(yàn)室內(nèi)對(duì)每條平均反射光譜利用其在350-1000nm范圍內(nèi)的波段反射率進(jìn)行歸一化處理,選取400-1000nm波譜范圍作為研究數(shù)據(jù).
1.3建模方法
數(shù)據(jù)處理與建模方法在水質(zhì)參數(shù)高光譜研究中起關(guān)鍵作用,在本研究中將主要從三個(gè)方面來對(duì)獲取數(shù)據(jù)加以分析,并在此基礎(chǔ)上建立模型.首先,分別對(duì)水體高光譜數(shù)據(jù)、微分光譜數(shù)據(jù)與同步獲取的對(duì)應(yīng)采樣點(diǎn)水體葉綠素?cái)?shù)據(jù)逐波段相關(guān)分析,并進(jìn)行線性回歸分析.微分光譜采用以下公式計(jì)算:
R(λ;)2=〔R(A+)-R(A;-)〕/(λ;+y-λ;-1)
(1)
其中,λ,A;,λ?-1為相鄰波長(zhǎng),R(λ?)'為波長(zhǎng)λ;的一階微分反射光譜.然后,采用光譜比值法建立水體葉綠素含量反演模型,評(píng)價(jià)不同比值法建立模型的精度;在此基礎(chǔ)上建立神經(jīng)網(wǎng)絡(luò)模型,將與水體葉綠素含量相關(guān)密切的波段作為輸入變量,反演水體葉綠素含量;最后對(duì)比分析不同方法建立的水體葉綠素a含量模型的精度.
2分析與討論
2.1光譜反射率特征
查干湖水體光譜反射率呈現(xiàn)典型的內(nèi)陸水體光譜特征(圖1).400-500 nm范圍內(nèi),由于葉綠素a在藍(lán)光波段的吸收峰及黃色物質(zhì)在該范圍的強(qiáng)烈吸收作用,水體的反射率較低[13],但由于懸浮物的影響,葉綠素a在440nm的吸收峰不是很明顯;510-620nm范圍的反射峰是由于葉綠素、胡蘿素弱吸收,細(xì)胞和懸浮顆粒的散射作用形成的[3],該反射峰值與色素組成有關(guān),而且水體葉綠素濃度越高,該反射峰值也越高,可以作為葉綠素定量標(biāo)志[14];630、675nm附近出現(xiàn)反射率低谷,630 nm低谷是由于藻青蛋白吸收引起[3],675mm是葉綠素a的又一吸收峰,因此當(dāng)藻類密度較高時(shí)水體光譜反射率曲線在該處出現(xiàn)谷值1;685-715nm存在一個(gè)明顯的反射峰,一般認(rèn)為是葉綠素a的熒光峰3,9,19,且會(huì)隨著葉綠素a濃度的增加而向長(zhǎng)波方向移動(dòng)[3],該反射峰的出現(xiàn)是含藻類水體最顯著的光譜特征,其存在與否通常被認(rèn)為是判定水體是否含有藻類葉綠素的依據(jù),反射峰的位置和數(shù)值是葉綠素a濃度的指示(8).在近紅外的短波方向820nm左右存在一個(gè)懸浮物反射峰,而進(jìn)入900 nm左右,水體反射率急劇下降.
2.2光譜反射率、微分光譜與水體葉綠素a含量的相關(guān)分析
微分光譜技術(shù)通過對(duì)反射光譜進(jìn)行數(shù)學(xué)運(yùn)算,可以迅速地確定光譜彎曲點(diǎn)及最大最小反射率的波長(zhǎng)位置,微分技術(shù)對(duì)光譜信噪比非常敏感.研究表明,光譜的低階微分處理對(duì)噪聲影響敏感性較低,因而在實(shí)際應(yīng)用中較有效[l?|.一般認(rèn)為,可用一階微分處理去除部分線性或接近線性的背景、噪聲光譜對(duì)目標(biāo)光譜(必須為非線性的)的影響[17].在本研究中,對(duì)采集的全部光譜數(shù)據(jù)按公式(1)進(jìn)行了微分處理,然后將光譜反射率、微分光譜與水體葉綠素a含量數(shù)據(jù)進(jìn)行線性相關(guān)分析與逐波段線性回歸分析、如圖2所示,光譜反射率與葉綠素濃度在400-600nm區(qū)間相關(guān)系數(shù)在0.45-0.5左右;600-730nm區(qū)間,相關(guān)系數(shù)在
0.55左右;730-900nm區(qū)間的相關(guān)系數(shù)在0.70左右.光譜反射率與葉綠素濃度在紅光與近紅外短波方向密切相關(guān)的現(xiàn)象在內(nèi)陸懸浮物多且富營(yíng)養(yǎng)化水體中較為常見[1,8],這種現(xiàn)象目前還沒有給出其物理原因.從微分光譜與葉綠素濃度的相關(guān)系數(shù)的變化趨勢(shì)看,在藍(lán)、綠光波段相關(guān)系數(shù)較小,在紅光、近紅外的短波方向相關(guān)系數(shù)較高,但總體上沒有光譜反射率與水體葉綠素含量的相關(guān)系數(shù)高.
由以上分析表明,各波段光譜反射率、微分光譜與葉綠素a濃度的相關(guān)系數(shù)、線性回歸確定性系數(shù)普遍較低.這是由于查干湖多懸浮物,其高反射率掩蓋了水體中的葉綠素信息[19],同時(shí)本研究共計(jì)進(jìn)行了7次采樣,時(shí)間跨度較大,因此在采樣過程中,外界環(huán)境不可避免會(huì)對(duì)采集的光譜值有一定的影響,水體各種組成成分的變化同樣會(huì)對(duì)光譜反射率產(chǎn)生影響,以上種種影響都會(huì)對(duì)葉綠素反演起到干擾作用.這與以往針對(duì)富營(yíng)養(yǎng)化水體進(jìn)行研究的結(jié)果相似[1].
2.3波段比值法回歸模型的構(gòu)建
采用反射比可以部分地消除水表面光滑度和微波隨時(shí)間和空間變化的干擾,并在一定程度上減小其他污染物的影響',5,20,21].在葉綠素遙感中,通常利用葉綠素濃度與光譜響應(yīng)間的明顯特征,采用不同波段比值法擴(kuò)大葉綠素吸收峰與葉綠素反射峰或熒光峰間的差異,提取葉綠素濃度信息[1,5,22,281.
我們采用葉綠素?zé)晒夥?700nm)和葉綠素反射峰(580nm)兩個(gè)波段的反射率比值作為白變量,葉綠素濃度作為因變量,隨機(jī)提取50組數(shù)據(jù)建立回歸方程(圖3a):
Y=0.5554e?0s(R2=0.6239,N=50,P<0.01)
(1)
以剩余的46組數(shù)據(jù)對(duì)回歸模型(1)進(jìn)行了驗(yàn)證,并對(duì)所有樣本的預(yù)測(cè)值與實(shí)測(cè)值之間的關(guān)系進(jìn)行了線性回歸,結(jié)果如圖(3b),從圖3b中可以看出,線性回歸的中心線與1:1線之間存在一定的偏離,而且回歸的確定性系數(shù)R2僅為0.5767,剩余殘差RMSE為5.87624(μg/L),表明模型預(yù)測(cè)結(jié)果不是很理想.
Koponcn等人發(fā)現(xiàn)!8.21],通過對(duì)光譜反射率值進(jìn)行對(duì)數(shù)轉(zhuǎn)換,有助于對(duì)葉綠素a含量進(jìn)行定量遙感.
因此對(duì)In(Ro/R?sn)和In(Chl-a)進(jìn)行了對(duì)數(shù)處理,然后以隨機(jī)挑選的50組數(shù)據(jù)進(jìn)行回歸,得到的回歸方程為:
y=1.4821e2501
(2)
式中,y為In(Chl-a);x為In(R/Rw)數(shù)值,回歸的確定性系數(shù)R2為0.7067、以剩余樣本對(duì)模型進(jìn)行了驗(yàn)證,并將全部樣本的實(shí)測(cè)值與預(yù)測(cè)值進(jìn)行線性回歸,其方程為:
y =0.5727x +0.5628
(3)
最終回歸的確定性系數(shù)R2為0.6733,剩余殘差RMSE為4.8144μg/L.通過對(duì)比表明對(duì)數(shù)處理使回歸精度有了明顯提高,這主要是對(duì)數(shù)處理能夠?qū)ζx正常情況較大的數(shù)據(jù)起到歸一化作用,使數(shù)據(jù)更加收斂.
2.4葉綠素a含量的神經(jīng)網(wǎng)絡(luò)模型
人工神經(jīng)網(wǎng)絡(luò)是20世紀(jì)80年代中后期世界范圍內(nèi)迅速發(fā)展起來的一個(gè)前沿領(lǐng)域,因其良好的預(yù)測(cè)性和實(shí)用性被廣泛應(yīng)用于各個(gè)領(lǐng)域,尤其在遙感影像自動(dòng)分類與定量分析方面得到了廣泛應(yīng)用4-261.由于BP神經(jīng)網(wǎng)絡(luò)具有并行處理、非線性、容錯(cuò)性、自適應(yīng)和自學(xué)習(xí)的特點(diǎn),在數(shù)據(jù)擬合與模擬中有著無比的優(yōu)越性、因此本文嘗試采用BP神經(jīng)網(wǎng)絡(luò),把多個(gè)波段的反射率作為輸入矢量來預(yù)測(cè)查干湖水體葉綠素a隨光譜反射率的變化,改善以往單波段或比值法建立模型參與波段少、反演精度低的缺陷.
本研究采用的BP神經(jīng)網(wǎng)絡(luò)模型是由Matlab的Neural Network Toolbox提供,網(wǎng)絡(luò)共有3層,依次為輸入層、隱藏層和輸出層.輸入層為不同診斷波段的光譜反射率,中間層的神經(jīng)元個(gè)數(shù)為2-10之間的可變因子;輸出層神經(jīng)元為1.中間隱藏層的激活函數(shù)為tansig,輸出層為purelin函數(shù),使得輸出結(jié)果不局限在0-1之間;訓(xùn)練函數(shù)采用的是trainlm,該函數(shù)由Levenberg-Marquardt開發(fā),其特點(diǎn)是運(yùn)算高效,收斂快.在96個(gè)水體葉綠素a數(shù)據(jù)中隨機(jī)抽取50個(gè)作為訓(xùn)練樣本的學(xué)習(xí)目標(biāo)T,將431 nm、681 nm、705nm、820 nm處的反射率作為輸入矢量P(選擇這4個(gè)波段的反射率主要是綜合考慮水體在可見光與紅邊處的光譜反射特征
差異較大,處于葉綠素吸收或反射峰值區(qū),而以人工神經(jīng)網(wǎng)絡(luò)來擬合實(shí)測(cè)數(shù)據(jù)需要尋求不同波段的互補(bǔ)優(yōu)
勢(shì)),中間隱藏層的神經(jīng)元可在2-10之間變動(dòng),輸出層神經(jīng)元為1,設(shè)置網(wǎng)絡(luò)學(xué)習(xí)的迭代次數(shù)為300.
當(dāng)神經(jīng)網(wǎng)絡(luò)訓(xùn)練完畢后,把剩余樣本的光譜數(shù)據(jù)作為輸入矢量P,進(jìn)行模擬所得預(yù)測(cè)值與實(shí)測(cè)值進(jìn)行
擬合,結(jié)果如圖4a所示.當(dāng)隱藏層的節(jié)點(diǎn)數(shù)為8時(shí),確定性系數(shù)R2與剩余殘差RMSE分別為0.9515、
1.8425μg/L.可以看出,神經(jīng)網(wǎng)絡(luò)的模擬精度遠(yuǎn)遠(yuǎn)高于單波段與比值法構(gòu)建的回歸模型.當(dāng)隱藏層的節(jié)點(diǎn)數(shù)為2-9時(shí),R2與RSME的變化情況以及二者的對(duì)比情況如表2.從表2可以看出隨著節(jié)點(diǎn)數(shù)量的增加,網(wǎng)絡(luò)的模擬精度在不斷增加,但也有個(gè)別情況下,節(jié)點(diǎn)數(shù)增大反而預(yù)測(cè)精度略有下降.一般而言,當(dāng)節(jié)點(diǎn)數(shù)為7-9時(shí),網(wǎng)絡(luò)的模擬精度已經(jīng)趨于穩(wěn)定,節(jié)點(diǎn)數(shù)的增加對(duì)模擬的精度不會(huì)有太大的提高,而且節(jié)點(diǎn)過多可能出現(xiàn)過度擬合.
由圖2b微分光譜與水體葉綠素a的線性回歸的趨勢(shì)可以發(fā)現(xiàn),水體葉綠素a與微分光譜在部分波段關(guān)系密切,因此在本研究中將580nm、700nm、800nm、860nm波長(zhǎng)處的微分光譜作為輸入變量,進(jìn)行了神經(jīng)網(wǎng)絡(luò)模擬,得到的結(jié)果如圖4b.從圖4b的結(jié)果可以看出,以微分光譜作為輸入變量的神經(jīng)網(wǎng)絡(luò)模型同樣可以收到良好的反演精度.筆者在本研究過程中,曾嘗試用不同波段的反射率以及微分光譜值作為輸入變量
進(jìn)行神經(jīng)網(wǎng)絡(luò)模擬,都收到了良好的模擬結(jié)果;但是當(dāng)輸入變量與水體葉綠素a濃度相關(guān)性較低時(shí),神經(jīng)網(wǎng)絡(luò)的模擬精度就會(huì)有所下降,因此在神經(jīng)網(wǎng)絡(luò)模擬構(gòu)成中,所選擇的波段一定要與模擬目標(biāo)有一定的相關(guān)性.唐軍武等211在黃東海水域使用412、443、490、510、555nm等波段也取得了較好的效果.目前,國(guó)內(nèi)外利用神經(jīng)網(wǎng)絡(luò)算法反演水質(zhì)參數(shù)多用于遙感影像,由于神經(jīng)網(wǎng)絡(luò)強(qiáng)大的模擬能力,一般來說精度都比較高,如Zhangl?]等利用神經(jīng)網(wǎng)絡(luò)模型在海岸帶水體取得了較好的效果.但是,神經(jīng)網(wǎng)絡(luò)模型提取葉綠素a的不足之處在于它需要大量的樣本(一般在50以上)來訓(xùn)練與測(cè)試,因此在以神經(jīng)網(wǎng)絡(luò)模型進(jìn)行水體葉綠素a反演時(shí),一定要在大樣本事件的前提下進(jìn)行,并且網(wǎng)絡(luò)的訓(xùn)練以及隱藏層節(jié)點(diǎn)數(shù)都要合理控制,避免過度訓(xùn)練與過度擬合現(xiàn)象的發(fā)生.
3結(jié)論
本文在分析查干湖水體反射光譜特征的基礎(chǔ)上,通過對(duì)光譜反射率與葉綠素a濃度之間的關(guān)系進(jìn)行分析研究,結(jié)果表明:?jiǎn)尾ǘ喂庾V反射率與葉綠素a濃度的相關(guān)系數(shù)在藍(lán)、綠光波段為0.5左右,而在紅光以及近紅外短波方向,相關(guān)系數(shù)在0.5-0.7之間變化,并且隨著波長(zhǎng)的遞增,相關(guān)系數(shù)有所增加.光譜反射率比值(R/Rn)與葉綠素a濃度之間密切相關(guān),對(duì)二者進(jìn)行對(duì)數(shù)處理后,回歸的精度有所提高,確定性系
數(shù)R2為0.7067,且兩者顯著性水平P<0.01,模型驗(yàn)證也呈極顯著水平P<0.01,可以用來估算葉綠素a濃度.無論是逐波段線性回歸,還是比值法建立的模型,其反演精度都不是很高,但是神經(jīng)元網(wǎng)絡(luò)模型可以大大提高高光譜定量反演葉綠素a含量的精度,以光譜反射率或微分光譜與葉綠素a相關(guān)系數(shù)較大的波段作為輸入變量,都能夠收到良好的反演精度.