湖泊科学   2022, Vol. 34 Issue (2): 391-403.  DOI: 10.18307/2022.0203
0

研究论文——富营养化与水华防控

引用本文 [复制中英文]

汪志成, 王杰, 晏实江, 崔玉环, 王行行, 基于Sentinel-3 OLCI影像的巢湖藻蓝素浓度年内动态遥感监测. 湖泊科学, 2022, 34(2): 391-403. DOI: 10.18307/2022.0203
[复制中文]
Wang Zhicheng, Wang Jie, Yan Shijiang, Cui Yuhuan, Wang Hanghang. Annual dynamic remote sensing monitoring of phycocyanin concentration in Lake Chaohu based on Sentinel-3 OLCI images. Journal of Lake Sciences, 2022, 34(2): 391-403. DOI: 10.18307/2022.0203
[复制英文]

基金项目

国家自然科学基金项目(32171573,41401022)、安徽省科技重大专项(201903a07020014)和安徽高校自然科学研究项目(KJ2019A0045)联合资助

通信作者

王杰, E-mail: wangjie@ahu.edu.cn

文章历史

2021-07-02 收稿
2021-08-23 收修改稿

码上扫一扫

基于Sentinel-3 OLCI影像的巢湖藻蓝素浓度年内动态遥感监测
汪志成1,2 , 王杰1,2,3 , 晏实江1,3 , 崔玉环4 , 王行行1     
(1: 安徽大学资源与环境工程学院, 合肥 230601)
(2: 安徽大学湿地生态保护与修复安徽省重点实验室, 合肥 230601)
(3: 安徽省地理信息工程中心, 合肥 230601)
(4: 安徽农业大学理学院, 合肥 230036)
摘要:藻蓝素(PC)是水体蓝藻的指示性色素,其浓度反映了蓝藻生物量,利用卫星遥感监测藻蓝素浓度年内动态对蓝藻水华的有效防控有着重要意义.根据不同季节的巢湖藻蓝素浓度实测数据与同期Sentinel-3 OLCI影像,构建机器学习回归反演模型,应用于巢湖2019年OLCI影像集上,对巢湖藻蓝素浓度的空间分布、年内变化进行遥感监测.研究表明:在MUMM和C2RCC水体大气校正方法中,C2RCC的大气校正结果更接近实测光谱反射率;在机器学习回归算法中,基于梯度提升回归的藻蓝素浓度反演模型精度最高,其R2RMSErRMSE分别达到0.84、49.76 μg/L和34.1%.水体藻蓝素浓度在1—4月及12月较低,在5—11月浓度较高且波动频繁,日均气温是水体藻蓝素浓度年内变化的主要原因,而藻蓝素短期剧烈波动主要是受到日降水量和日照时数的影响;在夏、秋季节,西湖区藻蓝素浓度明显高于中、东湖区,主要与入湖河流中氮磷等物质的高输入有关.Sentinel-3 OLCI影像为湖库水体藻蓝素浓度动态监测提供了重要数据源,梯度提升回归算法在富营养化水体藻蓝素浓度反演中具有较大的应用潜力.
关键词Sentinel-3 OLCI    机器学习    藻蓝素    遥感反演    时空变化    巢湖    
Annual dynamic remote sensing monitoring of phycocyanin concentration in Lake Chaohu based on Sentinel-3 OLCI images
Wang Zhicheng1,2 , Wang Jie1,2,3 , Yan Shijiang1,3 , Cui Yuhuan4 , Wang Hanghang1     
(1: School of Resources and Environmental Engineering, Anhui University, Hefei 230601, P. R. China)
(2: Anhui Province Key Laboratory of Wetland Ecosystem Protection and Restoration, Anhui University, Hefei 230601, P. R. China)
(3: Engineering Center for Geographic Information of Anhui Province, Hefei 230601, P. R. China)
(4: School of Science, Anhui Agricultural University, Hefei 230036, P. R. China)
Abstract: Phycocyanin (PC) is an indicator pigment of cyanobacteria in water, and its concentration reflects the biomass of cyanobacteria. Monitoring the annual dynamics of PC concentration by satellite remote sensing is of great significance for the effective prevention and control of cyanobacteria bloom. Based on the measured data of phycocyanin concentration in Lake Chaohu in different seasons and the Sentinel-3 OLCI images of the same period, a machine learning regression retrieval model was constructed and applied to the 2019 OLCI image set of Lake Chaohu to monitor the spatial distribution and annual variation of PC concentration. The results show that among MUMM and C2RCC atmospheric correction methods, the atmospheric correction result of C2RCC is closer to the measured spectral reflectance. Among the machine learning regression algorithms, the retrieval model of PC concentration based on gradient boosting regression has the highest accuracy, its R2, RMSE and rRMSE reach 0.84, 49.76 μg/L and 34.1%, respectively. The concentration of PC was low from January to April and December, but high from May to November and fluctuated frequently. The average daily temperature was the main reason for the annual variation of PC concentration, and the short-term fluctuation of PC was mainly affected by the daily precipitation and sunshine duration. In summer and autumn, the PC concentration in the West Lake area was significantly higher than that in the middle and east lake area, which was mainly related to the high input of nitrogen and phosphorus into the lake. Sentinel-3 OLCI images provide important data sources for the dynamic monitoring of PC concentration in lake and reservoir waters, and the gradient boosting regression algorithm has great application potential in the retrieval of PC concentration in eutrophication waters.
Keywords: Sentinel-3 OLCI    machine learning    phycocyanin    remote sensing retrieval    spatiotemporal variation    Lake Chaohu    

在人类活动和气候变化因素的共同作用下,内陆水体蓝藻问题日趋严重,已成为全球环境关注的焦点[1-2]. 巢湖为我国五大淡水湖之一,近年来富营养化严重,水华频发,不仅给水产养殖和景区旅游带来了重大损失,还威胁到了周围居民的生产生活[3]. 因此,在治理蓝藻水华的同时,开展对湖区水环境监测以及蓝藻水华的预测预警己成为当务之急[4]. 相比于传统的实地采样监测,卫星遥感具有范围广、速度快、成本低和便于长期动态监测的优势,在内陆水体水质监测中起到了重要作用[5].

已有对蓝藻水华监测的研究大多将水体叶绿素a(Chl.a)看作蓝藻生物量的替代色素,对Chl.a的遥感反演研究较多,反演方法也相对成熟[6-8]. 然而,Chl.a不仅存在于蓝藻中,还存在于所有浮游植物中,仅用Chl.a浓度很难将蓝藻生物量与浮游植物生物量分离[9]. 藻蓝素(phycocyanin, PC)是水体蓝藻的特征色素,因此可以将藻蓝素浓度作为水体中蓝藻生物量的指示性指标[10]. 利用藻蓝素在620 nm波长处具有强吸收这一特性,国内外学者根据实测高光谱数据或遥感影像开展了关于藻蓝素浓度反演的研究,其算法主要集中在经验统计模型上. 经验统计模型中运用较广的有单一反射比算法(single reactance ratio algorithm)[11-13]、半经验基线算法(semi-empirical baseline algorithm)[14-16]. 除经验统计模型外,Simis等[10]提出了一种嵌套波段半分析算法(the nested band semi-analytical algorithm),利用波段比值和水的后向散射系数估算藻蓝素浓度;Liu等[17]利用Sentinel-3 OLCI数据的4个波段反射率数据构建了一种四波段藻蓝素半分析算法,该类方法具有较好的物理意义,但需输入的参数较多. 近年来,机器学习模型在水色遥感监测中被广泛应用[18],该类方法是将数据之间进行多次训练、验证和拟合,来拟合输入层和输出层之间的非线性关系,具有自调节、自聚类和高容错的优点. 苗松等[19]和Yim等[20]分别利用机器学习模型中的随机森林(random forest)、深度神经网络(deep neural networks)构建了适用于富营养化湖泊的藻蓝素浓度反演模型,模型精度优于波段比等经验统计方法.

目前用于水体藻蓝素浓度反演的遥感数据主要有MODIS、MERIS和Sentinel系列. 其中,MERIS影像具有中心波长在620 nm处的波段,适用于水体藻蓝素浓度反演,但该数据已于2012年5月停止发布;长时序的EOS MODIS影像缺乏中心波长在620 nm处的波段,难以准确反映藻蓝素浓度的光谱信号[21]. Sentinel-3 A/B卫星是欧洲航空局研发的多光谱中分辨率卫星,其搭载的海洋和陆地彩色成像光谱仪(OLCI),设有21个光谱波段(400~1020 nm),空间分辨率为300 m,继承了MERIS影像空间和光谱分辨率的优势. 其双星观测模式的重返周期为陆地1.1 d,可提供全球多光谱中等分辨率观测能力. 该传感器针对浮游植物的光谱特征,设计了更为精准的窄波段来检测,且具有覆盖藻蓝素吸收特征峰(620 nm)的波段[22]. 综合考虑到传感器波段设置及时间分辨率等因素,Sentinel-3 OLCI影像在水体藻蓝素浓度高频率遥感监测方面具有很大的潜力.

综上所述,国内外学者针对不同遥感数据源已提出了多种藻蓝素浓度反演方法,目前还未有根据Sentinel-3 OLCI影像集的高时谱分辨率特性开展湖库水体藻蓝素浓度长时序变化规律的相关研究. 本研究尝试根据不同季节实测水体藻蓝素浓度与同期Sentinel-3 OLCI遥感影像,构建适用于巢湖的水体藻蓝素浓度反演模型,筛选出最优模型并应用至2019年及2020年1、2月的Sentinel-3 OLCI影像集上,分析巢湖藻蓝素浓度年内变化特征及其影响因素,以期为巢湖蓝藻水华监测与预测预警提供参考依据.

1 材料与方法 1.1 研究区域

巢湖(31°25′~31°43′N,117°16′~117°51′E)位于安徽省合肥市,属于长江中下游北岸水系,是我国五大淡水湖之一. 巢湖自西向东分为西湖区、中湖区和东湖区,主要入湖河流有南淝河、十五里河、派河、兆河和柘皋河等[23](图 1). 湖区总面积约780 km2,流域面积约9258 km2,平均水深为3.0 m,最大水深6.78 m. 巢湖富营养化严重,蓝藻水华时常发生,主要分布在湖泊西北部,每年蓝藻水华最早暴发的月份为5-7月,高频暴发月份为8月[4].

图 1 巢湖概况与采样点分布 Fig.1 Overview of Lake Chaohu and distribution of sampling sites
1.2 实地采样

本研究分别于2019年12月27日(冬季)、2020年6月25日(夏季)、2020年11月3日(秋季)和2021年3月25日(春季)对巢湖按照点位图进行表层水样采集(图 1). 其中,第1次采样(冬季)的样点数为30个,后3次采样将样点数增加到了36个,共得到了138个湖面样点数据.

湖面采样通过租用快艇进行,水样采集及现场测定在北京时间9:00-14:00,与遥感影像成像时差控制在±3 h以内. 为避免陆地临近像元影响,采样点离岸线大于2 km. 在每个样点采集表层水样1.5 L,根据Xue等[24]关于巢湖水体的吸收特性在垂直方向上的变化研究并参考叶绿素a(Chl.a)采样的国家标准(HJ897-2017),将采样深度设置为0.5 m,该深度能保证样品不受水面聚集蓝藻的影响,并能对应遥感反应的真光层. 同时利用Avantes Field便携式地物光谱仪根据水表面以上测量法测定水体反射光谱数据[25],相关参数为光谱范围300~1100 nm、光谱分辨率1.5 nm、波长精度±0.3 nm. 光谱测定时,观测方位角为135°,观测天顶角为40°,需要测量的遥感参量有标准板、天空光和水面上行光谱辐亮度. 测量的遥感反射率Rrs根据公式(1)计算.

$ {R_{{\rm{rs}}}} = \frac{{{\rho _{\rm{p}}}\left( {{S_{{\rm{sw}}}} - r{S_{{\rm{sky}}}}} \right)}}{{{\rm{ \mathsf{ π} }}{S_{\rm{p}}}}} $ (1)

式中,SswSskySp分别为水面以上测量的辐射亮度、天空光的辐射亮度和标准板的辐射亮度;ρp为标准板的反射率,10 %;r是无量纲的空气水反射,取研究中常用的数值0.025[26].

为防止水体色素分解,采集的样品带回实验室后在24 h内过滤并测定藻蓝素浓度,测定全程在避光条件下进行. 藻蓝素浓度测量采用紫外可见光分光光度法[27],用直径47 mm的玻璃纤维滤膜过滤一定体积(取决于水样浑浊程度)的水样计为V1,滤膜放入离心管中,用pH=7的磷酸盐缓冲液定容至15 mL(V2),然后将离心管置于温度为-70℃的超低温冰箱中反复冻融3次,在4℃、9000 r/min条件下离心10 min,离心结束后取上清液作为待测液,利用紫外分光光度计测得其在615、652和750 nm处的吸光度,计为A615A652A750. 藻蓝素浓度Cpc(μg/L)采用庞晓宇等[28]在Bennett等[29]提出的藻蓝素浓度计算公式的基础上所改进的公式进行计算:

$ {C_{{\rm{pc}}}} = 1000\left[ {\frac{{\left( {{A_{615}} - {A_{750}}} \right) - 0.474\left( {{A_{652}} - {A_{750}}} \right)}}{{5.34}}} \right]\frac{{{V_1}}}{{{V_2}}} $ (2)

巢湖主要富营养化指标的浓度数据来源于安徽省水文局(http://slt.ah.gov.cn/tsdw/swj/),包括总氮(TN)、总磷(TP)、氨氮(NH3-N)和高锰酸盐指数(CODMn). 气温、降水、日照时数、风向和风速等气象数据来源于中国气象数据网(http://data.cma.cn/),湖泊水位数据来源于合肥水旱情信息网(http://sq.hfswj.net:8000/).

1.3 遥感数据来源与预处理

本研究选取与湖面采样同期成像的4景Sentinel-3 OLCI影像进行反演建模,该数据来自欧洲太空局(https://scihub.copernicus.eu),影像质量较好,无云覆盖. 水体遥感影像的大气校正是保证水质参数反演精度的前提,目前常用于Sentinel-3 OLCI影像的大气校正方法有集成在SNAP软件中的C2RCC(case 2 regional coast colour)算法[30]和SEADAS 7.5软件中的MUMM(management unit mathematical models)算法[31]. 为评价遥感影像大气校正效果,本研究结合实测水面光谱与Sentinel-3 OLCI传感器的光谱响应函数,计算得到OLCI传感器模拟波段反射率(公式(2)),与经过C2RCC和MUMM算法大气校正后的OLCI影像波段反射率进行比较,而后选择效果更好的大气校正算法应用于后续工作中.

$ R=\frac{\int_{\lambda_{2}}^{\lambda_{1}} f i(\lambda) R_{\mathrm{rs}}(\lambda) \mathrm{d} \lambda}{\int_{\lambda_{2}}^{\lambda_{1}} f i(\lambda) \mathrm{d} \lambda} $ (3)

式中,R为模拟波段反射率,Rrs为实测光谱反射率,fi(λ)为光谱响应函数,λ1λ2为传感器波段对应的波长.

影像中近岸水体像元反射率会受到附近陆地反射的影响而偏高,称之为近邻效应[32]. 在对鄱阳湖浊度反演的研究中,Feng等[33]利用远离岸线的最近邻像素来校正近邻效应. 相较于鄱阳湖,巢湖比较开阔且没有狭窄的河道,受近邻效应的影响相对较小,因此本研究参考毕顺等[32]所用的方法,在根据巢湖边界对影像裁剪的基础上,对离岸2个像元以内的区域进行掩膜处理,不参与后续反演建模及应用工作中.

1.4 反演模型构建与精度评价

本文根据巢湖实测藻蓝素浓度与同期的Sentinel-3 OLCI影像,通过对影像波段组合与实测数值的相关性分析,采用波段组合模型、基线模型、机器学习模型等方法,构建了多种水体藻蓝素浓度反演模型,并筛选出最佳的模型. 在机器学习建模中,利用网格搜索法来确定各模型的主要参数,提高模型精度并防止过拟合;采用十折交叉验证的方法对模型效果进行评价,即将数据集随机排序并划分为10份,轮流将其中9份作为训练数据,1份作为测试数据,最后将10次的结果平均. 反演模型的构建及精度评价通过Python语言中的keras库和scikit-learn库实现.

1.4.1 模型输入变量选择

在构建藻蓝素浓度反演模型时,需要选取与实测藻蓝素浓度相关性最高的波段或波段组合作为模型输入变量构建反演模型. 根据前人研究,Sentinel-3 OLCI影像中常用于水体藻蓝素浓度反演的为第6~12波段[21],其中第7波段(620 nm)为藻蓝素特征吸收峰波段. 因此,本文将第7波段与第6~12波段中的若干波段进行组合,共得到106种组合,对各个波段组合与实测藻蓝素浓度进行相关性分析,对相关性系数大于0.5的波段组合进行统计(表 1),从中筛选相关性最高的波段组合作为后续建模工作中的自变量.

表 1 OLCI影像波段组合与实测藻蓝素浓度的相关性分析 Tab. 1 Correlation analysis between OLCI band combinations and in-situ phycocyanin concentration
1.4.2 藻蓝素浓度反演模型

本研究构建的藻蓝素浓度反演模型包括波段组合模型、基线算法以及不同形式的机器学习模型,下面对这3种模型进行介绍.

波段组合模型是基于经验统计原理所构建的,选择与藻蓝素浓度相关性较高的波段组合作为自变量,实测藻蓝素浓度作为因变量,建立统计回归方程. 本文选取了表 1中相关性最高的波段组合(B7/(B6+B12))作为自变量构建对应的反演模型.

基线算法是以波长λ1λ3的遥感反射率所连接直线为基线,再计算波长λ2处的遥感反射率到基线的距离H,建立H与实测藻蓝素浓度的线性关系,进而实现藻蓝素浓度的估算. 本文选用的基线算法是齐琳等[15]提出的PCI指数,其峰值波长λ2为620 nm,基线两端波长λ1λ3分别为560和665 nm.

机器学习回归模型通过构建复杂结构的神经网络来捕捉输入变量的丰富特征,拟合输入变量与输出变量的非线性关系. 本研究分别采用随机森林、极端随机树、K近邻、支持向量机、梯度提升以及深度神经网络6种机器学习算法构建反演模型. 为防止模型过拟合同时保证模型精度,选择Sentinel-3 OLCI的第6~12波段反射率以及表 1中相关性较高的波段组合共13个变量作为建模的输入变量,建模输入变量的选择参考了Cao等[34]对水体Chl.a浓度反演的研究.

1.4.3 精度评价方法

本文利用决定系数(R2)、均方根误差(RMSE)和相对均方根误差(rRMSE)来评价各模型的反演精度.

$ R^{2}=1-\frac{\sum\limits_{i=1}^{n}\left(y_{i}^{\prime}-y_{i}\right)^{2}}{\sum\limits_{i=1}^{n}\left(y_{i}^{\prime}-\overline{y_{i}}\right)^{2}} $ (4)
$ R M S E=\sqrt{\frac{1}{n} \sum\limits_{i=1}^{n}\left(y_{i}^{\prime}-y_{i}\right)^{2}}$ (5)
$ r R M S E=\frac{R M S E}{\frac{1}{n} \sum\limits_{i=1}^{n} y_{i}} \times 100 \% $ (6)

式中,n为样本数目,yi为第i个样本对应的真实藻蓝素浓度值,y′ i为第i个样本对应的反演藻蓝素浓度值.

2 研究结果分析 2.1 水体影像大气校正效果评价

为有效评价不同水体大气校正算法的效果,将实测反射率与大气校正后的OLCI影像反射率(第6~12波段)进行比较. 图 2显示,在第6~12波段,经MUMM算法大气校正后的反射率显著高于实测光谱反射率,在第6波段(560 nm)误差最小(rRMSE=45.5 %),在第12波段(754 nm)误差最大(rRMSE=241.3 %);而经C2RCC算法大气校正所得到的反射率整体低于实测光谱反射率,但两者一致性较好,样点基本分布在1 ∶1线附近,在第6波段(560 nm)误差最小(rRMSE=22.8 %),在第12波段(754 nm)误差最大(rRMSE=40.9 %). 2种大气校正下的影像波段反射率均呈现波长越长,误差越大的特点,这可能是因为近红外波段信号整体比较弱,从而影响了校正精度. 由于C2RCC算法大气校正具有较好的精度,本研究采用该算法对Sentinel-3 OLCI影像进行大气校正.

图 2 水体实测反射率与大气校正OLCI影像反射率比较 Fig.2 Comparison of measured Rrs of water and atmospheric corrected OLCI image Rrs
2.2 水体藻蓝素反演模型构建与评价

利用1.4.2节中的方法,构建了不同形式的水体藻蓝素浓度反演模型. 利用各模型交叉验证结果,对各反演模型的预测精度进行评价(表 2).

表 2 不同形式反演模型的精度评价 Tab. 2 Precision evaluation of different retrieval models

传统的波段组合方法和PCI指数法的反演精度整体相对较低,其rRMSE均大于所有机器学习算法. 在6种机器学习方法中,精度最高的反演模型为梯度提升回归模型,其R2RMSErRMSE分别达到0.84、49.76 μg/L和34.1 %. 该模型精度低于Simis等[10]在荷兰某湖泊的反演精度(rRMSE=19.7 %、R2=0.94);相比Duan等[35]在太湖的反演精度(rRMSE=83 %,R2=0.88),该模型的R2略低,而rRMSE大幅降低. 这可能与不同研究区水体的富营养化程度差异有关.

经网格搜索调参,本文中梯度提升回归模型的主要参数n_esimators、learning_rate、random_state、sunbsample的最优值分别为10000、0.089、0和0.8.

为比较梯度提升回归模型与传统的波段组合、PCI指数模型反演结果的差异,生成这3种模型的反演精度散点图(图 3). 图 3显示,波段组合指数和PCI指数模型对藻蓝素浓度较高值(>300 μg/L)的估算出现了严重的低估,原因可能是线性模型较简单且输入变量较少,难以体现藻蓝素高低浓度间的差别. 而梯度提升回归模型虽在藻蓝素浓度较高时(>300 μg/L)出现轻微低估,在藻蓝素浓度较低时(< 50 μg/L)出现一定高估的现象,但其具有较高的反演精度,样点大多分布在1 ∶1线附近. 因此,本文将构建的梯度提升回归模型,应用于巢湖长时序Sentinel-3 OLCI影像集.

图 3 不同类型方法反演精度对比: (a)波段组合;(b)PCI指数;(c)梯度提升回归 Fig.3 Comparison of the retrieval and in-situ of phycocyanin concentration in water: (a) band combination; (b)PCI index; (c) gradient boosting regression
2.3 巢湖藻蓝素浓度的年内变化及影响因素

为探究巢湖水体藻蓝素浓度年内变化规律,根据2019年全年Sentinel-3 OLCI影像集的反演得到不同日期的藻蓝素浓度,通过GIS空间分析,统计得到各湖区的藻蓝素浓度年内变化图(图 4).

图 4 巢湖水体2019年藻蓝素浓度的年内变化 Fig.4 Intra-annual variation of phycocyanin concentration in Lake Chaohu in 2019

图 4表明,在2019年1-4月,中、东湖区藻蓝素浓度普遍较低,大多处于100 μg/L附近,中、东湖区仅在3月出现过一次浓度急增,其浓度分别达到287.1和238.9 μg/L,西湖区藻蓝素浓度在1-3月则明显高于中、东湖区;6月14日3个湖区出现同步大幅增长(平均增幅达315.4 μg/L),此后藻蓝素浓度整体较高且波动频繁,各湖区差异不大;10月3日西湖区藻蓝素浓度达到年内峰值580.0 μg/L,此后西湖区藻蓝素浓度维持在较高值,而中、东湖区藻蓝素浓度有所下降,湖区之间差异增大;12月后3个湖区藻蓝素浓度降至100 μg/L左右,趋于稳定.

气象因子是影响蓝藻增殖的关键因素,本文在合肥市2019年实测气象资料中,选择5种与蓝藻水华增殖密切相关的因子[36],包括气温、降水、风速、水位和日照时数,统计其日均值和月均值,与藻蓝素浓度反演值进行Pearson相关性分析(表 3). 考虑到气象因子对蓝藻生长的影响存在一定滞后性[37],气象因子的日均值数据为藻蓝素浓度数据前5日的平均值. 表 3显示,在5种气象因子中,日均气温与水体藻蓝素浓度的相关性较高且呈现显著正相关,表明其为影响巢湖藻蓝素浓度年内变化的主要因素. 在相关性上,中、东湖区的相关系数差异较小,而西湖区则明显小于中、东湖区.

表 3 巢湖藻蓝素浓度与气象因子的相关性分析 Tab. 3 Correlation coefficient between phycocyanin concentration and meteorological factors in Lake Chaohu
2.4 巢湖藻蓝素浓度的空间特征及其影响因素

为探究巢湖藻蓝素浓度的空间分布特征,本文将已构建的梯度提升反演模型应用于2019年3月到2020年2月成像的95景巢湖Sentinel-3 OLCI影像上,按照气象学所划分的季节(3-5月为春季(22景),6-8月为夏季(20景),9-11月为秋季(32景),12月-次年2月为冬季(21景))对反演值进行均值统计,得到不同季节的巢湖藻蓝素浓度分布(图 5). 由图 5可见,巢湖藻蓝素浓度空间差异较大. 春、冬季巢湖藻蓝素浓度较低,处于50~150 μg/L,部分沿岸区域因蓝藻聚集而浓度过高,可达到300~550 μg/L,3个湖区间的数值差异不大. 夏、秋季气温较高且日照充足,巢湖蓝藻水华频发,富营养化程度加剧,藻蓝素浓度在200~600 μg/L之间,西、中和东个湖区的浓度均值分别为(307.54±67.51)、(219.60±35.77)和(220.14±34.96) μg/L,西湖区藻蓝素浓度以及空间差异均显著高于中、东湖区.

图 5 不同季节巢湖藻蓝素浓度的空间分布 Fig.5 Spatial distribution of phycocyanin concentration in Lake Chaohu in different seasons

水体藻蓝素空间分布与湖区营养状况密切相关[13, 38],其中夏、秋季节巢湖西湖区藻蓝素浓度显著高于中、东湖区. 因此,本研究根据安徽省水文局水环境监测中心所提供的2019年夏季巢湖主要富营养化指标的测定结果,生成各样点TN、TP、NH3-N和CODMn浓度空间分布图(图 6). 图 6显示,西湖区各样点的TN、TP和NH3-N浓度整体较高,尤其是在西北部入湖河口区域,而CODMn虽呈现微弱的西高东低的趋势,但各样点浓度差别不大. 通过对比图 5图 6,可以看出TN、TP和NH3-N浓度与夏季藻蓝素浓度分布具有较高的一致性,这说明氮磷营养盐是影响巢湖藻蓝素浓度空间分布的主要因素. 西湖区的氮磷营养盐浓度高主要是因为西湖区与合肥市区接壤,大量生产生活污水经由南淝河、派河和十五里河等城市河流排入该区域所导致的[39].

图 6 巢湖夏季主要富营养指标浓度分布 Fig.6 Concentration distribution of main eutrophic indexes in Lake Chaohu in summer
3 讨论 3.1 遥感数据源对藻蓝素浓度反演的影响

为探究不同遥感数据源对水体藻蓝素浓度反演结果的影响,本文利用以往研究[6, 39]采用的EOS MODIS影像对巢湖藻蓝素浓度进行反演,选用数据源为MODIS逐日反射率产品(MOD09GA),空间分辨率为500 m,包含第1~7波段的反射率数据. 使用MODIS重投影工具(MODIS Reprojection Tools,MRT)将其投影到UTM-WGS84坐标系,利用其反射率数据与对应实测藻蓝素浓度进行反演建模,反演方法与1.4节中对OLCI影像反演的方法一致. 交叉验证的结果表明,对MODIS影像的最优藻蓝素浓度反演模型仍为梯度提升回归模型,其精度为R2=0.64,RMSE=75.37 μg/L,rRMSE =51.2 %,略低于Sentinel-3 OLCI影像(R2=0.84,RMSE=49.76 μg/L,rRMSE =34.1 %).

而后将建立的反演模型应用至2020年11月3日成像的MODIS逐日反射率影像上,与同期Sentinel-3 OLCI影像的反演结果进行对比分析(图 7). 图 7显示,两种数据源的藻蓝素浓度分布反演结果比较相似,其差异主要体现在西湖区的藻蓝素浓度高值区域(图中红色部分)的分布上. OLCI影像西、中、东湖区的藻蓝素浓度平均值分别为(139.6 ± 122.4)、(103.1 ± 42.3)、(89.1 ± 26.9) μg/L,MODIS影像的西、中和东湖区的藻蓝素浓度平均值分别为(194.3 ± 104.5)、(97.6 ± 32.0)、(85.0 ± 25.5) μg/L. OLCI影像的高值区域分布在西北部沿岸区和湖中的部分区域,高值和低值(图中蓝色部分)间的分割比较明显;MODIS影像的高值区域覆盖面积较大,整个西湖区的藻蓝素浓度平均值较高,且差距较小.

图 7 基于Sentinel-3 OLCI和MODIS影像的巢湖藻蓝素浓度反演结果对比 Fig.7 Comparison of phycocyanin concentration retrieval results from Sentinel-3 OLCI data and MODIS data in Lake Chaohu

相较而言,基于MODIS的藻蓝素浓度反演精度较低,可能是由于MODIS影像在500~900 nm光谱范围的波段较少且缺少620 nm的藻蓝素强吸收波段,难以提取藻蓝素浓度细微的差别,导致反演精度受限[40];此外,MOD09GA产品的空间分辨率较高(500 m),在反演建模时会存在较大的误差. 因而,Sentinel-3 OLCI影像可为湖库水体藻蓝素浓度动态监测提供重要数据源.

3.2 本文所用反演算法的适用性与不确定性

梯度提升回归模型的优势在于通过多次迭代训练n个不同的弱学习器,再将弱学习器有权重的分配生成强学习器,结果是多颗回归树的累加之和[41],其在小样本数据处理上的交叉验证精度高,对低维数据、非线性数据的处理能力强,在回归问题中有很强的应用价值[42]. 由于不同湖泊水体的光学特性存在较大差异[43]. 本文所用的反演方法可在其他富营养化水体藻蓝素浓度遥感监测中推广,但仍需要利用其他湖泊的实测数据集对模型进行重新训练. 在今后研究中,可考虑利用多个湖泊的实测藻蓝素浓度数据进行反演建模,以提高模型的泛化能力.

研究采用的遥感数据源Sentinel-3 OLCI以其高光谱分辨率、高时间分辨率及特殊的波段设置等优势,可为内陆水体藻蓝素浓度反演提供良好的数据支撑,但其目前还缺少比较成熟的大气校正算法[19]. 研究过程尝试了C2RCC和MUMM两种算法对水体影像进行大气校正,其中C2RCC算法大气校正的精度整体令人满意. 针对富营养化水体,后期尝试采用6S等大气校正算法,并根据不同时相、大气环境、传感器类型对影像数据进行划分,选择最优的大气校正算法进行大气校正.

3.3 藻蓝素浓度年内剧烈波动的原因分析

巢湖各湖区的藻蓝素浓度在年内会发生同步的剧烈波动. 据统计,在2019年全湖藻蓝素浓度均值在半个月内发生了大幅波动(幅度达100 μg/L以上)的情况共发生3次,分别在3月、6月和10月(图 4). 在排除了影像质量问题后,本研究对波动时期的原始遥感影像进行目视解译发现:在藻蓝素浓度大幅增长的日期,巢湖表面均暴发了严重的水华,在水华消退后,藻蓝素浓度也随之降低. 蓝藻水华的暴发及消退会受到多种气象因素的综合作用,其原因和机制较为复杂[44],如降水可能会增加水体营养盐,促进藻类增殖[13],但降水时期又会伴有较低的日照时长,不利于蓝藻的增殖. 因此,为更好地探究气象因素对蓝藻水华暴发的影响,将剧烈波动时期的逐日藻蓝素浓度和气象指标列于表 4.

表 4 剧烈波动时期的逐日巢湖藻蓝素浓度和气象指标* Tab. 4 Concentration data and daily meteorological data of Lake Chaohu during periods of large fluctuations in phycocyanin

表 4中可以看出,在藻蓝素浓度的剧烈波动时期,气象变化有着一定规律:在藻蓝素浓度增高时期,降水量均为0 mm,日照时长相对较高;在6月和10月藻蓝素浓度下降的时期,发生了多次降水,且日照时长出现0值. 由此可见,藻蓝素浓度的剧烈波动主要是由于日照时数和降水量的变化所导致的. 长时间的日照能促进蓝藻的光合作用使其迅速增殖[36];降水会加快藻类迁移同时暂时性破坏水体的热分层,从而减少并抑制藻类生长[45]. 另外,3月12-13日,藻蓝素浓度迅速降低,考虑到两种可能,一是人工打捞[46],二是从其水位下降了0.1 m来看,可能是因为闸控因素,导致巢湖水体流动加快,聚集的藻类被水流冲散.

4 结论

本文利用巢湖藻蓝素浓度实测数据和同期的Sentinel-3 OLCI影像,构建多种水体藻蓝素浓度反演模型,并将反演精度最高的梯度提升回归模型应用于巢湖OLCI影像数据集,分析了湖泊藻蓝素浓度的年内变化特征及影响因素,得到以下结论:

1) 在水体大气校正算法中,C2RCC算法校正后的影像反射率更接近实测光谱反射率;在各种藻蓝素浓度反演模型中,梯度提升回归模型的反演精度最高,其R2RMSErRMSE分别达到0.84、49.76 μg/L和34.1 %,在富营养化水体参数反演中具有较大的应用潜力.

2) 在时间变化上,巢湖藻蓝素浓度在1-4月及12月普遍较低,在5-11月较高且波动剧烈,藻蓝素浓度变化与日均气温、日照时长以及降水量有显著关系. 在空间分布上,夏、秋季节西湖区的藻蓝素浓度较高,主要是西湖区入湖河流携带的大量氮、磷等营养盐大量输入引起的.

3) 相较于MODIS影像对藻蓝素浓度的反演结果,本文所用的Sentinel-3 OLCI影像具有更高的反演精度,可为湖库水体藻蓝素浓度的高时频动态监测提供重要数据源.

5 参考文献

[1]
Yan DN, Xu H, Yang M et al. Responses of cyanobacteria to climate and human activities at Lake Chenghai over the past 100 years. Ecological Indicators, 2019, 104: 755-763. DOI:10.1016/j.ecolind.2019.03.019
[2]
Huisman J, Codd GA, Paerl HW et al. Cyanobacterial blooms. Nature Reviews Microbiology, 2018, 16(8): 471-483. DOI:10.1038/s41579-018-0040-1
[3]
Liu EF, Shen J. A comparative study of metal pollution and potential eco-risk in the sediment of Lake Chaohu (China) based on total concentration and chemical speciation. Environmental Science and Pollution Research, 2014, 21(12): 7285-7295. DOI:10.1007/s11356-014-2639-8
[4]
Li SM, Liu JP, Song KS et al. Analysis on spatial and temporal character of algae bloom in Lake Chaohu and its driving factors based on landsat imagery. Resources and Environment in the Yangtze Basin, 2019, 28(5): 1205-1213. [李晟铭, 刘吉平, 宋开山等. 基于Landsat影像巢湖蓝藻水华暴发时空变化特征及其驱动因素分析. 长江流域资源与环境, 2019, 28(5): 1205-1213.]
[5]
Zhang B, Li JS, Shen Q et al. Recent research progress on long time series and large scale optical remote sensing of inland water. Journal of Remote Sensing, 2021, 25(1): 37-52. [张兵, 李俊生, 申茜等. 长时序大范围内陆水体光学遥感研究进展. 遥感学报, 2021, 25(1): 37-52.]
[6]
Ma RH, Kong WJ, Duan HT et al. Quantitative estimation of phycocyanin concentration using MODIS imagery during the period of cyanobacterial blooming in Taihu Lake. China Environmental Science, 2009, 29(3): 254-260. [马荣华, 孔维娟, 段洪涛等. 基于MODIS影像估测太湖蓝藻暴发期藻蓝素含量. 中国环境科学, 2009, 29(3): 254-260.]
[7]
Smith ME, Robertson LL, Bernard S. An optimized chlorophyll a switching algorithm for MERIS and OLCI in phytoplankton-dominated waters. Remote Sensing of Environment, 2018, 215: 217-227. DOI:10.1016/j.rse.2018.06.002
[8]
Liu G, Li L, Song KS et al. An OLCI-based algorithm for semi-empirically partitioning absorption coefficient and estimating chlorophyll a concentration in various turbid case-2 waters. Remote Sensing of Environment, 2020, 239: 111648. DOI:10.1016/j.rse.2020.111648
[9]
Varunan T, Shanmugam P. An optical tool for quantitative assessment of phycocyanin pigment concentration in cyanobacterial blooms within inland and marine environments. Journal of Great Lakes Research, 2017, 43(1): 32-49. DOI:10.1016/j.jglr.2016.11.001
[10]
Simis SGH, Peters SWM, Gons HJ. Remote sensing of the cyanobacterial pigment phycocyanin in turbid inland water. Limnology and Oceanography, 2005, 50(1): 237-245. DOI:10.4319/lo.2005.50.1.0237
[11]
Schalles JF, Yacobi YZ. Remote detection and seasonal patterns of phycocyanin, carotenoid and chlorophyll pigments in eutrophic waters. Ergebnisse Der Limnologie, 2000, 55: 153-168.
[12]
Wo z ' niak M, Bradtke K, Darecki M et al. Empirical model for phycocyanin concentration estimation as an indicator of cyanobacterial bloom in the optically complex coastal waters of the Baltic sea. Remote Sensing, 2016, 8(3): 212. DOI:10.3390/rs8030212
[13]
Sòria-Perpinyà X, Vicente E, Urrego P et al. Remote sensing of cyanobacterial blooms in a hypertrophic lagoon (Albufera of València, Eastern Iberian Peninsula) using multitemporal Sentinel-2 images. Science of the Total Environment, 2020, 698: 134305. DOI:10.1016/j.scitotenv.2019.134305
[14]
Dekker AG. Detection of optical water quality parameters for eutrophic waters by high resolution remote sensing. Amsterdam Vrije Universiteit, 1993, 24: 82-93.
[15]
Qi L, Hu CM, Duan HT et al. A novel MERIS algorithm to derive cyanobacterial phycocyanin pigment concentrations in a eutrophic lake: Theoretical basis and practical considerations. Remote Sensing of Environment, 2014, 154: 298-317. DOI:10.1016/j.rse.2014.08.026
[16]
Castagna A, Simis S, Dierssen H et al. Extending Landsat 8: Retrieval of an orange contra-band for inland water quality applications. Remote Sensing, 2020, 12(4): 637. DOI:10.3390/rs12040637
[17]
Liu G, Simis SGH, Li L et al. A four-band semi-analytical model for estimating phycocyanin in inland waters from simulated MERIS and OLCI data. IEEE Transactions on Geoscience and Remote Sensing, 2018, 56(3): 1374-1385. DOI:10.1109/TGRS.2017.2761996
[18]
Reichstein M, Camps-Valls G, Stevens B et al. Deep learning and process understanding for data-driven Earth system science. Nature, 2019, 566(7743): 195-204. DOI:10.1038/s41586-019-0912-1
[19]
Miao S, Wang R, Li JC et al. Retrieval algorithm of phycocyanin concentration in inland lakes from Sentinel 3A-OLCI images. Journal of Infrared and Millimeter Waves, 2018, 37(5): 621-630. [苗松, 王睿, 李建超等. 基于哨兵3A-OLCI影像的内陆湖泊藻蓝蛋白浓度反演算法研究. 红外与毫米波学报, 2018, 37(5): 621-630.]
[20]
Yim I, Shin J, Lee H et al. Deep learning-based retrieval of cyanobacteria pigment in inland water for in situ and airborne hyperspectral data. Ecological Indicators, 2020, 110: 105879. DOI:10.1016/j.ecolind.2019.105879
[21]
Yan YE, Bao ZJ, Shao JG. Phycocyanin concentration retrieval in inland waters: A comparative review of the remote sensing techniques and algorithms. Journal of Great Lakes Research, 2018, 44(4): 748-755. DOI:10.1016/j.jglr.2018.05.004
[22]
Li XW, Jiang S, Zhang Y et al. Maximum peak height(MPH) algorithm applied to sentinel-3 OLCI data for retrieving chlorophyll-a and distinguishing cyanobacteria and floating vegetation areas in lake Taihu. Environmental Monitoring and Forewarning, 2019, 11(5): 59-65. [李旭文, 姜晟, 张悦等. "哨兵-3"卫星OLCI影像MPH算法反演太湖叶绿素a及藻草区分的研究. 环境监控与预警, 2019, 11(5): 59-65.]
[23]
Zhang M, Shi XL, Yang Z et al. The variation of water quality from 2012 to 2018 in Lake Chaohu and the mitigating strategy on cyanobacterial blooms. J Lake Sci, 2020, 32(1): 11-20. [张民, 史小丽, 阳振等. 2012--2018年巢湖水质变化趋势分析和蓝藻防控建议. 湖泊科学, 2020, 32(1): 11-20. DOI:10.18307/2020.0102]
[24]
Xue K, Zhang YC, Duan HT et al. Variability of light absorption properties in optically complex inland waters of Lake Chaohu, China. Journal of Great Lakes Research, 2017, 43(1): 17-31. DOI:10.1016/j.jglr.2016.10.006
[25]
Tang JW, Tian GL, Wang XY et al. The methods of water spectra measurement and analysis Ⅰ: Above-water method. Journal of Remote Sensing, 2004, 8(1): 37-44. [唐军武, 田国良, 汪小勇等. 水体光谱测量与分析Ⅰ: 水面以上测量法. 遥感学报, 2004, 8(1): 37-44.]
[26]
Ruddick KG, Ovidio F, Rijkeboer M. Atmospheric correction of SeaWiFS imagery for turbid coastal and inland waters. Applied Optics, 2000, 39(6): 897-912. DOI:10.1364/ao.39.000897
[27]
Pyo J, Pachepsky Y, Baek SS et al. Optimizing semi-analytical algorithms for estimating chlorophyll-a and phycocyanin concentrations in inland waters in Korea. Remote Sensing, 2017, 9(6): 542. DOI:10.3390/rs9060542
[28]
Pang XY, Duan HT, Zhang YC et al. Comparison of the extraction methods of phycocyanin pigments in eutrophic lake waters. J Lake Sci, 2014, 26(5): 799-806. [庞晓宇, 段洪涛, 张玉超等. 富营养化湖泊水体中藻蓝蛋白提取方法的对比. 湖泊科学, 2014, 26(5): 799-806. DOI:10.18307/2014.0519]
[29]
Bennett A, Bogorad L. Complementary chromatic adaptation in a filamentous blue-green alga. The Journal of Cell Biology, 1973, 58(2): 419-435. DOI:10.1083/jcb.58.2.419
[30]
Toming K, Kutser T, Uiboupin R et al. Mapping water quality parameters with sentinel-3 ocean and land colour instrument imagery in the Baltic sea. Remote Sensing, 2017, 9(10): 1070. DOI:10.3390/rs9101070
[31]
Vanhellemont Q, Ruddick K. Atmospheric correction of Sentinel-3/OLCI data for mapping of suspended particulate matter and chlorophyll-a concentration in Belgian turbid coastal waters. Remote Sensing of Environment, 2021, 256: 112284. DOI:10.1016/j.rse.2021.112284
[32]
Bi S, Li YM, Lv H et al. Estimation of chlorophyll-a concentration in Lake Erhai based on OLCI data. J Lake Sci, 2018, 30(3): 701-712. [毕顺, 李云梅, 吕恒等. 基于OLCI数据的洱海叶绿素a浓度估算. 湖泊科学, 2018, 30(3): 701-712. DOI:10.18307/2018.0312]
[33]
Feng L, Hu CM, Chen XL et al. Human induced turbidity changes in Poyang Lake between 2000 and 2010: Observations from MODIS. Journal of Geophysical Research: Oceans, 2012, 117(C7): 1-19. DOI:10.1029/2011jc007864
[34]
Cao ZG, Ma RH, Duan HT et al. A machine learning approach to estimate chlorophyll-a from Landsat-8 measurements in inland lakes. Remote Sensing of Environment, 2020, 248: 111974. DOI:10.1016/j.rse.2020.111974
[35]
Duan HT, Ma RH, Hu CM. Evaluation of remote sensing algorithms for cyanobacterial pigment retrievals during spring bloom formation in several lakes of East China. Remote Sensing of Environment, 2012, 126: 126-135. DOI:10.1016/j.rse.2012.08.011
[36]
Lu WK, Yu LX, Ou XK et al. Relationship between occurrence frequency of cyanobacteria bloom and meteorological factors in Lake Dianchi. J Lake Sci, 2017, 29(3): 534-545. [鲁韦坤, 余凌翔, 欧晓昆等. 滇池蓝藻水华发生频率与气象因子的关系. 湖泊科学, 2017, 29(3): 534-545. DOI:10.18307/2017.0302]
[37]
Qi GH, Ma XS, He SY et al. Long-term spatiotemporal variation analysis and probability prediction of algal blooms in Lake Chaohu (2009-2018) based on multi-source remote sensing data. J Lake Sci, 2021, 33(2): 414-427. [祁国华, 马晓双, 何诗瑜等. 基于多源遥感数据的巢湖水华长时序时空变化(2009--2018年)分析与发生概率预测. 湖泊科学, 2021, 33(2): 414-427. DOI:10.18307/2021.0204]
[38]
Wang JH, Li JL, Jiang DS et al. The potential impact of phosphorus concentration in typical lakes in China on water body indicators and cyanobacteria bloom trends based on Meta-analysis. Journal of Beijing University of Chemical Technology: Natural Science Edition, 2021, 48(2): 59-67. [王金航, 李京霖, 江德霜等. 我国典型湖泊磷浓度对水体指标及蓝藻水华爆发趋势的潜在影响——基于Meta分析. 北京化工大学学报: 自然科学版, 2021, 48(2): 59-67. DOI:10.13543/j.bhxbzr.2021.02.008]
[39]
Wang SH, Jiang X, Jin XC. Classification and pollution characteristic analysis for inflow rivers of Lake Chaohu. Environmental Science, 2011, 32(10): 2834-2839. [王书航, 姜霞, 金相灿. 巢湖入湖河流分类及污染特征分析. 环境科学, 2011, 32(10): 2834-2839. DOI:10.13227/j.hjkx.2011.10.024]
[40]
Tao M, Duan HT, Cao ZG et al. A hybrid EOF algorithm to improve MODIS cyanobacteria phycocyanin data quality in a highly turbid lake: Bloom and nonbloom condition. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2017, 10(10): 4430-4444. DOI:10.1109/JSTARS.2017.2723079
[41]
Huang YF, Liu YH, Li CH et al. GBRTVis: online analysis of gradient boosting regression tree. Journal of Visualization, 2019, 22(1): 125-140. DOI:10.1007/s12650-018-0514-2
[42]
Schonlau M. Boosted regression (boosting): An introductory tutorial and a stata plugin. The Stata Journal: Promoting Communications on Statistics and Stata, 2005, 5(3): 330-354. DOI:10.1177/1536867x0500500304
[43]
Lv H, Wang Q, Wu CQ et al. Variations in optical scattering and backscattering by organic and inorganic particulates in Chinese lakes of Taihu, Chaohu and Dianchi. Chinese Geographical Science, 2015, 25(1): 26-38. DOI:10.1007/s11769-014-0689-y
[44]
Hu MQ, Zhang YC, Ma RH et al. Spatial and temporal dynamics of floating algal blooms in lake Chaohu in 2016 and their environmental drivers. Environmental Science, 2018, 39(11): 4925-4937. [胡旻琪, 张玉超, 马荣华等. 巢湖2016年蓝藻水华时空分布及环境驱动力分析. 环境科学, 2018, 39(11): 4925-4937. DOI:10.13227/j.hjkx.201801057]
[45]
Liu XY, Song LX, Ji DB et al. Effect of the rainfall on extinction of cyanobacteria bloom and its mechanism analysis. Environmental Science, 2018, 39(2): 774-782. [刘心愿, 宋林旭, 纪道斌等. 降雨对蓝藻水华消退影响及其机制分析. 环境科学, 2018, 39(2): 774-782. DOI:10.13227/j.hjkx.201708203]
[46]
Zhu X, Hu MM, Zhu JH et al. Thoughts and measures of water environment comprehensive management in Lake Chaohu. Water Resources Protection, 2016, 32(1): 120-124, 141. [朱喜, 胡明明, 朱金华等. 巢湖水环境综合治理思路和措施. 水资源保护, 2016, 32(1): 120-124, 141.]