基于无人机影像和深度学习技术的青海湖刚毛藻水华提取研究
doi: 10.18307/2026.0115
张娟1 , 姚晓军1,3 , 陈进轩2 , 张瑜轩1 , 韩胜利1 , 窦皓敏1
1. 西北师范大学地理与环境科学学院,兰州 730070
2. 青海湖国家级自然保护区管理局,刚察 812300
3. 中国科学院青海湖综合观测研究站,刚察 812300
基金项目: 国家自然科学基金项目(42571163)和西北师范大学绿洲科学科研成果突破行动计划(NWNU-LZKX-202301)联合资助
Extraction of Cladophora blooms in Lake Qinghai based on unmanned aerial vehicle (UAV) imagery and deep learning techniques
Zhang Juan1 , Yao Xiaojun1,3 , Chen Jinxuan2 , Zhang Yuxuan1 , Han Shengli1 , Dou Haomin1
1. College of Geography and Environmental Science, Northwest Normal University, Lanzhou 730070 , P.R.China
2. Qinghai Lake National Nature Reserve Administration, Gangcha 812300 , P.R.China
3. Qinghai Lake Comprehensive Observation and Research Station, Chinese Academy of Sciences, Gangcha 812300 , P.R.China
摘要
受青藏高原气候暖湿化影响,青海湖新生湖滨带刚毛藻水华频繁暴发。以往刚毛藻水华提取研究主要依赖多源卫星遥感影像,但受限于影像空间分辨率和混合像元效应,难以精确捕捉刚毛藻水华的真实分布及其细节特征。本文利用低空无人机影像结合Attention DeepLab V3+深度学习模型自动提取青海湖刚毛藻水华特征,对比分析其与光谱指数和机器学习方法的提取结果,并探讨无人机影像与光学卫星遥感影像提取结果的差异。结果表明:(1)Attention DeepLab V3+可在没有先验阈值情况下准确检测刚毛藻水华分布范围,模型的Kappa系数、精度、召回率和F1得分分别为0.985、0.969、0.983和0.976,表明识别能力较强。(2)与随机森林模型和红—绿—蓝浮游藻类指数相比,该模型Kappa系数和F1得分分别提高4.47%~29.75%和6.35%~34.02%,能够更好地适应复杂的刚毛藻水华分布特征,尤其是在边界细节呈现和空洞分离方面具有明显优势。(3)基于Landsat OLI-2和Sentinel-2 MSI等常用光学卫星遥感影像的提取结果存在高估青海湖刚毛藻水华面积的现象,前者平均相对误差值范围为65.28%~110.69%,后者平均相对误差值范围为5.5%~323.47%。本研究利用无人机影像的高分辨率优势,为准确评估青海湖刚毛藻水华的真实分布提供了技术支持,并为其他水体藻华特征的监测与追踪奠定了基础。
Abstract
Frequent outbreaks of Cladophora blooms in the newly formed littoral zone of Lake Qinghai have been observed due to the warming and humidification of the Qinghai-Tibet Plateau climate. Previous studies on the extraction of Cladophora blooms mainly relied on multi-source satellite remote sensing imagery. However, the limitations of image spatial resolution and mixed-pixel effects hindered the accurate identification of the true distribution and detailed features of the blooms. This study utilized low-altitude UAV imagery combined with the Attention DeepLab V3+ deep learning model to automatically extract Cladophora bloom features in Lake Qinghai. A comparative analysis was conducted with results derived from spectral indices and machine learning methods, and the differences between UAV imagery and optical satellite remote sensing imagery in extracting Cladophora blooms were explored. The subsequent results are outlined below: (1) It has been demonstrated that Attention DeepLab V3+ is capable of accurately detecting Cladophora blooms without the necessity of prior thresholds, achieving a kappa coefficient, precision, recall, and F1 score of 0.985, 0.969, 0.983, and 0.976, respectively. (2) In comparison with both the random forest model and the red-green-blue floating algae index, the model demonstrated a marked improvement in both the kappa coefficient and the F1 score, with increases of 4.47% and 6.35%, respectively. This is particularly noteworthy in terms of its superior adaptability to complex bloom distribution patterns, as evidenced by its ability to capture boundary details and differentiate between voids. (3) Optical satellite remote sensing imagery tends to overestimate Cladophora blooms in Lake Qinghai, with mean relative error values ranging from 5.5% to 323.47%. This study utilized the high-resolution capabilities of UAV imagery to provide technical support for accurately assessing the true distribution of Cladophora blooms in Lake Qinghai, thereby establishing a foundation for the monitoring and tracking of algal bloom features in other water bodies.
青海刚毛藻(Cladophora qinghaiensis)是一种丝状绿藻,具有显著的顶端生长和居间生长特性,大多着生于沙石、沉木和水草等基质上[1]。青海湖是中国最大的内陆咸水湖,在区域气候调节和生物栖息地保护中具有重要作用[2]。受青藏高原气候暖湿化影响,自2005年以来,青海湖水位持续上升,湖周新生淹没区丰富的附着基质和营养盐的释放显著促进了河口与湿地区域刚毛藻的异常增殖,进而引起公众和政府部门的广泛关注[3-4]。统计数据显示,自1990年以来,青海湖刚毛藻水华面积以每年0.42 km2的速率增长[5],展现出极强的环境适应性和快速繁殖能力[6]。鉴于刚毛藻水华发生率持续上升,精准获取其分布范围并深入探究不同时空尺度的动态变化已成为湖泊管理工作的核心任务之一。
与传统采样方法相比,卫星遥感技术具有大面积同步观测、强时效性和数据综合性等显著优势,为实现全球湖泊藻类水华的长时序监测奠定了技术基础[7]。与太湖、巢湖的蓝藻及乌梁素海的绿藻不同,青海湖的刚毛藻水华主要集中分布在西岸的浅水区域,分布面积较小且大多呈斑块状,表现出较强的空间异质性。因此,Landsat MSS、MODIS、MERIS和SAR等卫星影像因空间分辨率较低无法在湖泊近岸区使用[8]。尽管一些学者针对较高空间分辨率的卫星传感器(如Landsat TM/ETM+/OLI,Sentinel-2 MSI)提出多种方法来监测刚毛藻水华,包括浮游藻类指数(floating algae index,FAI)、叶绿素光谱指数(chlorophyll spectral index,CSI)和归一化差值植被指数(normalized difference vegetation index,NDVI)[59],但由于影像空间分辨率差异及混合像元引发的“同质异谱”和“同谱异质”效应,难以精确获取和捕捉刚毛藻水华的真实分布及其细节特征[8]。此外,青海湖刚毛藻水华暴发期主要集中在8—9月,受云雨天气影响,高质量的卫星遥感影像通常难以获得,在很大程度上制约了对刚毛藻水华年内时空演变特征的深入分析。低空无人机遥感凭借其分辨率高、灵活性强和实时获取数据等优势[10-11],适用于刚毛藻水华精细监测和快速分析,可有效弥补卫星遥感影像的诸多不足。
当前国内外藻类水华研究主要集中在光学影像的应用,并采用多种方法进行藻类提取。光谱指数结合阈值分类法通过构建指数来增强藻类特征,并设定适当的阈值将藻类与背景信息分离[12]。然而,该方法在提取过程中阈值选择的主观性较强,且难以有效处理复杂背景及细小斑块或密集分布的小尺度藻类。混合像元分解法通过分解每个像素的光谱混合成分来提取藻类信息,但此方法需要更高的光谱和空间分辨率遥感数据[13]。叶绿素浓度反演法基于多光谱或高光谱数据,建立与实测叶绿素浓度相关的遥感定量反演模型,进而模拟藻类水华的时空分布特征[14]。然而,湖泊作为光学特性较为复杂的二类水体,目前尚未建立普适的水色要素及其理化性质的反演模型[15]。机器学习法则通过训练分类器来提取和分类藻类信息,但该方法无法自动从原始数据中学习高层次特征[16-17]。深度学习凭借其强大的特征学习与表征能力,能够自动从影像中提取高级抽象特征[18]。多种深度学习网络已成功应用于遥感图像的语义分割任务,涵盖不同类型的漂浮藻类,但大多基于卫星数据[19-23]。本文针对青海湖斑块状刚毛藻水华遥感提取中存在的精度不足和效率低下等问题,提出了一种基于无人机影像的深度学习自动提取方案,通过与红—绿—蓝浮游藻类指数和随机森林模型的提取结果进行对比,验证该深度学习模型的有效性,并讨论基于无人机影像与光学卫星遥感影像提取的刚毛藻水华结果的差异,从而为快速精确提取青海湖刚毛藻水华范围和认识其时空演变规律提供科学依据。
1 研究区域与数据源
1.1 研究区概况
青海湖(36°31′48″~37°15′0″N,99°36′0″~100°46′48″E)地处青藏高原东北部和青海湖流域东南角,是阻止西部荒漠化向东蔓延的天然屏障[24]。青海湖湖岸线曲折,湖面略呈“凸”形,东西长约105 km,南北宽约63 km[25]。湖中有两个湖心岛(海心山和三块石),湖周有鸟岛等岛屿,是重要的水鸟繁殖栖息地(图1a)。青海湖湖水主要来源为地表径流和湖面降水,其中径流以布哈河等7条河流为主。青海湖具有典型的高原大陆性气候,冬寒夏凉,暖季短暂,冷季漫长,水温随季节变化显著,冬季湖面结冰[26-27]。近年来,青海湖新生湖滨带刚毛藻水华频繁暴发,尤以西岸区域最为显著,水华多以破碎斑块状漂浮于湖面[28]图1b)。通过实地调查发现,刚毛藻水华在真彩色无人机影像上通常呈现浅黄色或米色,而在现场实际观测中则呈现黄色或黄绿色(图1b~c)。
1青海湖及刚毛藻水华:(a)Sentinel-2真彩色影像; (b)现场拍摄的刚毛藻水华;(c)无人机影像上的刚毛藻水华
Fig.1Lake Qinghai and Cladophora blooms: (a) Sentinel-2 true color image, (b) field-captured Cladophora blooms, and (c) Cladophora blooms in UAV Imagery
1.2 数据及预处理
1.2.1 无人机数据
本研究采用华测P330 Pro固定翼无人机搭载成都睿铂M10可见光波段相机,分别于2023年8月和2024年8—9月获取青海湖沿岸沙柳河口、泉吉河口、哈达湾湿地、布哈河口两侧、泉湾湿地和黑马河口的刚毛藻水华航拍照片(图1a)。根据相机类型和精度要求,设定无人机飞行的航向重叠率为60%,旁向重叠率为50%,垂直起飞高度和航拍高度分别为60和667 m。为便于刚毛藻水华提取,所有航拍照片均在Pix4Dmapper软件中处理为空间分辨率为5 cm的无人机正射影像,空间投影坐标为CGCS2000_GK_CM_99E,数据量总计92.99 GB(附表Ⅰ)。
1.2.2 卫星遥感数据
为分析基于无人机影像与光学卫星遥感影像提取的刚毛藻水华结果的差异,本文选取与无人机影像同期获取的无云或少云的Landsat OLI-2和Sentinel-2 MSI遥感影像进行对比分析,其中Landsat OLI-2影像1景,同步时间为2024年8月28日;Sentinel-2 MSI影像共4景,同步时间分别为2023年8月8日和2024年9月26日。Landsat OLI-2影像由美国地质调查局网站(https://earthexplorer.usgs.gov/)下载,该影像经过大气校正,利用Create Pan-sharpened Raster Dataset工具将多光谱与全色波段融合最终获得分辨率较高(15 m)的大气底层地表反射率数据;Sentinel-2 MSI影像通过欧空局哥白尼数据中心网站(https://browser.dataspace.copernicus.eu/)下载,预处理包括基于Sen2Res的超分辨率合成、影像拼接和裁剪,最终获得空间分辨率为10 m的大气底层地表反射率数据。
2 研究方法
2.1 深度学习提取方法
DeepLab V3+是当前最先进的语义分割算法之一,已成功应用于藻类水华提取。本文采用Chu等[29]提出的Attention DeepLab V3+网络对青海湖刚毛藻水华进行识别。该网络在DeepLab V3+基础上进行两点改进:(1)将传统用于DeepLab V3+网络特征提取的主干网络Xception改为更轻量级的ResNet 34,从而大幅减少模型的参数计算量,降低计算机内存占用,提高模型的运算速度。(2)在空间多孔金字塔池化模块中添加空间和通道注意力机制以增强目标像素权重,从而使网络关注目标像素的空间位置和光谱信息。
Attention DeepLab V3+网络结构图见附图Ⅰ,其主要为编码再加解码的过程。利用编码进行特征提取,利用解码模块可将获取的特征进行解码,进而获得目标像素的预测结果,即输入影像每个像素点所属的种类。在编码部分,模型首先通过深度卷积神经网络ResNet 34提取特征,生成深层特征和浅层特征两个有效特征层。深层特征通过不同膨胀率的膨胀卷积和注意力机制进一步提取,以扩大网络感受野并增强目标像素的权重。随后将提取的特征进行拼接,并通过1×1卷积调整通道数,得到解码特征。在解码部分,首先对解码特征进行上采样,以调整通道数并便于与浅层特征进行拼接,完成特征融合。其次利用3×3的卷积对融合后的特征进行特征提取,最后通过上采样获得输入影像每一个结果所属种类。
2.2 数据增强
数据增强是一种用于提升计算机视觉任务中神经网络模型性能并减小泛化误差的关键技术。本文通过形态变换对原始数据集进行扩充,以增加训练样本量[30]。鉴于遥感影像具有旋转不变性的特点,将样本裁剪为512×512大小的标准尺寸,并对其对应的标签影像分别进行水平翻转、垂直翻转、对角镜像、逆时针旋转90°及顺时针旋转90°,以进一步丰富样本库(图2)。数据增强不仅可以有效缓解样本不平衡问题,还能显著提升模型的鲁棒性,从而促进卷积神经网络的高效训练。
2影像和标签的数据增强示意图
Fig.2Schematic of data augmentation for image and label
2.3 可见光浮游藻类指数与随机森林方法
2.3.1 红-绿-蓝浮游藻类指数
RGB-FAI是一种光谱指数,其定义为利用红色和蓝色波段作为基线,衡量绿色波段反射率的相对高度。该指数由Jiang等[31]基于厘米级无人机正射影像的可见光波段开发,在绿潮监测方面表现出显著的效果。由于绿潮与刚毛藻水华均属于漂浮藻类,因此本文采用该指数来提取刚毛藻水华,计算公式为:
RGB-FAI =Rgreen -Rblue -Rred -Rblue ×λgreen -λblue /λred -λblue
(1)
式中,RredRgreenRblue分别代表红、绿、蓝3个波段的反射率,λredλgreenλblue分别代表红、绿、蓝3个波段的中心波长。
2.3.2 随机森林方法
随机森林(random forest,RF)[32]是一种通过集成多棵决策树进行分类的机器学习方法。该算法广泛应用于光学遥感影像的土地利用分类,尤其在数据维度较高、样本数据较少且对分类精度要求较高的多光谱和多时相遥感影像中。随机森林方法凭借其运行速度快、分类精度高及稳定性强的优势,在藻类水华分类任务中展现出突出的性能。本文将无人机影像的3个波段值作为随机森林模型的输入数据,分类结果作为输出数据。以无人机真彩色影像为参考,通过目视解译方式随机选择1600个样本点,其中刚毛藻水华和湖水样本点均为800个。将1200个样本点作为随机森林的训练集,刚毛藻水华和湖水样本点均为600个,将400个样本点作为随机森林模型的测试集,两者均为200个。随机森林模型表达式如下:
y=1NΣi=1Nfi(x)
(2)
式中,y为RF的预测结果,N为RF中树的数量,fix)为第i棵树对输入数据x的预测值。
2.4 刚毛藻水华整体提取流程
本文基于无人机影像和深度学习模型提取青海湖刚毛藻水华,提取流程如图3所示。首先通过无人机航拍原始照片、POS数据(无人机飞行过程中的位置和姿态信息)和地面控制点生成无人机正射影像,其次利用人工目视解译刚毛藻水华斑块生成深度学习样本库,其中刚毛藻水华赋值为“1”,其余背景信息赋值为“0”。将总体样本库按8∶1∶1的比例划分为训练集、验证集和测试集,以减少数据偏差。深度学习模型训练过程的输入变量为2024年9月26日无人机影像的红、绿、蓝3个波段。在模型训练过程中,通过监控损失值变化,在避免模型过拟合的情况下选取损失最小的最优模型进行预测。最后,对深度学习模型的提取结果进行精度评估,并将其与可见光浮游藻类指数和随机森林模型的刚毛藻水华提取结果进行对比分析。
3刚毛藻水华提取流程
Fig.3Extraction process of Cladophora blooms
2.5 精度评价指标
地面真值在验证光谱指数、机器学习和深度学习方法对藻类水华提取结果的准确性中具有至关重要的作用。无人机影像凭借其高空间分辨率的优势,能够精确地描绘青海湖刚毛藻水华的实际分布情况。尽管对空间分辨率为5 cm的影像进行目视解译耗时较长,但多次实验证明,目视解译仍是获取地面真值的最优且最精确的手段。在本研究中,刚毛藻水华目视解译结果被视为地面真值,并通过Kappa系数、平均交并比(mean intersection over union,MIoU)、精度(Precision,P)、召回率(Recall)和F1得分(F1-score)等指标对各方法提取结果的准确性进行评估。在二分类问题中,由于只有一个正类及其对应的隐含负类,MIoU实际上等同于该正类的IoU。上述评估指标的计算公式如下:
Kappa=(TP+TN)-(TP+FP)(TP+FN)+(TN+FN)(TN+FP)TP+TN+FP+FN1-(TP+FP)(TP+FN)+(TN+FN)(TN+FP)(TP+TN+FP+FN)2
(3)
IoU=TPTP+FP+FN
(4)
P=TPTP+FP
(5)
Recall =TPTP+FN
(6)
F1=2×P× Recall P+ Recall
(7)
式中,TP代表真正例,即刚毛藻水华被正确识别为刚毛藻水华的像素;FP代表假正例,即背景信息被错误归类为刚毛藻水华的像素;TN代表真负例,即背景信息被正确识别为背景信息的像素;FN代表假负例,即刚毛藻水华被错误识别为背景信息的像素。刚毛藻水华提取的准确度越高,P、Recall和F1的值越接近1。
3 结果与分析
3.1 不同方法提取结果
3.1.1 刚毛藻水华深度学习模型提取结果
本文所有训练和预测实验在配置NVIDIA GeForce RTX 3090 GPU(3.70 GHz)和24 GB内存的计算机上运行,基于PyTorch框架,编程环境为PyCharm 2022(Python)。Attention DeepLab V3+模型训练使用23000个样本,切片大小为512×512。模型初始学习率为10-4,采用自适应调整策略。损失函数为DiceLoss和交叉熵的加权和,训练200轮后模型趋于稳定,损失值降至0.033,验证集精度升至0.917,模型达到最优(图4)。
4训练集损失值和验证集精度值
Fig.4Training loss values and validation accuracy values
利用训练的最优模型分别对青海湖黑马河口、泉湾湿地、布哈河口南侧、布哈河口北侧、哈达湾湿地、泉吉河口和沙柳河口的刚毛藻水华分布区进行预测。结果表明,该模型能准确提取无人机影像上不同斑块大小的刚毛藻水华。针对人工目视解译遗漏的零散碎小的刚毛藻水华斑块(图5),该模型也能很好地识别。
5基于Attention DeepLab V3+模型的刚毛藻水华提取结果
Fig.5Extraction results of Cladophora blooms using Attention DeepLab V3+ model
3.1.2 刚毛藻水华不同方法提取效果
将不同方法提取的刚毛藻水华结果和地面真值在空间上做“True×1+Predict×2”运算,用来评估不同方法的提取效果。运算结果0、1、2和3分别代表TN、FN、FP和TP,其中,FN和FP分别表示漏分和错分。从2024年8月28日布哈河口南侧的无人机影像整体来看,Attention DeepLab V3+模型能将青海湖的高、中、低覆盖度的刚毛藻水华都识别出来,因此能较完整地提取青海湖不同程度的刚毛藻水华。RF方法整体识别能力较好,但对斑块状碎小的刚毛藻水华识别能力较弱,未能识别出分布相对零散的刚毛藻水华,且将湖面上的太阳耀斑误识别为刚毛藻水华。RGB-FAI方法的整体识别能力较弱,尽管能将青海湖的高覆盖度的刚毛藻水华大部分识别出来,但对中、低覆盖度的刚毛藻水华的识别能力较弱,不能完整地提取刚毛藻水华(图6)。从局部来看(图7),在布哈河口南侧的西北部和东南部,RF方法存在漏提刚毛藻水华的现象,尤其在岸边边缘区域,RGB-FAI提取的刚毛藻水华结果中断现象更为严重,其提取效果最差。在布哈河口北侧和南侧,RGB-FAI方法提取出了部分刚毛藻水华,RF方法提取出大部分刚毛藻水华,而Attention DeepLab V3+模型较能完整地将布哈河口南侧不同覆盖度和不同斑块大小的刚毛藻水华提取出来。因此,尽管3种方法整体上均能很好地识别青海湖高覆盖度的刚毛藻水华,但Attention DeepLab V3+模型整体上比RF和RGB-FAI方法提取的刚毛藻水华结果更加完整可靠。
6不同方法提取刚毛藻水华效果
Fig.6Effect of different methods for extracting Cladophora blooms
7不同方法局部提取刚毛藻水华效果
Fig.7Effectiveness of different methods for localized extraction of Cladophora blooms
由于Attention DeepLab V3+模型和RF方法均能完整提取青海湖刚毛藻水华,因此通过对比两种方法提取结果的细节特征,可进一步分析其提取效果的差异。如图8所示,Attention DeepLab V3+模型在提取刚毛藻水华斑块边界信息方面表现更为准确,能够清晰区分大斑块与碎小零散斑块,并成功分离刚毛藻水华斑块中的空洞。RF方法虽然在整体上能较为准确地提取刚毛藻水华,但在边缘与细节特征的提取方面存在不足,主要表现为对边界模糊区域识别能力的欠缺以及对小面积斑块提取效果的不理想。此外,RF方法在处理水华斑块内部空洞时,常出现误判或填充现象,影响了结果的精确性。相比之下,Attention DeepLab V3+模型依托其多尺度特征提取能力和注意力机制的优势,能够更好地适应复杂的刚毛藻分布特征,在边界细节呈现和空洞分离方面展现出明显的优越性。这些差异充分表明,Attention DeepLab V3+模型在处理高分辨率遥感数据以及复杂背景信息方面具有更高的适用性。
8Attention DeepLab V3+和RF提取刚毛藻水华细节特征的局部比较
Fig.8Local comparison of Attention DeepLab V3+ and RF for extracting detailed features of Cladophora blooms
3.2 不同方法比较评估
基于无人机影像提取青海湖刚毛藻水华的不同方法精度评估如附表Ⅱ所示。结果表明,Attention DeepLab V3+模型的平均精度和F1得分均最高,分别达到0.969和0.976。RF方法提取刚毛藻水华的精度也较高,平均Kappa系数和F1得分分别达到0.941和0.914,但MIoU和P值相比深度学习模型较低,分别为0.847和0.888。RGB-FAI方法的精度和F1得分最低,分别仅为0.632和0.644,不适合刚毛藻水华的提取,其MIoU仅为0.472。由此可知,基于深度学习的Attention DeepLab V3+模型在提取青海湖刚毛藻水华时表现出显著优势,其高精度和稳定性表明该模型在处理无人机影像复杂背景方面具有较强的适用性。RF方法虽然精度较高,但在边界细节和小斑块识别方面存在不足,其MIoU明显低于深度学习模型,反映出传统机器学习方法在提取细节特征时的局限性。相比之下,RGB-FAI方法由于过于依赖简单的指数计算,难以应对刚毛藻水华复杂的空间分布特征,表现最差。因此,对于青海湖刚毛藻水华的高精度提取,Attention DeepLab V3+模型表现优异。
4 讨论
4.1 基于无人机影像与光学卫星遥感影像的刚毛藻水华提取结果比较分析
对于青海湖刚毛藻水华提取,目前主要基于多源光学卫星遥感影像分析。Xu等[5]、Duan等[9]和Zhang等[8]采用Landsat TM/ETM+/OLI和Sentinel-2 MSI影像提取刚毛藻水华,但不同研究中提取结果均存在差异。这种差异可能源于使用的阈值法、分类算法或光谱指数在精度和适用性方面差异,此外,影像的空间分辨率和影像质量(如水体浑浊度、太阳耀斑等)也会对提取结果产生影响。为提升刚毛藻水华提取的准确性和一致性,应考虑引入高分辨率遥感数据(如无人机影像)作为补充,定量验证卫星遥感影像提取结果的不确定性。
本文以无人机影像结合深度学习模型提取的结果作为接近刚毛藻水华真值的参考,进一步比较分析同步光学卫星遥感影像目视解译的刚毛藻水华分布情况。如图9图10所示,由于卫星遥感影像的空间分辨率较低以及混合像元效应的影响,其未能准确反映刚毛藻水华的真实分布,导致目视解译的分布范围大于无人机影像提取结果。因此,光学卫星遥感影像存在高估青海湖刚毛藻水华的现象。相比之下,无人机影像结合深度学习模型,凭借高分辨率和对空间特征的深度挖掘能力,能够更加精确地刻画水华的空间分布特征。作为验证和优化卫星遥感影像提取结果的重要参考,未来研究可进一步发挥无人机影像高分辨率的优势,结合自动化算法,从而显著提升刚毛藻水华提取的精度、可靠性和一致性。
9无人机影像与Sentinel-2 MSI影像提取刚毛藻水华结果比较
Fig.9Comparison of the results of extracting Cladophora blooms using UAV imagery and Sentinel-2 MSI imagery
10无人机影像与Landsat OLI影像提取刚毛藻水华结果比较
Fig.10Comparison of the results of extracting Cladophora blooms using UAV imagery and Landsat OLI imagery
平均相对误差(mean relative error,MRE)是衡量预测值与实际值之间误差的重要指标[33]。以无人机影像解译的刚毛藻水华面积作为实际值,卫星影像解译的结果作为预测值,用以评估光学卫星遥感影像提取结果的不确定性。如表1所示,同期卫星影像解译的刚毛藻水华面积均高于无人机影像提取的面积,MRE值的范围为5.5%~323.47%。其中,泉吉河口(266.67%)和泉湾湿地(323.47%)的刚毛藻水华面积被严重高估,而哈达湾湿地的高估程度则随刚毛藻水华面积的增加而加大,8月28日的MRE(110.69%)远高于9月26日(13.30%)。相比之下,沙柳河口(25.13%)和布哈河口两侧的刚毛藻水华高估程度相对较小。不同区域MRE的差异可能与不同时期刚毛藻水华斑块的大小、破碎化程度及集聚程度有关。本文基于Landsat OLI影像的平均相对误差值范围为65.28%~110.69%,基于Sentinel-2 MSI影像的平均相对误差值范围为5.5%~323.47%。总之,以往仅基于光学卫星遥感影像的研究在整体上严重高估了青海湖刚毛藻水华面积。
1无人机影像与光学卫星遥感影像提取刚毛藻水华面积比较
Tab.1Comparison of the area of Cladophora blooms extracted from UAV and optical satellite remote sensing imagery
4.2 深度学习模型提取刚毛藻水华的优缺点
基于高分辨率无人机影像的波段信息与能够深度挖掘图像上下文语义信息的深度学习分割模型,青海湖刚毛藻水华得以实现自动、快速的提取。与传统的光谱指数法RGB-FAI提取青海湖刚毛藻水华相比,深度学习技术的优势在于能够快速且可靠地处理大量样本数据。而阈值法首先需要将青海湖及刚毛藻水华范围以外的陆地区域进行掩膜处理。此外,阈值的选择在很大程度上依赖于每景影像的色调、色彩和饱和度等光谱特征,并未考虑形状、大小、纹理和位置布局等空间特征。即便是同一时间获取的不同影像,每景影像的阈值也需要重新确定。与此不同,本文所使用的模型在检测刚毛藻水华特征时不依赖于阈值,从而减少了RGB-FAI阈值选择过程中可能产生的偏差。与传统的机器学习方法(DT、SVM、RF及XGBoost)相比,深度学习技术在复杂背景下表现出更好的鲁棒性,本文结果的RF方法的漏分率较高。值得注意的是,即使人工目视解译的样本和标签存在微小误差,Attention DeepLab V3+模型依然能够实现令人满意的性能,这得益于训练过程中不仅利用了影像的光谱信息,还融入了空间信息。Attention DeepLab V3+模型的另一个优势是灵活性,它可以通过调整输入通道参数,适应不同高分辨率遥感影像和输入特征的需求。尽管Attention DeepLab V3+模型在网络结构上相对直观,但其内部运行过程难以进行有效的诊断和解释,而传统的刚毛藻水华提取算法和规则更易于理解。此外,模型性能在很大程度上依赖于训练样本的质量。如果训练样本的制作不够准确或充分,预测结果可能会受到显著影响,导致较差的表现。
5 结论
本文以青海湖刚毛藻水华为研究对象,基于低空无人机正射影像结合Attention DeepLab V3+深度学习模型自动提取刚毛藻水华特征,对比分析其与光谱指数(RGB-FAI)和机器学习(RF)方法的提取结果,并探讨无人机影像与光学卫星遥感影像提取结果的差异,得到以下主要结论:
1)Attention DeepLab V3+模型可在没有先验阈值情况下准确提取无人机影像上不同斑块大小的刚毛藻水华,即使是人工目视解译遗漏的零散碎小刚毛藻水华斑块,该模型也能准确识别。模型的Kappa系数、精度、平均交并比、召回率和F1得分分别为0.985、0.969、0.962、0.983和0.976,整体识别精度较高。
2)与光谱指数(RGB-FAI)和机器学习(RF)方法相比,Attention DeepLab V3+模型可准确识别不同覆盖度的青海湖刚毛藻水华。RF方法整体识别能力较好,但分布相对零散、细小的刚毛藻水华未能完全识别,同时将湖面上的太阳耀斑误识别为刚毛藻水华。RGB-FAI方法的整体识别能力较弱,无法完整地提取刚毛藻水华。进一步通过精度评估对比得出,Attention DeepLab V3+模型的Kappa系数和F1得分分别提高4.47%~29.75%和6.35%~34.02%,能够更好地适应复杂的刚毛藻水华分布特征,在边界细节和空洞分离表征方面展现出明显的优越性。
3)Landsat OLI和Sentinel-2 MSI等常用的光学卫星遥感影像存在高估青海湖刚毛藻水华的现象,平均相对误差值范围为5.5%~323.47%。不同区域MRE的差异可能与不同时期刚毛藻水华斑块的大小、破碎化程度及集聚程度有关。
6 附录
附表Ⅰ、Ⅱ和附图Ⅰ见电子版(DOI: 10.18307/2026.0115)。
1青海湖及刚毛藻水华:(a)Sentinel-2真彩色影像; (b)现场拍摄的刚毛藻水华;(c)无人机影像上的刚毛藻水华
Fig.1Lake Qinghai and Cladophora blooms: (a) Sentinel-2 true color image, (b) field-captured Cladophora blooms, and (c) Cladophora blooms in UAV Imagery
2影像和标签的数据增强示意图
Fig.2Schematic of data augmentation for image and label
3刚毛藻水华提取流程
Fig.3Extraction process of Cladophora blooms
4训练集损失值和验证集精度值
Fig.4Training loss values and validation accuracy values
5基于Attention DeepLab V3+模型的刚毛藻水华提取结果
Fig.5Extraction results of Cladophora blooms using Attention DeepLab V3+ model
6不同方法提取刚毛藻水华效果
Fig.6Effect of different methods for extracting Cladophora blooms
7不同方法局部提取刚毛藻水华效果
Fig.7Effectiveness of different methods for localized extraction of Cladophora blooms
8Attention DeepLab V3+和RF提取刚毛藻水华细节特征的局部比较
Fig.8Local comparison of Attention DeepLab V3+ and RF for extracting detailed features of Cladophora blooms
9无人机影像与Sentinel-2 MSI影像提取刚毛藻水华结果比较
Fig.9Comparison of the results of extracting Cladophora blooms using UAV imagery and Sentinel-2 MSI imagery
10无人机影像与Landsat OLI影像提取刚毛藻水华结果比较
Fig.10Comparison of the results of extracting Cladophora blooms using UAV imagery and Landsat OLI imagery
1无人机影像与光学卫星遥感影像提取刚毛藻水华面积比较
Tab.1Comparison of the area of Cladophora blooms extracted from UAV and optical satellite remote sensing imagery
Zhao ZJ, Zhu H, Xiong X et al. The identification of Cladophora qinghaiensis sp.nov.,within the genus Cladophora collected from Qinghai Lake, China. Acta Hydrobiologica Sinica,2021,45(3):663-669. DOI:10.7541/2021.2020.113.[赵志娟, 朱欢, 熊雄等. 采自青海湖的刚毛藻属一新种——青海刚毛藻. 水生生物学报,2021,45(3):663-669.]
Wang SN, Liu P, Li B et al. Qinghai Lake is the largest lake in China. Forest & Humankind,2024,(10):94-99.[王淑宁, 刘鹏, 李斌等. 青海湖中国第一大湖. 森林与人类,2024,(10):94-99.]
Zhou D, Zhang J, Luo J et al. Analysis of the causes of water level changes in Qinghai Lake and prediction of future trends. Ecology and Environmental Sciences,2021,30(7):1482-1491.[周丹, 张娟, 罗静等. 青海湖水位变化成因分析及其未来趋势预估研究. 生态环境学报,2021,30(7):1482-1491.]
Ma KL, Xiong X, Ao HY et al. Differences in water environment characteristics between the new lakeshore zone and the main lake area of Qinghai Lake. Acta Hydrobiologica Sinica,2022,46(12):1788-1796. DOI:10.7541/2022.2021.0289.[马凯丽, 熊雄, 敖鸿毅等. 青海湖新生湖滨带与主湖区水环境特征差异研究. 水生生物学报,2022,46(12):1788-1796.]
Xu WT, Shen Q, Zhang B et al. Remote sensing identification and spatiotemporal change analysis of Cladophora with different morphologies. Remote Sensing,2024,16(3):602. DOI:10.3390/rs16030602.
段红玉. 青海湖藻类遥感监测与治理评价[学位论文]. 兰州: 西北师范大学,2020.
Gower J, King S, Goncalves P. Global monitoring of plankton blooms using MERIS MCI. International Journal of Remote Sensing,2008,29(21):6209-6216. DOI:10.1080/01431160802178110.
Zhang J, Yao XJ, Duan HY et al. Extraction of Cladophora blooms in Qinghai Lake through the integration of sentinel-2 MSI imagery and deep learning techniques. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2024,17:19115-19129.
Duan HY, Yao XJ, Zhang DH et al. Long-term temporal and spatial monitoring of Cladophora blooms in Qinghai Lake based on multi-source remote sensing images. Remote Sensing,2022,14(4):853. DOI:10.3390/rs14040853.
Chen A, Xu C, Zhang M et al. Cross-scale mapping of above-ground biomass and shrub dominance by integrating UAV and satellite data in temperate grassland. Remote Sensing of Environment,2024,304:114024. DOI:10.1016/j.rse.2024.114024.
Gallo I, Rehman AU, Dehkordi RH et al. Deep object detection of crop weeds: Performance of YOLOv7 on a real case dataset from UAV images. Remote Sensing,2023,15(2):539. DOI:10.3390/rs15020539.
Alawadi F. Detection of surface algal blooms using the newly developed algorithm surface algal bloom index(SABI). Remote Sensing of the Ocean, Sea Ice,and Large Water Regions 2010. Toulouse, France. SPIE,2010:782506.. DOI:10.1117/12.862096.
Ding Y, Huang J, Cui TW et al. The decomposition method of MODIS images Enteromorpha mixed pixels based on the relation of NDVI to abundance. Haiyang Xuebao,2015,37(7):123-131.[丁一, 黄娟, 崔廷伟等. 基于NDVI与丰度关系的MODIS影像浒苔混合像元分解方法. 海洋学报,2015,37(7):123-131.]
Feng TS, Pang ZG, JiangW. Remote sensing retrieval of chlorophyll-a concentration in Lake Chaohu based on Zhuhai-1 hyperspectral satellite. Spectroscopy and Spectral Analysis,2022,42(8):2642-2648.[冯天时, 庞治国, 江威. 基于珠海一号高光谱卫星的巢湖叶绿素a浓度反演. 光谱学与光谱分析,2022,42(8):2642-2648.]
Lai L, Zhang YC, Cao Z et al. Algal biomass mapping of eutrophic lakes using a machine learning approach with MODIS images. Science of the Total Environment,2023,880:163357. DOI:10.1016/j.scitotenv.2023.163357.
李兆鑫. 基于机器学习的漂浮大型藻类遥感研究[学位论文]. 南京: 南京信息工程大学,2019.
Luo N, Ruan RZ, Wang JH. Species identification of wetland vegetation: Based on machine learning and hyperspcetral data. Chinese Agricultural Science Bulletin,2019,35(13):157-164.[罗宁, 阮仁宗, 王俊海. 基于机器学习与高光谱数据的湿地植被物种识别研究. 中国农学通报,2019,35(13):157-164.]
Redmon J, Divvala S, Girshick R et al. You only look once: Unified,real-time object detection.2016 IEEE Conference on Computer Vision and Pattern Recognition(CVPR). Las Vegas,2016:779-788. DOI:10.1109/CVPR.2016.91.
Baek SS, Pyo J, Kwon YS et al. Deep learning for simulating harmful algal blooms using ocean numerical model. Frontiers in Marine Science,2021,8:729954. DOI:10.3389/fmars.2021.729954.
Cao HY, Han L, Li LZ. A deep learning method for cyanobacterial harmful algae blooms prediction in Taihu Lake, China. Harmful Algae,2022,113:102189. DOI:10.1016/j.hal.2022.102189.
Zhu SY, Wu YL, Ma XS. Deep learning-based algal bloom identification method from remote sensing images—Take China's Chaohu Lake as an example. Sustainability,2023,15(5):4545. DOI:10.3390/su15054545.
Kim T, Shin J, Cha Y. Incorporation of feature engineering and attention mechanisms into deep learning models to develop an early warning system for harmful algal blooms. Journal of Cleaner Production,2023,414:137564. DOI:10.1016/j.jclepro.2023.137564.
Kwon DH, Hong SM, Abbas A et al. Inland harmful algal blooms(HABs)modeling using internet of things(IoT)system and deep learning. Environmental Engineering Research,2023,28(1):210280.
Xia XS, Cai JJ, Wang LG et al. Spatial and temporal variation of Qinghai Lake in two seasons monitored by remote sensing. Remote Sensing Technology and Application,2024,39(4):1026-1038.[夏兴生, 蔡建军, 王林刚等. 青海湖两季水体范围时空变化遥感监测. 遥感技术与应用,2024,39(4):1026-1038.]
Qi MM, Yao XJ, Liu SY et al. Dynamic change of Lake Qinghai shoreline from 1973 to 2018. J Lake Sci,2020,32(2):573-586. DOI:10.18307/2020.0225.[祁苗苗, 姚晓军, 刘时银等.1973—2018年青海湖岸线动态变化. 湖泊科学,2020,32(2):573-586.]
Li FX, Fu Y, Yang Q et al. Climate change and its environmental effects in the surrounding area of Qinghai Lake. Resources Science,2008,30(3):348-353.[李凤霞, 伏洋, 杨琼等. 环青海湖地区气候变化及其环境效应. 资源科学,2008,30(3):348-353.]
Yi WJ, Li XY, Cui BL et al. Climate change and impact on water level of the Qinghai Lake watershed. Journal of Arid Meteorology,2010,28(4):375-383.[伊万娟, 李小雁, 崔步礼等. 青海湖流域气候变化及其对湖水位的影响. 干旱气象,2010,28(4):375-383.]
Hao MY, Zhu H, Xiong X et al. Analysis on the distribution and origin of Cladophora in the nearshore water of Qinghai Lake. Acta Hydrobiologica Sinica,2020,44(5):1152-1158. DOI:10.7541/2020.133.[郝美玉, 朱欢, 熊雄等. 青海湖刚毛藻分布特征变化及成因分析. 水生生物学报,2020,44(5):1152-1158.]
Chu XD, Yao XJ, Duan HY et al. Glacier extraction based on high-spatial-resolution remote-sensing images using a deep-learning approach with attention mechanism. The Cryosphere,2022,16(10):4273-4289. DOI:10.5194/tc-16-4273-2022.
张媛. 基于深度学习的田间杂草识别技术研究[学位论文]. 武汉: 武汉轻工大学,2024.
Jiang XP, Gao M, Gao ZQ. A novel index to detect green-tide using UAV-based RGB imagery. Estuarine, Coastal and Shelf Science,2020,245:106943. DOI:10.1016/j.ecss.2020.106943.
Breiman L. Statistical modelling: The two cultures. Statistical Science,2001,16(3):199-231.
Mao L, Jiang N, Wang J et al. Construction of a suspended sediment concentration inversion model in the Yellow River Estuary surrounding waters based on GOCI-Ⅰ images. Journal of Telemetry, Tracking and Command,2024,45(6):121-130.[毛露, 江娜, 王娟等. 基于GOCI-Ⅰ影像的黄河口周边海域悬浮物浓度反演模型构建. 遥测遥控,2024,45(6):121-130.]
您是第    位访问者
地址:南京市江宁区麒麟街道创展路299号    邮政编码:211135
电话:025-86882041;86882040     传真:025-57714759     Email:jlakes@niglas.ac.cn
Copyright:中国科学院南京地理与湖泊研究所《湖泊科学》 版权所有:All Rights Reserved
技术支持:北京勤云科技发展有限公司

苏公网安备 32010202010073号

     苏ICP备09024011号-2