摘要
河流是连接陆地、大气和海洋三大“碳库”之间生物地球化学过程的纽带,是全球水循环和碳循环过程的重要参与者。河流二氧化碳分压(pCO2)是反映河流水—气界面CO2交换过程的关键指标,受多种自然和人为因素综合影响而表现出复杂的时空变化,但目前对河流pCO2主要控制因子及其作用的认识仍十分有限。本研究以汉江流域为例,基于高空间分辨率月尺度数据识别了河流pCO2的时空分布特征,使用可解释性机器学习方法(增强回归树模型(BRT)和累积局域效应(ALE))量化了潜在控制因子的相对贡献率并解析了其控制作用。结果表明,汉江流域多年平均河流pCO2呈现出从上游到下游的递增趋势,且高于大气平均值。基于k-Shape聚类算法,汉江流域多年月平均河流pCO2的波动类型分为平稳(T1)、单峰(T2)和双峰(T3)结构3类。BRT模型很好地模拟了汉江流域河流pCO2的多年平均值和多年月平均值,在重复实验中表现出较高的模拟效果(r>0.86,NSE>0.75)和可接受的误差(MAE<212.18 μatm,RMSE <274.16 μatm)。多年平均河流pCO2主要受温度要素控制,总相对贡献率约为66.1%。多年月平均河流pCO2的控制因子相对贡献率在不同类型间差异较大,但温度要素仍发挥着关键作用(约为26.6%~46.9%)。植被和水量要素分别在类型T2和T3中具有较高的贡献率,而水质要素的重要性相对有限(小于20.1%)。ALE分析结果揭示了河流pCO2与潜在控制因子之间的非线性、非单调关系,且在多年平均和多年月平均尺度之间、不同波动类型之间均表现出较大差异。研究揭示了汉江流域河流pCO2的主要控制因子及其作用的复杂时空变化,提高了对河流碳循环过程的认识。
Abstract
Rivers are links connecting the biogeochemical processes among terrestrial, atmospheric, and oceanic carbon pools, and are important participants in the global water and carbon cycles. Riverine partial pressure of carbon dioxide (pCO2) is a key indicator reflecting the CO2 exchange process at the riverine water-air interface, which exhibits complex spatiotemporal variations due to the co-impacts of various natural and anthropogenic factors. However, the current understanding of the main controlling factors and their effects on riverine pCO2 is still limited. In this study, the spatiotemporal distribution characteristics of riverine pCO2 were identified, and the relative contributions and controlling effects of potential controlling factors were quantified and revealed using an interpretable machine learning method (boost regression tree (BRT) and accumulated local effects (ALE)), based on monthly datasets with high spatial resolution in the Hanjiang River Basin (HRB). Results indicated that multi-year average riverine pCO2 in the HRB showed an increasing trend from upstream to downstream, and was higher than the atmospheric average. The fluctuation type of multi-year monthly average riverine pCO2 in the HRB could be classified into three types based on the k-Shape clustering algorithm, with stationary (T1), unimodal (T2), and bimodal (T3) structures, respectively. The BRT model effectively simulated the multi-year average and multi-year monthly average values of riverine pCO2 in the HRB, showing high performance (r>0.86, NSE>0.75) and acceptable errors (MAE<212.18 μatm, RMSE<274.16 μatm) in replicate experiments. Multi-year average riverine pCO2 was primarily influenced by temperature factors, accounting for approximately 66.1% of the total relative contribution rate. The relative contributions of the controlling factors for multi-year monthly average riverine pCO2 exhibited significant variation among each fluctuation type, while temperature continued to play a critical role (approximately 26.6%-46.9%). The findings of the study demonstrated that vegetation and water quantity factors exerted a significant influence on types T2 and T3, respectively. Conversely, the importance of water quality factors was found to be comparatively limited, with their contribution ranging below 20.1%. The non-linear and non-monotonic relationships between riverine pCO2 and its potential controlling factors were revealed based on ALE analysis, which showed significant differences between multi-year average and multi-year monthly average scales, as well as between different fluctuation types. The present study revealed the complex spatiotemporal variations of the main controlling factors and their effects on riverine pCO2 in the HRB, thus improving the understanding of riverine carbon cycle processes.
自然生态系统中的水循环和碳循环过程紧密耦合互馈[1],对地球各圈层之间的物质迁移和能量转化具有重要影响。河流不仅是全球水循环系统的组成部分,还是连接陆地、大气和海洋三大“碳库”的纽带,在将陆地碳向海洋输送的同时还通过活跃的代谢过程与大气进行碳交换[2-3],发挥着连接流域水循环和碳循环过程的桥梁作用。随着气候变化和人类社会发展,河流温室气体排放问题已经成为国际关注的焦点。据估算,全球河流每年向大气排放的碳量大约是向海洋输送量的两倍[4],因此河流被视为大气二氧化碳(CO2)的重要来源。河流二氧化碳分压(pCO2)反映了河流水—气界面的CO2交换方向和量级大小,是揭示河流碳循环过程的重要指标[5]。在大力推进落实“双碳目标”(碳达峰与碳中和)的背景下,厘清河流pCO2时空格局及其控制因子,有助于合理制定流域温室气体减排和河流生态保护策略,实现国家经济绿色低碳转型和可持续发展。
受复杂自然环境和人类活动共同影响,河流pCO2呈现出显著的时空差异。在空间上,河流pCO2水平在不同区域之间差异较大,如干流和支流、上游和下游、不同土地利用类型的地区之间等[3,6-8]。在时间上,河流pCO2呈现出年内、季节、日内和风暴事件驱动的变化[9-10]。河流pCO2的时空变化与气候、水文、水质、土地利用类型等因素密切相关[11-13],主要控制因子及其作用也呈现出显著的时空差异[14]。例如,Wang等[15]指出河流pCO2与环境变量的关系在不同城市化水平的地区之间差异较大;Ni等[16]发现河流pCO2在湿季与海拔和溶解性有机碳浓度显著相关,而在干旱期则不然。目前,对河流pCO2主要控制因子及其作用的认识仍然有限,亟需开展相关研究系统揭示河流pCO2的控制机理。
目前,大量研究使用相关分析、回归分析、主成分分析和冗余分析等方法探讨了河流pCO2的控制因子及其作用[14,17-19]。尽管这些方法建立了河流pCO2与其潜在控制因子之间的关系,但它们难以同时实现自变量之间共线性的处理、自变量相对贡献率的量化以及自变量和因变量之间响应关系的揭示[20-21],导致对河流pCO2控制因子的理解仍十分有限。作为一种数据驱动技术,机器学习方法可以建立自变量与因变量之间的映射关系,对非线性关系也具有良好的效果[22],其中一些方法还能够有效处理自变量之间的共线性并量化它们的相对贡献率[23-24]。为了更好地理解机器学习方法建立的自变量与因变量之间的响应关系,机器学习的可解释性技术已被广泛应用,如部分依赖图(PDP)、局部可解释的模型无关阐释(LIME)、沙普利加和解释(SHAP)和累积局域效应(ALE)等[25-26]。然而,由于对数据量的需求较高,在之前对河流pCO2及其控制因子的研究中,机器学习方法的应用十分有限。
汉江流域河流水系丰富,是我国重要的生态功能区和南水北调中线工程的水源地,流域内部自然环境和人类活动复杂,水循环和碳循环过程也呈现出显著的时空差异[27-28]。研究指出,在不同碳排放情境下,汉江流域的径流量呈现出不同的变化特征,直接影响南水北调工程未来的可调水量和水资源管理策略[29]。因此,揭示汉江流域河流pCO2时空格局及其控制机理,有助于准确估算流域碳排放水平,为合理制定流域温室气体减排政策与水利工程碳调控方案提供科学支撑。本研究使用高空间分辨率的月尺度数据集提取汉江流域河流pCO2分析其时空格局,进一步以月尺度的水量(降水量和径流量)、温度(平均气温和地表温度)、植被(净初级生产力和归一化植被指数)和水质(生化需氧量和总溶解固体)要素作为潜在控制因子,采用可解释性机器学习方法量化各潜在控制因子的相对贡献率,并解析其控制作用。
1 数据与方法
1.1 研究区域
汉江发源于陕西省秦岭南麓,于湖北省武汉市注入长江,干流长约1577 km,是长江最大的支流。汉江流域(30°4′12″~34°12′0″N,106°5′24″~114°17′24″E)位于长江中游,流域面积约15.9万km2,属亚热带季风气候。流域地势西高东低,分布着众多重要水利工程,土地利用类型以林地和耕地为主,受人类活动影响较为剧烈[30-31]。如图1a所示,汉江流域河流水系发达,支流众多。为满足后续分析需要,本研究使用ArcMap软件将汉江流域划分为0.1°×0.1°的网格(图1b),其中仅零星网格无河段分布(基于河流pCO2数据产品的河段)。
图1研究区域
Fig.1Study area
1.2 数据与预处理
本研究使用的河流pCO2数据是Liu等[32]在全球尺度上估算的高空间分辨率、月尺度数据产品,其中汉江流域的数据与其他研究中报告的实测值或基于水化学参数的估算值具有较高的一致性[11,14,33]。同时,基于相关研究结果和汉江流域月尺度数据的可用性,本研究在分析河流pCO2的主要控制因子及其控制作用时选择了对河流碳循环过程具有重要影响的水量、温度、植被和水质4类潜在控制要素[4,13,34-39],包括降水量(P)、径流量(R)、平均气温(AirT)、地表温度(LST)、净初级生产力(NPP)、归一化植被指数(NDVI)、生化需氧量(BOD)和总溶解固体(TDS)。本研究使用的数据均来自公开发布的月尺度数据产品,因空间分辨率和时间跨度有所不同,故进行以下数据预处理步骤:首先,使用ArcMap软件将空间分辨率较低(大于1 km×1 km)的数据产品重采样至0.01°×0.01°,以满足后续计算需要;随后,使用RStudio软件将所有变量数据计算到图1b所示的0.1°×0.1°网格尺度上,其中无河段的网格不用于后续分析计算;最后,使用RStudio软件计算所有变量数据的多年平均值和多年月平均值,计算时仅使用数据产品中2011—2018年期间的数据记录。数据产品的详细信息如附表I所示。
1.3 分析方法
1.3.1 k-Shape聚类算法
k-Shape聚类算法常用于时间序列数据的聚类分析,该算法基于归一化互相关算法衡量时间序列数据之间的距离(即基于形状的距离),并通过迭代将时间序列数据分为给定的k类[40-41]。在进行聚类分析时,常使用基于误差平方和(SSE)的肘方法确定最佳的分类数目[42-43]。一般而言,更多的分类数目意味着每个类中的样本更接近分类中心,即SSE随着分类数目的增加而减小。肘方法的原理是将SSE下降率开始放缓的点所对应的分类数目识别为最佳分类数目。本研究使用Matlab软件将肘方法实验重复了10次,以确定汉江流域多年月平均河流pCO2波动类型的最佳分类数目k。
1.3.2 增强回归树机器学习方法
增强回归树模型(BRT)是一种基于传统分类回归树算法开发的机器学习方法,兼具回归树和增强算法的优势,擅长处理非线性问题,能够充分考虑自变量间的共线性和交互作用,还能量化自变量的相对贡献率[23,44-46]。本研究使用RStudio软件的“dismo”包实现BRT建模,模型的两个主要参数——树复杂度和学习率,分别设置为5和0.01。BRT模型的模拟和相对贡献率分析过程被重复100次,在每次模拟时随机选择75%的样本作为训练集,剩余25%作为测试集。使用4个指标来评价模型的效果,即Spearman秩相关系数(r)、纳什效率系数(NSE)、平均绝对误差(MAE)和均方根误差(RMSE)。r适用于检验原始数据与模拟数据之间的线性相关性,NSE可以综合衡量原始数据与模拟数据之间的波动性吻合程度,MAE反映了模拟数据的总体误差,RMSE则反映了模拟数据的离散程度。综合4个指标的结果能够全面评价模型的整体性能。指标计算公式如下:
(1)
(2)
(3)
(4)
式中,和分别为原始数据序列和模拟数据序列中的第i个值;和分别为原始数据序列和模拟数据序列的平均值;n是数据序列的长度。
1.3.3 累积局域效应后解释技术
累积局域效应(ALE)可以用于解释机器学习模型中因变量与自变量之间的关系。该方法通过对其他自变量的影响进行平均,将模型简化为仅依赖单一自变量的函数,从而揭示单一因变量与多个自变量之间的关系。ALE方法的运算效率较高,当自变量之间存在相关性时也能表现出较好的效果[47-48],适用于本研究中河流pCO2控制因子作用的分析。在本研究中,ALE分析也使用RStudio软件实现,在每次BRT模拟时均进行ALE分析,即ALE分析也重复了100次。
2 结果与分析
2.1 汉江流域河流pCO2的时空格局
汉江流域多年平均河流pCO2的空间分布如图2所示,整体呈现出从上游到下游递增的趋势且高于大气平均值(约380 μatm[32]),表明汉江流域的河流为CO2排放源。使用k-Shape聚类算法和肘方法对汉江流域多年月平均河流pCO2的波动特征进行分类(图3a),结果表明波动特征应被分为平稳(T1)、单峰(T2)和双峰(T3)结构3类(图3b、c)。类型T1和T2分布在汉江流域中上游地区,河流pCO2在夏季和秋季较高,二者之间的波动特征差异较小,类型T1更为平稳,类型T2则具有相对明显的单峰结构(图3c)。类型T3呈现出明显的双峰结构,主要分布在汉江流域中下游地区,河流pCO2在春季最高。多年月平均河流pCO2波动特征的显著空间差异表明汉江流域的河流具有不同的CO2排放高峰期。
图3汉江流域多年月平均河流pCO2波动特征分类
Fig.3Classification of fluctuations of multi-year monthly average riverine pCO2 in the Hanjiang River Basin
2.2 多年平均河流pCO2的控制因子及其作用
基于河流pCO2及8个潜在控制因子的多年平均值在整个汉江流域建立BRT模型并进行ALE分析。表1展示了100次重复实验中训练集和测试集的效果,图4a展示了模型的整体模拟结果和效果。BRT模型表现良好,模拟值与原始值在1∶1线附近紧密分布,在整个汉江流域显示出很强的相关性和可接受的误差(图4a)。然而,在整个汉江流域的模拟结果中,模型模拟的类型T1和T3的多年平均河流pCO2误差较大(图4b、d)。不同波动类型中包含的网格数量不同(类型T1、T2和T3分别包含588、658和273个网格),导致BRT模型训练时对网格数量较少的类型的模拟效果较差。这表明在后续分析多年月平均河流pCO2的控制因子时,有必要对不同波动类型分别进行BRT建模,以减少其他类型的干扰。此外,4个评价指标在100次重复实验中的标准差较小,表明BRT模型的结构较为相似。综上所述,BRT模型的模拟效果稳定,8个潜在控制因子能够有效地模拟多年平均河流pCO2。
图3汉江流域多年月平均河流pCO2波动特征分类
Fig.3Classification of fluctuations of multi-year monthly average riverine pCO2 in the Hanjiang River Basin
表1BRT模型在训练集和测试集对多年平均河流pCO2的模拟效果*
Tab.1Simulation performance of the BRT model on multi-year average riverine pCO2 in training and testing sets
*表中的评价指标值为100次重复实验模拟结果的平均值和标准差。
根据BRT模型的结果量化了潜在控制因子的相对贡献率,100次重复实验的平均值和标准差如图5所示。汉江流域多年平均河流pCO2最重要的3个控制因子分别为LST、AirT和TDS,总相对贡献率超过75.0%。其他潜在控制因子的重要性较低,相对贡献率均小于6.0%。整体而言,温度要素主导了汉江流域多年平均河流pCO2的空间分布,特别是LST,水量和植被要素的作用则相当有限。
基于ALE方法识别潜在控制因子对汉江流域多年平均河流pCO2的控制作用,结果表明多年平均河流pCO2与潜在控制因子之间的关系是非线性和非单调的(图6)。多年平均河流pCO2随AirT、LST和BOD的增加而非线性增大,随NPP、NDVI和TDS的增加而先增大后减小。AirT和LST分别在约13.0和11.9℃以上对多年平均河流pCO2发挥较强的提升作用,BOD在约50.3 mg/L以上时作用较强。NPP和NDVI的提升作用分别在约14.6 g C/m2和0.45以上时较强,在约26.3 g C/m2和0.58时发生转折并呈现出微弱或较强的降低作用。在TDS低于5578.7 mg/L时呈现出提升作用,随后表现出降低作用。多年平均河流pCO2与降水量和径流量的关系十分复杂,表现出显著的非线性关系。
图4BRT模型对多年平均河流pCO2的模拟效果(图中的点和误差线分别表示100次重复实验模拟的多年平均河流pCO2的平均值和标准差;评价指标的值为重复实验中整体模拟效果的平均值和标准差; 虚线表示1∶1线;子图b~d分别展示了子图a中与类型T1、T2和T3所对应区域的模拟结果)
Fig.4Simulation performance of the BRT model on multi-year average riverine pCO2 (Points and error bars represent the mean and standard deviation of the multi-year average riverine pCO2 simulated in 100 replicate experiments, respectively. Evaluation metrics are the mean and standard deviation of the simulation effect in replicate experiments. Dashed lines represent the1∶1 line. Subplots b-d show the simulation results of the regions corresponding to types T1, T2, and T3 in subplot a, respectively)
2.3 多年月平均河流pCO2的控制因子及其作用
用不同波动类型所对应区域的河流pCO2和潜在控制因子的多年月平均值分别建立BRT模型,模型模拟效果如表2和图7所示。与在整个汉江流域模拟多年平均河流pCO2的效果相比,不同波动类型分别建模的方式提升了BRT模型的模拟效果,特别是类型T1(NSE增加约0.44)。相似地,BRT模型的稳定性较高,8个潜在控制因子能够有效地模拟多年月平均河流pCO2。BRT模型对类型T2的模拟效果最好,类型T1的NSE指标小于类型T2,类型T3则具有较大的模拟误差。指标NSE对高值的模拟效果较为敏感[49],类型T1的多年月平均河流pCO2的高值占比相对较小(图3),可能导致了BRT模型对类型T1高值区的模拟效果较差。对于类型T3而言,其模拟误差较大的原因可能是模型样本数量相对较少和多年月平均河流pCO2的波动性和离散程度较大。
图5控制因子对多年平均河流pCO2的相对贡献率 (数值表示100次重复实验的相对贡献率的平均值和标准差)
Fig.5Relative contribution of controlling factors to multi-year average riverine pCO2 (Values represent the mean and standard deviation of the relative contribution of 100 replicate experiments)
图6控制因子对多年平均河流pCO2的累积局域效应 (实线和阴影分别表示100次重复实验的平均结果和标准差)
Fig.6Accumulated local effects of controlling factors on multi-year average riverine pCO2 (Solid lines and shads represent the mean result and standard deviation of 100 replicate experiments)
表2BRT模型在训练集和测试集对不同波动类型多年月平均河流pCO2的模拟效果*
Tab.2Simulation performance of the BRT model on multi-year monthly average riverine pCO2 of different fluctuation types in training and testing sets
*表中的评价指标值为100次重复实验的模拟结果的平均值和标准差。
不同波动类型的多年月平均河流pCO2的主要控制因子呈现出较大差异(图8)。对于类型T1,温度要素仍发挥着最重要的作用,AirT和LST是最重要的控制因子;水质要素的总贡献率紧随其后,但就单个控制因子而言,NDVI的重要性更高。类型T2与T1的主要控制因子相似,但NDVI比AirT和LST更重要。水量要素对类型T1和T2的控制作用均十分有限,但在类型T3中发挥着最为重要的作用,降水量的相对贡献率接近40.0%。温度要素对类型T3的控制作用虽然有所降低,但总贡献率仍在25.0%以上。
图7BRT模型对不同波动类型的多年月平均河流pCO2的模拟效果 (图中的点和误差线分别表示100次重复实验模拟的多年月平均河流pCO2的平均值和标准差; 评价指标的值为重复实验中整体模拟效果的平均值和标准差;虚线表示1∶1线)
Fig.7Simulation performance of the BRT model on multi-year monthly average riverine pCO2 of different fluctuation types (Points and error bars represent the mean and standard deviation of the multi-year monthly average riverine pCO2 simulated in 100 replicate experiments, respectively. Evaluation metrics are the mean and standard deviation of the simulation effect in replicate experiments. Dashed lines represent the 1∶1 line)
图8控制因子对不同波动类型的多年月平均河流pCO2的相对贡献率 (数值表示100次重复实验的相对贡献率的平均值和标准差)
Fig.8Relative contributions of controlling factors to multi-year monthly average riverine pCO2 of different fluctuation types (Values represent the mean and standard deviation of the relative contribution of 100 replicate experiments)
潜在控制因子与不同波动类型的多年月平均河流pCO2的关系也呈现出显著的差异(图9)。潜在控制因子与类型T1和T2的多年月平均河流pCO2的关系较为相似,但与类型T3的关系则十分不同。水量要素在类型T1和T2中的控制作用较为稳定,多年月平均河流pCO2随着降水量的增大表现出先缓慢降低后缓慢升高并相对趋于稳定的特征,随着径流量的增大则表现出先增加后趋于稳定的特征。而对于类型T3,水量要素对多年月平均河流pCO2呈现出很强的提升作用,在降水量和径流量分别达到约79.8 mm和135.3 mm以上时相对稳定。温度要素对类型T1和T2的多年月平均河流pCO2具有提升作用,但对类型T3则具有降低作用。当NPP相对较低时,对3类多年月平均河流pCO2均具有提升作用,随后表现出轻微(类型T1和T2)或明显(类型T3)的“U型”关系。类型T1和T2的多年月平均河流pCO2随NDVI的增加呈近似线性下降趋势,类型T3则呈非线性上升趋势。水质要素与类型T3的多年月平均河流pCO2的关系也与类型T1和T2差别很大。对于类型T3而言,多年月平均河流pCO2随着BOD的增加而增加,随着TDS的增加先降低后趋于稳定;对于类型T1和T2,多年月平均河流pCO2与BOD的关系则表现出先降低后轻微提升的特征,与TDS则呈现出先迅速提升后缓慢提升的特征。
图9控制因子对不同波动类型的多年月平均河流pCO2的累积局域效应 (线和阴影分别表示100次重复实验的平均结果和标准差)
Fig.9Accumulated local effects of controlling factors on multi-year monthly average riverine pCO2 of different fluctuation types (Lines and shads represent the mean result and standard deviation of 100 replicate experiments)
3 讨论
3.1 河流pCO2的时空异质性
受有机质来源与浓度、水生生态系统代谢以及其他水文过程等共同影响,河流pCO2呈现出显著的时空异质性。研究表明,低海拔的农业河流往往比山区河流具有更高的水体pCO2[50]。与以山地森林为主的中上游地区相比,汉江流域中下游地区地势相对平坦,土地利用类型以耕地和城市为主[51-52],河流pCO2较高。对于月波动特征而言,汉江流域中上游地区的河流pCO2在夏季和秋季较高,与其他位于长江流域的研究结果相似[53-55]。在汉江流域中下游地区,河流pCO2在春季最高,这可能是由于夏季和秋季(雨季)丰富的降水量和径流量引起较强的稀释效应以及水体中不稳定的有机物组分被优先消耗导致的[55-56]。此外,以往的研究指出,长江流域河流pCO2的时间波动特征在流域上下游、河流干支流之间普遍存在差异,整体表现出下游和支流的波动相对剧烈的特点[3,57],与本研究结果较为一致。
3.2 河流pCO2的控制因子作用及重要性差异
潜在控制因子对河流pCO2的控制作用通常具有两面性。水量要素对河流pCO2的作用方式主要包括稀释和冲刷效应,丰富的降水和径流能够直接稀释水体中的CO2,导致pCO2降低,但同时也将大量的陆地碳(包括直接补充至水体的土壤CO2和可被河流生态系统利用的其他化合物)冲刷进河流,间接提升了河流pCO2[15,56,58-59]。温度要素通过控制生物过程和气体溶解度来调节河流pCO2,较高的温度有利于水生生态系统的微生物代谢和陆地生态系统生产,但也促进了水生植物对CO2的消耗并降低了水体CO2的溶解度,对河流pCO2产生复杂影响[18,60-62]。陆地植被要素对河流pCO2的影响同样具有两面性:茂密的植被一方面提高了陆地生态系统对河流生态系统的有机物补充潜力,另一方面则削弱了降雨—径流的冲刷作用,降低了陆地碳向河流的转移能力[3,36]。水质要素通过控制水体中CO2生产和消耗过程之间的平衡影响河流pCO2,如富营养化的水体导致藻类和水生植物快速生长消耗CO2,降低水体pCO2;而随之增加的死亡和分解的生物量则通过增强水生系统呼吸作用促进CO2生产,提升水体pCO2[37-38,63]。
河流pCO2是多种控制因子综合作用的结果[8,13,64],因此在不同波动类型所对应的区域中,潜在控制因子的波动特征差异(图10)也导致了汉江流域多年月平均河流pCO2的控制因子重要性及其作用十分不同。与之前相近纬度地区的研究结果相似,气候要素(如水量和温度要素)对河流pCO2的影响通常较强;其中,温度要素的重要性通常高于水量要素[13,34]。对于植被要素而言,NDVI的重要性高于NPP[36],这可能是由于植被对陆地碳向河流输送过程的控制作用是其影响河流pCO2的主要途径。水质要素对多年月平均河流pCO2的相对贡献率在类型T3中最低,表明水体中的营养要素在营养丰富的河流中对pCO2的调节作用弱于营养匮乏的河流[15]。
图10不同波动类型中各控制因子的多年月平均值(图中未显示异常值)
Fig.10Multi-year monthly average values of each controlling factor in different fluctuation types (Outliers are not shown in the subplots)
潜在控制因子对河流pCO2可能表现出相反的控制作用[6,14,37],这在本研究中也得到了验证。潜在控制因子的主导控制作用在不同环境条件下可能存在差异。在森林和草地密布的汉江中上游地区(类型T1和T2),陆地植被生产(NPP)对河流碳起到了补充作用,但茂密的植被(NDVI)也抑制了陆地碳向河流的转移,进而削弱了水量要素对河流pCO2的提升作用。同时,温度升高对河流及其周边陆地生态系统代谢活动的促进作用补充了水体CO2,弥补了溶解度下降引起的河流pCO2降低。对于水质要素,BOD升高对河流pCO2的降低作用可能是水生植物对CO2的消耗大幅提升造成的,而TDS的增加可能更有利于水体碳酸盐系统产生CO2[39]。相反地,汉江中下游地区分布着大量耕地(类型T3),潜在控制因子对河流pCO2的主导控制作用与中上游地区显著不同。植被生长对河流碳的补充作用可能占据了主导地位,同时相对较低的NDVI(图10f)对降雨—径流冲刷效应的抑制作用有限,水量要素对河流pCO2的提升作用增强。温度要素对水生植物消耗CO2过程的促进作用更强,CO2溶解度的降低也加剧了河流pCO2的降低。农业和城市河流面临更严重的富营养化问题,BOD升高可能进一步促进了水生植物的死亡和微生物代谢,使河流pCO2升高;而TDS对农业河流的CO2排放过程具有较强的促进作用[38],降低了河流pCO2。
3.3 研究的局限性
本研究识别了汉江流域河流pCO2的时空格局及其主要控制因子,揭示了不同控制因子对河流pCO2的作用,但存在一定的局限性。首先,为识别河流pCO2在大空间尺度上(整个汉江流域)的时空格局,本研究使用高空间分辨率、月尺度的估算数据代替有限和离散的现场采样监测数据进行分析。然而,估算数据本身存在一定的不确定性,精确可靠的现场采样监测仍是辅助分析大型河流pCO2时空格局的重要途径。其次,尽管本研究选择的8个潜在控制因子很好地解释了汉江流域河流pCO2的时空格局,但受数据限制,本研究使用的潜在控制因子相对有限,评估的相对贡献率可能存在偏差。在数据资料充分时,更多影响河流碳循环过程的因子应被纳入模型(如流速、水温、氮磷等营养物质浓度、地下水和土壤理化性质等),以更加全面地解析河流pCO2的控制因子及其控制作用。最后,潜在控制因子的主导控制作用在不同波动类型之间存在差异,这可能是潜在控制因子之间的交互作用导致的。尽管BRT模型已经考虑了潜在控制因子之间的交互作用,但其对河流pCO2时空格局及其控制因子主导作用的影响尚不清楚。综上,为系统揭示河流水—气界面碳交换过程的控制因子及其控制机理,应通过开展现场采样监测和开发高时空分辨率的数据集等途径构建更加全面的河流pCO2及其潜在控制因子体系,并针对潜在控制因子之间的交互作用开展深入分析。
4 结论
1)汉江流域河流pCO2呈现出显著的时空差异,多年平均河流pCO2呈现出从上游到下游的递增趋势,多年月平均河流pCO2波动特征可分为平稳(T1)、单峰(T2)和双峰(T3)结构3类,类型T1和T2的河流pCO2在夏季和秋季相对较高,类型T3则在春季达到峰值。
2)BRT模型可以较好地模拟汉江流域河流pCO2的多年平均值和多年月平均值,表现出较高的拟合效果(r>0.86、NSE>0.75)和可接受的误差(MAE<212.18 μatm、RMSE<274.16 μatm),模型模拟效果在重复实验中相差不大,表明BRT模型结构较为稳定,8个潜在控制因子能够有效反映河流pCO2的时空格局。
3)温度要素是河流pCO2的主要控制因子,尽管在类型T2和T3中的重要性有所降低;水量和植被要素对多年平均河流pCO2的重要性相对有限,但对多年月平均河流pCO2的重要性有所提升;水质要素的重要性则相对稳定。
4)基于ALE方法揭示了河流pCO2与潜在控制因子之间的非线性、非单调关系。潜在控制因子对河流pCO2的控制作用强度和效果复杂多变,在多年平均和多年月平均尺度之间、不同波动类型之间呈现出显著差异。
5 附录
附表Ⅰ见电子版(DOI: 10.18307/2026.0123)。

