三江源地区是气候变化敏感区,也是季节性冻土和多年冻土的过渡地带。该地区土壤温度变化对冻土退化和植被过程有深远影响,并对区域气候、生态和水文过程产生显著影响。基于土壤温度观测数据和相关的网格数据,采用随机森林方法开发了一个新的土壤温度数据集,以提供了1982年至2015年间九个深度的月度土壤温度数据,数据集空间分辨率为0.01°×0.01°。在两个土壤观测网络和六个气象站的验证中,本数据集的纳什效率系数(NSE)在所有深度均超过0.7。与ERA5和CRA40的陆面再分析土壤温度数据相比,本数据集修正了冷偏差,提高了NSE,并将均方根误差(RMSE)从4℃-8℃降低到1℃-2℃。该数据集文件夹包含9个名为“LTXXXcm.nc”的NetCDF文件,其中XXX代表土壤层深度。
采集时间 | 1982/01/01 - 2015/12/31 |
---|---|
采集地点 | 三江源及周边地区 |
数据量 | 25.7 GB |
数据格式 | NetCDF |
数据空间分辨率(/米) | 0.01°×0.01° |
数据时间分辨率 | 月 |
坐标系 |
区域土壤温度数据由多套网格数据驱动随机森林土壤温度回归模型得出。其中,土壤温度和气象观测数据来自气象台站,气象网格数据来自中国气象驱动数据集(CMFD),植被数据来自美国国家海洋和大气管理局全球库存监测和建模系统NDVI产品(GIMMS NDVI3g v1),积雪数据来自中国5km云缺口填补高级超高分辨率辐射计雪盖扩展产品数据集(CGF-AVHRR SCE),土壤物理特性数据来自于中国陆面模型土壤性质数据集。
基于17个气象站点观测数据训练随机森林土壤温度回归模型,并利用多个空间网格数据集作为输入,对三江源区域的逐月土壤温度进行估算。这个网格数据集融合了多种关键的气象影响因子,包括气温(单位为°C)、降水(月累积量,单位为mm)以及风速(单位为ms-1,此外还纳入了地表覆盖因素,如归一化植被指数和每月积雪日数,同时考虑了土壤物理属性。
数据集分别在六个验证站点、两个土壤观测网处进行验证,并与两套常用再分析资料进行对比。在未参与模型建立的训练站点上,在0-20 cm深度处模拟值与观测值之间的相关系数超过0.98。在40、80、160和320 cm深度处,相关系数分别为0.97、0.93、0.86和0.71。在土壤观测网处的验证结果显示,玛曲观测网的NSE大于0.9,KGE大于0.84,RMSE介于1.2°C C至1.6°C之间;那曲观测网的NSE大于0.84,第4层的NSE可达0.99,KGE可达0.95,RMSE为0.8°C,Bias接近0°C。与再分析数据集的对比及验证结果显示,RF数据集在所有土壤层中的NSE值较高,显示出更优的模拟性能;RF数据集的RMSE值通常低于2°C;RF数据集在所有土壤层中的Bias值较小,绝对值约为1°C。与ERA5和CRA40数据集对比结果显示,在季节尺度和年度变化尺度上RF土壤温度数据集与观测值在年均和月度土壤温度估计方面最为接近,尤其在高温月份和表层。
1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015