GlobeLand30是一套由中国研制的全球地表覆盖数据集,空间分辨率达到30米。简单来说,它就像是给地球表面拍了一张高清照片,然后把照片中的每个像素点(30米×30米)都标注上对应的地表类型。这套数据目前包含2000年、2010年和2020年三个时间点的全球地表覆盖情况,就像是给地球做了三次"体检"。
我第一次接触这套数据是在做一个湿地变化研究项目时。当时需要找一套能覆盖全球、时间跨度长、精度又足够高的地表覆盖数据,找来找去发现GlobeLand30是最合适的选择。它把全球地表分为10大类:耕地、林地、草地、灌木地、湿地、水体、苔原、人造地表、裸地、冰川和永久积雪。这种分类既科学又实用,基本覆盖了我们常见的各种地表类型。
这套数据的精度相当不错。2010年版的总体精度达到83.5%,2020年版更是提高到85.72%。这是什么概念呢?相当于在100个检验点中,有85个点的分类结果与实际地表情况完全一致。在遥感领域,这个精度已经相当可靠了。
GlobeLand30的数据来源主要是Landsat系列卫星的影像,包括TM5、ETM+和OLI传感器获取的多光谱影像,还有中国环境减灾卫星HJ-1的数据。2020版还加入了16米分辨率的GF1卫星影像。这些卫星就像是在太空中运行的"相机",不断拍摄地球表面的照片。
数据处理过程很有意思。科研人员会优先选择生产基准年或更新年度±2年内植被生长季的无云或少云影像。为什么要选生长季的影像呢?因为这个时候植被特征最明显,更容易准确分类。对于影像获取困难的地区,时间要求会适当放宽,确保全球覆盖。
分类算法是这套数据的核心技术之一。虽然官方没有详细公开具体算法,但从精度评价结果来看,算法效果相当不错。我曾在项目中尝试用GlobeLand30的数据做二次分类,发现原始分类结果已经相当精细,特别是对森林、水体等大面积均质区域的识别非常准确。
获取GlobeLand30数据其实比想象中简单。数据可以通过PIE-Engine等平台在线获取和使用。下面我分享一个实际使用中的代码示例:
javascript复制// 加载全球地表覆盖GlobeLand30数据
var img = pie.ImageCollection('NGCC/GLOBELAND30')
.filterDate("2009", "2011")
.select("B1")
.mosaic();
print(img);
// 设置可视化参数
visGL = {
uniqueValue:'10, 20, 30, 40, 50, 60, 70, 80, 90, 100',
palette: ['00FF00', '00e900', '00dF00', '00ce00', '00ba00',
'0002FF', '97FF00', 'FF0000', 'FFce00', 'FFFFFF']
};
// 加载显示影像
Map.addLayer(img, visGL, "img");
这段代码会加载2009-2011年间的GlobeLand30数据并显示在地图上。不同地表类型会用不同颜色表示,比如绿色代表林地,蓝色代表水体,红色代表人造地表等。
在实际使用中,我发现有几点需要注意:
用GlobeLand30监测森林变化特别直观。我曾经对比过某地区2000年、2010年和2020年的林地数据,发现20年间森林面积减少了15%。更惊人的是,通过空间分析还能看到森林减少主要发生在哪些区域,以及这些区域变成了什么地表类型(大多是变成了耕地或人造地表)。
具体操作时,可以用GIS软件计算不同时期林地面积的变化,或者制作变化轨迹图。比如下面这个简单的面积统计方法:
python复制import geopandas as gpd
# 假设已经加载了三个年份的林地数据
forest_2000 = gpd.read_file('forest_2000.shp')
forest_2010 = gpd.read_file('forest_2010.shp')
forest_2020 = gpd.read_file('forest_2020.shp')
# 计算各时期森林面积(平方公里)
area_2000 = forest_2000.geometry.area.sum() / 10**6
area_2010 = forest_2010.geometry.area.sum() / 10**6
area_2020 = forest_2020.geometry.area.sum() / 10**6
print(f"2000年森林面积:{area_2000:.2f} km²")
print(f"2010年森林面积:{area_2010:.2f} km²")
print(f"2020年森林面积:{area_2020:.2f} km²")
GlobeLand30对人造地表的识别非常准确,特别适合研究城市扩张。我分析过长三角地区三个时期的人造地表数据,发现城市扩张呈现明显的"摊大饼"模式,而且扩张速度在2010-2020年间比2000-2010年更快。
这类分析不仅可以计算城市面积变化,还能结合道路网、人口数据等,研究城市扩张的驱动因素。比如通过空间统计可以发现,新增加的人造地表中有多少是占用了耕地,多少是占用了林地。
湿地是最容易受到人类活动影响的生态系统之一。使用GlobeLand30的湿地数据,可以量化湿地面积的变化,并分析变化的空间格局。我曾经发现某重要湿地自然保护区在20年间面积缩小了近30%,这个结果后来被用作保护政策调整的重要依据。
湿地变化分析有个小技巧:因为湿地经常和水体相邻,所以最好把水体数据也一起分析,看看湿地是直接消失了,还是先变成了水体再干涸的。这种变化路径分析对理解湿地退化机制特别有帮助。
把三个时期的GlobeLand30数据放在一起分析,就像打开了一本记录地球20年变化的相册。从全球尺度来看,有几个明显的趋势:
这些趋势背后反映的是人口增长、经济发展和气候变化等多重驱动力的共同作用。GlobeLand30的价值就在于,它用客观的数据记录下了这些变化,让我们能够定量评估人类活动对地球表面的影响。
在实际研究中,我经常建议学生先做全局的趋势分析,找到变化热点区域,然后再对这些热点区域进行深入分析。这种方法既把握了大局,又能聚焦关键问题。比如先看全球森林变化趋势,发现东南亚是森林减少最严重的地区之一,然后再深入研究东南亚各国的具体情况。