计算机系统应用  2020, Vol. 29 Issue (2): 40-48   PDF    
基于随机森林的遥感土地利用分类及景观格局分析
周正龙, 沙晋明, 范跃新, 帅晨, 高尚     
1. 福建师范大学 地理科学学院, 福州 350007;
2. 湿润亚热带山地生态国家重点实验室培育基地, 福州 350007
摘要:2009年福建平潭综合实验区设立, 作为闽台合作及国家对外开放的窗口, 其土地利用变化主要受社会经济因素的影响和自然地理环境的制约, 也与未来的土地利用规划密切相关. 本文利用1990、2000、2010和2017年4期Landsat遥感影像数据, 定量分析近27年的土地利用变化对景观格局的影响. 结果表明: (1)在选择合适训练样本的情况下, 利用随机森林方法可获得较高的遥感土地利用分类精度(4期遥感影像分类的总体精度均在87%以上, Kappa系数均在0.84以上); (2) 1990~2017年, 水域面积急剧减少31.04 km2, 流失的水域主要转化为建设用地和林地; 建设用地增加40.98 km2, 年平均增长1.52 km2. 近十年呈快速增长趋势, 年平均增长3.87 km2; (3)在斑块类型级别上, 逐年增加的建设用地导致最大斑块占景观面积比例(LPI)、聚合度(AI)和边缘密度(ED)呈上升趋势, 其中LPI受到建设用地增加的影响最显著. 在景观类型级别上, 多样性(SHDI)和景观形状(LSI)呈下降趋势.
关键词: 遥感    随机森林    土地利用变化    景观格局分析    海坛岛    
Remote Sensing Land Usage Classification and Landscape Pattern Analysis Based on Random Forest
ZHOU Zheng-Long, SHA Jin-Ming, FAN Yue-Xin, SHUAI Chen, GAO Shang     
School of Geographical Sciences, Fujian Normal University, Fuzhou 350007, China;
Key Laboratory for Subtropical Mountain Ecology (Funded by Ministry of Science and Technology of Fujian Province), Fuzhou 350007, China
Foundation item: National Key Research and Development Program of China (SQ2018YFGH000008)
Abstract: In 2009, Fujian Pingtan Comprehensive Experimental Zone was established as a window for cooperation between Fujian and Taiwan and the country’s opening to the outside world. Its land use change is mainly affected by social and economic factors and natural geographical environment, and is also closely related to future land use planning. Landsat remote sensing image data of 1990, 2000, 2010, and 2017 is used to quantitatively analyze the impact of land use change on landscape pattern in the past 27 years. The results show that: (1) high accuracy of remote sensing land use classification can be obtained by using random forest method when selecting suitable training samples (the overall accuracy of the 4 remote sensing image classifications is above 87%, and the Kappa coefficient is above 0.84). (2) From 1990 to 2017, the water area decreased sharply by 31.04 km2, and the lost water area is mainly converted into construction land and forest land; the construction land is increased by 40.98 km2, and the annual average growth is 1.52 km2. In the past ten years, it has shown a rapid growth trend with an average annual growth of 3.87 km2. (3) At the plaque type level, the construction land is increasing year by year. The largest plaques accounted for the proportion of landscape area (LPI), degree of polymerization (AI), and edge density (ED), and the LPI was most affected by the increase of construction land. At the landscape type level, diversity (SHDI) and landscape shape (LSI) are declining.
Key words: remote sensing     random forest     land use change     landscape pattern analysis     Haitan Island    

土地利用/土地覆盖变化(LUCC)一直被认为是全球环境变化与可持续发展研究的重要内容[13], 在全球气候变化、食品安全、土地退化和生物多样性等关键问题研究中发挥重要作用[46]. 相比以前依靠人力勘察为主的土地利用调查. 目前, 遥感技术是被公认能最快速、最有效地获取土地利用信息及其空间分布的手段[7], 它具有更新周期快、可研究范围广、客观、技术发展成熟等优点. 近年来, 土地覆盖变化的研究成果多集中在土地利用模型模拟与预测[810]、土地利用覆盖变化及驱动机制[1113]、土地利用景观格局变化[14,15]等方面. 王书玉等[16]基于随机森林的洪河湿地遥感影像分类研究, 结果表明在湿地信息提取中精度较高. 马玥等[17]利用随机森林算法对农耕区土地利用分类研究, 较支持向量机和最大似然法总体分类精度分别高9.46%和5.27%. 马骊[18]对随机森林算法优化改进提高了随机森林的分类性能.

景观格局分析是景观生态学发展的驱动力[19]. 目前, 研究者主要从两个方面来进行景观格局分析: 模糊的景观格局分析和针对特定生态过程的景观格局分析[19]. 模糊的景观格局分析是指通过计算各种景观指数, 静态的描述区域景观类型的组成和结构特征, 对于静态的空间格局分析已经做过大量研究[20,21]. 针对特定生态过程的景观格局分析是在景观生态学家充分认识到格局-过程关系的重要性以后被提出来的, 是景观格局分析的更高层次, 它将在当前及未来的景观格局分析中占据主导地位[22,23]. 土地利用变化是地表最显著的生态过程, 它受到人为和自然因素的共同影响, 因此, 研究LUCC和景观格局之间的关系对区域景观格局的构建具有重要意义.

2009年福建省根据国务院《关于支持福建省加快建设海峡西岸经济区的若干意见》精神, 决定设立平潭综合实验区. 2011年, “加快平潭综合实验区开放开发”写入国家“十二五”规划纲要和国务院批准的《海峡西岸经济区发展规划》, 平潭开放开发上升为国家战略. 一系列优惠政策促使海坛岛的建设与发展进入了飞速发展阶段, 本文借助遥感和GIS技术, 以海坛岛为研究对象, 定量分析1990~2017年土地利用变化对景观格局的影响. 以揭示近27年来该地区景观生态格局同生态过程和人为活动之间的关系, 从而为该地区土地资源的合理利用及可持续发展奠定基础.

1 研究区及数据 1.1 研究区概况

平潭是福建省东部沿海的一个岛县, 位于福州市南部, 与台湾隔海相望. 全县陆地面积392平方公里, 海域面积6064平方公里, 平潭县主岛海坛岛, 为全省第一大岛, 中国第五大岛, 面积为267.13平方公里, 占平潭县总面积的72%, 平潭县东临台湾海峡, 是大陆与台湾本岛距离最近处, 平潭县地理坐标为东经119°32′~120°10′、北纬25°16′~25°44′. 年降水量1196.2毫米, 年均温19.5 ℃. 平潭县境内地势低平, 中部略高, 地形以海积平原为主, 南北有山丘, 海岸蜿蜒曲折. 有天然淡水湖三十六脚湖, 是福建省最大的天然淡水湖(图1).

1.2 数据源

2009年以前海坛岛土地利用变化并不显著, 但2009年设立平潭综合实验区后, 大规模的经济投入致使土地利用变化显著. 本文选择时间序列长且连续的Landsat数据作为研究的主要遥感数据源, 时间跨度为1990~2017年, 共分4期, 影像均下载自地理空间数据云平台( http://www.gscloud.cn/). 为保证影像质量, 本文仅选取云量小于20%的影像. 其中1990年为Landsat4影像、2000年和2010年为Landsat5影像、2017年为Landsat8影像, 影像下载时已经做过几何校正和地形校正, 后期进行了定标、大气校正和裁剪等预处理, 辅助数据包括海坛岛DEM数据和边界矢量数据. 海坛岛位于湿润亚热带地区, 地物(特别是影响分类的植被)四季变化不明显, 可选择不同季节的影像进行土地利用信息的提取, 研究所用软件有ArcGIS 10.3、FRAGSTATS 4.3和ENVI 5.3等. 具体数据源信息(表1).

图 1 研究区域

表 1 数据源信息

2 研究方法与原理 2.1 随机森林

随机森林是2001年被提出的一种机器学习方法, 在原始训练样本中通过bootstrapping方法随机有放回抽取n个样本, 构成训练样本集, 每个训练样本集可构造一个决策树模型, 这样可生成n颗决策树模型. 在每颗决策树的分裂节点处随机选取m个特征变量作为预测变量, 根据节点不纯度最小原则来选取最优的特征变量作为该分裂节点的分裂特征, 直到每个分裂节点不纯度最小时决策树停止生长[24]. 生成所有决策树后, 用投票的方法对所有决策树的分类结果进行综合, 得出最终结果[25,26]. 森林中每一棵树都依赖于一个随机向量, 森林中的所有向量都是独立分布的. 随机森林的预测精度与单个树的强度和树间的相关性有关[27].

应用随机森林模型分类器需要设定2个关键参数: ① 生成树个数(number-of-trees), 该值决定了随机森林总体规模. 取值一般在100~10 000之间, 值越大模型越收敛, 模型运行时间增加, 且当树的个数不断增加时, 模型会出现过饱和现象. ② 随机抽取最大特征数(max-features), 该值表示生成每一棵决策树时从特征空间中随机抽取特征的最大数. 该值越大模型中每棵决策树强度越大, 但决策树间相关性也增大. 因此, max-features需根据oob误差率来调优, 以达到一定精度[28].

本文采用2017年发布并实施的土地利用现状分类国家标准, 选取4个一级类(林地、耕地、水域和建设用地), 2个二级类(沙地和裸土地). 通过ENVI 5.3插件随机森林分类器可实现分类.

随机森林分类器的优点为[27]; ① 算法精度高; ② 可以处理大数据集, 无需对大量的输入特征变量进行删减; ③ 可以给出变量的重要性估计; ④ 在模型建立过程中可以产生一个对一般误差的无偏估计, 不会过度估计; ⑤ 可以有效处理缺失数据的情况; ⑥ 产生的森林模型易于保存和未来重复利用; ⑦ 可以扩展到无类别数据中, 进行非监督分类.

2.2 景观格局指标

在排除高相关性指标的基础上, 研究在类型级别上选用了4个指标, 分别为最大斑块所占景观面积的比例、边界密度、聚合度和周长-面积分维数. 在景观级别上选用了4个指标蔓延度、香农均匀度、香农多样性和景观形状. 运用FRAGSTATS 4.3软件, 采用eight-cell-neighborhood规则计算景观指标, 指标的描述如表2所示.

3 结果分析 3.1 土地利用特征

基于随机森林理论, 选取334个训练样本(1990年85个、2000年79个、2010年8个、2017年87个)将地物分为林地、耕地、水域、建设用地、沙地和裸土地6类, 选择分类树数目500对研究区四期的Landsat影像进行分类, 分类结果如图2所示.

表 2 景观格局指标

图 2 影像分类结果

表3统计各地类面积占比, 1990年和2000年, 海坛岛土地利用类型面积从大到小排序为耕地>林地>建设用地>水域>裸土地>沙地. 2010年, 海坛岛土地利用类型面积从大到小排序为耕地>林地>建设用地>水域>沙地>裸土地. 2017年, 海坛岛土地利用类型面积从大到小排序为耕地>林地>沙地>水域>裸土地. 以2017年为例, 耕地占40.00%, 林地占 24.96%, 建设用地占28.43%, 三者之和占92.00%以上, 其余土地利用类型面积占比不到8.00%, 因此研究区耕地、建设用地和林地为主要景观. 1990~2017年建设用地面积持续增加14.12%; 水域和裸土地面积分别减少了10.85%、2.68%; 林地面积先减少后增加, 最大变化量为7.29%; 沙地面积先增加后减少, 最大变化量为4.56%.

表 3 1990~2017年土地利用类型面积占比统计表(%)

3.2 分类经度验证

分类后利用计算机按土地利用类型随机生成若干个检验点(1990年256个、2000年263个、2010年274个、2017年264个). 通过目视解译的方法对检验点进行分析判读, 采用误差矩阵和Kappa系数对随机森林分类结果进行精度评价计算出的误差矩阵(表4). 从4期分类误差矩阵看, 制图精度中水域最高, 沙地最低; 用户精度中水域最高, 裸土地最低, 整体来看, 4期总分类精度在87.07%以上, 总Kappa系数在0.84以上.

表 4 1990~2017随机森林分类器的误差矩阵计算结果

3.3 土地利用变化

每次计算以前一时期的土地利用分类结果为标准, 求出4个时期土地利用类型间的相互转化量, 得到土地利用转移矩阵(表5). 1990~2000年间, 建设用地面积增加9.36 km2, 主要源于耕地和林地的减少; 林地面积减少10.29 km2, 流失的林地主要转化为耕地和建设用地; 水域面积减少2.25 km2, 流失的水域面积主要转化为建设用地; 耕地面积增加4.15 km2, 主要源于林地的减少; 沙地面积减少0.90 km2, 流失的沙地主要转化为耕地和裸土地; 裸土地面积减少0.07 km2, 流失的裸土地主要转化为建设用地和耕地. 1990~2000年间土地利用变化不明显, 主要是当时经济发展速度有限, 大部分土地都保持原有面貌. 但随着人口的缓慢增加, 建筑用地和耕地也会略有增加. 2000~2010年间, 建设用地面积增加4.53 km2, 主要源于耕地和林地的减少; 林地面积减少10.55 km2, 流失的林地主要转化为耕地和建设用地; 水域面积减少7.98 km2, 流失的水域面积主要转化为建设用地和沙地; 耕地面积增加1.38 km2, 主要源于林地的减少; 沙地面积增加13.04 km2, 增加的沙地主要源于水域和林地减少; 裸土地面积减少0.41 km2, 流失的裸土主要转化为建设用地和沙地. 2000~2010年间土地利用变化较为缓慢, 其主要原因与前一时期类似.

表 5 1990~2017土地利用转移矩阵(km2)

2010~2017年间, 建设用地面积增加27.09 km2, 主要源于水域、沙地和耕地的减少; 林地面积增加14.35 km2, 增加的林地主要源于水域和耕地的转化; 水域面积减少20.80 km2, 流失的水域面积主要转化为建设用地和林地; 耕地面积减少8.36 km2, 流失的耕地主要转化为建设用地和林地; 沙地面积减少5.08 km2, 减少的沙地主要转化为建设用地和林地; 裸土地面积减少7.20 km2, 流失的裸土主要转化为建设用地.

3.4 类型级别分析

1990~2017年海坛岛土地利用类型与景观类型级别指标关系如图3所示. 从图3可见, 1990~2000年, 耕地的最大斑块占景观面积比例(LPI)和聚合度(AI)呈上升趋势. 因为耕地在这一时期是最主要的景观类型, 分布规模最大且面积增加, 耕地分布更加聚集. 聚集的耕地使边界周长减小, 在面积相同的情况下, 导致耕地的边缘密度(ED)和周长-面积分形维数(PAFRAC)下降. 林地的LPI、ED和PAFRAC呈下降趋势, 因为林地面积减少, 林地的规模在缩减, 且减少的林地位于林地的集中分布区, 研究区的东北部(图2). 建设用地LPI、ED、PAFRAC和AI均呈上升趋势, 主要是建筑设用地面积增加, 且在上一期的建设用基础上向外扩散造成的.

2000~2010年, 耕地的最大斑块占景观面积比例(LPI)和聚合度(AI)呈下降趋势. 因为耕地在这一时期面积增加缓慢, 且耕地最大斑块面积减小, 由图2可知, 耕地分布聚集度下降. 聚集度下降的耕地使边界周长增加, 则在面积相同的情况下, 导致耕地的边缘密度(ED)和周长-面积分形维数(PAFRAC)上升. 林地的LPI和PAFRAC呈上升趋势, 因为林地最大斑块面积增加. 随着林地面积的减少, ED和AI均下降.

2010~2017年, 建设用地的最大斑块占景观面积比例(LPI)、聚合度(AI)和边缘密度(ED)呈上升趋势. 因为建设用地在这一时期面积显著增加, 分布规模增大. 边缘长度增加明显大于面积增大. 但建设用地整体形状复杂性下降, 即周长-面积分形维数(PAFRAC)下降. 水域的LPI、ED、AI和PAFRAC均呈下降趋势, 因为水域面积急剧减少, 水域形状由复杂变简单且分布零散, 聚集度下降. 林地的面积有所增加, 人工植树造林导致分布集中形状复杂. 因此林地的LPI、ED、PAFRAC和AI均呈上升趋势.

图 3 1990~2017类型级别指标与土地利用关系图

3.5 景观级别分析

表6统计景观级别指标变化, 1990~2000年, 蔓延度(CONTAG)上升0.713, 说明这10年间不同土地利用类型之间的聚集程度增加. 景观形状(LSI)下降3.315, 说明景观的几何复杂性在减小, 同时表明相同土地利用类型之间分布更加离散. 1990~2010年, 多样性(SHDI)和均匀度(SHEI)变化不明显, 说明3期的土地利用类型分配的均匀程度相似, 各土地利用类型所占比例变化不明显, 1990~2010年间的土地利用变化也可以看出. 2000~2010年, CONTAG下降1.936, 说明这10年间不同土地利用类型之间的聚集度程度降低. LSI上升7.812, 说明景观的复杂性在增加, 同时表明相同土地利用类型之间分布更加集聚. 2010~2017年, CONTAG上升2.373, 说明近10年间不同土地利用类型之间的聚集程度增加较1990~2010年显著, LSI下降0.783, 说明景观的几何复杂性在减小, 同时表明相同土地利用类型之间分布更加离散. SHDI和SHEI分别增加了0.081和0.042, 说明不同土地利用类型分配的均匀程度增加, 主要土地利用类型占比增加, 2010~2017年土地利用急剧变化, 建设用地增加, 水域减少是导致SHDI和SHEI变化的主要原因.

表 6 1990~2017年景观级别指标统计表

4 结论与展望

运用随机森林法进行遥感影像分类, 分类精度很大程度上受制于训练样本的选择. 本文通过目视解译选取较纯净的地类像元作为训练样本, 经过多次实验获得较高的土地利用分类精度(4期遥感影像分类的总体精度均在87%以上, Kappa系数均在0.84以上).

2010年以前, 研究区土地利用覆盖整体上变化不明显, 但在2010~2017年间土地利用变化显著, 主要是2009年设立平潭综合试验区后, 大量的资金注入以及政策支持造成, 海坛岛开发进入快车道, 为了获取足够的发展空间, 岛内进行了大规模的围垦造陆, 使得近海区域的滩涂、湿地和水域等景观被大规模开发利用, 其中大部分被规划为建设用地使用. 研究显示, 2010~2017年耕地面积变化很小, 说明国家对耕地的保护力度很大. 林地面积在2010~2017年略微增加, 说明在开发的同时考虑到生态环境的重要性.

1990~2017年, 持续增加的建设用地致使斑块类型级别的最大斑块占景观面积比例(LPI)、聚合度(AI)和边缘密度(ED)景观指数呈上升趋势, 其中LPI受建设用地增加的影响最为显著. 景观多样性(SHDI)和景观形状(LSI)呈下降趋势, 表明研究区整体景观破碎化程度和景观异质性降低. 因此, 海坛岛的发展应该注重景观格局的演变效应, 提出适合海岛型城市发展的模式, 从而实现城市发展与景观格局优化的共赢.

参考文献
[1]
刘纪远, 刘明亮, 庄大方, 等. 中国近期土地利用变化的空间格局分析. 中国科学(D辑), 2002, 32(12): 1031-1040. DOI:10.3321/j.issn:1006-9267.2002.12.008
[2]
Turner BL II, Lambin EF, Reenberg A. The emergence of land change science for global environmental change and sustainability. Proceedings of the National Academy of Sciences of the United States of America, 2007, 104(52): 20666-20671. DOI:10.1073/pnas.0704119104
[3]
刘纪远, 张增祥, 徐新良, 等. 21世纪初中国土地利用变化的空间格局与驱动力分析. 地理学报, 2009, 64(12): 1411-1420. DOI:10.3321/j.issn:0375-5444.2009.12.001
[4]
Overmars KP, Verburg PH. Analysis of land use drivers at the watershed and household level: Linking two paradigms at the Philippine forest fringe. International Journal of Geographical Information Science, 2005, 19(2): 125-152. DOI:10.1080/13658810410001713380
[5]
Veldkamp A, Lambin EF. Predicting land-use change. Agriculture, Ecosystems & Environment, 2001, 85(1–3): 1-6.
[6]
葛全胜, 赵名茶, 郑景云. 20世纪中国土地利用变化研究. 地理学报, 2000, 55(6): 698-706. DOI:10.3321/j.issn:0375-5444.2000.06.007
[7]
安建科. 基于RS和GIS的酒泉市肃州区土地利用变化及景观格局研究[硕士学位论文]. 兰州: 西北师范大学, 2011.
[8]
刘淼, 胡远满, 常禹, 等. 土地利用模型时间尺度预测能力分析——以CLUE-S模型为例. 生态学报, 2009, 29(11): 6110-6119. DOI:10.3321/j.issn:1000-0933.2009.11.044
[9]
刘淼, 胡远满, 孙凤云, 等. 土地利用模型CLUE-S在辽宁省中部城市群规划中的应用. 生态学杂志, 2012, 31(2): 413-420.
[10]
王友生, 余新晓, 贺康宁, 等. 基于CA-Markov模型的藉河流域土地利用变化动态模拟. 农业工程学报, 2011, 27(12): 330-336. DOI:10.3969/j.issn.1002-6819.2011.12.062
[11]
宋开山, 刘殿伟, 王宗明, 等. 1954年以来三江平原土地利用变化及驱动力. 地理学报, 2008, 63(1): 93-104. DOI:10.3321/j.issn:0375-5444.2008.01.010
[12]
胡乔利, 齐永青, 胡引翠, 等. 京津冀地区土地利用/覆被与景观格局变化及驱动力分析. 中国生态农业学报, 2011, 19(5): 1182-1189.
[13]
张涛, 张颖, 杨力鹏, 等. 内蒙古自治区呼和浩特市1990-2010年景观格局变化及其驱动力. 水土保持通报, 2018, 38(2): 217-222.
[14]
刘娟, 刘华民, 卓义, 等. 毛乌素沙地1990-2014年景观格局变化及驱动力. 草业科学, 2017, 34(2): 255-263. DOI:10.11829/j.issn.1001-0629.2016-0258
[15]
杨国清, 吴志峰, 祝国瑞. 广州地区土地利用景观格局变化研究. 农业工程学报, 2006, 22(5): 218-221. DOI:10.3321/j.issn:1002-6819.2006.05.050
[16]
王书玉, 张羽威, 于振华. 基于随机森林的洪河湿地遥感影像分类研究. 测绘与空间地理信息, 2014, 37(4): 83-85, 93. DOI:10.3969/j.issn.1672-5867.2014.04.022
[17]
马玥, 姜琦刚, 孟治国, 等. 基于随机森林算法的农耕区土地利用分类研究. 农业机械学报, 2016, 47(1): 297-303. DOI:10.6041/j.issn.1000-1298.2016.01.040
[18]
马骊. 随机森林算法的优化改进研究[硕士学位论文]. 广州: 暨南大学, 2016.
[19]
陈利顶, 刘洋, 吕一河, 等. 景观生态学中的格局分析: 现状、困境与未来. 生态学报, 2008, 28(11): 5521-5531. DOI:10.3321/j.issn:1000-0933.2008.11.037
[20]
齐伟, 曲衍波, 刘洪义, 等. 区域代表性景观格局指数筛选与土地利用分区. 中国土地科学, 2009, 23(1): 33-37. DOI:10.3969/j.issn.1001-8158.2009.01.007
[21]
刘常富, 李京泽, 李小马, 等. 基于模拟景观的城市森林景观格局指数选取. 应用生态学报, 2009, 20(5): 1125-1131.
[22]
傅伯杰. 地理学综合研究的途径与方法: 格局与过程耦合. 地理学报, 2014, 69(8): 1052-1059. DOI:10.11821/dlxb201408002
[23]
王仰麟. 农业景观格局与过程研究进展. 环境科学进展, 1998, 6(2): 29-34.
[24]
Watts JD, Powell SL, Lawrence RL, et al. Improved classification of conservation tillage adoption using high temporal and synthetic satellite imagery. Remote Sensing of Environment, 2011, 115(1): 66-75. DOI:10.1016/j.rse.2010.08.005
[25]
王栋, 岳彩荣, 田传召, 等. 基于随机森林的大姚县TM遥感影像分类研究. 林业调查规划, 2014, 39(2): 1-5. DOI:10.3969/j.issn.1671-3168.2014.02.001
[26]
姚明煌, 骆炎民. 改进的随机森林及其在遥感图像中的应用. 计算机工程与应用, 2016, 52(4): 168-173. DOI:10.3778/j.issn.1002-8331.1402-0227
[27]
Breiman L, Last M, Rice J. Random forests: Finding quasars. Feigelson ED, Babu GJ. Statistical Challenges in Astronomy. New York: Springer, 2003. 243–254.
[28]
郭玉宝, 池天河, 彭玲, 等. 利用随机森林的高分一号遥感数据进行城市用地分类. 测绘通报, 2016(5): 73-76.