计算机系统应用  2022, Vol. 31 Issue (9): 360-367   PDF    
基于特征优化的面向对象建筑物提取
李星, 曹建农     
长安大学 地质工程与测绘学院, 西安 710054
摘要:相比于基于像素的建筑物提取方法, 面向对象方法能减少“异物同谱”和“同物异谱”现象, 提高提取精度; 针对遥感影像特征繁多, 造成特征维数灾难的问题, 本文提出了一种面向对象的特征优化方法进行建筑物提取. 首先将最小误差自动阈值分割方法和多尺度分割相结合, 优化分割技术; 然后基于Relief算法和fast correlation-based filter (FCBF)算法进行特征选择, 构建最优特征子集; 最后使用随机森林方法进行建筑物提取并用最小外接矩形方法优化建筑物边界. 结果显示, 特征重要性差异较大, 基于最优特征子集建筑物提取的总体精度达到0.93, Kappa系数为0.91, 明显高于原始特征集和优化特征集提取结果.
关键词: 面向对象    多尺度分割    Relief算法    FCBF算法    特征优化    随机森林    特征提取    目标检测    
Object-oriented Building Extraction Based on Feature Optimization
LI Xing, CAO Jian-Nong     
School of Geological Engineering and Geomatics, Chang’an University, Xi’an 710054, China
Abstract: Compared with pixel-based building extraction methods, object-oriented methods can reduce the phenomena of “the same spectrum for different objects” and “different spectra for the same object” and improve extraction accuracy. To address the curse of feature dimensionality due to numerous features of remote sensing images, this study proposes an object-oriented feature optimization method for building extraction. First of all, minimum error automatic threshold segmentation is combined with multi-scale segmentation to optimize the segmentation technology. Then, features are selected by the Relief algorithm and fast correlation-based filter (FCBF) algorithm to construct the optimal feature subset. Finally, buildings are extracted by the random forest method, and building boundaries are optimized by the minimum bounding rectangle method. The results show that the importance of features varies greatly. An overall accuracy of 0.93 is achieved by building extraction based on the optimal feature subset, and the Kappa coefficient is 0.91, which is significantly higher than the extraction results of the original feature set and the optimized feature set.
Key words: object-oriented     multi-scale image segmentation     Relief algorithm     fast correlation-based filter (FCBF) algorithm     feature optimization     random forest     feature extraction     object detection    

随着遥感技术的不断发展, 遥感影像处理技术也越来越成熟. 目前许多学者使用基于像素的方法进行建筑物提取. Huang 等通过建筑物阴影的形态学指数提取高分影像上的建筑物[1, 2]; Lin等利用边缘检测算法和建筑物在影像上的规则排列方向及外形完成建筑物的定位提取[3]. 相比于基于像素的提取方法, 面向对象的方法能够综合考虑目标的光谱、纹理和空间结构特征[4], 更适合建筑物的提取. 朱芳芳等[5]建立了一种基于特征分量的面向对象模型来实现对高分影像城市建筑物的提取. 施文灶等[6]通过图像分割理论实现高分影像上的建筑物的变化监测. 在基于特征优化的地物提取方面, 梁加玲等[7]基于Relief算法的多分类算法ReliefF算法进行特征优化后识别的耕地图斑, 取得较好提取结果. 肖艳等[8]基于ReliefF和PSO的混合特征选择方法选择最优特征子集, 并使用支持向量机分类器对土地进行分类. 但是这些方法并没有有效去除冗余特征, 没有构成最优特征子集, 效率不高. 因此本文将Relief算法和FCBF算法相结合, 有效去除了不相关特征和冗余特征, 构成最优特征子集进行建筑物提取, 提高了提取精度和效率, 为今后基于特征优化的建筑物提取提供借鉴意义, 并且对建筑物的信息有一个清晰准确地掌握.

1 研究方法和原理

本文主要是基于特征优化进行建筑物提取, 在遥感影像提取过程中, 并非特征越多, 提取建筑物越容易, 应该在繁多特征中选出有用特征, 提高分类精度, 技术流程如图1所示.

图 1 技术流程图

1.1 影像分割 1.1.1 最小误差阈值分割

一幅影像大小为M×N, 其每个像素点(x, y)的灰度值为f(x, y). 用直方图h(g)描述图像灰度概率分布. 假设理想的灰度分布模型符合混合正态分布 $ p(g) = \displaystyle\sum\nolimits_{i = 0}^1 {{P_i}} p(g|i) $ , 其中pi表示子分布的先验概率, p(g)的两个子分布p(j|i)分别服从均值为 ${{μ }}{}_{{i}}$ [9], 方差为 $ {{\text{σ }}^{\text{2}}} $ 的正态分布.

对于阈值 ${{t}} \in G$ , Kittler等基于最小分类误差思想给出下面的函数[9]:

$ \begin{split} {{J(t)}} =& {\text{1}} + {\text{2}}[{P_0}(t)\ln{\sigma _0}(t) + {P_1}(t)\ln{\sigma _1}(t)] \\ & - {\text{2}}[{P_0}(t)\ln{P_0}(t) + {P_1}(t)\ln{P_1}(t)] \end{split} $ (1)

其中, ${{{P}}_{\text{0}}}{{(t)}} = \displaystyle\sum\limits_{{{g = 0}}}^{{t}} {h(g)}$ , ${{{P}}_{\text{1}}}{{(t)}} =\displaystyle \sum\limits_{{{g = t + 1}}}^{{{L - 1}}} {h(g)}$ , ${{{\mu }}_{\text{0}}}{{(t)}} = \displaystyle\sum\limits_{{{g = 0}}}^{{t}} {h(g)g} / {P_0}(t)$ , ${{{\mu }}_{\text{1}}}{{(t)}} = \displaystyle\sum\limits_{{{g = t + 1}}}^{{{L - 1}}} {h(g)g} /{P_1}(t)$ , ${{{\sigma }}_{\text{0}}}^{\text{2}}{{(t)}} = \left[ {\displaystyle\sum\limits_{{{g = 0}}}^{{t}} {{{(g - {\mu _0}(t))}^2}h(g)} } \right]/ {P_0}(t)$ , ${{{\sigma }}_{{1}}}^{\text{2}}{{(t)}} = \left[ {\displaystyle\sum\limits_{{{g = t + 1}}}^{{{L - 1}}} {{{(g - {\mu _1}(t))}^2}h(g)} } \right]/{P_1}(t)$ .

最佳阈值选为使J(t)最小化的 ${{t}} = {{{t}}^{{*}}}$ .

$ {{{t}}^{\text{*}}} = \arg\mathop {\min}\limits_{0 < t < L - 1} J(t) $ (2)

上述方法称为最小误差阈值法[9]. 对影像进行最小误差阈值分割处理, 得到建筑物初步分割结果, 如图2所示, 此算法可以很好的分割建筑物和非建筑物, 但仍然将部分道路误分为建筑物.

图 2 最小误差阈值分割结果

1.1.2 多尺度分割

多尺度分割是指在影像信息损失最小的前提下, 基于异质性最小原则的区域合并算法, 以任意尺度生成最小异质性和最大同质性的有意义影像多边形对象的过程[10], 其是一种影像抽象的手段, 即把高分辨率像元的信息保留到低分辨率的对象上, 不同的地物类型可以在相应尺度的对象上得到反映. 多尺度分割的参数构成包括光谱和形状两个因子, 其中形状因子又包括光滑度(smoothness)和紧致度(compactness) . 大多数情况下, 颜色因子对生成对象最重要, 形状因子有效控制着影像对象的破碎程度, 可以防止“同物异谱”和 “同谱异物”现象与“胡椒盐效应”, 以此提高分类精度.

各个波段分割权重的确定十分重要. 通过计算影像的相关性矩阵和协方差矩阵确定其R、G、B三波段分割权重[11], 结果如表1表2所示. 从表可得R、G、B三波段方差大小相当, 且波段之间的相关性显著, 对分割的贡献度大[7], 所以把R、G、B的权重均设为1.

表 1 波段的相关性矩阵

表 2 波段的协方差矩阵

确定多尺度分割的最优参数和最优尺度是多尺度分割的关键, 包括shape、compactness因子和scale尺度. 对各因子做0.1–0.9的多次重复实验, 观察分割结果与建筑物边界的贴合程度以及“过分割”和“欠分割”现象. 如图3图4所示, 最终确定最优shape为0.6, 最优compactness为0.5. 使用局部方差法进行分析确定最优scale, 如图5所示, 该影像对象同质性局部变化(local variance)取得极大值时对应最优得分割尺度scale, 最后可得最优分割尺度为125.

图 3 不同形状因子参数分割效果(分割尺度, 形状因子, 紧致度)

仅多尺度分割方法存在较多的过分割和欠分割现象, 因此将最小误差阈值分割结果与多尺度方法进行融合, 改进部分欠分割与过分割现象. 由图6可知, 与仅多尺度分割结果相比, 改进的多尺度分割方法能够分割出更多的细小地物且完整性较好, 分割效果更好. 由于分割的精度会对分类结果产生较大影响, 所以改进的多尺度分割也会提高最终建筑物分类的精度.

图 4 不同紧致度参数分割效果(分割尺度, 形状因子, 紧致度)

图 5 局部误差分析

图 6 影像分割结果对比

1.2 特征选择

特征空间集中包括不相关特征性和相关性特征, 相关性特征中由包括弱相关性且冗余特征、弱相关性但不冗余特征和强相关性特征. 其中弱相关性但不冗余特征和强相关性特征构成了最优特征子集, 关系图如图7所示. Relief算法和FCBF算法能互相弥补缺陷, 可有效去除弱相关性特征和冗余特征.

1.2.1 Relief算法

Relief算法是一种特征权值算法(feature weighting algorithms), 依据所有特性和类型的关联性给与特点差异的权值, 权值低于特定阈值的特性将被删除. Relief算法中特征和类别的相关性是基于特征对近距离样本的区分能力[11]. 计算特征权重公式如下:

$ \begin{gathered} {{W[A]}} = {{W[A]}} - \sum\limits_{{{j = 1}}}^{{k}} {{\textit{diff}}(A, {R_i}, {H_j})} /({{m}}\times{{k}}) + {{Q(c)}} \\ \end{gathered} $ (3)
$ \begin{split} {Q(c)}=&{\displaystyle \sum _{C \notin class({R}_{i})}\left[\frac{P(C)}{1-P(class({R}_{i}))}\right]}\\ & \times{\displaystyle \sum _{{j=1}}^{\text{k}}{\textit{diff}}}(A, {R}_{i}, {M}_{j}(C)/({m}\times{k})\end{split} $ (4)

其中, ${\textit{diff}}(A, {R_1}, {R_2})$ 表示样本 $ {R_1} $ $ {R_2} $ 关于特征A的距离差值, m表示抽样次数, $ {M_j}(C) $ 表示最近邻样本, $ P(C) $ 表示对象样本所占比例[12].

获取影像中每个对象的多个特征, 其中包括9个光谱特征, 27个形状特征和60个纹理特征, 经过Relief算法可有效去除不相关性特征和弱相关性特征, 通过计算各特征的权重均值, 得到前50特征权重如图8所示.

图 7 特征关系图

1.2.2 FCBF算法

FCBF算法的全称是fast correlation-based filter即快速相关性滤波算法, 提出应用SU (smymetrical uncertainty)代替信息增益IG (information gain)作为衡量一个特征是否与类别C相关或者是否冗余[11]. 计算公式如下:

$ {{{\textit{SU}}(X, Y)}} = 2\left[ {\frac{{IG({{X}}, {{Y}})}}{{H({{X}}) + H({{Y}})}}} \right] $ (5)
$ H = - \sum\limits_{i = 1}^n {{p_i} \cdot \log{_2}({p_i})} $ (6)

其中, H表示信息熵, Pi表示某个灰度在该图像中出现的概率, 由灰度直方图得到.

由于Relief算法本身存在局限, 不能去除冗余特征, 而FCBF算法正好可以弥补它的缺陷, 可有效的去除冗余特征. 所以对前50特征进行FCBF特征提取并进行精度分析. 由图9可知, 当特征数目为13时的总体分类精度(OA)和Kappa系数最高, 所以最优特征子集数目为13, 具体特征包括3个光谱特征: Brightness、MeanLayer2和Standard deviation Layer 2; 2个形状特征: Density和Main direction; 8个纹理特征: GLCM Mean (0?、GLCM Mean (135?、GLDV Ang.2nd moment (135?、GLCM Homogeneity (90?、GLDV Ang. 2nd moment (0?和GLDV Ang.2nd moment(0?.

图 8 前50特征变量的平均权重

图 9 不同特征数目的提取精度

1.3 随机森林

随机森林就是属于集成学习中的Bagging (bootstrap aggregation)方法, 具有高准确度、抗噪声能力强、性能稳定等优势. 它的基本单元是决策树, 通过训练多个决策树, 生成模型, 然后综合利用多个决策树进行分类, 其输出的类别是由个别树输出的类别的众数而定[13].

$ {{H(x)}} = {\text{argmax}}\sum\limits_{{{i = 1}}}^{{K}} {{I}} ({h_i}(x) = Y) $ (7)

其中, $ {h_i}(x) $ 表示某一决策树的分类结果, ${{H(x)}}$ 表示随机森林分类结果, $I( \cdot )$ 表示示性函数[14].

2 建筑物提取 2.1 研究区及数据源

本文选取河南省新乡市局部区域作为研究区域, 通过 Bigmap下载Google Earth高清卫星遥感正射影像, 研究场景主要是厂区. 影像空间分辨率为0.5 m, 包括红、绿、蓝3波段, 影像中不同建筑物的光谱差异大, 有些建筑物的光谱信息和道路相近, 所以除光谱特征外, 本文结合了形状和纹理等多种特征通过特征优化后进行建筑物提取.

2.2 建筑物提取结果

基于13个特征构成最优特征集, 使用随机森林方法进行提取, 然后与决策树、神经网络和支持向量机方法进行比较. 如图10所示, 随机森林的提取效果最好, 能把大部分建筑物提取出来; 神经网络和支持向量机方法会遗漏微小建筑物, 神经网络还会把一些植被误判为建筑物, 精度较低; 由于光谱相近, 决策树方法会把一些道路误判为建筑物, 精度较低.

本文是基于特征优化进行建筑物提取, 此外仅用Relief算法和仅用FCBF算法生成13个相应的特征子集, 并且与基于原始特征集、仅用Relief的特征子集和仅FCBF的特征子集使用随机森林的方法进行提取, 与基于Relief和FCBF的最优特征子集进行比较, 结果如图11所示, 基于最优特征子集的建筑物提取效果最好.

本文使用总体分类精度(OA)、F1分数和Kappa系数进行提取精度评定. 由表3表4可得, 基于特征优化的随机森林方法提取精度最高, 总体分类精度为0.93, Kappa系数为0.91, 比原始特征集提取精度提高了1.07%, 比仅使用Relief算法提取结果精度提高了1.24%, 比仅FCBF算法提高了1.06%. 在不同分类器比较中, 神经网络的精度最低, 随机森林的精度最高. 由于影像中有些建筑物被植被遮盖, 提取的建筑物边界不规则, 所以使用最小外接矩形方法优化建筑物边界, 得到优化结果如图12所示, 最终影像提取结果如图12(a)所示.

图 10 不同分类器的分类结果

图 11 不同特征集的分类结果

表 3 不同分类器的精度评定

表 4 不同特征集提取的精度评定

图 12 最小外接矩形界优化结果

3 泛化性

为验证特征优化方法的泛化性, 除了厂区范围的正射影像, 本文还研究了居民地范围的倾斜影像. 在影像种类上, 正射影像地物是在一个平面的, 而倾斜影像可以很好地反映地物的真实情况, 具有真实高度; 在影像场景上, 厂区建筑物不规整, 植被遮盖严重, 而居民区建筑物整齐规范, 但存在高度干扰. 因此在影像种类和场景两方面来验证特征优化方法的泛化性和优化性, 使用的是空间分辨率为1 m的无人机倾斜摄影影像.

结果如图13表5所示, 对比不同特征集, 经过Relief和FCBF算法优化的最优特征集提取建筑物效果最好, 效率最高; 由于仅经过Relief算法优化的特征集存在冗余特征, 仅经过FCBF算法优化的特征集存在不相关特征, 提取效果较差精度较低; 而原始特征集中存在过多冗余特征和不相关特征, 因此进行建筑物提取效果最差. 对比不同的分类器, 神经网络方法提取效果最差, 错分较多; 基于最优特征子集的随机森林方法建筑物提取效果最好, 可以正确提取绝大部分建筑物, 错分较少, 总体分类精度为94.46%, Kappa系数为90.98%, 相比于原始特征集分别提高了4.22%、3.48%, 相比于Relief算法分别提高了3.4%、3.01%, 相比于FCBF算法分别提高了2.88%、2.52%, 体现了随机森林方法准确度高, 性能稳定的优势以及特征优化方法的优化性与泛化性.

图 13 倾斜摄影影像建筑物提取结果对比

4 结论

本文提出了一种基于特征优化和面向对象的建筑物提取方法, 精度比原始特征集和优化特征集有所提高, 而且保证了建筑物的完整度. 在居民地和厂区两种场景以及正射影像和倾斜影像两种类别上进行对比和验证, 体现了方法的优化和泛化性. 但仍存在一些问题, 一方面, 本文的Relief算法只适用于目标和背景两类, 不适用于多分类, 后续应进行拓展; 另一方面, 目前影像分割并没有成熟的理论基础, 分割精度严重影响了分类精度, 以至于大尺度影像分割效果较差, 最终导致建筑物提取效果差, 后续会深入研究, 使其适应更大区域内的多样建筑物提取.

表 5 不同方法建筑物提取精度对比

参考文献
[1]
Huang X, Zhang LP. A multidirectional and multiscale morphological index for automatic building extraction from MultiSpectral GeoEye-1 imagery. Photogrammetric Engineering & Remote Sensing, 2011, 77(7): 721-732.
[2]
尹峰, 祁琼, 许博文. 基于角点的高分辨率遥感影像建筑物提取. 地理空间信息, 2018, 16(10): 58-61, 69. DOI:10.3969/j.issn.1672-4623.2018.10.017
[3]
Lin C, Nevatia R. Building detection and description from a single intensity image. Computer Vision and Image Understanding, 1998, 72(2): 101-121. DOI:10.1006/cviu.1998.0724
[4]
黄昕, 张良培, 李平湘. 融合形状和光谱的高空间分辨率遥感影像分类. 遥感学报, 2007, 11(2): 193-200. DOI:10.11834/jrs.20070226
[5]
朱芳芳, 李仲勤, 杨树文, 等. 特征分量的城市建筑物面向对象提取方法. 测绘科学, 2020, 45(1): 84-91.
[6]
施文灶, 毛政元. 基于图分割的高分辨率遥感影像建筑物变化检测研究. 地球信息科学学报, 2016, 18(3): 423-432.
[7]
梁加玲, 刘彦花, 徐军, 等. 基于ReliefF算法的遥感影像分类特征优化. 地矿测绘, 2020, 36(3): 1-5. DOI:10.3969/j.issn.1007-9394.2020.03.001
[8]
肖艳, 姜琦刚, 王斌, 等. 基于ReliefF和PSO混合特征选择的面向对象土地利用分类. 农业工程学报, 2016, 32(4): 211-216. DOI:10.11975/j.issn.1002-6819.2016.04.030
[9]
Kittler J, Illingworth J. Minimum error thresholding. Pattern Recognition, 1986, 19(1): 41–47.
[10]
宿方睿, 郭长宝, 张学科, 等. 基于面向对象分类法的川藏铁路沿线大型滑坡遥感解译. 现代地质, 2017, 31(5): 930-942. DOI:10.3969/j.issn.1000-8527.2017.05.005
[11]
Yu L, Liu H. Feature selection for high-dimensional data: A fast correlation-based filter solution. Proceedings of the 20th International Conference. Washington: AAAI Press, 2003. 856–863.
[12]
成洁. 基于面向对象的高分辨率遥感影像建筑物提取研究[硕士学位论文]. 西安: 西安科技大学, 2020.
[13]
王笑影, 周玉科, 温日红. 基于Landsat-8影像和随机森林方法的土地分类研究. 测绘与空间地理信息, 2020, 43(11): 1-3. DOI:10.3969/j.issn.1672-5867.2020.11.001
[14]
张志强, 张新长, 辛秦川, 等. 结合像元级和目标级的高分辨率遥感影像建筑物变化检测. 测绘学报, 2018, 47(1): 102-112. DOI:10.11947/j.AGCS.2018.20170483