计算机系统应用  2024, Vol. 33 Issue (5): 203-209   PDF    
基于Mult-TWDTW算法的时序SAR图像土地覆盖分类
孟萌萌1,2,3, 黄瑞瑞1,2,3, 毋琳1,2,3, 黄亚博1,2,3     
1. 河南大学 计算机与信息工程学院, 开封 475004;
2. 河南省空间信息处理工程研究中心, 开封 475004;
3. 河南省大数据分析与处理重点实验室, 开封 475004
摘要:合成孔径雷达(SAR)图像为土地覆盖分类提供了重要的时序数据源. 现有的时间序列匹配算法可以充分挖掘时序特征的相似性信息, 从而获得较好的分类效果. 本文引入了综合考虑形状相似性和物候差异的经典时序匹配算法TWDTW (time weighted dynamic time warping)指导SAR土地覆盖分类, 并针对传统TWDTW仅考虑单一特征时间序列上的相似性匹配问题, 提出了一种基于多特征联合的时间加权动态时间规整算法(Mult-TWDTW). 该方法首先提取后向散射系数、干涉相干性以及双极化雷达植被指数(dual polarization radar vegetation Index, DpRVI) 这3种特征, 然后在TWDTW算法基础上联合多个特征设计了Mult-TWDTW模型. 为验证所提方法的有效性, 使用Sentinel-1A时序数据在丹江口区域完成土地覆盖分类, 并将Mult-TWDTW与MLP、1D-CNN、K-means、SVM和使用单特征的TWDTW算法进行对比. 实验结果显示, Mult-TWDTW算法得到了最好的分类效果, 总体精度和Kappa系数可以达到95.09%和91.76, 表明Mult-TWDTW算法有效联合了多个特征信息, 能够提升时序匹配算法在多种土地覆盖类别分类中的潜力.
关键词: 土地覆盖分类    合成孔径雷达 (SAR)    相似性匹配    Mult-TWDTW    DpRVI    
Land Cover Classification of Time-series SAR Images Using Mult-TWDTW Algorithm
MENG Meng-Meng1,2,3, HUANG Rui-Rui1,2,3, WU Lin1,2,3, HUANG Ya-Bo1,2,3     
1. School of Computer and Information Engineering, Henan University, Kaifeng 475004, China;
2. Henan Province Engineering Research Center of Spatial Information Processing, Kaifeng 475004, China;
3. Henan Key Laboratory of Big Data Analysis and Processing, Kaifeng 475004, China
Abstract: Synthetic aperture radar (SAR) images provide an important time-series data source for land cover classification. The existing time-series matching algorithms can fully exploit the similarity among time-series features to obtain satisfactory classification results. In this study, the classic time-series matching algorithm named time-weighted dynamic time warping (TWDTW), which comprehensively considers shape similarity and phenological differences, is introduced to guide SAR-based land cover classification. To solve the problem that the traditional TWDTW algorithm only considers the similarity matching of a single feature on the time series, this study proposes a multi-feature fusion-based TWDTW (Mult-TWDTW) algorithm. In the proposed method, three features, namely, the backscattering coefficient, interferometric coherence, and the dual-polarization radar vegetation index (DpRVI), are extracted, and the Mult-TWDTW model is designed by fusing multiple features based on the TWDTW algorithm. To verify the effectiveness of the proposed method, the study implements land cover classification in the Danjiangkou area using time-series data obtained from the Sentinel-1A satellite. Then, the Mult-TWDTW algorithm is compared with the multi-layer perception (MLP), one-dimensional convolutional neural network (1D-CNN), K-means, and support vector machine (SVM) algorithms as well as the TWDTW algorithm using a single feature. The experimental results show that the Mult-TWDTW algorithm obtains the best classification results, manifested as its overall accuracy and Kappa coefficient reaching 95.09% and 91.76, respectively. In summary, the Mult-TWDTW algorithm effectively fuses the information of multiple features and can enhance the potential of time-series matching algorithms in the classification of multiple types of land covers.
Key words: land cover classification     synthetic aperture radar (SAR)     similarity match     Mult-TWDTW     DpRVI    

土地覆盖分类是对地表上不同地物类型进行分类的过程[13]. 土地覆盖产品的精度对气候变化、生态环境保护等研究具有重要意义[46].

SAR影像覆盖范围相对较广, 并且不受天气的影响, 可以提供稳定的时序数据, 已经被广泛地应用于土地覆盖分类等研究领域[7]. 单时相SAR影像极化信息不足, 存在部分地物散射特征混淆的现象. 时序极化SAR数据可以反映地物在不同时期的散射特性变化规律, 加强地物间的散射特征差异. 因此, 充分挖掘SAR时序特征, 对高精度土地覆盖分类制图至关重要[810].

近年来基于时序匹配算法的分类方法开始快速发展, 该类方法可以在有限的样本条件下对不同时间点上的特征值进行相似性度量, 按照隶属度最小原则给像元分配对应类别[11,12]. TWDTW是一种基于特征时间序列匹配的分类算法[1315], 它充分利用全部的样本信息, 能够更准确地对时间序列数据进行对齐和相似性比较[1618]. Xiao等人使用VH后向散射特征, 验证了TWDTW算法在玉米、大豆等农作物分类上的有效性, 精度最高可达93.4%[19]. Li等人使用后向散射系数特征, 结合TWDTW算法对研究区的蔬菜进行识别, 取得了80%的整体精度, 证明了TWDTW算法有效性[20]. Pan等人使用VH后向散射特征, 并基于TWDTW算法进行水稻识别, 在研究区内取得了较好的效果, 精度达到88.49%[21]. 以上研究都说明了TWDTW算法在农作物分类领域的有效性, 但其都是采用单一特征的时间序列曲线[2224]. 由于SAR影像本身特殊的成像方式, 使其拥有更多的极化信息, 如何充分发挥多极化信息在分类中的作用, 使其与算法相融合, 更好的指导土地覆盖分类具有重要的意义.

本文提出了一种基于多特征联合的时间加权动态时间规整土地覆盖分类算法(Mult-TWDTW), 算法充分联合了多特征的优势, 以提高SAR图像土地覆盖分类的准确性和稳定性. 具体而言, 首先从时序Sentinel-1A数据中提取后向散射系数、双极化雷达植被指数等特征; 然后, 设计联合多特征的Mult-TWDTW算法; 最后, 选择1D-CNN、MLP、K-means、SVM和基于单特征的TWDTW作为对比算法, 分析Mult-TWDTW算法在联合多种特征之后区分多种地物的潜力.

1 研究概况及数据来源 1.1 研究区域

本文选择了以丹江口库区(110º42'44''E– 111º57'38''E, 32º12'17''N–33º03'31''N)为中心, 辐射河南省南阳市的浙川县、内乡县, 以及湖北省十堰市的部分地区为研究区, 研究区面积约5700 km2. 该研究区自西向东分布有山地、河谷、丘陵、水体、平原, 土地覆盖类型分布完备, 根据中国土地资源分类系统的一级分类标准[25], 将研究区内的地物类型分为居民用地、水域、耕地和林地4种.

1.2 数据来源

将在欧空局地球观测卫星网站上免费下载的, 从2021年7月1日–2022年6月2日共26景Sentinel-1A数据作为本文的实验数据, 极化方式为VV和VH, 详细数据信息如表1所示.

数据分类过程中使用的训练样本及验证样本通过多人目视解译制作完成. 首先, 选择高分辨率的谷歌遥感图像并与研究区的SAR图像进行配准作为目视解译的主要参考数据. 而后, 简单随机选取若干具有代表性的样本, 多人独立完成解译. 最后, 当样本被标记为不同地物类型时, 通过讨论确定最终标记, 样本参数如表2所示.

表 1 Sentinel-1A 卫星基本参数

表 2 样本数量(像元)

1.3 数据处理

在进行分类前, 首先对Sentinel-1A时序数据进行数据处理. 具体处理步骤如下: (1)使用SNAP软件对时间序列Sentinel-1A数据进行多视、地形矫正等操作获得后向散射系数特征. (2)对预处理之后的数据进行干涉处理, 得到时间序列的干涉相干性特征. (3)对预处理之后的数据求C2矩阵元素, 得到双极化雷达植被指数. (4)将数据的空间分辨率重采样为10 m.

在实际的土地覆盖分类中, 高山和丘陵区域会使SAR成像过程中出现叠掩阴影等现象, 从而增加土地覆盖分类错误的概率. 因此, 在分类之前检测SAR遥感影像的叠掩阴影区域并去除[26].

2 基于多特征联合的Mult-TWDTW算法 2.1 基本原理及流程

使用Sentinel-1A时序数据构造后向散射系数等3种特征的时序曲线, 并设计了基于多特征联合的TWDTW算法(Mult-TWDTW). 最后, 选择TWDTW、MLP、1D-CNN、K-means和SVM为对比算法, 分析Mult-TWDTW算法的多维时序特征挖掘能力. 具体技术路线如图1所示.

2.2 干涉相干性特征

相干图像是干涉SAR处理的中间产物. 相关性直接反映了主从两幅图像采集时间间隔内地面目标的稳定性, 不同地物具有不同的相干性. 通过使用两个共同配准的复杂SAR图像(S1S2)的幅度和相位信息获得干涉相干性(γ), 计算公式如下:

$ \gamma = \frac{{ < {S_1}{S^ *_2} > }}{{\sqrt { < {S_1}{S^ *_1} > < {S_2}{S^ *_2} > } }} $ (1)

其中, S1S2表示后向散射系数的复像元值, *表示复共轭, <…>内的像元值表示在选定窗口大小上的空间平均值. γ在0–1之间变化; 如果两幅图像完全相同, 则γ等于1; 如果两幅图像不一致, 则γ等于0. 窗口尺寸越大, SAR图像中的特征辨别能力越差.

图 1 技术路线图

2.3 双极化雷达植被指数DpRVI

双极化雷达植被指数DpRVI是一种表征植被状态的植被描述符, 由双极化SAR数据通过极化分解得到的极化度和特征值谱两个参数计算而成. 该指数增加了植被与其他地物的区分度, 有利于在广阔的地理区域进行土地覆盖分类. DpRVI计算公式如下:

$ {{DpRVI}} = (1 - m\beta ) $ (2)

其中, m为极化度, 相当于双极化SAR中的散射波各向异性. 它量化了第1和第2主要散射机制之间的相对强度. 引入β作为散射机制中的主要调制. mβ的计算公式如下.

$ m{\text{ = }}\frac{{{\lambda _{\text{1}}} -{\lambda _{\text{2}}}}}{{{\lambda _{\text{1}}}{\text{ + }}{\lambda _{\text{2}}}}} $ (3)
$ \beta {\text{ = }}\frac{{{\lambda _{\text{1}}}}}{{{\lambda _{\text{1}}}{\text{ + }}{\lambda _{\text{2}}}}} $ (4)

其中, λ1λ2是2×2协方差矩阵C2的归一化特征值. C2计算公式如下.

$ {{{C}}_{{2}}}{{ = }}\left[ {\begin{array}{*{20}{c}} {{{{C}}_{{{11}}}}}&{{{{C}}_{12}}} \\ {{C_{21}}}&{{C_{22}}} \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} { < |{S_{\mathit{HH}}}{|^2} > }&{ < {S_{\mathit{HH}}}S_{HV}^ * > } \\ { < {S_{\mathit{HV}}}S_{\mathit{HH}}^ * > }&{ < |{S_{\mathit{HV}}}{|^2} > } \end{array}} \right] $ (5)

其中, 上标*表示复共轭, <…>表示移动窗口上的空间平均值. 这个移动窗口是指以像元为中心的一个正方形像元块, 具有一定的边距, 窗口尺寸大小定为5×5.

2.4 Mult-TWDTW

TWDTW是一种用于时间序列对齐和相似性比较的算法, 通过锁定最小TWDTW距离值为每个像元确定最终的类别. Mult-TWDTW是在TWDTW算法的基础上设计的多特征联合时间加权动态时间规整算法. 该算法不仅能灵活地匹配地物在时间序列中的相似性, 还可以有效结合多个特征, 从而提升算法的分类能力. Mult-TWDTW通过计算每个像元属于每个类别的总能量确定最终类别, 能量计算公式如下.

$ {E_a}(total) = w \times {E_a}({{bc}}) + w \times {E_a}(coh) + w \times {E_a}(DpRVI) $ (6)

其中, $ {E_a}(total) $是像元属于类别$ a $的总能量, $ w $是分配给每个分能量权重, 数值设为0.5. $ {E_a}({{bc}}) $$ {E_a}(coh) $$ {E_a}({{DpRVI}}) $是3种特征分别得到的每个像元属于类别$ a $的能量.

具体的实验过程分为4个步骤. 首先, 采用欧氏距离公式依次计算特征序列与样本均值序列的距离绝对值. 其次, 设置时间逻辑权重的陡度$ \alpha $和逻辑权重中值$ \beta $来计算时间权重. 然后, 针对不同特征逐类别的计算TWDTW距离矩阵, 按照距离值最小原则为每个像元确定类别. 最后, 为每个特征的分类结果分配权重$ w $, 根据式(6)逐像元计算并累计属于每个类别的总能量$ E(total) $, 从而确定每个像元的最终类别.

3 实验结果及对比分析

以Sentinel-1A时序影像为数据源, 在丹江口区域开展土地覆盖分类实验, 实验的模型布置平台为Matlab. 其中, 根据经验值将时间逻辑权重的陡度$ \alpha $设置为0.1. 实验所用数据时间间隔为1年, 因此将逻辑权重中值$ \beta $设置为180. 为每个特征分类结果赋予的权重$ w $为0.5. 实验所用样本按照1:1的比例分为训练样本和验证样本. 对比算法选择1D-CNN、MLP、K-means、SVM和基于单特征的TWDTW, 其中MLP算法设置的隐藏层共4层, 单元数均为20, 激活函数为ReLU 优化算法的类型为adam, 正则化参数为0.0001, 学习率设置为constant, 学习率的初始值设置为0.001, 迭代次数设置为200. 1D-CNN算法设置了3层一维卷积层, 卷积核的尺寸大小分别设置为7、5和3, 卷积核数目分别为32、64和128, 在卷积层之后添加了最大池化层和批量归一化层, 池化层的窗口大小设为2. 精度验证指标为总体精度、Kappa系数、用户精度和生产者精度, 计算公式如下:

$ 总体精度=\frac{(TP+TN)}{(TP+TN+FP+FN)} $ (7)
$ {\mathrm{Kappa}}系数=\frac{(OA+{p}_{e})}{(1-{p}_{e})} $ (8)
$ {p_e} = \frac{{(TP + TN) \times (FP + TP) \times (FP + TN) \times (FN + TN)}}{{{{(TP + TN + FP + FN)}^2}}} $ (9)

其中, TP为模型预测为正的正样本, TN为模型预测为负的负样本, FP为模型预测为正的负样本, FN为模型预测为负的正样本.

3.1 多特征联合对分类结果的影响及评价

多特征联合的Mult-TWDTW和使用单特征的TWDTW的分类结果如图2所示.

分类精度如表3所示. 可以看出, TWDTW分类效果相对较差, 总体精度为76.40%, Kappa系数为62.94%, 其中居民用地的生产者精度和用户精度仅为6.1%和1.97%, 出现了严重的居民用地漏分、居民用地与林地错分、居民用地与耕地错分等现象, 降低了整体分类精度. 这主要是因为不同特征在不同地物分类上的作用不同, 难以找到能够区分所有地物的单一特征, 所以使用单特征的TWDTW算法分类精度提升面临很大的局限性.

而多特征联合的Mult-TWDTW算法充分发挥了它有效联合多个特征的优势, 实现了较好的分类效果, 总体精度和Kappa系数分别达到了95.09%、91.76%.

图 2 不同特征联合的分类结果图

表 3 分类精度表 (%)

3.2 算法对比分析

不同算法的分类结果如图3所示. 从图3中可以看出, MLP、SVM和K-means等对比算法的分类结果都出现了不同程度的椒盐现象. 其中K-means算法精度最低, 结果中出现大量的林地、居民用地与耕地的混分, 总体精度与Kappa系数分别为76.45%、65.59%. SVM算法的分类结果中水域和居民用地的错分较为严重, 总体精度与Kappa系数分别为80.73%、71.65%. MLP算法结果中出现大量的林地与耕地的混分, 以及部分居民用地和耕地的混分, 总体精度与Kappa系数分别为86.80%、79.32%. 1D-CNN算法分类结果中改善了较大一部分的林地漏分和耕地错分现象, 总体精度与Kappa系数为92.26%、87.41%. 本文所提算法Mult-TWDTW分类效果最好, 总体精度与Kappa系数分别为95.09%、91.76%. 该算法发挥了多特征信息联合的时序匹配算法在分类中的潜力, 很大程度地改善了居民用地的错分、漏分现象, 实现了最好的分类效果.

4 结论

本文使用时间序列Sentinel-1A数据提取后向散射系数、双极化雷达植被指数等多个特征, 设计了多特征联合的时间加权动态时间规整算法(Mult-TWDTW), 并与SVM、K-means、MLP、1DCNN和使用单特征的TWDTW等算法进行对比, 得出以下结论.

图 3 不同分类算法的结果图

图 3 不同分类算法的结果图 (续)

(1) Mult-TWDTW算法得到了最好的土地覆盖分类制图效果, 总体精度和Kappa系数分别为95.09%和91.76%. 该算法突破了TWDTW使用单一特征限制分类精度的局限性, 极大地发挥了多特征信息联合使用在分类中的潜力.

(2) 相对于MLP、1D-CNN等需要大量样本的神经网络算法, Mult-TWDTW对样本数量的敏感性较低, 可以实现效果较好的土地覆盖分类图, 总体精度比神经网络算法高3%–9%.

参考文献
[1]
李林, 田馨, 翁永玲. 基于极化SAR和光学影像特征的土地覆盖分类. 东南大学学报(自然科学版), 2021, 51(3): 529-534. DOI:10.3969/j.issn.1001-0505.2021.03.023
[2]
毛丽君, 李明诗. GEE环境下联合Sentinel主被动遥感数据的国家公园土地覆盖分类. 武汉大学学报(信息科学版), 2023, 48(5): 756-764.
[3]
Ling J, Zhang HS, Lin YY. Improving urban land cover classification in cloud-prone areas with polarimetric SAR images. Remote Sensing, 2021, 13(22): 4708. DOI:10.3390/rs13224708
[4]
高文龙, 苏腾飞, 张圣微, 等. 矿区地物分类及土地利用/覆盖变化动态监测——以海流兔流域为例. 国土资源遥感, 2020, 32(3): 232-239.
[5]
Dumitru CO, Schwarz G, Datcu M. SAR image land cover datasets for classification benchmarking of temporal changes. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2018, 11(5): 1571-1592. DOI:10.1109/JSTARS.2018.2803260
[6]
Ghanbari M, Xu LL, Clausi DA. Local and global spatial information for land cover semisupervised classification of complex polarimetric SAR data. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2023, 16: 3892-3904. DOI:10.1109/JSTARS.2023.3264452
[7]
Gui R, Xu X, Wang L, et al. A generalized zero-shot learning framework for PolSAR land cover classification. Remote Sensing, 2018, 10(8): 1307. DOI:10.3390/rs10081307
[8]
Xi XY, Liu ZM, Sun L, et al. High-confidence sample generation technology and application for global land-cover classification. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2023, 16: 3248-3263. DOI:10.1109/JSTARS.2022.3227911
[9]
Naboureh A, Li AN, Bian JH, et al. National scale land cover classification using the semiautomatic high-quality reference sample generation (HRSG) method and an adaptive supervised classification scheme. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2023, 16: 1858-1870. DOI:10.1109/JSTARS.2023.3241620
[10]
Lei GB, Li AN, Bian JH, et al. OIC-MCE: A practical land cover mapping approach for limited samples based on multiple classifier ensemble and iterative classification. Remote Sensing, 2020, 12(6): 987. DOI:10.3390/rs12060987
[11]
Zhu JS, Hu J, Jia S, et al. Multiple 3-D feature fusion framework for hyperspectral image classification. IEEE Transactions on Geoscience and Remote Sensing, 2018, 56(4): 1873-1886. DOI:10.1109/TGRS.2017.2769113
[12]
Martakis P, Reuland Y, Stavridis A, et al. Fusing damage-sensitive features and domain adaptation towards robust damage classification in real buildings. Soil Dynamics and Earthquake Engineering, 2023, 166: 107739. DOI:10.1016/j.soildyn.2022.107739
[13]
Wang CC, Ding LZ, Gao H, et al. Phenology alignment-based PolSAR crop classification considering polarimetric statistical and time-varying curve characteristics. IEEE Geoscience and Remote Sensing Letters, 2023, 20: 2501905. DOI:10.1109/LGRS.2023.3268539
[14]
Belgiu M, Csillik O. Sentinel-2 cropland mapping using pixel-based and object-based time-weighted dynamic time warping analysis. Remote Sensing of Environment, 2018, 204: 509-523. DOI:10.1016/j.rse.2017.10.005
[15]
Gella GW, Bijker W, Belgiu M. Mapping crop types in complex farming areas using SAR imagery with dynamic time warping. ISPRS Journal of Photogrammetry and Remote Sensing, 2021, 175: 171-183. DOI:10.1016/j.isprsjprs.2021.03.004
[16]
Moola WS, Bijker W, Belgiu M, et al. Vegetable mapping using fuzzy classification of dynamic time warping distances from time series of Sentinel-1A images. International Journal of Applied Earth Observation and Geoinformation, 2021, 102: 102405. DOI:10.1016/j.jag.2021.102405
[17]
Moharana S, Kambhammettu BVNP, Chintala S, et al. Spatial distribution of inter- and intra-crop variability using time-weighted dynamic time warping analysis from Sentinel-1 datasets. Remote Sensing Applications: Society and Environment, 2021, 24: 100630. DOI:10.1016/j.rsase.2021.100630
[18]
Qu XZ, Zhou JP, Gu XH, et al. Monitoring maize lodging severity based on multi-temporal Sentinel-1 images using time-weighted dynamic time warping. Computers and Electronics in Agriculture, 2023, 215: 108365. DOI:10.1016/j.compag.2023.108365
[19]
Xiao XY, Jiang LL, Liu YQ, et al. Limited-samples-based crop classification using a time-weighted dynamic time warping method, Sentinel-1 imagery, and Google earth engine. Remote Sensing, 2023, 15(4): 1112. DOI:10.3390/rs15041112
[20]
Li MM, Bijker W. Vegetable classification in Indonesia using dynamic time warping of Sentinel-1A dual polarization SAR time series. International Journal of Applied Earth Observation and Geoinformation, 2019, 78: 268-280. DOI:10.1016/j.jag.2019.01.009
[21]
Pan BH, Zheng Y, Shen RQ, et al. High resolution distribution dataset of double-season paddy rice in China. Remote Sensing, 2021, 13(22): 4609. DOI:10.3390/rs13224609
[22]
Li CC, Xian G, Zhou Q, et al. A novel automatic phenology learning (APL) method of training sample selection using multiple datasets for time-series land cover mapping. Remote Sensing of Environment, 2021, 266: 112670. DOI:10.1016/j.rse.2021.112670
[23]
Viana CM, Girão I, Rocha J. Long-term satellite image time-series for land use/land cover change detection using refined open source data in a rural region. Remote Sensing, 2019, 11(9): 1104. DOI:10.3390/rs11091104
[24]
Guo HL, Xu BW, Yang H, et al. CUDA-based parallelization of time-weighted dynamic time warping algorithm for time series analysis of remote sensing data. Computers & Geosciences, 2022, 164: 105122. DOI:10.1016/j.cageo.2022.105122
[25]
刘纪远. 中国资源环境遥感宏观调查与动态研究. 北京: 中国科学技术出版社, 1996.
[26]
Wu L, Wang HX, Li Y, et al. A novel method for layover detection in mountainous areas with SAR images. Remote Sensing, 2021, 13(23): 4882. DOI:10.3390/rs13234882