摘要 对 2000 年以来基于遥感数据的红树林范围与种类识别的研究结果进行荟萃分析, 阐明红树林范围和种类识别精度的现状, 分析遥感数据源、分类算法、地物类型和物种数对总体精度的影响。结果表明, 红树林范围识别的总体精度范围为 55.7%~99.7%; 约 66%的研究基于 Landsat 遥感数据开展, 且总体精度最高(75%~99.7%); 光学遥感与雷达数据融合可有效地提高范围识别的总体精度(>90%); 地物类型越简单(≤3 种)或越复杂(≥6 种), 范围识别的总体精度越高, 越稳定。红树植物种类识别的总体精度为 64%~98.6%; 空间分辨率越接近红树植物冠幅尺寸, 种类识别的总体精度越高; 在高空间分辨率遥感数据源中, 有短波红外波段的数据源种类识别总体精度高于无短波红外波段; 多源遥感数据融合和植物特征信息有助于提高种类识别的总体精度; 种类识别算法以监督机器学习算法中的支持向量机(SVM)、最大似然分类(MLC)和随机森林(RF)算法应用为最广, 总体精度更高; 随物种数增加, 种类识别总体精度因遥感数据源和分类算法而异。红树林范围和种类识别精度还有提升空间, 遥感数据源、分类算法、地物类型和物种数均会影响识别精度。
关键词 红树林分布; 种类识别; 遥感; 总体精度
红树林是生长在热带和亚热带海岸潮间带, 受周期性潮水浸淹, 以常绿灌木或乔木为主的潮滩湿地木本植物群落[1]。红树林具有多种生态功能, 在海湾河口生态系统中发挥着重要的作用[2]。红树林可以维持海岸带生态系统平衡, 保护海岸生物多样性[3], 护岸固堤, 应对海平面上升的不利影响[4], 提供多种生物技术产品[5], 净化水体[6], 具有生态旅游、自然教育和科学研究等功能和价值[7]。红树林生态系统是高生产力的生态系统, 虽然面积仅占热带森林的 0.7%, 但红树林是热带地区最富碳的森林之一, 平均每公顷含碳量为 1023 Mg[8]。20 世纪 50 年代以来, 在自然因素和人为干扰的双重作用下, 全球红树林面积减少 35%左右[9]。当前, 我国已逆转红树林减少的趋势, 对红树林的保护和恢复力度空前, 但仍存在多部门统计数据不一致、尚未实现红树林分布地图数据统一等问题[10]。
由于红树林生长在热带、亚热带潮间带, 封闭性高, 进行地面调查不仅耗费大量的时间与人力, 而且在空间和时间尺度上都具有很大的局限性, 无法满足大面积监测的需求。遥感技术具备覆盖面积广、时效性强、相对成本低和可重复获取等优势, 填补了红树林监测中数据缺失与滞后的空白, 已成为国内外红树林监测的重要手段[11]。伴随遥感技术的迅速发展, 遥感数据的空间分辨率不断提高, 已经能够有效地获取零星分布的红树林的光谱与结构特征, 可为红树林研究提供及时、可靠的数据来源。利用关键词(主题)“Mangrove*(红树林)”和“Remote Sensing (遥感)”在 Web of Science 和中国知网(CNKI)数据库进行文献检索, 截至 2019 年, 红树林遥感相关文献共有 1400 篇, 其中英文文献 1097篇, 中文文献 303 篇。世界范围内, 红树林遥感研究的历史可追溯至 1956 年[12], 2000 年之前相关研究较少, 进入 21 世纪后, 文献数量迅速增加。
已有研究者从多个方面系统总结红树林遥感研究现状, 但均未系统和定量分析各类遥感监测研究中红树林范围与种类识别的总体精度现状及其影响因素。Kuenzer 等[13]基于 2011 年前的红树林遥感研究文献, 分析航拍、中/高空间分辨率多光谱数据、高光谱数据和雷达数据等检测手段的优点和不足。Heumann[1]从红树林范围变化、物种组成、叶面积与冠幅分割、高度和生物量以及生产力等方面总结红树林遥感数据和分析技术的最新进展。Hu 等[14]梳理红树林范围变化遥感监测的提取方法和相关数据集, 分析红树林范围变化及其驱动因素, 发现遥感技术在红树林范围变化及其驱动因素研究中具有优势。Pham 等[15]总结 2010 年以来基于红树林遥感监测的应用研究及其局限性, 提出遥感与机器学习相结合的技术是未来红树林制图、生物量和碳储量评估的重要研究方向。Wang 等[16]总结 1956 年以来红树林遥感研究的轨迹, 发现当前研究热点已从红树林范围制图转变为红树林种类识别和碳储量估算等红树林生态系统过程的描述, 红树林遥感研究具有参考陆地森林遥感研究的特点, 在各个研究方向存在不同程度的时间滞后现象。
红树林范围和种类识别是红树林遥感研究中最基础、最重要的工作, 其识别精度直接影响后期对生物物理参数、生态系统过程观测指标等定量反演的准确性。常用的分类精度评价指标有总体精度(overall accuracy, OA)、用户精度(user’s accuracy, UA)和生产者精度(producer’s accuracy, PA)等, 其中总体精度[17]是对各类分类精确度的整体描述, 故本研究选用总体精度作为统计指标。
本研究基于文献检索法和荟萃分析法, 统计应用于红树林范围和种类识别的各类遥感数据源、不同的种类识别算法、地物类型数量、物种数信息以及相应的总体精度数据, 分析上述参数与总体精度间的关系, 阐明红树林范围和种类识别精度的现状及其影响因素, 并提出红树林基础遥感信息提取的优化建议, 以期为提高红树林遥感研究结果的可靠性提供参考。
荟萃分析(Meta 分析)是对已发表的数据进行二次处理。通过荟萃分析, 研究者在不具备实验条件的情况下就可得到具有一定可信度的科学结论。在荟萃分析过程中, 充分收集文献尤为重要。Brander等[18]荟萃分析经济价值评估文献, 应用价值估计函数评估东南亚红树林的生态价值。Cai 等[19]通过荟萃分析, 阐明植物叶片滞尘的时空变化趋势和影响因素, 为揭示叶片滞尘机理以及城市绿化植物的选择与配置提供科学依据。
我们利用检索式 TS = (“mangrove*” and “remote sensing” and “mapping”)和 TS =(“mangrove*” and “remote sensing” and “species”), 在 Web of Science数据库中分别检索到红树林范围识别和种类识别相关文献 729 篇和 413 篇。经逐篇筛选, 剔除与主题无关的文献、重复的文献以及未使用总体精度(OA)作为评价指标的文献, 最终符合要求的关于红树林范围识别和种类识别的文献分别为 58 篇和 34 篇(图 1)。从文献中提取的信息包括遥感数据源、验证样本量、分类算法、地物类型数量、物种数和总体精度(OA)。
本研究采用 Q 值统计量检验法和 I 2 统计量检验法[20], 对收集的数据进行异质性检验。Q 值统计量检验法的原理是根据统计样本的实际观测值与理论推断平均值的偏离程度来决定 Q 值的大小, 计算公式如下:
其中, wi 为第 i 个研究的权重值, 与其样本量相关, 样本量越大, 权重越大; Ti 为第 i 个研究的效应量;
为所有研究的平均效应量:
因此,
(3)
由于 Q 服从自由度为 n -1 的χ2分布, Q 值越小, 偏差越小, 所以当Q值对应的P值小于0.05时, 则认为异质性存在, 否则没有异质性。
I 2统计量的计算公式为
其中, Q为χ2统计量, df为自由度(n-1)。I2值在0~ 100%之间变化, 其值越大, 异质性程度越高。当0≤I2<25%时, 代表该研究无异质性; 当25%≤I2< 50%时, 表示存在轻度异质性; 当50%≤I2<75%时, 表示存在中度异质性; 当I2≥75%时, 表示该研究存在高度异质性[20]。
本研究中, 数据异质性主要由研究区域不同、遥感数据源不同以及所用算法不同等因素导致, 因此异质性程度越高, 说明上述因素对总体精度的影响越大, 对遥感数据源和算法分析的价值也越大, 更需要提出红树林遥感应用研究的优化方案。基于Stata软件中的Meta分析方法, 计算获得红树林范围识别数据集和种类识别数据集的Q统计量分别为5082.44(P<0.001)和955.09(P<0.001), I2统计量分别为99.34%和97.14%, 均具有高度异质性。
图1 荟萃分析流程图
Fig.1 Flow chart of meta analysis
2.1.1红树林范围识别的精度
荟萃分析结果表明, 在红树林范围的遥感识别方面, 仅9.3%的研究涉及总体精度的评价; 不同研究的地面验证样本量差别较大, 范围为35~6000, 多数(80.4%)在100~1000之间。基于卫星遥感数据源的红树林范围识别总体精度范围为55.7%~ 99.7%(图2)。涉及的相关遥感数据源包括卫星数据源(光学数据: Landsat系列卫星、SPOT系列卫星和高分系列卫星等; 雷达数据: Sentinel-1卫星和Ra-darsat卫星等)和无人机遥感数据。在范围识别中, 基于无人机(UAV)收集数据的总体精度比卫星数据源低; 由于无人机具有较高的空间分辨率, 并受限于续航能力, 在范围识别领域多用于地面验证数据的采集[21]。
2.1.2遥感数据源对总体精度的影响
Landsat系列卫星具有长时间序列优势, 是红树林范围识别研究的主要遥感数据源, 占全部相关研究的66%。Malik等[22]基于Landsat MSS, Landsat TM和SPOT-4遥感数据, 分别对印度尼西亚南苏拉威西省1979, 1996, 2006和2011年的红树林范围进行制图, 总体精度分别为92.52%, 95.82, 97.26%和96.28%。Lu等[23]利用Landsat-5和Landsat-8卫星的多光谱数据, 对1990, 1997, 2005, 2010和2017年泉州湾河口湿地自然保护区的红树林、互花米草和泥滩等10种地面覆盖物进行识别, 各年份总体精度分别为93%, 91%, 91%, 92%和93%。Gaw等[24]利用Landsat-5, Landsat-7和Landsat-8卫星遥感数据, 分别对缅甸南端坦因塔里省2000, 2005, 2009和2014年的水体、泥滩、红树林、裸地、陆地植被和城镇进行制图, 总体精度分别为95.6%, 96.9%, 96.2%和78.4%。Ahmad等[25]用Landsat TM/ETM/OLI数据, 分别对1997, 2002, 2006, 2013和2016年马来西亚半岛切里廷河口的红树林进行制图, 总体精度分别为77.78%, 84%, 87.23%, 81.32%和77.27%。
与其他卫星数据源相比, Landsat系列卫星数据用于红树林范围识别的总体精度较高。Landsat系列卫星中, Landsat-5, Landsat-7, Landsat-8, Landsat-3以及Landsat-1卫星数据总体精度从大到小依次为83.77%~96.55%, 84.1%~95.6%, 75%~99.7%, 82%~ 92.52%和81%~86.36%(图2(a))。Sentinel-2, IRS-1D, ALOS PALSAR, SPOT-5以及World-View-2卫星数据的总体精度从大到小依次为78.7%~96.52%, 80.88%~94.24%, 66.61%~92.17%, 84.56%~87%和55.7%~85%(图2(a))。Wang等[26]使用Landsat-8, Sentinel-2和Pléiades-1卫星遥感数据, 对海南岛东寨港国家自然保护区的红树林进行范围识别, 总体精度分别为96.09%, 96.52%和91.89%。Rosmasita等[27]分别使用Sentinel-2和Landsat-8遥感数据, 对马来西亚廖内省Liong河的红树林、水体、农业区和橡胶树等9种地面覆盖物进行识别, 总体精度分别为62.7%和78.7%。
将光学数据与雷达数据源融合, 可获得较高的分类精度, 总体精度可提高至90%以上。将IKONOS卫星数据与LiDAR数据结合, 红树林范围识别的总体精度可达90.4%[28]。将Landsat 7卫星多光谱数据与RADARSAT-1卫星C波段数据结合, 范围识别的总体精度为94.59%[29]。将Landsat-7卫星数据与Sentinel-1雷达数据相结合, 范围识别的总体精度高达99.19%[30]。将WorldView-2卫星数据与LiDAR数据融合, 范围识别的总体精度达94%[10]。
无人机具有空间分辨率高、成本低以及效率高等特点, 已将其采集的数据应用于红树林遥感研究中。Wang等[21]最早将无人机采集的数据作为Landsat和SPOT卫星数据的补充, 对分类结果进行验证。Zhu等[31]使用机载激光雷达(LiDAR)数据, 结合红树林的淹没模式对福建漳江口国家红树林自然保护区的3个红树林物种、互花米草、水体和泥滩进行识别, 总体精度为78.6%。
不同空间分辨率带来的精度差异正是遥感科学的核心问题“尺度效应”所关注的问题。本研究发现在空间分辨率更高的遥感影像中, 由于图像的复杂度高, 光谱特征易受相邻像素影响, 加上部分高空间分辨率的遥感卫星缺乏对植物测绘有用的短波红外(SWIR)波段(图2(b)), 获得的红树林范围识别精度反而更低, 更不稳定(如ALOS遥感数据源)(图2 (a))[32]。此外, 高分辨率卫星影像的购买成本高, 数据处理所需的时间长。与Landsat系列卫星相比, 大多数高分辨率卫星的光谱分辨率较低, 长时间序列数据有限。考虑到成本和精度双重因素, Landsat系列卫星是大范围红树林分布范围识别较佳的数据来源。
(a)中数据来自 58 篇红树林范围识别文献; N 代表研究案例数, SR 代表空间分辨率, 下同。(b)中黄色区域表示短波红外波段(SWIR: 1000~2500 nm)
图2 不同遥感数据源的红树林范围识别的总体精度(a)和波段信息(b)
Fig.2 Overall accuracy (a) and band information (b) of mangrove range identification on different remote sensing platforms
2.1.3地物类型数量对总体精度的影响
本研究统计了122组红树林范围识别数据, 包括地物类型总数和相应的范围识别总体精度, 并对同一遥感数据源的相同地物类型分类数的总体精度取平均值, 结果如图3所示。随着土地利用类型数量的增加, 总体精度的波动范围呈先增后减的趋势。分类总数为2~3种时, 精度范围为82%~ 99.19%, 即地物类型越简单, 识别精度越高, 波动较小; 分类总数为4~5种时, 精度范围为55%~ 96.4%, 总体精度更小, 波动幅度较大; 分类总数≥6种时, 精度范围为75%~99.7%, 即地物类型更复杂, 总体精度和波动幅度均有改善。因此, 地物类型复杂程度对范围识别总体精度的稳定性有明显的影响。地物类型越简单(≤3种)或越复杂(≥6种), 范围识别的总体精度越高且越稳定; 处于中间水平时, 总体精度及其稳定性均降低。同时, 随着土地利用类型数量的增加, 不同数据源的总体精度变化趋势有差异(图 3)。高空间分辨率的数据源(SR<10 m; 如Worldview2, IRS 1D和ALOS)多表现为下降趋势, 中空间分辨率的数据源(Landset系列)多表现为增加趋势。
数据来自58篇红树林范围识别文献
图3 不同遥感平台土地利用类型数量与总体精度的关系
Fig.3 Relationship between the number of land use types and the overall accuracy of different remote sensing plat-forms
2.2.1红树林种类识别的精度
在红树林植物种类遥感识别方面, 仅 7.6%的研究涉及对种类识别总体精度的评价; 不同研究的地面验证样本量差别较大, 样本量范围为 108~3554, 多数(89.5%)样本量在100~500之间。由于对数据源空间分辨率的要求不同, 在纳入分析的文献中, 仅有约15%的范围识别数据源直接用于红树植物种类识别。在已统计的34篇文献中, 红树林植物种类识别的总体精度范围为64%~98.6%, 高空间分辨率卫星数据(空间分辨率SR<10m)和监督机器学习算法在红树林种类识别研究中备受关注[9,33-34]。
2.2.2遥感数据源对种类识别精度的影响
对文献中62组具有遥感数据源和总体精度两个指标的红树林种类识别研究结果的分析, 发现基于中等空间分辨率的Landsat-8卫星数据进行种类识别的总体精度最低(64%~89%, 图4(a))。在Valder- rama-Landeros等[35]和Wang等[26]的研究结果中, 红树植物种类识别的总体精度分别为64%和68.57%, 原因可能是由于红树林树种级别的冠幅尺寸显著小于Landsat-8多光谱遥感数据的空间分辨率(30m), 因此获取的遥感信息无法支持红树林物种间分类。基于高空间分辨率遥感数据源的种类识别研究具有较高的总体精度, 范围为65.74%~94.4%(图4(a))。同时, 高空间分辨率遥感数据源(SR由高到低) UAV(SR=0.02m)、Worldview-2 (SR=1.6m)和 GF-2 (SR=3.2m)的红树植物种类识别总体精度分别为85.62%~89.34%, 87.62%~92.31%和87.63%~93% (图4(a)), 即当遥感数据源空间分辨率越接近红树植物冠幅尺寸时, 总体精度越高, 说明在种类识别过程中, 空间分辨率与冠幅尺寸的关系是种类识别精度的主要影响因素, 遥感数据源空间分辨率越接近冠幅尺寸, 种类识别的总体精度越高。
在高空间分辨率的遥感数据源中, 具有短波红外波段的卫星数据源(如WorldView-3)的种类识别总体精度高于不具有短波红外波段的数据源(如GF-2和Pléiades-1)。在中等空间分辨率的遥感数据源中, 波段对总体精度的影响不大, 空间分辨率仍起主要作用(如GF-1, 图4(b))。将多源遥感数据融合, 可以获取更丰富的地物信息, 充分利用植物的特征信息(如物候和树高等), 有助于提高种类识别的总体精度。Peng等[36]利用Gaofen-2(GF-2)和RapidEye-4(RE-4)卫星遥感数据, 对淇澳岛的5个红树林物种进行识别, 发现与单独使用GF-2数据(OA=89.78%)相比, 结合GF-2和RE-4两种卫星数据的总体精度更高(OA=92.01%)。Li等[37]使用多物候期的Sentinel-2多光谱数据, 对福建漳江口国家红树林自然保护区的3个红树林物种、互花米草、水体和泥滩进行识别, 总体精度较高(OA=84%)。
无人机具有较高的空间分辨率, 可搭载多光谱、高光谱和雷达等多种传感器。Cao等[38]利用无人机高光谱和激光雷达(LiDAR)数据, 对淇澳岛的红树林进行种类识别, 发现将光谱特征和空间特征(包括纹理特征和高度信息)进行组合可以得到更高的总体精度(89.55%)。Qiu等[34]基于WorldView-2卫星多光谱数据, 结合无人机LiDAR数据, 对海南岛东北部青兰港省级自然保护区的5个红树林物种进行种类识别, 总体精度为86.08%。无人机较容易获取对种类识别有重要影响的高度信息, 既可作为单独的光学或雷达数据源, 也可与卫星数据相结合。基于无人机的种类识别总体精度高于部分卫星数据源, 在红树植物种类识别方面具有较大的应用潜力。
2.2.3分类算法对种类识别精度的影响
基于遥感数据的红树林物种识别方法的发展与统计学习领域的发展联系紧密。在早期研究中, 基于像元的分类算法是经典的遥感影像分类技术, 通常分为无监督分类和监督分类。无监督分类不需要训练数据或研究区域先验知识的帮助, 常见的是 K均值聚类算法(K-means clustering algorithm)及其改进算法、迭代自组织数据分析算法(ISODATA)等, 这些算法在图像处理软件包中容易实现。监督分类则需要训练数据或先验知识作为基础, 主要方法有最大似然分类算法(MLC)以及k最近邻分类算法(KNN)等[39]。近年来, 机器学习的不断发展和基于对象的监督分类算法的应用, 为遥感影像的识别分类提供了一种新的模式, 非参数决策树分类算法(如支持向量机(SVM)、随机森林(RF)和人工神经网络(ANN)等)正逐渐取代其他分类算法应用于种类识别中[39]。常用种类识别监督分类算法的原理及优缺点如表1所示。
(a)中数据来自34篇红树林种类识别文献; (b)中黄色区域表示短波红外(SWIR: 1000~2500 nm)
图4 不同遥感数据源的红树植物种类识别总体精度(a)和波段信息(b)
Fig.4 Overall accuracy (a) and band information (b)of mangrove species identification on different remote sensing platforms
最大似然分类(MLC, OA=82.86%~98.6%)、支持向量机(SVM, OA=81.91%~96.85%)和随机森林(RF, OA=68.57%~89.96%)是应用最多的种类识别算法, 且总体精度较高(图5(a))。Satyanarayana等[29]和Mungai等[42]结合MLC算法, 对东马来西亚群岛文莱湾的5个红树林物种以及肯尼亚-坦桑尼亚间跨边境保护区的9个红树林物种进行种类识别, 总体精度分别为80%和89%。Wang等[40]使用Pléiades- 1卫星多光谱数据, 对珠江口南沙湿地的4个红树林物种进行分类, 通过比较基于像素和基于对象分类的决策树(DT)、SVM和RF机器学习算法, 发现基于对象分类的总体精度更高, 尤其是RF算法(OA =82.4%)。Cao等[38]利用无人机高光谱和LiDAR数据, 对淇澳岛红树林自然保护区的6个红树林物种和3个非红树林地物进行分类, 发现与KNN算法相比, SVM算法具有更高的总体精度(OA: 89.55%)。同时, 分类物种数不同也会对分类结果产生影响, 分类算法适用的分类数多在4~10之间(图5(b))。值得注意的是, 深度学习网络逐渐应用于红树林种类识别, 并取得较高的总体精度。Wan等[43]利用卷积神经网络(CNN)对深湾的7个红树林物种进行分类, 总体精度高达98.8%。
表1 常用种类识别监督分类算法的原理及优缺点
Table 1 Principles, advantages, and disadvantages of common species classification algorithms
分类算法算法原理优缺点参考文献输入数据分布假设训练数据算法复杂性和计算成本备注 支持向量机(SVM)通过对训练样本寻找一个最优决策超平面高维空间, 生成最佳的类分离无少量较高适于将非遥感变量纳入分类中; 应用核函数时参数选择复杂[40] 随机森林(RF)生成每棵树时所选特征都随机产生, 不需额外剪枝, 通过计算使整体模型具有较高的精确度无少量较低适用于训练样本较少时的分类问题, 对输入变量个数不敏感; 响应类别具有不同数量级时可能存在偏差[37] 最大似然分类(MLC)根据先验知识及贝叶斯理论, 选择感兴趣区并计算分类函数, 样本归属于函数概率值最大的类别高斯分布大量较高适用于训练样本数量大的分类问题; 样本容量较大时几乎无偏差[41] k最近邻分类(KNN)统计某样本在特征空间中k个最相邻样本的类别, 该样本被归为有最多样本数的类别并具有该类样本的特性无不需要较高适于多分类问题; 受类别样本数的影响比较大, k参数的选择直接影响结果[38] 光谱角制图(SAM)结合光谱维的信息, 利用n维角度来匹配样本光谱和参考光谱, 进而确定分类类别无不需要较高适于已知足够光谱信息的情况; 当空间工作有问题时不考虑亚像素值[42] 分类和回归树(CART)基于训练数据集生成决策二叉树, 递归地二分每个特征, 用验证数据集对已生成的树进行剪枝, 并选择最优子树用于分类无少量较低适用于离散字段的预测; 可显示重要字段; 对有时间顺序的数据需要预处理[36] 自适应增强(AdaBoost)训练多个基分类器。在带权重样本上训练基分类器, 以前错分的样本权重大, 分对的权重小无大量较高适用于二分类问题, 迭代次数方面, 弱分类器数目和切分点设置难度大[36] 旋转森林(RoF)在旋转森林框架下, 利用决策树方法独立构造分类器, 在主成分分析(PCA)变换得到的旋转特征空间中对训练样本进行训练无少量低适用于解决过拟合问题; 需要 PCA变换[36]
2.2.4物种数对种类识别精度的影响
分类的物种数越多, 错分或漏分的可能性越大, 最终的总体精度可能会降低。但是, 基于不同遥感数据源的种类识别总体精度受物种数的影响, 需要根据目标区域的红树植物种类数量选择合适的遥感数据源。如EO-1, Sentinel-2和WorldView-2数据的总体精度随着物种数增加而减小, 而Landsat-5和Landsat-8数据的总体精度有增加的趋势(图6(a))。
就分类算法而言, KNN和SAM算法的总体精度随着分类物种数的增加呈现降低趋势(图6(b))。SVM和CART算法的总体精度随着分类物种数的增加先升高后降低, 在物种数为6左右达到最大。MLC算法与SVM和CART算法相反, 总体精度随物种数的增加先降后升, 在物种数为6左右为最小值。RF算法的总体精度随物种数的增加呈升高趋势, 在物种数较多时表现较好(图6(b))。
本研究基于荟萃分析方法, 分析红树林范围和种类识别总体精度的现状及其影响因素, 得到如下主要结论。
1)基于遥感数据的红树林范围和种类识别总体精度分别为55.7%~99.7%和64%~98.6%, 波动范围较大, 存在提升空间。
2)不同的遥感数据源通过空间分辨率和波段组成均会影响识别精度, 且多源遥感数据融合和植物特征信息(如物候和树高等)有助于提高范围和种类识别的总体精度。
数据来自34篇红树林种类识别文献。MLC: 最大似然分类; SVM: 支持向量机; RoF: 旋转森林; AdaBoost: 自适应增强; SAM: 光谱角制图; KNN: k-最近邻分类; RF: 随机森林; CART: 分类和回归树
图5 不同分类算法的红树植物种类识别总体精度(a)和识别的物种数(b)
Fig.5 Overall accuracy (a) and species number (b) of mangrove plant species recognition by different classification algorithms
数据来自34篇红树林种类识别文献
图6 红树植物种类识别的物种数与总体精度的关系
Fig.6 Relationship between species number and overall accuracy of mangrove species identification
3)种类识别对算法的要求更高, 监督机器学习算法中的支持向量机(SVM)、最大似然分类(MLC)和随机森林(RF)算法应用最广, 种类识别的总体精度更高。
4)地物类型和物种数均会影响识别精度。地物类型越简单(≤3种)或越复杂(≥6种), 范围识别总体精度越高且越稳定; 随物种数增加, 种类识别总体精度因遥感数据源和分类算法而异。
需要注意的是, 红树林遥感识别的精度受遥感数据源、分类算法、地物类型或物种数量等多种因素的共同影响。在理想状态下, 若要研究识别精度的影响因素, 应有效地控制其他变量, 只改变单一变量, 研究该变量对识别精度的影响。然而, 本研究受限于红树林遥感相关研究的广泛性和持续性, 不同文献涉及的研究区、数据源、时间、分类算法、红树林种类和分布都各不相同, 很难做到只改变单一变量来分析该变量对精度的影响。后续工作中随着文献数量的增加, 有进一步改进的可能性。
综上所述, 本研究提出如下提升红树林范围和种类识别总体精度的具体建议。
1)根据红树林大面积遥感监测时间需求和地物类型复杂程度, 合理地选择遥感数据源。长时间序列的红树林范围变化监测可使用发射时间早、卫星数量多的Landsat系列卫星, 并具有红树林范围识别中起重要作用的短波红外波段。在短时间序列的研究中, 可通过多源遥感数据融合方式, 进一步提升范围识别总体精度。若红树林及周边区域土地利用类型数量<6, 选用Sentinel-2, ALOS和Landsat-5 卫星数据可获得大于90%的总体精度; 若土地利用类型数量≥6, 则选用Landsat-7, Landsat-8等遥感数据源。
2)在红树植物种类识别中, 需根据目标区域的红树植物冠幅和种类数量, 选择合适的遥感数据源和分类算法。进行种类识别前, 可提前调研目标区域红树植物单木冠幅等信息, 确定该区主要红树植物种类的冠幅大小。进一步地, 选择空间分辨率接近红树植物冠幅尺寸的遥感数据源, 有望获得更高的种类识别总体精度。当需分类的物种数<6时, 数据源选择WorldView-2, GF-1和EO-1等, 特种数≥6时, 选择WorldView-3, GF-2和Landsat-5等。当需分类的物种数<5或>7时, MLC算法是较好的选择; 物种数在6左右时, SVM算法的总体精度较高。
3)充分发挥无人机遥感监测的优势, 提高红树林范围识别的效率和种类识别的精度。在红树林范围识别中, 使用无人机遥感可以获取地面验证数据集, 提高大面积地面调查效率和降低人工成本。在种类识别中, 充分利用无人机遥感的高空间分辨率、灵活的多源遥感平台和相关结构信息(如高度等)获取优势, 进一步提升红树植物种类识别的总体精度。
参考文献
[1]Heumann B W.Satellite remote sensing of mangrove forests: recent advances and future opportunities.Progress in Physical Geography, 2011, 35(1): 87-108
[2]Silinski A, Schoutens K, Puijalon S, et al.Coping with waves: plasticity in tidal marsh plants as self-adapting coastal ecosystem engineers.Limnology and Oceanography, 2018, 63(2): 799-815
[3]Barbier E B, Hacker S D, Kennedy C, et al.The value of estuarine and coastal ecosystem services.Ecologi-cal Monographs, 2011, 81(2): 169-193
[4]Alongi D M.Mangrove forests: Resilience, protec-tion from tsunamis, and responses to global climate change.Estuarine Coastal and Shelf Science, 2008, 76(1): 1-13
[5]Kamat S, Gaikwad S, Kumar A R, et al.Xylitol pro-duction by Cyberlindnera (Williopsis) saturnus, a tro-pical mangrove yeast from xylose and corn cob hydro-lysate.Journal of Applied Microbiology, 2013, 115 (6): 1357-1367
[6]Tam N F Y, Wong A H Y, Wong M H, et al.Mass balance of nitrogen in constructed mangrove wetlands receiving ammonium-rich wastewater: effects of tidal regime and carbon supply.Ecological Engineering, 2009, 35(4): 453-462
[7]Mehvar S, Filatova T, Dastgheib A, et al.quantifying economic value of coastal ecosystem services: a revi-ew.Journal of Marine Science and Engineering, 2018, 6(1): no.5
[8]Giri C, Ochieng E, Tieszen L L, et al.Status and dis-tribution of mangrove forests of the world using earth observation satellite data.Global Ecology and Bio-geography, 2011, 20(1): 154-159
[9]周振超, 李贺, 黄翀, 等.红树林遥感动态监测研究进展.地球信息科学学报, 2018, 20(11): 1631-1643
[10]Jia Mingming, Wang Zongming, Zhang Yuanzhi, et al.Monitoring loss and recovery of mangrove forests during 42 years: the achievements of mangrove con-servation in China.International Journal of Applied Earth Observations and Geoinformation, 2018, 73: 535-545
[11]王乐, 时晨, 田金炎, 等.基于多源遥感的红树林监测.生物多样性, 2018, 26(8): 838-849
[12]West R C.Mangrove swamps of the Pacific coast of Colombia.Annals of the Association of American Geographers, 1956, 46(1): 98-121
[13]Kuenzer C, Bluemel A, Gebhardt S, et al.Remote sensing of mangrove ecosystems: a review.Remote Sensing, 2011, 3(5): 878-928
[14]Hu Luojia, Li Wenyu, Xu Bing.The role of remote sensing on studying mangrove forest extent change.International Journal of Remote Sensing, 2018, 39 (19): 6440-6462
[15]Pham T D, Yokoya N, Bui D T, et al.Remote sensing approaches for monitoring mangrove species, struc-ture, and biomass: opportunities and challenges.Re-mote Sensing, 2019, 11(3): no.230
[16]Wang Le, Jia Mingming, Yin Dameng, et al.A re- view of remote sensing for mangrove forests: 1956-2018.Remote Sensing of Environment, 2019, 231: UNSP111223
[17]隋晨红.基于分类精度预测的高光谱图像分类研究[D].武汉: 华中科技大学, 2015: 18-21
[18]Brander L M, Wagtendonk A J, Hussain S S, et al.Ecosystem service values for mangroves in Southeast Asia: a meta-analysis and value transfer application.Ecosystem Services, 2012, 1(1): 62-69
[19]Cai Mengfan, Xin Zhongbao, Yu Xinxiao.Spatio-temporal variations in PM leaf deposition: a meta-analysis.Environment Pollution, 2017, 231: 207-218
[20]白雪莲, 羊钊.基于荟萃分析的出行时间价值计算方法.武汉理工大学学报(交通科学与工程版), 2019, 43(4): 712-717
[21]Wang Anqi, Chen Jiadai, Jing Changwei, et al.Monitoring the invasion of Spartina alterniflora from 1993 to 2014 with Landsat TM and SPOT 6 satellite data in Yueqing Bay, China.PLOS ONE, 2015, 10(8): e0135538
[22]Malik A, Mertz O, Fensholt R.Mangrove forest dec-line: consequences for livelihoods and environment in South Sulawesi.Regional Environmental Change, 2017, 17(1): 157-169
[23]Lu Chunyan, Liu Jinfu, Jia Mingming, et al.Dynamic analysis of mangrove forests based on an optimal segmentation scale model and multi-seasonal images in Quanzhou Bay, China.Remote Sensing, 2018, 10(12): no.2020
[24]Gaw L Y F, Linkie M, Friess D A.Mangrove forest dynamics in Tanintharyi, Myanmar from 1989-2014, and the role of future economic and political deve-lopments.Singapore Journal of Tropical Geography, 2018, 39(2): 224-243
[25]Ahmad Z, Suharni M L M, Taib S N A, et al.Impact of coastal development on mangrove distribution in Cherating Estuary, Pahang, Malaysia.Malaysian Jour-nal of Fundamental and Applied Sciences, 2019, 15 (3): 456-461
[26]Wang Dezhi, Wan Bo, Qiu Penghua, et al.Evaluating the performance of Sentinel-2, Landsat 8 and Pléia-des-1 in mapping mangrove extent and species.Re-mote Sensing, 2018, 10(9): no.1468
[27]Rosmasita, Siregar V P, Agus S B, et al.An object-based classification of mangrove land cover using support vector machine algorithm.IOP Con-ference Series: Earth and Environmental Science, 2019, 284(1): 012024
[28]Maryantika N, Lin C.Exploring changes of land use and mangrove distribution in the economic area of Sidoarjo District, East Java using multi-temporal Lan-dsat images.Information Processing in Agriculture, 2017, 4(4): 321-332
[29]Satyanarayana B, Muslim A M, Horsali N A I, et al.Status of the undisturbed mangroves at Brunei Bay, East Malaysia: a preliminary assessment based on remote sensing and ground-truth observations.Peer J, 2018, 6: e4397
[30]Liao Jingjuan, Zhen Jianing, Zhang Li, et al.Under-standing dynamics of mangrove forest on protected areas of Hainan Island, China: 30 years of evidence from remote sensing.Sustainability, 2019, 11(19): no.5356
[31]Zhu Xudong, Hou Yuwen, Weng Qihao, et al.Inte-grating UAV optical imagery and LiDAR data for assessing the spatial relationship between mangrove and inundation across a subtropical estuarine wetland.ISPRS Journal of Photogrammetry and Remote Sen-sing, 2019, 149: 146-156
[32]Shapiro A C, Trettin C C, Kuchly H, et al.The mangroves of the Zambezi Delta: increase in extent observed via satellite from 1994 to 2013.Remote Sensing, 2015, 7(12): 16504-16518
[33]Wang Le, Shi Chen, Tian Jinyan, et al.Researches on mangrove forest monitoring methods based on multi-source remote sensing.Biodiversity Science, 2018, 26(8): 838-849
[34]Qiu Penghua, Wang Dezhi, Zou Xinqing, et al.Finer resolution estimation and mapping of mangrove bio-mass using UAV LiDAR and WorldView-2 data.Fo-rests, 2019, 10(10): no.871
[35]Valderrama-Landeros L, Flores-de-Santiago F, Kovacs J M, et al.An assessment of commonly employed satellite-based remote sensors for mapping mangrove species in Mexico using an NDVI-based classification scheme.Environmental Monitoring and Assessment, 2017, 190(1): no.23
[36]Peng Liheng, Liu Kai, Cao Jingjing, et al.Combining GF-2 and RapidEye satellite data for mapping mang-rove species using ensemble machine-learning me-thods.International Journal of Remote Sensing, 2020, 41(3): 813-838
[37]Li Huiying, Jia Mingming, Zhang Rong, et al.Incorporating the plant phenological trajectory into mangrove species mapping with dense time series Sentinel-2 imagery and the Google Earth Engine platform.Remote Sensing, 2019, 11(21): no.2479
[38]Cao Jingjing, Leng Wanchun, Liu Kai, et al.Object-Based mangrove species classification using unman-ned aerial vehicle hyperspectral images and digital surface models.Remote Sensing, 2018, 10(1): no.89
[39]孔嘉鑫, 张昭臣, 张健.基于多源遥感数据的植物物种分类与识别: 研究进展与展望.生物多样性, 2019, 27(7): 796-812
[40]Wang Dezhi, Wan Bo, Qiu Penghua, et al.Artificial mangrove species mapping using Pléiades-1: an eva-luation of pixel-based and object-based classifications with selected machine learning algorithms.Remote Sensing, 2018, 10(2): no.294
[41]Jia Mingming, Wang Zongming, Li Lin, et al.Mapping China’s mangroves based on an object-oriented classification of Landsat imagery.Wetlands, 2014, 34(2): 277-283
[42]Mungai F, Kairo J, Mironga J, et al.Mangrove cover and cover change analysis in the transboundary area of Kenya and Tanzania during 1986-2016.Journal of the Indian Ocean Region, 2019, 15(2): 157-176
[43]Wan Luoma, Zhang Hongsheng, Lin Guanghui, et al.A small-patched convolutional neural network for mangrove mapping at species level using high-resolution remote-sensing image.Annals of GIS, 2019, 25(1): 45-55
A Meta-Analysis of the Overall Accuracy of Extent and Species of the Coastal Mangroves
Abstract A meta-analysis of the research on the extent and species identification of mangroves has been conducted using remote sensing since 2000.The study clarified the overall accuracy status of mangrove extent and species identification, as well as the influence of remote sensing data source, classification algorithm, feature type and species number on the overall accuracy.The results showed that the overall accuracy range of mangrove extent identification was 55.7%- 99.7% and about 66% of the researches were based on Landsat series satellite data, and had the highest overall accuracy (75%- 99.7%).Optical remote sensing and radar data fusion could effectively improve the overall accuracy of extent identification (>90%).The simpler the type of ground features (≤3 types) or the more complex (≥6 types), the overall accuracy of extent identification is higher and more stable.The overall accuracy of mangrove species identification ranged from 64% to 98.6%; the closer the spatial resolution is to the size of the plant canopy, the higher the overall accuracy of species identification.Among the high spatial resolution remote sensing data sources, the overall accuracy of the species identification of data sources with shortwave infrared bands was higher than that of non-shortwave infrared bands.Multi-source remote sensing data fusion and plants themselves feature information that helps to improve the overall accuracy of category identification.Support vector machines (SVM), maximum likelihood classification (MLC), and random forest (RF) algorithms in supervised machine learning algorithms were the most widely used and had better overall accuracy.As the number of species increases, the overall accuracy of species identification varies with remote sensing data sources and classification algorithms.In summary, the identification accuracy of mangrove extent and species may be improved to a certain extent, and remote sensing data sources, classification algorithms, feature types, and the number of species will all affect the identification accuracy.
Key words mangrove distribution; species identification; remote sensing; meta-analysis
doi: 10.13209/j.0479-8023.2021.096
收稿日期: 2021-01-04;
修回日期: 2021-03-19
广东省海洋经济发展专项资金(粤自然资合[2020]059 号)和深圳市科技创新委员会自然科学基金重点项目(JCYJ20200109140605948)资助