北京大学学报(自然科学版) 第60卷 第3期 2024年5月

Acta Scientiarum Naturalium Universitatis Pekinensis, Vol. 60, No. 3 (May 2024)

doi: 10.13209/j.0479-8023.2024.022

中国地质调查局地质调查项目(DD20211364)资助

收稿日期: 2023–05–14;

修回日期: 2023–06–02

滑坡位移预测模型补充评价方法

田原1,2 常啸寅1,2 赵文祎3,† 程楚云1,2 Bronte Scheuer1,2 邓杨兰朵1,2 马睿平1,2 张建学1,2

1.北京大学遥感与地理信息系统研究所, 北京 100871; 2.空间信息集成与3S工程应用北京市重点实验室, 北京 100871; 3.中国地质环境监测院, 北京 100081; †通信作者, E-mail: 395447712@qq.com

摘要 针对目前滑坡位移预测模型评价方法中总体性指标区分能力不足, 以及对滑坡高风险期预测效果评价不准确等问题, 设计滑坡位移预测模型快速位移期综合误差(CERDP)和峰值预测误差(PPE)两个补充评价指标以及对应的补充评价技术流程。基于滑坡监测数据的实例研究表明, 所提补充评价指标和应用流程合理可行, 可以有效地应对均方根误差(RMSE)等指标差异不显著带来的评价不准确问题, 遴选出总体性能可靠, 在风险时段和最高风险时点表现更好的模型, 为滑坡风险管理工作提供有效的技术支持。

关键词 滑坡位移预测模型; 评价指标; 补充评价; 快速位移期; 位移峰值

我国地质灾害多发, 其中滑坡灾情尤为严峻, 造成重大的生命和财产损失[1]。基于历史监测数据进行滑坡位移预测, 对减少滑坡灾害可能带来的生命财产损失具有重要意义[2]。得益于智能化方法的不断发展, 非线性模型的拟合学习能力日益强大[3], 在滑坡位移预测工作中得到广泛的应用[4]。既有的滑坡位移预测工作中, 使用的模型种类和优化方法为数众多, 包括支持向量回归(support vector regres- sion, SVR)[5]、极限学习机(extreme learning machine, ELM)[6]和长短时记忆网络(long short term memory network, LSTM)[7]等, 针对模型超参数优化的方法包括灰狼算法(gray wolf optimization, GWO)[8]、粒子群算法(particle swarm optimization, PSO)[9]、遗传算法(genetic algorithm, GA)[10]以及人工蜂群算法(artificial bee colony, ABC)[11]等, 模型拟合能力不断增强。在实际工作中, 需要对众多备选模型进行遴选, 以便指导滑坡风险防范工作。目前常见的评判指标为模型整体预测误差, 其中以均方根误差(root mean squared error, RMSE)最为典型[12–14], 能较好地反映模型的整体拟合能力和预测能力。

随着研究的进展, 大量性能出色的模型在滑坡位移预测中得到应用。许多情况下, 不同模型的整体误差指标差异明显降低, 甚至变得不显著, 说明模型总体预测精度已不分伯仲[15], 此时使用 RMSE指标难以直接完成模型遴选工作。滑坡位移一般分为平稳期和快速位移期[16], 其危险性大不相同。滑坡快速位移期对应滑坡的主要风险期[17], 其中的位移速度峰值点大致对应滑坡风险峰值点, 因此, 应高度关注模型针对滑坡快速位移期和位移速度峰值点的预测能力。

当模型总体精度均处于较高水平, 使用 RMSE指标难以明确地区分模型效果时, 应考虑通过评估模型在滑坡快速位移期的预测精度, 对其效果进行补充评价[18], 遴选出在滑坡主要风险期预测效果占优的模型。如果模型快速位移期的预测效果仍然旗鼓相当, 则应聚焦模型在位移速度峰值点的预测精度, 进一步遴选出在滑坡风险峰值点预测效果更优的模型。依据上述技术思路, 本文针对模型在滑坡位移危险期以及位移速度峰值时段的预测精度, 研究和设计补充评价指标及其应用流程, 对整体预测效果相似的模型进行更深入的补充评价, 定量化地评估其快速位移期预测精度及峰值预测能力, 从而遴选出总体性能可靠、在危险位移期和峰值时段表现更加优异的预测模型, 为滑坡风险管理工作提供有效的技术支持。

1 补充评价指标及应用流程

1.1 快速位移期预测能力评价指标

在实际工作中, 使用两个模型对同一滑坡面进行预测, 可能出现图 1 所示的情况: 两个模型预测结果的 RMSE 值均为 0.37, 但模型 1 在滑坡快速位移期误差较大, 在滑坡平稳位移期误差较小, 而模型 2 在滑坡快速位移期误差较小, 在滑坡平稳位移期误差较大。此时, RMSE 难以评价两个模型预测能力的差异, 显然需要设计一个新的指标, 对模型在快速位移期的预测能力进行补充评价。

计算模型快速位移期预测精度最直观的方式, 是由专家指定位移速度阈值, 提取滑坡位移变化曲线中形变速度大于该阈值的部分作为快速位移期, 然后对该时期的预测误差进行计算[19], 得到快速位移期的均方根误差, 记为 RMSEq, 计算方式如下:

width=152.15,height=41.85 (1)

width=135.8,height=35.25

width=119.55,height=35.25

其中, vq 是根据专家经验确定的滑坡快速位移期的位移速度阈值, n 为总的数据点数量, vii 时刻滑坡位移速度观测值, vi′为 i 时刻滑坡位移速度预测值。RMSEq 表达了模型在滑坡快速位移期的预测精度表现, 可以支持前述补充评价工作。

然而, 人为指定快速位移期的位移速度阈值依赖专家经验, 存在一定的模糊性[20], 并且基于不同位移速度阈值计算得出的 RMSEq也会不同, 因此仅用此指标难以表达模型在位移速度较快时期的总体表现。为解决这一问题, 指定快速位移期位移速度阈值的取值范围为[vmin, vmax], 在该区间遍历所有的观测速度值, 依次作为阈值, 得到每个阈值对应的RMSEq 并进行求和, 从而得到快速位移期的综合误差值(combined error of rapid displacement period, CERDP), 用于综合呈现模型在滑坡位移速度较大时期的总体预测精度。

计算 CERDP 时, 需要根据监测数据生成滑坡位移速度数据集 V, 然后对数据集 V′=[ ]∩V 中所有数值进行递增排列, 得到递增数列 v1, v2, v3, …, vm, 再通过式(2)进行计算:

width=152.75,height=21.45 (2)

实际应用过程中, 积分上限 vmax 一般取监测数据形变速度最高值, 积分下限 vmin 的取值则需要视数据分布情况决定, 应使主要变形过程的速度值包含在[vmin, vmax]区间, 例如可以取位移速度排序前10%左右的数值作为 vmin。CERDP 值越小, 表示模型在指定位移速度阈值区间的总体 RMSE 越低, 对滑坡快速位移时期的综合预测精度越高。

width=354.35,height=155.85

图1 滑坡位移预测结果示意图

Fig. 1 Predicted values of landslide displacement prediction models

CERDP 指标的实际意义为 RMSEq的变化曲线在[vmin, vmax]区间的积分[21]:

width=119.15,height=24.85 (3)

其原理如图 2 所示。当以图 2(a)中绿色虚线对应的形变速度为快速位移期的 vq 时, 将形变速度作为横轴 X, 对应的 RMSEq 作为纵轴 Y, 即可绘制 RMSEq变化曲线(图 2(b)), 其左侧起点对应将最低位移速度作为阈值时的 RMSEq, 也就是整个数据集对应的原始 RMSE 值。该曲线上任意一点(X, Y)表示以 X为阈值 vq 提取快速位移期数据时, 对应的 RMSEq值为 Y。当设定计算 CERDP 所需的[vmin, vmax]区间时, 这个 CERDP 值实际上是图 2(b)中阴影部分的面积[22], 综合表征了该模型在滑坡位移速度较大时期的预测精度。

width=459.2,height=130.4

图2 CERDP计算方法示意图

Fig. 2 Calculation of combined error of rapid displacement period

width=215.4,height=136.05

图3 峰值预测能力示意图

Fig. 3 Ability of peak value prediction

width=215.4,height=127.55

图4 达峰时间及达峰幅度示意图

Fig. 4 Time difference and value percentage of predicted peak values

1.2 峰值预测能力评价指标

如果应用 CERDP 进行补充评价后仍然存在模型效果相当的情况, 则可以依据模型在位移速度峰值点的预测能力进行进一步的补充评价。位移速度峰值点是快速位移期内形变速度最快的时刻, 因而可能也是滑坡风险最大的时间点。图 3 中两个模型的整体预测精度和快速形变期预测精度取值均无显著差异, 其 RMSE 值分别为 1.08 和 1.12, CERDP 值分别为 13.15 和 13.36 (vmin 的取值为滑坡位移速度的前 10%, vmax 的取值为滑坡位移速度最大值)。但是, 两个模型对位移峰值的预测存在明显差异, 模型 1 对峰值的预测天数提前, 且预测值大于监测值, 模型 2 对峰值的预测天数滞后, 且预测值小于监测值。因此, 有必要设计位移速度峰值预测能力评价指标, 对模型预测效果进行补充评价。

为了对模型的峰值预测能力进行评价和对比, 本文综合考虑模型预测数据的达峰时间和达峰幅度, 设计峰值预测误差(peak prediction error, PPE)作为补充评价指标。如图 4 所示, 达峰时间表明模型能否准确地预测出位移速度峰值出现时间, 达峰幅度则表明模型对位移速度峰值预测的准确程度。滑坡监测数据中可能存在多处位移速度峰值, 为了评判模型对全部峰值的综合预测能力, 首先需要找到监测数据中全部峰值, 然后搜索每个峰值点对应的预测峰值点。

在进行本项补充评价时, 模型的总体RMSE指标和快速位移期的 CERDP 指标都不分伯仲, 预测的峰值不存在本质性的偏差。在此前提下, 对峰值的预测有所夸大, 对达峰时间的预测有所提前, 在一定程度上应能更好地帮助减少灾害可能造成的损失[23]。为此, 在计算峰值预测时间以及峰值预测值的误差时, 可以进行加权处理, 减少预测峰值时间偏前以及峰值偏大时误差的权重。

峰值预测误差 PPE 的计算方法如下:

width=206.55,height=28.3 (4)

width=91.7,height=33.45

width=94.3,height=33.45

其中, n 为峰值个数; W(Ti, Vi)为 Ti时刻出现的幅度为Vi的第 i 个峰值点(对应的预测时刻为 Ti′, 预测峰值为 Vi′)的权重, 取值范围为(0, 1], 取值越大表明对应峰值的重要性越大, 实践中可以将最大峰值的权重设置为 1, 其他峰值点的权重依据其峰值与最大峰值的比例来设置, 也可以将所有峰值的权重均设置为 1 (即认为同等重要); Ft(Ti′−Ti)为峰值预测时间加权误差函数; Fv(Vi′−Vi)为峰值预测值加权误差函数; αtβt是达峰时间的加权系数, 分别对应预测时间提前和滞后时误差数值的权重, αvβv 是达峰幅度的加权系数, 分别对应峰值预测值偏大和偏小时误差的权重, 这 4 个系数取值范围均为(0, 1], 取值越大表明在相应情况下产生的误差对模型的负面影响越大, 一般情况下应使 αt <βt, αv <βv

1.3 补充评价应用流程

本文提出的模型补充评价流程如图 5 所示。该流程中, 进行补充评价前, 仍然使用 RMSE 或类似指标对模型整体预测能力进行评价; 当存在多个模型整体 RMSE 指标差异不显著时, 则进入补充评价流程: 首先使用 CERDP 指标对模型快速位移期预测能力进行补充评价, 遴选出快速位移期预测能力优势显著的模型; 如果仍然有多个模型快速位移期预测能力相当, 则使用峰值预测指数 PPE 对模型峰值预测能力进行进一步的补充评价, 以峰值预测能力最强的模型作为遴选结果。

2 实例研究

为了验证本文提出的补充评级指标的可行性和有效性, 我们选择一个典型滑坡位移监测位点开展实例研究。在研究过程中构建多种位移预测模型, 并使用图 5 所示流程对模型开展总体评价和补充评价, 遴选出效果最佳的预测模型。

2.1 预测建模与初步评价

实例研究中所用春辉砖厂滑坡监测点的位移及降雨监测数据来自中国地质环境监测院, 监测工作始于 2021 年 6 月。春辉砖厂滑坡位于甘肃省定西市安定区符家川镇春辉砖厂北侧, 滑坡体长约 100m, 宽约 80m, 平均厚度约为 15m, 坡面呈凸状, 坡度约为 35°, 坡向为 185°, 滑坡体的体积约为 120000m3, 规模等级为中型, 滑坡剖面的结构如图 6 所示。

width=221.15,height=306.1

图5 模型补充评价流程

Fig. 5 Supplemental evaluation process of the proposed model

如图 7 所示, 截至 2023 年 1 月 1 日, 该滑坡面累计位移量的变化较为明显, 位移量时间序列曲线具有阶梯状特点, 明显地分为滑坡平稳期和快速位移期[16]

width=221.15,height=133.2

图6 监测点剖面图

Fig. 6 Profile of the monitored slope

选择在滑坡位移预测领域得到广泛应用的机器学习模型 SVR 和 XGBoost[24], 两个模型分别使用 4种超参数优化方式(GA, PSO, GWO 和 ABC), 共生成 8 个预测模型, 各模型预测精度如表 1 所示。可以发现, 其中 4 个模型(PSO-SVR, ABC-SVR, PSO-XGBoost 和 GWO-XGBoost)的 RMSE 比其他模型有明显优势, 但这 4 个模型误差值的最大差异也小于5.5%, 表明上述 4 个模型的整体预测精度相近, 仅用 RMSE 难以区分模型的预测能力。因此, 应对这4 个模型进行补充评价。

2.2 模型效果补充评价

对上述 4 个整体预测精度相近的模型开展补充评价时, 首先计算模型的 CERDP 值, 对模型在快速位移期的预测精度进行评价和比较。

4 个模型的滑坡位移速度预测结果如图 8 所示,基于曲线形态观察可见 2022 年 10 月前后出现最显著的滑坡快速位移。可以看出, 在这个快速位移期内, PSO-XGBoost 和 GWO-XGBoost 的预测结果比另外两个模型更接近监测值。

width=360,height=172.9

图7 滑坡累计位移和日降雨量监测数据

Fig. 7 Cumulative displacement and daily precipitation values of the slope

表1 滑坡位移预测模型的RMSE指标

Table 1 RMSEs of landslide displacement prediction models

SVRXGBoost GAPSOGWOABCGAPSOGWOABC 9.326.378.196.048.836.166.077.94

width=357.1,height=170

图8 滑坡位移速度预测结果

Fig. 8 Landslide displacement velocity prediction results

根据监测数据的分布情况, 本研究设定 vmin=8.71mm/d(滑坡位移速度前 10%的取值), vmax=83.27mm/d(滑坡位移速度的最大值)。位于该取值区间内的数据点, 实际上对应位移速度最快的(前10%)监测时间点, 代表典型的滑坡快速位移期。据此计算得到的 CERDP 值列于表 2, 可见 PSO-XG-Boost 的误差最小, GWO-XGBoost 的误差与 PSO-XGBoost 只相差 4.97%, 其他两个模型的误差则显著偏大, 均大于 PSO-XGBoost 模型 15%以上。通过 CERDP 指标可以看出, PSO-XGBoost 和 GWO- XGBoost 模型在滑坡快速位移期的预测效果更佳, 与上述对各模型快速位移期预测效果的直接观察分析结果相符。

width=357.1,height=170

红色箭头指示滑坡位移速度峰值监测值

图9 滑坡位移速度峰值预测结果

Fig. 9 Prediction results for landslide displacement velocity peaks

表2 各模型的CERDP指标

Table 2 CERDPs of landslide displacement prediction models

模型CERDP模型CERDP PSO-SVR2553.6GWO-XGBoost2033.9 ABC-SVR2228.5PSO-XGBoost1937.6

由于 PSO-XGBoost 以及 GWO-XGBoost 模型的CERDP 值相差仍然小于 5%, 难以说明两者存在显著的差异, 因此需要计算模型的 PPE 值来评价模型的峰值预测能力。设定滑坡位移速度峰值的取值为监测值的前 5%, 即 vm=10.19mm/d。依据这个阈值设定, 在监测时间段内滑坡位移速度共有 5 个峰值, 如图 9 所示。

观察图 9 中各峰值处两个模型的预测结果可以发现, PSO-XGBoost 对达峰时间的预测更准确, 峰值预测的误差也更小。这两个模型的峰值预测数据见表 3, 其中达峰时间提前为负值, 滞后为正值。

根据峰值预测情况, 利用峰值预测误差计算公式, 将每个峰值点的预测值视为同等重要, 即 W(Ti, Vi)=1。因为峰值预测时间提前在一定程度上优于滞后, 预测峰值幅度偏大总体上优于幅度偏小, 所以将峰值加权系数设定为 αt=0.8, βt=1.0, αv=0.8, βv=1.0。据此计算得到 PSO-XGBoost 的 PPE 值为8.97, GWO-XGBoost 为 11.45, 相差 27.5%, 差异较明显, 说明 PSO-XGBoost 的峰值预测能力更强, 因此遴选 PSO-XGBoost 模型作为最优模型。

上述补充评价结果表明, 在 RMSE 指标占优, 但差异不显著的 4 个模型中, PSO-XGBoost 和 GWO-XGBoost 在快速位移期的预测精度显著优于 PSO-SVR 和 ABC-SVR, 而在 CERDP 指标占优但差异不显著的两个模型中, PSO-XGBoost 的峰值预测能力明显优于 GWO-XGBoost, 因此将 PSO-XGBoost 作为模型遴选的最终结果。

回顾评价流程, PSO-XGBoost 的 RMSE 指标处于第一梯队, 但其绝对数值并非最佳, 如果直接根据 RMSE 数值排序, 则会选择 ABC-SVR 作为最优模型。然而, 在补充评价流程中, PSO-XGBoost 的快速位移期预测能力和峰值预测能力突出, 因此最终被选中。

上述实例研究结果表明, 补充评价流程可以在RMSE 指标差异不显著时, 以模型的快速位移期预测能力(CERDP)和峰值预测能力(PPE)作为补充评价指标, 从而遴选出在滑坡高风险期及最危险时刻表现更好的模型。

3 总结与展望

本文结合滑坡风险管理工作重点关注高风险时段和最高风险时点的核心需求, 在滑坡位移预测模型性能日益提升、总体性评价指标区分能力日益不足的背景下, 提出以位移预测模型在快速位移期和最快位移速度时刻的表现作为补充评价指标, 从而遴选出总体性能可靠、在风险时段和最高风险时刻表现最好的模型, 以期为相关风险管理工作提供更加有效的业务支持。

为了对模型在快速位移期和最快位移时刻的预测效果进行定量评判, 本文提出快速位移期综合误差(CERDP)和峰值预测误差(PPE)作为补充评价指标, 同时设计补充评价的技术流程, 明确了补充评价指标的应用模式, 并选择一个典型滑坡作为实例, 开展验证工作。实例研究结果表明, 本文提出的补充评价指标和流程可以从RMSE指标不具备显著差别的模型中, 进一步遴选出在高危时段和最危险时刻表现更佳的模型, 相关技术指标和流程具有合理性、可行性和有效性。

表3 滑坡位移速度峰值预测数据

Table 3 Prediction results for landslide displacement velocity peaks

日期位移速度峰值监测值/(mm·d−1)PSO-XGBoost预测结果GWO-XGBoost预测结果 位移速度峰值/(mm·d−1)达峰时间/d位移速度峰值/(mm·d−1)达峰时间/d 2022–05–1724.720.1−231.7−2 2022–06–2022.419.6 118.7−1 2022–09–2531.514.1−115.5−1 2022–09–3084.172.5 063.8−1 2022–10–0531.141.1 021.2−1

本文提出的补充评价指标计算过程中, 部分参数仍然需人工干预和判断, 尚无法实现自动化计算。未来的工作中, 将重点结合不同类型滑坡体形变总体特征规律及其主控因素等既有研究成果, 梳理出针对不同类型滑坡的补充指标参数体系, 进一步拓展补充评价指标的适用性。

参考文献

[1] 司康平, 田原, 汪大明, 等. 滑坡灾害危险性评价的 3 种统计方法比较——以深圳市为例. 北京大学学报(自然科学版), 2009, 45(4): 639–646

[2] 高彩云. 基于智能算法的滑坡位移预测与危险性评价研究[D]. 北京: 中国矿业大学(北京), 2016

[3] 庄育龙, 田原, 程楚云. 基于深度神经网络的滑坡危险性评价——以深圳市为例. 地理与地理信息科学, 2019, 35(2): 104–110

[4] 许强, 黄润秋, 李秀珍. 滑坡时间预测预报研究进展. 地球科学进展, 2004, 19(3): 478–483

[5] 杨玲, 魏静, 许子伏. 基于平滑先验法–麻雀搜索算法–支持向量机回归模型的滑坡位移预测——以三峡库区八字门和白水河滑坡为例. 地球科学与环境学报, 2022, 44(6): 1096–1110

[6] Ma Junwei, Tang Huiming, Liu Xiao, et al. Proba-bilistic forecasting of landslide displacement accoun-ting for epistemic uncertainty: a case study in the Three Gorges Reservoir area, China. Landslides, 2018, 15(6): 1145–1153

[7] Zeng Taorui, Jiang Hongwei, Liu Qingli, et al. Land-slide displacement prediction based on variational mo-de decomposition and MIC-GWO-LSTM model. Sto-chastic Environmental Research and Risk Assessment, 2022, 36: 1353–1372

[8] 廖康, 吴益平, 李麟玮, 等. 基于时间序列与GWO-ELM模型的滑坡位移预测. 中南大学学报(自然科学版), 2019, 50(3): 619–626

[9] 姜宇航, 王伟, 邹丽芳, 等. 基于粒子群−变分模态分解、非线性自回归神经网络与门控循环单元的滑坡位移动态预测模型研究. 岩土力学, 43(S1): 601–602

[10] 胡俊涛, 张细香. 基于GA-BP神经网络的滑坡运动距离预测. 化工矿物与加工, 2022, 51(8): 22–26

[11] 杨帆, 许强, 范宣梅, 等. 基于时间序列与人工蜂群支持向量机的滑坡位移预测研究. 工程地质学报, 2019, 27(4): 880–889

[12] Huang F, Huang J, Jiang S, et al. Landslide displace-ment prediction based on multivariate chaotic model and extreme learning machine. Engineering Geology, 2017, 218: 173–186

[13] 王晨辉, 赵贻玖, 郭伟, 等. 滑坡位移EEMD-SVR预测模型. 测绘学报, 2022, 51(10): 2196–2204

[14] 曹博, 汪帅, 宋丹青, 等. 基于蚁群算法优化极限学习机模型的滑坡位移预测. 水资源与水工程学报, 2022, 33(2): 172–178

[15] Wang Y, Tang H, Huang J, et al. A comparative study of different machine learning methods for reservoir landslide displacement prediction. Engineering Geo-logy, 2022, 298: 106544

[16] 刘传正. 累积变形曲线类型与滑坡预测预报. 工程地质学报, 2021, 29(1): 86–95

[17] 梅伟, 顾世祥, 刘鑫, 等. 基于滑坡大变形过程的滑坡定量风险评估方法. 武汉大学学报(工学版), 2022, 55(5): 443–453

[18] 刘鹏, 田原, 李亭, 等. 基于空间聚集度的滑坡危险性区划补充评价——以深圳市为例. 地理与地理信息科学, 2015, 31(4): 47–50

[19] 田原, 庞骁, 赵文祎, 等. 基于Transformer的滑坡短期位移预测模型. 北京大学学报(自然科学版), 2023, 59(2): 197–210

[20] 温宗周, 李璐, 李丽敏, 等. 优化GD-模糊规则的滑坡预报模型研究. 计算机工程与应用, 2019, 55(10): 250–255

[21] Lusted L B. Decision-making studies in patient mana-gement. New England Journal of Medicine, 1971, 284 (8): 416–424

[22] Cortes C, Mehryar M. AUC optimization vs. error rate minimization // Proceedings of the 16th International Conference on Neural Information Processing Sys-tems. Whistler, 2003: 313–320

[23] 陈立华, 羊汉平, 廖丽萍, 等. 容县2010年6月滑坡灾害降雨阈值研究. 自然灾害学报, 2023, 32(1): 228–235

[24] 杨玲, 魏静, 许子伏. 基于平滑先验法–麻雀搜索算法–支持向量机回归模型的滑坡位移预测——以三峡库区八字门和白水河滑坡为例. 地球科学与环境学报, 2022, 44(6): 1096–1110

Supplemental Evaluation of Landslide Displacement Prediction Models

TIAN Yuan1,2, CHANG Xiaoyin1,2, ZHAO Wenyi3,†, CHENG Chuyun1,2, Bronte Scheuer1,2, DENG Yanglanduo1,2, MA Ruiping1,2, ZHANG Jianxue1,2

1. Institute of Remote Sensing and Geographical Information Systems, Peking University, Beijing 100871; 2. Beijing Key Laboratory of Spatial Information Integration and Its Applications, Beijing 100871; 3. China Institute for Geo-Environmental Monitoring, Beijing 100081; † Corresponding author, E-mail: 395447712@qq.com

Abstract The distinguishing ability of typical overall indicators is becoming increasingly insufficient in the evaluation tasks of landslide displacement prediction models while the predicting ability of the models in the high-risk deformation periods has unexpectedly not been paid enough attention. Therefore, two supplemental evaluation indicators for landslide displacement prediction models, combined error of rapid displacement period (CERDP) and peak prediction error (PPE), along with their application process, are accordingly designed. To verify the feasibility and performance of the proposed supplemental evaluation indicators, a case study based on actual landslide monitoring data has been carried out. It can be concluded that the proposed supplemental evaluation indicators and application process are reasonable, feasible, and practical for effectively addressing the evaluation issues caused by insignificant differences in indicators, such as root mean squared error (RMSE), and are able to finally select an overall reliable model which performs best during rapid displacement periods and around peak deformation times, thus providing effective technical support for landslide risk management tasks.

Key words landslide displacement prediction model; evaluation indicators; supplemental evaluation; rapid dis-placement period; peak displacement