北京大学学报(自然科学版) 第61卷 第3期 2025年5月

Acta Scientiarum Naturalium Universitatis Pekinensis, Vol. 61, No. 3 (May 2025)

doi: 10.13209/j.0479-8023.2025.018

国家自然科学基金(42304110)资助

收稿日期: 2025–02–01;

修回日期: 2025–02–21

基于卷积神经网络和双向长短期记忆网络的微地震记录去噪方法

王泰然1 鲍逸非2,†

1.北京邮电大学国际学院电子信息工程专业, 北京 100876; 2.北京邮电大学理学院物理系, 北京 100876; †通信作者, E-mail: byffly@bupt.edu.cn

摘要 提出一种基于卷积神经网络(CNN)和双向长短期记忆网络(BiLSTM)的深度学习模型, 用于时间域波形去噪。选取四川省自贡和内江地区的微震观测数据, 基于该地区的构造模型和震源机制进行数值模拟, 生成无噪声数据集, 并叠加观测微震噪声, 构建模拟含噪声数据集。通过深度学习网络的训练, 获得性能稳定且泛化能力强的去噪模型, 该模型在验证集上也表现优异。与传统去噪方法相比, 所提方法的去噪效果显著提升, 能够更好地保留信号的细节特征和频谱特征。将该模型应用于自贡和内江地区的实际微震观测数据, 结果表明能有效地去除实测数据中的噪声。

关键词 微小地震; 噪声去除; 卷积神经网络(CNN); 双向长短期记忆网络(BiLSTM); 深度学习

地震观测受到自然环境和人类活动产生的各类噪声干扰, 这些噪声不仅影响震相的识别和振幅的精确测量, 还会导致地震定位、地下结构反演和震源机制等研究结果出现偏差。因此, 地震数据去噪一直是地震观测数据处理中的重要环节, 其中微震观测数据的去噪尤为关键[1–2]

微震观测在生产和生活中具有重要且广泛的应用价值。例如, 在非常规油气田开发中, 通过动态监测水力压裂过程中产生的大量微震事件, 可以评估压裂效果, 为优化油气田开发方案提供关键依据[3–4]。在矿山开采领域, 微震观测是预测和防控岩爆的重要手段[5]。火山活动过程中的岩浆运移会引发大量微震事件, 对这些事件的实时观测可以为火山活动的动态监测和喷发预警提供重要的数据支撑[6]。然而, 微震的震级通常小于 3.0, 由于其震源破裂尺度小, 信号持续时间短, 频率较高且能量较弱, 观测数据更容易受到环境噪声和人类活动噪声的干扰, 导致信噪比低, 许多微震事件可能被噪声淹没。因此, 如何有效地去除微震观测记录中的噪声, 成为微震观测数据处理中的一个重要问题。

传统的微震去噪方法主要基于信号与噪声在频率、速度、传播方向和能量等方面的差异, 采用相应的滤波技术进行处理[7]。其中, 基于傅里叶变换的频率域滤波仍然是目前主流的去噪手段。然而, 由于地震高频信号与噪声在频段上发生重叠, 该方法难以取得理想的去噪效果。为此, 研究者将 t-x域数据转换到 f-k 域、τ-p 域或 f-x 域进行滤波处理, 有效地提升去噪效果。此外, 小波变换具有多尺度和多分辨率时频分解的特性, 能够有效地分离噪声[8]。聚束滤波方法则在消除复杂地震资料中的多次波以及其他相关噪声方面表现出色[9]。这些方法在实际应用中面临的主要挑战在于, 需要根据数据特性选择合适的参数来达到理想的去噪效果, 而这一参数的选择过程往往依赖经验性判断, 难以满足大规模数据自动化处理的需求。

近年来, 随着深度学习技术的快速发展, 深度神经网络广泛应用于地震数据去噪领域, 展现出强大的性能和自动化处理优势[10]。Zhu 等[11]提出一种基于深度神经网络的去噪方法, 通过利用信号和噪声的时频域特征差异, 实现对多种噪声的有效处理。Yang 等[12]将深度学习去噪作为预处理步骤, 显著地提升噪声环境下城市地震检测和定位的准确性。Saad 等[13]引入注意力机制, 开发适用于三维地震数据的无监督深度学习去噪模型。Sun 等[14]基于自注意力机制构建深度学习模型, 能够同步去除二维地震数据中的随机噪声并提高分辨率。李从昀等[15]针对无噪声标签数据缺失的问题, 提出 Noise-to-Noise 自监督学习方法, 只需含噪数据即可训练去噪网络。陈天等[16]成功地将深度卷积神经网络应用于二维地震数据的随机噪声压制。刘立超等[17]提出一种基于无监督神经网络的叠前表面多次波匹配算法, 有效地压制表面多次波。上述方法主要针对地震记录的二维时频域图像或二、三维地震数据剖面图像, 充分发挥深度学习方法在图像去噪中的优势。然而, 时频域掩码方法受限于掩码设计, 难以完全分离信号与噪声, 基于地震剖面的方法需要完整道集数据, 无法适用于单道记录场景。

为解决上述问题, 考虑到地震波形记录是具有时间依赖性的序列数据(地震波的传播和衰减过程均表现出明显的时间依赖性), 同时注意到同一地震事件在不同时刻记录的各类震相, 其到时与波形特征之间存在密切的关联, 本文基于时间域开展微震波形数据去噪研究。针对时序数据特性, 本文融合两种深度学习算法的优势, 卷积神经网络(convo-lutional neural network, CNN)[18]擅长提取序列的局部特征(如波形的峰值和谷值等短时模式), 双向长短期记忆网络(bidirectional long short-term memory, BiLSTM)[19]能有效地建模时间序列的长期依赖关系。基于此, 我们提出结合 CNN 和 BiLSTM (CNN+ BiLSTM)的时间域微地震记录去噪方法。

2020—2022 年期间, 四川自贡和内江页岩气开采区记录到上万次微震事件, 其中许多记录因信噪比较低而严重地影响数据利用效果。为解决这一问题, 本研究首先基于该地区结构模型和震源机制进行数值模拟, 生成无噪声地震数据集; 然后从实际微震记录中提取典型噪声片段, 将其叠加到模拟数据中, 构建含噪声训练集; 进而利用该数据集训练深度神经网络, 并利用验证集检验模型的性能和泛化能力。最后, 将该方法应用于自贡和内江地区实际微震数据, 验证其对观测数据的去噪能力。

1 结合 CNN 与 BiLSTM 网络的深度学习框架

1.1 学习任务

实际记录的地震数据y可以表示为

width=43.8,height=13.25 (1)

其中, x 为无噪声的干净数据, n 为记录中包含的噪声数据。深度学习网络通过建立实测数据 y 与无噪声数据 x 之间的映射关系, 实现数据去噪, 其输出可表示为

width=62.2,height=15.55 (2)

其中, Net(⋅)表示网络模型, Θ={W, b}表示网络参数。去噪的目标是通过优化式(2)中的参数 Θ, 使得网络能够将含噪输入 y 映射为去噪后的估计值width=9.2,height=13.25。对应的损失函数定义为

width=203.95,height=28.8 (3)

其中, N 为训练集的数据对数量, l 为网络输出width=6,height=12与无噪声数据 x 之间的误差。

本文采用 CNN+BiLSTM 去噪方法, 通过优化式(3)中的损失函数完成网络训练。如图 1 所示, 工作流程包含 3 个主要步骤: 1)数据输入阶段, 向网络分别输入无噪声数据和含噪声数据; 2)特征处理阶段, 将 CNN 作为特征提取器, 对一维地震波形进行卷积操作, 提取局部特征和多尺度特征。这些特征既能够有效地捕捉波形细节信息, 又可初步滤除部分高频噪声; 3)时序建模阶段, 将 CNN 提取的特征输入 BiLSTM, 利用其双向结构, 建模时间依赖关系, 准确地识别不同震相的时间顺序和模式, 最终生成去噪后的波形数据。最后, 对模型的性能进行评估。

1.2 CNN和BiLSTM网络结构

本研究的网络输入为一维地震波形的时间序列数据。在模型中, CNN 和 BiLSTM 用串联的方式连接, 分别用于提取时间序列数据的不同层次特征。CNN 通过 1D 卷积层提取时间序列的局部特征。卷积核沿时间维度滑动, 能够有效地捕捉时间序列中的局部模式(如峰值和波动等)。采用的 Conv1D 网络包含 5 个卷积层, 每层使用大小为 3 的一维卷积核, 卷积核的数量逐层增加(分别为 32, 64, 128, 256和 512), 以便逐步提取更高级别的特征。所有卷积层均采用步幅为 1 的“same”填充方式, 确保特征图的尺寸与输入保持一致。每层卷积操作后进行批量归一化(batch normalization)处理, 以便加速训练, 并提升模型的稳定性。随后, 通过 ReLU 激活函数引入非线性, 进一步增强特征表达能力。这种层次化结构使网络能够逐步提取地震数据中的有效信号特征, 同时抑制噪声干扰。随后, 将这些特征输入BiLSTM 网络中, 利用其双向结构的特性, 进一步提取全局时序动态特征, 最终实现对微震数据的有效去噪。

width=66.35,height=152.4

图1 基于CNN与BiLSTM的去噪方法流程

Fig. 1 Workflow of CNN+BiLSTM-based denoising method

本文采用 BiLSTM 来建模地震信号中的长期时间序列依赖关系。该网络包含两个隐藏层, 每层的维度为 64。BiLSTM 同时考虑过去和未来的信息, 能有效地捕捉时间序列中的前后关系, 其核心机制是通过输入门、遗忘门和输出门来记住或遗忘时间序列中的信息, 从而解决长距离依赖问题。当使用多层 LSTM 时, 我们引入 Dropout 机制来防止过拟合。网络输入来自 CNN 提取的特征, 这些特征经过卷积网络处理, 已包含丰富的局部信息。在此基础上, BiLSTM 进一步提取全局时间序列特征, 最后通过全连接层映射到目标输出维度, 完成去噪任务。这种结合 CNN 与 BiLSTM 的设计充分发挥CNN 的局部特征提取能力和BiLSTM的时间序列建模能力, 能够有效地处理地震波形中的复杂噪声, 同时保留有效信号。

模型的输入为一个批次的时间序列微震波形数据。首先, CNN 对输入的时间序列进行卷积操作, 并提取局部特征。然后, 通过多层卷积处理, 将提取的特征转换为适合 BiLSTM 输入的格式。接着, BiLSTM 接收这些特征, 并进一步捕捉时间序列中的长期依赖关系。最后, 通过全连接层, 将BiLSTM的输出映射到目标输出维度。

1.3 损失函数和优化、正则化策略

采用结构相似性指数(structural similarity index measure, SSIM)度量去噪后波形width=6,height=12和无噪声波形width=6,height=12的差异, 其表达式为

width=177.4,height=30.55 (4)

其中, width=13.25,height=15.55width=13.25,height=15.55分别为两个信号的均值, width=29.95,height=15.55width=15.55,height=15.55分别为两个信号的方差和协方差, C1C2 为稳定常数。SSIM 的取值范围为[–1, 1], 因此式(3)中的损失函数定义为 width=57.6,height=15.55, 其目标是最大化地去噪信号与无噪声信号之间的结构相似性[20]

采用 Adam 优化器优化损失函数, 初始学习率设为 0.001。在训练过程中, 使用 ReduceLROnPla-teau 学习率调度器, 动态地调整学习率, 如果验证损失在连续 3 个轮次内未下降, 调度器会将当前学习率乘以 0.5 进行衰减。这种机制能够在模型训练进入平台期时, 通过降低学习率进行更精细的参数优化, 既有助于避免陷入局部最优解, 又能提高模型的收敛效果和稳定性。

2 模型的训练

2020—2022 年期间, 四川省自贡市与内江市交界区域发生大量微震活动。在该地区布设的 50 多台密集分布的 MEMS 地震仪记录到一万余次微震事件(图 2), 其中绝大部分震级小于 3.0, 且信号信噪比很低。为更好地把这批数据用于地震学和地震工程学的研究中, 需要对其进行有效的噪声去除。我们将上述基于 CNN+BiLSTM 的深度神经网络方法应用于该数据集。

2.1 训练集数据

网络训练所需输入数据包括原始观测波形数据和无噪声波形数据, 但无法直接从观测数据中获取无噪声数据。为此, 本文基于该地区的速度结构模型和已有微震震源特征研究结果, 构建符合该地区特点的数值模型。通过数值模拟, 生成图 2 所示地震事件范围内的模拟数据, 作为无噪声数据(图 3)。

width=467.65,height=393.25

图2 四川省自贡市与内江市交界地区的台站和部分微震震中分布

Fig. 2 Distribution of seismic stations and some micro-seismic epicenters in the border regions of Zigong City and Neijiang City, Sichuan Province

width=476.3,height=150.7

图3 模拟震源深度为3.0 km的微地震的地表加速度

Fig. 3 Synthetic ground acceleration for micro-earthquake with a focal depth of 3.0 km

采用 Lai 等[21]提出的分层速度模型。该地区记录到的已定位微震的震源深度范围为 1~7km, 震源分布相对集中, 观测台站的震中距在 20km 以内。已定位的震源分布和 3.0 级以上地震的震源机制表明, 微震活动受到构造控制[21]

训练集的完备性体现在数据多样性和分布一致性两个方面。数据的多样性要求训练集应涵盖任务中可能出现的各种情况。数据分布的一致性要求训练样本集的数据分布与实际应用场景中的数据分布一致。如果两者存在较大的差异, 模型的性能可能会下降。为确保数值模拟的数据集能够准确地反映观测数据的特征, 并全面覆盖任务中可能出现的所有情况, 我们共模拟 6 个地震记录。考虑到实际地震的深度范围为 1~7km, 本文在该深度范围内每隔1km模拟一个地震记录, 地震的震源机制设定充分考虑当地微震的特征, 断层走向参照实际构造方向, 断层倾角随深度增加而变缓。由于已知该区域震源机制几乎都为逆冲断层[21], 因此将 6 个模拟地震设为具有不同滑动角度的逆冲断层。为使模拟数据更好地代表实际数据的采样特征, 在遵循上述原则的基础上随机选取震源参数, 以便获得符合该地区背景特征的无噪声数据样本。表 1 列出 6 个模拟地震的震源参数。

为符合实际台站的震中距分布情况, 在每次地震的震中距 20km 范围内设置 500 个观测台站, 台站间距为 0.04km, 确保模拟结果包含不同的地震信号特征。图 3 展示震源深度为 3km 的部分台站水平分量和垂直分量的无噪声模拟数据, 该无噪声数据集包含 6 个地震的模拟结果, 共计 3000 条记录。

为充分体现研究区域的噪声特征, 我们从观测数据中提取丰富的噪声样本, 将其添加到无噪声的合成数据中, 用于构建含噪声的模拟数据集。随后, 将这两个数据集输入网络进行模型训练。为保证噪声样本的多样性, 从观测数据中随机挑选20条噪声段数据, 选取方式如下: 在 2.0~2.8 级地震范围内, 每隔 0.1 级选取 2 条数据(共 18 条), 并从 2.9 和 3.0 级地震中各选取 1 条数据。对每条数据, 通过随机调整振幅比例, 生成 150 种不同强度的噪声信号, 20条噪声记录, 共生成 3000 条噪声信号。然后, 对模拟数据的波形振幅进行归一化处理, 将噪声信号的最大振幅调整为 0.4, 再将生成的噪声信号与模拟的无噪声信号叠加, 生成3000条含噪声的模拟信号数据。为保持与无噪声模拟数据的时长一致(图 3), 将图 4 中噪声信号段通过首尾相接的方法延长至 10s, 再进行数据叠加。

表1 模拟地震的震源深度与参数

Table 1 Focal depth and parameter for the earthquakes used in modeling

编号震源深度/km走向/(°)倾角/(°) 滑动角/(°) 11.0 3080 60 22.0 4570110 33.013060 30 44.014565 50 55.0 1050 45 66.034545135

2.2 训练结果

本文设计的深度网络以含噪声的模拟数据为输入, 以对应的无噪声数据为目标输出进行训练。我们从 3000 条数据中随机选取 80%作为训练集, 其余20%作为验证集。经过多次训练和测试, 确定当前实验条件下表现最优的超参数组合(表 2), 并训练出在验证集上性能最佳的模型。

width=473.05,height=414.95

每幅子图的右上角标注台站名称、震级和发震日期; 黑色曲线为原始数据, 灰色曲线为选取的噪声信号段

图4 10条原始微震记录波形与选取的噪声信号段

Fig. 4 Ten original micro-earthquake waveforms and the selected noise

如图 5 所示, 最优模型训练损失与验证损失的变化趋势非常一致, 表明模型泛化能力良好。经过5 次训练, 最优模型训练损失值和验证损失值从0.97 左右迅速下降到 0.05 左右, 随后保持平稳下降趋势, 表明模型在训练集和验证集上的拟合持续改善, 优化过程稳定且一致, 反映模型已逐渐掌握有效的去噪策略, 并展现出良好的优化性能。在第 20轮训练时, 学习率从 0.001 降至 0.0005, 第 24 轮时进一步降至 0.00025, 到第 28 轮时则降至 0.000125。这种逐步降低的学习率策略有助于模型在训练后期更好地收敛。调整后, 训练损失和验证损失继续下降, 表明学习率调整取得预期效果。

表2 通过训练得到的最优超参数值

Table 2 Optimal hyperparameter values obtained through training

训练集比例批量大小输入维度隐藏层维度循环层数输出维度暂退率初始学习率训练轮次 0.832164210.10.00130

width=277.55,height=166.1

图5 训练损失和验证损失随训练次数的变化

Fig. 5 Variation of training loss and validation loss with the number of training rounds

为评估模型的去噪性能, 我们利用去噪后的数据、无噪声的目标数据和输入的模拟噪声数据, 分别计算训练集和验证集数据的平均信噪比(SNR), 结果如图 6 所示。

信噪比采用有效信号和噪声的功率来计算

width=83,height=30.55 (5)

其中 PsPn 分别为有效信号 s 和噪声 n 时间窗口内波形的功率, 计算公式为

width=133.65,height=28.8 (6)

其中, NM 分别为有效信号和噪声时间窗口内的数据点数。模拟含噪波形的信噪比通过噪声数据和无噪声数据直接计算得到, 训练过程中信噪比的变化则采用训练所得数据和噪声数据进行计算。所有的计算均基于整条记录的 2048 个全时程数据点。

训练集的 SNR 整体上呈上升趋势, 从第 1 轮的–17.52dB 开始, 到第 3 轮变为正值, 并在第 30 轮升至 13.24dB, 表明模型在训练集上的去噪效果显著提升。验证集的 SNR 也呈现上升趋势, 从第 1 轮的–18.76dB 开始, 到第 4 轮变为正值, 并在第 30 轮升至 10.98dB, 表明模型在验证集上的去噪效果也显著提升。随着学习率的调整, 训练集和验证集的SNR 的改善量也逐渐增加, 表明学习率调整有效。

较高的训练集 SNR 改善和较低的训练损失, 表明模型能够较好地拟合训练数据, 并掌握有效的去噪策略。验证集的 SNR 改善略低于训练集, 两者变化趋势一致, 表明模型在未见数据上也表现良好。验证损失略高于训练损失, 两者整体上呈平稳下降趋势, 表明模型的泛化能力良好。

width=471.7,height=144

绿色实线和虚线分别为训练集的初始信噪比(4.44 dB)和验证集的初始信噪比(5.46 dB)

图6 训练集和验证集信噪比(a)和信噪比改善量(b)随训练次数的变化

Fig. 6 Variation of SNR (a) and SNR improvement (b) for the training and validation set with the number of training rounds

为根据波形直接评估模型的去噪能力, 从验证集中随机挑选 5 条去噪波形, 与相应的无噪声目标波形对比, 结果如图 7 所示。去噪波形与目标波形在波形形状、振幅大小和震相到时方面均吻合良好, 并且对于不同振幅的震相, 都呈现很好的一致性, 表明本文训练得到的模型具有良好的去噪能力, 同时能有效地保留波形的细节特征。

2.3 与其他方法的对比

为验证模型在训练集和验证集之外数据上的性能, 通过数值模拟生成新的无噪声数据集, 并从观测数据中获取新的噪声数据。将两者叠加后得到新的含噪声数据, 用于评估模型的去噪性能。我们将本文提出的方法与传统的基于小波变换(Wavelet)和傅里叶变换(Fourier)的去噪方法进行对比, 评估其去噪性能。

width=400.1,height=495.85

每个子图的右上角数字表示波形在验证集中的序号, 黑色曲线为含噪波形, 蓝色曲线为目标无噪波形, 红色曲线为模型去噪后的波形

图7 5条验证集去噪波形与无噪声目标波形的对比

Fig. 7 Comparison of 5 denoised waveforms selected from validation set with the target clean waveform

模拟地震的震源深度为 3.5km, 震源破裂面的走向、倾角和滑动角分别为 110°, 35°和 65°。图 8为基于该地震模型, 选取震中距为 1.0, 5.0, 10.0 和15.0km 的波形数据, 分别用上述 3 种去噪方法进行对比分析的结果。经 CNN+BiLSTM 去噪方法处理后, 不同震中距的波形都能与目标波形较好地吻合, 不仅完整地保留地震信号的振幅、到时和细节特征, 还能有效地去除背景低频噪声和虚假信号, 显著地提高信噪比。基于小波变换的滤波方法能较好地保留信号的振幅和到时特征, 但难以消除背景低频噪声和虚假信号。基于傅里叶变换的滤波方法因信号与噪声频段重叠, 可能导致较强的噪声残留。相比之下, 本文提出的去噪方法在保留波形细节特征方面展现独特的优势, 这一点从信号的傅里叶频谱中也可以得到验证。选取 10.0km 处的一条记录进行去噪结果对比, 图 9 展示模拟无噪信号的频谱和加噪声信号的傅里叶振幅谱, 可见观测噪声具有较宽的频率分布。图 10 给出 3 种方法去噪后波形的傅里叶振幅谱, 可见本文方法能较好地保留无噪声信号的频谱特征, 而基于小波变换和傅里叶变换的滤波方法都残留部分噪声信号。对比 3 种去噪波形的信噪比(表 3)可见, 相较于另外两种方法, 本文方法在 4 个距离上均表现出更好的去噪效果, 特别是在处理低信噪比含噪信号时, 本文方法能实现更大的信噪比改善量, 凸显本文方法在处理低信噪比和强噪声信号方面的显著优势。

width=402.5,height=513.35

从上至下分别为1.0, 5.0, 10.0和15.0 km震中距的波形; 黑色曲线为含噪波形, 蓝色曲线为目标无噪波形, 红色曲线为模型去噪后的波形

图8 本文提出的CNN + BiLSTM去噪方法分别与基于小波变换和傅里叶变换的滤波方法的比较

Fig. 8 Comparison between the denoising method (CNN + BiLSTM) proposed in this paper, and filtering methods based on wavelet transform and Fourier transform, respectively

3 对实际观测数据的应用

我们将本文提出的 CNN+BiLSTM 去噪方法应用于四川自贡和内江地区的微震观测数据。随机选取 5 个覆盖整个观测区域、信噪比较低的台站记录数据, 对应微震事件的震级分别为 2.0, 2.1, 2.2, 2.3和 2.4。

为检验本文方法的去噪性能, 同时采用上述小波变换和傅里叶变换滤波方法进行处理, 并对结果进行对比分析。图 11 展示 5 个台站实际观测数据的去噪结果对比, 可见原始记录信噪比较低, 有效信号被强噪声淹没, 本文方法的去噪结果清晰地显示了有效信号的振幅、到时和细节特征。基于小波变换的去噪方法能够有效地保留波形特征, 但会残留部分低频背景噪声和虚假信号; 基于傅里叶变换的滤波方法因信号与噪声频段重叠, 去噪效果较差。

通过对比去噪前后的信噪比来评估本文方法和传统方法的去噪效果。实际数据的信噪比计算方法与上述模拟数据的计算方法有所不同, 主要区别在于实际数据没有无噪声的原始数据作为参考。因此, 在使用式(5)和(6)计算信噪比时, PsPn 分别表示同一条波形记录中有效信号 s 和噪声 n 所在时间窗口的功率, Pn 取自有效信号到达之前的记录段, 而Ps 取自包含有效信号的记录段。对去噪前后的数据分别采用相同的时间窗计算信噪比, 并进行比较。具体而言, 针对每条原始记录和去噪后的波形, 分别计算信号段和噪声段的功率, 进而求得信噪比。如表 4 所示, 经本文方法去噪后的信号信噪比显著高于基于小波变换和傅里叶变换去噪的结果。3 种去噪方法的效果存在明显差异, 本文提出的 CNN+ BiLSTM 去噪方法对 5 条记录去噪后, SNR 的增加量介于 20~30 dB 之间, 基于小波变换去噪方法处理后的 SNR 的增加量介于 6~14dB 之间, 而基于傅里叶变换去噪方法处理后的 SNR 的增加量介于 3~5dB之间。该结果与表 3 中模拟数据的对比分析结果一致, 表明本文结合 CNN 与 BiLSTM 的去噪方法对实测的低信噪比微震数据具有优良的处理性能。

width=476.3,height=155.4

(a)无噪声模拟信号; (b)叠加上实测噪声后的模拟含噪信号

图9 震中距离为10.0 km的波形的傅里叶振幅谱

Fig. 9 Fourier amplitude spectrum for waveform at epicentral distance of 10.0 km

width=476.3,height=278.4

图10 3种方法计算震中距离为10.0 km时波形的傅里叶振幅谱的比较

Fig. 10 Comparison of the Fourier amplitude spectrum for waveform at epicentral distance of 10.0 km calculated for three methods

表3 3种方法去噪前后的波形信噪比对比

Table 3 Comparison of SNR before and after denoising by three methods

震中距/km信噪比/dB含噪波形CNN+BiLSTMWaveletFourier 1.00.240.250.230.13 5.01.522.131.840.96 10.0–0.556.623.541.25 15.0–6.377.981.55–1.35

针对研究区 2.0~3.0 级微震的所有记录(共 9084条), 采用本文提出的方法进行去噪处理, 并对去噪结果开展统计分析与对比, 全面地检验其对实际数据的去噪效果。图 12 展示原始数据和去噪后数据的信噪比分布, 除极个别无效观测数据的信噪比小于 0 外, 研究区内微震记录去噪后的信噪比均显著提高, 数据质量大幅度提升。原始数据中, 信噪比小于 10dB 的数据(质量差)占比达到 66.47%, 信噪比在 10~30dB 之间的数据(质量中等)占比为27.50%, 信噪比高于 30dB的数据(质量好)占比仅为0.62%。由于研究区域内微震观测数据的噪声水平较高, 可能会对地震事件和震相的准确识别产生影响。经过本文方法去噪后, 数据信噪比显著提升。其中, 信噪比小于 10dB 的数据占比降至 22.22%, 10~30dB 的数据占比达到 31.44%, 高于 30dB 的数据占比升至 42.38%, 尤其是高于 40dB 的高质量数据, 占比达到 27.18%。采用本文方法去噪后, 信噪比的提升幅度处于 20~30dB 之间, 与表 4 中 5 个地震的情况一致。

4 结论与讨论

本文结合 CNN 和 BiLSTM 深度神经网络, 提出适用于微地震信号的时间域去噪方法。该方法利用CNN 的局部特征提取能力和BiLSTM的时间序列建模能力, 不仅能够有效地处理地震波形中的复杂噪声, 还能保留有效信号。本研究基于四川省自贡和内江地区的大量微震观测数据, 通过该地区速度模型和震源机制数值模拟生成无噪声波形数据集, 再叠加实际微震噪声构成模拟噪声数据集, 并用于模型训练。网络学习到的微震去噪模型的性能良好且稳定, 在验证数据集上表现出良好的泛化能力。与基于小波变换和傅里叶变换的传统滤波方法相比, 本文方法能够更有效地保留波形的细节和频谱特征, 展现优良的性能。将该方法应用于四川省自贡和内江地区的实际微震观测时, 也表现出比传统方法更优秀的去噪能力。本文方法避免了传统方法中依赖人为经验选取参数的问题, 能够对海量微震观测数据进行高效的自动去噪处理, 显著地提升去噪效率。

width=399.95,height=609.35

每组图顶部的子图为原始数据, 右上角标记观测台站的代码、震级和发震日期; 下面3幅子图分别为3种去噪方法的结果

图11 研究区域内5条微震记录的去噪波形对比

Fig. 11 Comparison of denoised waveforms for 5 micro-earthquake recordings within the study area

表4 3种方法对5个观测波形去噪前后的信噪比

Table 4 SNRs before and after denoising with three methods for five observed waveforms

台站编号信噪比/dB含噪波形CNN+BiLSTMWaveletFourier RX113.5023.839.486.44 RX314.5426.1316.219.55 WY094.4737.1816.379.70 RX374.6528.7313.168.92 RX179.5638.9623.0914.51

width=309.95,height=191.15

图12 研究区内全部微震观测数据去噪前后信噪比变化直方图

Fig. 12 Histogram showing SNR changes of all micro-earthquake observation data in the study area before and after denoising

参考文献

[1] Mousavi S M, Langston C A, Horton S P. Automatic microseismic denoising and onset detection using the synchrosqueezed continuous wavelet transform. Geo-physics, 2016, 81(4): V341–V355

[2] 代丽艳, 董宏丽, 李学贵. 微地震数据去噪方法综述. 吉林大学学报(地球科学版), 2019, 49(4): 1145–1159

[3] Maxwell S C, Rutledge J, Jones R, et al. Petroleum reservoir characterization using downhole microseis-mic monitoring. Geophysics, 2010, 75(5): 75A129–75A137

[4] 翟尚, 喻志超, 谭玉阳等. 基于波形聚类分析的微地震监测事件类型判别及应用. 北京大学学报(自然科学版), 2020, 56(3): 406–416

[5] Mendecki A J. Keynote address: real time quantitative seismology in mines // Proceedings of the 3rd Interna-tional Symposium on Rockbursts and Seismicity in Mines. Kingston, 1993: 287–295

[6] Tepp G, Dziak R P, Haney M M, et al. Seismic and hydroacoustic observations of the 2016–17 Bogoslof eruption. Bulletin of Volcanology, 2020, 82(4): 1–21

[7] 张军华, 吕宁, 田连玉, 等. 地震资料去噪方法技术综合评述. 地球物理学进展, 2006, 21(2): 546–553

[8] Gaci S. The use of wavelet-based denoising techniques to enhance the first-arrival picking on seismic traces. IEEE Trans Geosci Remote Sensing, 2014, 52: 4558–4563

[9] 胡天跃, 王润秋, White R E. 地震资料处理中的聚束滤波方法. 地球物理学报, 2000, 43(1): 105–115

[10] Yu S, Ma J, Wang W. Deep learning for denoising. Geophysics, 2019, 84(6): V333–V350

[11] Zhu W, Mousavi S M, Berozam G C. Seismic signal denoising and decomposition using deep neural net-works. IEEE Transactions on Geoscience and Remote Sensing, 2019, 57(11): 9476–9488

[12] Yang L, Liu X, Zhu W, et al. Toward improved urban earthquake monitoring through deep-learning-based noise suppression. Science Advances, 2022, 8(15): eabl3564

[13] Saad O M, Oboué Y A S I, Bai M, et al. Self-attention deep image prior network for unsupervised 3-D seismic data enhancement. IEEE Transactions on Geoscience and Remote Sensing, 2022, 60: 1–14

[14] Sun Q, Feng Y, Du Q, et al. Removing random noise and improving the resolution of seismic data using deep-learning transformers. Geophysical Prospecting, 2025, 73(2): 611–627

[15] 李从昀, 朱亚洲, 杨晓, 等. 基于Noise-to-Noise自监督学习的地震数据去噪方法. 地球物理学进展, 2023, 38(2): 0662–0676

[16] 陈天, 易远元. 基于深度卷积神经网络的地震数据随机噪声压制. 地震学报, 2021, 43(4): 474–482

[17] 刘立超, 胡天跃, 李徯徯, 等. 基于无监督神经网络匹配算法的叠前表面多次波压制方法. 北京大学学报(自然科学版), 2024, 60(3): 453–463

[18] LeCun Y, Bengio Y, Hinton G. Deep learning. Nature, 2015, 521: 436–444

[19] Schuster M, Paliwal K K. Bidirectional recurrent neu-ral networks. IEEE Transactions on Signal Processing, 1997, 45(11): 2673–2681

[20] Zhao H, Gallo O, Frosio I, et al. Loss functions for image restoration with neural networks. IEEE Transac-tions on Computational Imaging, 2017, 3(1): 47–57

[21] Lai G, Jiang C, Wang W, et al. Spatial-temporal distri-bution and focal mechanisms for the shallow earth-quakes in the Rongchang-Luxian region in southern Sichuan basin, China. Seismological Research Letters, 2023, 94: 1860–1876

Micro-earthquake Recording Denoising Method Based on Convolutional Neural and Bidirectional Long Short-term Memory Network

WANG Tairan1, BAO Yifei2,†

1. Electronic Information Engineering Program, International School, Beijing University of Posts and Telecommunications, Beijing 100876; 2. Department of Physics, School of Science, Beijing University of Posts and Telecommunications, Beijing 100876; †Corresponding author, E-mail: byffly@bupt.edu.cn

Abstract This paper proposes a deep learning-based time-domain denoising method for micro-earthquake recor-dings by combining a convolutional neural network (CNN) and a bidirectional long short-term memory network (BiLSTM). Based on micro-earthquake observation data from Zigong and Neijiang areas of Sichuan, the structural model and focal mechanism of the region are used to generate a synthetic noise-free dataset by numerical modeling, which is then combined with observed micro-earthquake noise to create a synthetic noisy dataset. A high-performance and stable denoising model is obtained through training of the deep learning network, demonstrating excellent generalization performance on the validation set. Compared with traditional methods, the proposed method demonstrates excellent denoising performance and better preserves the detailed characteristics of both the waveform and the spectrum of the noise-free signal. Application to micro-earthquake observation data of Zigong and Neijiang areas demonstrates the model’s strong denoising performance and generalization ability on real-world data.

Key words micro-earthquake; denoising; CNN; BiLSTM; deep learning