北京大学学报(自然科学版) 第60卷 第3期 2024年5月
Acta Scientiarum Naturalium Universitatis Pekinensis, Vol. 60, No. 3 (May 2024)
doi: 10.13209/j.0479-8023.2024.031
国家自然科学基金(42274163)、国家重点研发计划(2018YFA0702503)和中国石油天然气集团有限公司–北京大学基础研究项目资助
收稿日期: 2023–06–12;
修回日期: 2023–09–15
摘要 为了有效地压制海上地震勘探数据中的表面多次波, 实现勘探目标的正确成像, 提出一种基于无监督神经网络的叠前表面多次波匹配算法, 将神经网络方法与表面相关多次波压制方法相结合, 通过设定学习率不断下降, 用无监督神经网络取代匹配滤波算子, 对叠前地震数据进行表面多次波的压制, 既不需要传统的匹配算法, 也不需要在标签数据集上进行训练。在简单合成数据、Sigsbee 模型数据和实际数据上的应用结果验证了该方法对表面多次波压制的有效性。
关键词 无监督神经网络; 表面多次波压制; 叠前地震数据; 匹配算法
随着勘探技术的发展和中国油气资源需求的快速增加, 我国海上油气勘探逐渐成为地震勘探领域的研究热点。就海上地震数据而言, 由于海水表面的存在, 导致自由表面多次波发育, 会对有效波信号造成很强的干扰, 影响最终成像的效果。因此, 对自由表面多次波进行压制, 是处理海上地震数据的重要环节。
在现有的多次波压制技术中, Berkhout等[1]提出的基于波动方程的表面相关多次波压制(surface-related multiple elimination, SRME)方法完全基于数据驱动, 不需要任何先验的地下信息, 且容易实现, 在工业界得到广泛应用。
SRME 方法通常包含两个步骤: 第一步基于波动方程, 利用原始地震数据对表面多次波进行预测, 得到预测表面多次波模型; 第二步利用自适应匹配相减方法, 将预测表面多次波模型与原始地震数据进行匹配, 再从原始地震数据中减去匹配后的模型, 得到不含表面多次波的数据。匹配的作用是对预测模型的振幅和相位等进行调整, 以便与原始地震数据中的表面多次波更好地拟合。因此, SRME 算法严重依赖于匹配算法, 如 L2 范数匹配算法[2]、扩展多道匹配算法[3]、均衡拟多道匹配算法[4]、L1 范数匹配算法[5]、均衡多道 L1 范数匹配算法[6]、均衡拟多道 L1 范数匹配算法[7]、混合 L1 范数和 L2 范数的匹配算法[8]等。匹配算法不同, 则对表面多次波的压制效果不同, 计算效率也不一样。
近年来, 随着人工智能技术在图像识别领域的快速发展, 深度学习方法越来越频繁地应用于勘探地球物理领域。神经网络技术已经应用于随机噪声压制[9–10]、初至拾取[11]、多震源分离[12]、断层识别[13]和速度谱拾取[14]等多个方面, 基于神经网络的多次波压制算法也被提出。Siahkoohi 等[15]将基于稀疏约束的一次波估计方法的处理结果作为标签数据, 通过训练得到能够应用于表面多次波压制的有监督神经网络。宋欢等[16]利用具有卷积编码和卷积解码的 U-net 网络, 在大量标签数据上训练得到具有多次波压制能力的网络模型。Li 等[17]提出一种基于卷积神经网络的特征识别算法, 先用卷积神经网络对预测表面多次波模型进行特征拾取, 再用L1 范数匹配算法, 将提取到的多次波的特征与原始地震数据进行匹配, 取得更好的多次波压制效果。Tao 等[18]在 U-net 中引入自注意力机制, 分别在合成数据和实际数据上完成对表面多次波的分离。
为了在不利用标签数据和传统匹配算法的前提下实现对叠前表面多次波的压制, 本文结合 SRME方法和神经网络方法, 提出一种基于无监督神经网络匹配算法的叠前表面多次波压制方法。首先通过SRME, 计算得到预测表面多次波模型, 然后将预测模型输入无监督神经网络, 通过迭代更新网络中的参数, 不断降低网络输出与原始地震数据之间的损失函数, 最后从原始地震数据中减去经过无监督神经网络匹配后的输出结果, 完成对表面多次波的压制。
SRME 方法能够直接利用叠前地震数据构建预测表面多次波模型。图 1 和式(1)描述利用共炮点道集和共接收点道集求取预测表面多次波的原理。
其中, m 表示预测表面多次波模型; xs 和 xr 分别为炮点 s 和检波点 r 对应的横坐标值, xk 为桩号 k 对应的横坐标值; P(xk, xs, t)表示以 xs 为炮点, 在 xk 点接收到的含表面多次波的地震数据; P0(xr, xk, t)表示以 xk为炮点, 在 xr 点接收到的不含表面多次波的地震数据, t 表示时间。在实际运用中, P0(xr, xk, t)是无法直接得到的, 通常用含表面多次波的地震数据 P(xr, xk, t)代替。
通过式(1)得到的预测表面多次波模型与原始地震数据中的真实表面多次波并不一致, 两者在振幅、相位、到时以及频带等方面都存在差异, 所以还需要再采用自适应匹配相减方法减去多次波, 才能达到压制多次波的目的。目前应用较为广泛的自适应匹配相减方法包括 L2 范数方法[2]和 L1 范数方法[5], 两者都需要先求取合适的匹配滤波器, 再将求取到的匹配滤波器与预测表面多次波模型进行卷积, 实现对预测模型的调整。式(2)给出求取匹配滤波器为 f(xr, xs, t)时的目标函数 E(xr, xs, t):
n 为 1 时表示 L1 范数方法的目标函数, n 为 2 时表示 L2 范数方法的目标函数。式(3)表示匹配滤波器与预测表面多次波模型进行卷积, 得到对真实表面多次波的估计值:
(3)
不同的自适应匹配相减方法采用的目标函数的形式是不同的, 但目的都是求取合适的匹配滤波器, 并且滤波器的求取是通过最小化目标函数来实现。在得到合适的匹配滤波器之后, 从含表面多次波的地震数据中减去对真实表面多次波的估计值, 就能够完成对表面多次波的压制。这也是自适应匹配相减算法直接影响 SRME 方法效果的原因。
有监督神经网络的基本原理可以用式(4)和(5)表示:
图1 预测表面多次波的计算原理
Fig. 1 Computational principles for predicting surface multiples
(5)
其中, Net( )表示神经网络, θ 表示网络中的参数; D 表示含表面多次波的共炮点道集(即神经网络的输入), Mout 表示神经网络的输出, Mlabel 表示人工给定的标签数据。有监督神经网络的训练需要大量数据对, 数据对由原始数据和对应的标签数据组成, 标签数据可以是不含表面多次波的地震数据(即实际有效波), 也可以是只含表面多次波的地震数据(即实际表面多次波)。若标签数据是前者, 则训练好的神经网络会输出对地震数据中的表面多次波压制后的结果; 若标签数据是后者, 则训练好的神经网络会输出地震数据中的表面多次波。有监督神经网络的训练是通过不断地更新网络中的参数 θ, 使得损失函数不断下降来实现。
无监督神经网络匹配算法的基本原理可以用式(6)和(7)表示:
(7)
其中, Mpred 表示预测表面多次波模型, 与式(4)和(5)相比, 式(6)和(7)分别用 Mpred 取代原始数据 D, 用原始数据 D 取代标签数据Mlabel。也就是说, 本研究中用到的无监督神经网络并不需要人工给定标签数据, 但需要先利用 SRME 方法得到预测表面多次波模型。
式(7)与式(2)具有相似的结构, 体现了无监督神经网络匹配算法与传统匹配算法之间的联系, 相当于用无监督神经网络取代了传统匹配算法中滤波算子的作用, 而传统匹配算法中对式(2)中目标函数的最小化, 则对应无监督神经网络匹配算法对式(7)中损失函数的最小化。
图 2 示意无监督神经网络匹配算法的原理, 通过最小化网络输出与原始地震数据之间的损失函数, 能够对预测表面多次波模型进行调整, 进而输出地震数据中的表面多次波。无论是有监督神经网络, 还是本文中用到的无监督神经网络, 都通过最小化损失函数来进行训练, 训练的过程就是不断更新神经网络中的参数 θ 的过程。两者的不同之处在于, 有监督神经网络需要在标签数据集上进行训练, 目的是得到一个训练好的, 能够迁移到其他地震数据上的网络, 该网络能够应用于压制新的地震数据中的表面多次波, 因此需要保留训练后网络中的参数 θ, 而无监督神经网络训练的目的仅是得到最后的输出结果, 训练后的网络仅对当前的地震数据有效, 在处理新的地震数据时需要重新训练网络。
图2 无监督神经网络匹配算法的原理
Fig. 2 Principle of matching algorithm with unsupervised neural networks
本文采用的无监督神经网络包含 12 个卷积层, 其中 9 个卷积层含激活函数, 3 个卷积层不含激活函数, 卷积核的尺寸、数目以及神经网络的结构如图2 所示。此外, 将卷积层的“padding”设置为“same” (即在数据的四周填充 0), 能够保证神经网络的输入和输出尺寸相同。
如图 3 所示, 本文方法的基本流程如下: 首先利用原始地震数据, 通过 SRME 方法得到预测表面多次波模型; 然后将原始地震数据作为神经网络的“label”, 预测表面多次波模型作为网络的输入, 通过最小化损失函数进行训练; 最后从原始地震数据中减去网络的输出, 完成对表面多次波的压制。
本文采用的 5 层水平层状模型如图 4 所示, 其中第一层为海水层, v 表示声波波速。对模型添加吸收边界后, 采用声波方程有限差分算法进行正演, 采用的 Ricker 地震子波主频为 25Hz, 网格大小为 5m×5m, 炮点间距和检波点间距均为 5m, 且炮点与检波点完全重合。时间采样间隔为 1ms, 时间长度为 1.5s。
若不在模型顶部设置吸收边界, 则通过有限差分算法能够得到含表面多次波的地震记录, 而在模型顶部设置吸收边界后, 到达模型表面的上行波场会被吸收衰减, 不再向下反射, 就能够得到不含表面多次波的地震记录。然后, 分别利用无监督神经网络匹配算法、传统 L1 范数匹配算法和传统 L2 范数匹配算法对含表面多次波的数据进行处理, 并对比不同方法的处理结果。
用图 3 所示的流程对合成地震数据进行处理, 得到 3 种算法对表面多次波的匹配结果(图 5)以及对表面多次波的压制结果(图 6)。对比图 5(a)与(e)可以看出, SRME 方法得到的预测表面多次波模型与实际表面多次波之间存在明显的差异。在用匹配算法进行处理后, 图 5(b)~(d)与图5(e)的差异大大降低。对比 3 种算法匹配结果的误差可以发现, 传统L2 范数算法的效果最差, 无监督神经网络算法的效果最好。对比图 6(b)~(d)或(f)~(h)之间的差异可以看出, 无监督神经网络算法能够对表面多次波进行有效的压制, 并且不会对有效波造成损伤, 压制效果好于传统 L1 范数和 L2 范数算法。
图3 基于无监督神经网络匹配算法的表面多次波压制流程
Fig. 3 Flow of surface multiple suppression based on matching algorithm with unsupervised neural network
图4 合成数据的速度模型[8]
Fig. 4 Velocity model of synthetic data[8]
无监督神经网络的训练通过最小化损失函数实现, 损失函数会随着网络中参数的迭代更新而不断地下降。图 7 示意损失函数随着迭代过程的变化情况, 其中水平虚线为理想情况下的损失函数。经过500 次迭代后, 损失函数收敛, 结束神经网络的训练。如式(8)所示, 理想情况下, 损失函数(Ideal level)是用实际表面多次波数据 Mtrue 代入损失函数计算之后的结果:
(a)为网络的输入(SRME得到的预测多次波模型), (b)为网络的输出(无监督神经网络算法的匹配结果), (c)为 L1 范数算法的匹配结果, (d)为 L2 范数算法的匹配结果, (e)为实际表面多次波记录, (f)为(b)减(e), (g)为(c)减(e), (h)为(d)减(e)
图5 3种算法对简单合成数据中表面多次波的匹配结果
Fig. 5 Matching results of three algorithms for surface multiples in simple synthetic data
(a)为原始数据, (b)为无监督神经网络算法的压制结果, (c)为 L1 范数算法的压制结果, (d)为 L2 范数算法的压制结果, (e)为实际不含表面多次波记录, (f)为(b)减(e), (g)为(c)减(e), (h)为(d)减(e)
图6 3 种算法对简单合成数据中表面多次波的压制结果
Fig. 6 Suppression results of three algorithms for surface multiples in simple synthetic data
图7 损失函数随训练过程的变化
Fig. 7 Variation of loss function with training process
但是, 在实际处理过程中, 损失函数很难下降到理想的程度。
此外, 为了防止无监督神经网络对有效波造成损伤, 在神经网络的训练过程中, 设定学习率是不断下降的, 所以随着迭代次数的增加, 损失函数趋于平缓, 一方面是因为损失函数本身随着迭代而收敛, 另一方面是因为学习率越来越小, 网络中参数的变化也越来越小。
为了验证本文方法对复杂地质构造情况下地震数据的适应性, 分别利用 3 种匹配算法在叠前对Sigsbee 模型数据进行处理, 同时与公开数据集中不含表面多次波的数据进行对比, 结果如图 8 和 9 所示。从图 8(f)~(h)以及图 9(f)~(h)可以看出, 无监督神经网络的输出与实际表面多次波的差异是 3 种匹配算法中最小的。图 8 中黑色箭头所指区域, 由于预测表面多次波模型没有得到与实际表面多次波对应的结构, 因此 3 种匹配算法的误差都较大。图 9中黑色箭头所指区域, 无监督神经网络算法得到的压制结果中表面多次波的残留最少, 同时也没有对有效波造成明显的损伤, 说明即便是对复杂地质构造情况下的地震数据, 本文方法依旧能够很好地平衡对表面多次波的压制和对有效波的保护。
经过 1000 次迭代后, 损失函数趋于收敛, 停止网络训练, 得到的输出结果如图 10 所示, 其中水平虚线代表理想值。对于复杂地质构造情况下的地震数据, 虽然本文方法依旧有效, 但相比于处理简单地质构造情况下的数据, 训练过程需要的迭代次数变多了, 说明随着数据复杂程度增加, 匹配难度加大, 无监督神经网络的损失函数收敛速度变慢。
为了定量地比较 3 种算法对表面多次波压制的效果, 利用式(9)计算处理结果的信噪比:
其中, EP 表示有效信号的能量, EM 表示残余表面多次波的能量。计算结果见表 1。
对于简单合成数据, 表 1 给出的是图 6(b)~(d)中的信噪比; 对于 Sigsbee 模型数据, 表 1 给出的是图 9(b)~(d)中的信噪比。可以看出, 在处理简单合成数据以及 Sigsbee 模型数据时, 无监督神经网络匹配算法的表现好于 L1 范数和 L2 范数匹配算法, 处理结果的信噪比明显提高。
3 种算法运行的计算机硬件配置如下: CPU 为Intel(R) Core(TM) i9-9900K, 显卡为 NVIDIA Ge-Force RTX 3080Ti。无监督神经网络匹配算法的运算耗时会受迭代次数和输入数据尺寸影响, 简单合成数据的尺寸是 1300×599, Sigsbee 数据的尺寸为900×348。虽然无监督神经网络匹配算法在处理Sigsbee 模型数据时的迭代次数增加, 但由于输入数据的尺寸减小, 所以总运算耗时下降。在采用GPU并行运算的前提下, 无监督神经网络匹配算法的运算耗时也低于 L1 范数和 L2 范数匹配算法。表 2 给出 3 种匹配算法处理单个共炮点道集的运算耗时。对照表 1 与表 2 可以发现, 与 L1 范数和 L2 范数匹配算法相比, 无监督神经网络匹配算法能够以更小的时间开支, 取得更好的多次波匹配及压制效果。
为了进一步测试本文方法的实际效果, 图 11 给出无监督神经网络匹配算法对叠前实际数据的处理结果, 实际数据来自 SEG wiki 的 Mobil AVO viking graben line 12。图 11(c)中黑色箭头所指区域, 表面多次波得到有效的压制, 并较好地恢复了有效波的同相轴, 表明在压制表面多次波的同时, 实际叠前数据中的有效波也得到充分的保护。与图 11(c)相比, 图 11(d)中红色箭头所指区域, L1 范数方法的处理结果对有效波的同相轴造成损伤, 表明在处理实际叠前数据时, 本文无监督神经网络匹配算法的表现仍然好于 L1 范数算法。
(a)为网络的输入(SRME 得到的预测多次波模型), (b)为网络的输出(无监督神经网络算法的匹配结果), (c)为 L1 范数算法的匹配结果, (d)为 L2范数算法的匹配结果, (e)为实际表面多次波记录, (f)为(b)减(e), (g)为(c)减(e), (h)为(d)减(e); 箭头所指位置因预测模型不准确导致较大的误差
图8 3种算法对Sigsbee模型数据中表面多次波的匹配结果
Fig. 8 Matching results of three algorithms for surface multiples in Sigsbee data
(a)为原始数据, (b)为无监督神经网络算法的压制结果, (c)为L1范数算法的压制结果, (d)为L2范数算法的压制结果, (e)为实际不含表面多次波记录, (f)为(b)减(e), (g)为(c)减(e), (h)为(d)减(e); 箭头指示表面多次波的残留
图9 3种算法对Sigsbee模型数据中表面多次波的压制结果
Fig. 9 Suppression results of three algorithms for surface multiples in Sigsbee data
图10 Sigsbee 模型损失函数随迭代次数变化
Fig. 10 Variation of loss function of Sigsbee model with training process
本文将 SRME 方法中得到的预测表面多次波模型与有监督神经网络的基本结构相结合, 摆脱对传统匹配算法和标签数据集的依赖, 利用无监督神经网络匹配算法对表面多次波进行压制。在经过无监督神经网络的处理后, SRME 预测的表面多次波模型能够更好地匹配原始数据中的实际表面多次波。在简单合成数据和 Sigsbee 模型数据上的应用表明, 基于无监督神经网络匹配算法的叠前表面多次波压制方法能够在不损害有效波的前提下, 完成对表面多次波的压制。相对于传统 L1 范数和 L2 范数匹配算法, 本文方法既能提高处理结果的信噪比, 又能降低运算成本。在实际数据上的应用证明了本文方法的有效性。
表1 表面多次波压制效果的定量对比
Table 1 Quantitative comparison of the effect of surface multiples suppression
数据类型信噪比/dB 无监督神经网络L1范数L2范数 简单合成数据26.3123.8219.33 Sigsbee数据20.1218.4516.47
表2 3种算法计算效率对比
Table 2 Comparison of the computational efficiency of the three algorithms
数据类型运算耗时/s 无监督神经网络L1范数L2范数 简单合成数据47.09176.8659.96 Sigsbee数据18.21 50.8435.65
(a)为原始数据, (b)为预测表面多次波模型, (c)为无监督神经网络的处理结果, (d)为 L1 范数算法处理结果; 黑色箭头指示得到恢复的有效波同相轴, 红色箭头指示被损伤的有效波同相轴
图11 无监督神经网络对实际数据的处理结果
Fig. 11 Results of unsupervised neural network when processing field data
参考文献
[1] Berkhout A J, Verschuur D J. Estimation of multiple scattering by iterative inversion, Part Ⅰ: Theoretical considerations. Geophysics, 1997, 62(5): 1586–1595
[2] Verschuur D J, Berkhout A J. Estimation of multiple scattering by iterative inversion, Part Ⅱ: Practical as-pects and examples. Geophysics, 1997, 62(5): 1596–1611
[3] Wang Y H. Multiple subtraction using an expanded multichannel matching filter. Geophysics, 2003, 68(1): 346–354
[4] 李鹏, 刘伊克, 常旭, 等. 均衡拟多道匹配滤波法在波动方程法压制多次波中的应用. 地球物理学报, 2007, 50(6): 1844–1853
[5] Guitton A, Verschuur D J. Adaptive subtraction of multiples using the L1-norm. Geophysical Prospec-ting, 2004, 52(1): 27–38
[6] 李学聪, 刘伊克, 常旭, 等. 均衡多道1范数匹配多次波衰减的方法与应用研究. 地球物理学报, 2010, 53(4): 963–973
[7] 武银婷, 刘伊克, 常旭, 等. 改进的1范数匹配滤波法及在南海深水盆地的应用. 地球物理学报, 2012, 55(3): 1007–1016
[8] 陈习峰, 薛永安, 黄新武. 自适应加权混合L1/L2范数匹配相减多次波压制方法. 石油物探, 2019, 58 (4): 524–532
[9] Yu S W, Ma J W, Wang W L. Deep learning for denoi-sing. Geophysics, 2019, 84(6): V333–V350
[10] Jiang J S, Ren H R, Zhang M. A convolutional auto-encoder method for simultaneous seismic data recon-struction and denoising. IEEE Geoscience and Remo-te Sensing Letters, 2022, 19: 1–5
[11] Hu L L, Zheng X D, Duan Y T, et al. First-arrival picking with a U-net convolutional network. Geophy-sics, 2019, 84(6): U45–U57
[12] Zu S H, Cao J X, Qu S, et al. Iterative deblending for simultaneous source data using deep neural network. Geophysics, 2020, 85(2): V131–V141
[13] Wu X M, Liang L M, Shi Y Z, et al. FaultSeg3D: using synthetic data sets to train an end-to-end convolutional neural network for 3D seismic fault segmentation. Geophysics, 2019, 84(3): IM35–IM45
[14] 崔家豪, 杨平, 王洪强, 等. 基于深度学习的地震速度谱自动拾取研究. 地球物理学报, 2022, 65(12): 4832–4845
[15] Siahkoohi A, Verschuur D J, Herrmann F J. Surface-related multiple elimination with deep learning // SEG Technical Program Expanded Abstracts 2019. Santigo: 2019, doi: 10.1190/segam2019-3216723.1
[16] 宋欢, 毛伟建, 唐欢欢. 基于深层神经网络压制多次波. 地球物理学报, 2021, 64(8): 2795–2808
[17] Li Z X, Gao H T. Feature extraction based on the convolutional neural network for adaptive multiple subtraction. Marine Geophysical Research, 2020, 41: doi: 10.1007/s11001-020-09409-7
[18] Tao L R, Ren H R, Ye Y M, et al. Seismic surface-related multiples suppression based on SAGAN. IEEE Geoscience and Remote Sensing Letters, 2022, 19: 1–5
Prestack Surface Multiple Suppression Method Based on Matching Algorithm with Unsupervised Neural Network
Abstract To effectively suppress surface multiples in marine seismic data and then correctly image the exploration target, a prestack surface multiple attenuation algorithm based on unsupervised neural networks is proposed, which combines neural network methods with surface-related multiple elimination (SRME) methods. By continuously decreasing the learning rate, the unsupervised neural network replaces the matching filter operator for suppressing surface multiples in the prestack seismic data. This method requires neither traditional matching algorithms nor training on labeled datasets. The application of simple synthetic data, Sigsbee model data and field data verifies the effectiveness of the proposed method for surface multiple wave suppression.
Key words unsupervised neural networks; surface multiple suppression; prestack seismic data; matching algorithm