SOM 方法在中国东部夏季降水分型中的应用

罗未萌 钱维宏蒋宁 梁卓轩

北京大学物理学院大气与海洋科学系, 北京 100871; † 通信作者, E-mail: qianwh@pku.edu.cn

摘要使用自组织映射(SOM)和经验正交函数(EOF)两种方法, 对比分析中国东部地区夏季日平均和季节平均的降水分型。结果表明, SOM比EOF能够更真实地描述降水分布。SOM得到的夏季降水分型的空间结构能够很好地用850 hPa的风扰动和700 hPa的比湿扰动解释。作为事后问题, 850 hPa的高度扰动负值中心能够很好地解释对应的降水落区; 但作为预报问题, 强降水不仅由数值模式预报中的负值高度扰动决定, 还受制于水汽和温度扰动等因素。

关键词中国夏季降水; 自组织映射(SOM); 经验正交函数(EOF)

中国夏季降水受到东亚季风环流系统的影响, 表现出区域差异以及年际和年代际变化的特征[12]。中国东部夏季降水到底有多少种空间上的异常分布类型, 需要利用客观的方法加以识别。前人对中国东部夏季降水异常分布提出不同的分型或分区。廖荃荪等[3]根据夏季总降水量距平百分率及 500 hPa环流形式, 将中国东部地区夏季大范围降水异常分布概括为主要多雨带分别位于黄河流域及其以北、黄河至长江之间以及长江流域或江南 3 个类型。魏凤英等[4]用经验正交函数(empirical or-thogonal func- tion, EOF)中前 3 个特征向量的时间系数, 将中国东部夏季雨带划分为 3 种主要类型。王绍武等[5]利用EOF, 划分 6 种雨型。孙林海等[6]利用 EOF 和主成分分析等方法, 将中国东部季风区降水划分为二类四型。黄荣辉等[7]揭示出中国东部降水从南到北的经向三极子型和偶极子型两种分布模态, 并发现存在准两年的周期振荡和年代际变化。龚振淞等[8]将阻塞高压和西太平洋副高的配置与中国夏季旱涝分布特点结合起来, 将中国夏季旱涝分布划分为 8 种雨带类型。可见, 前人的分型(或雨带)从 3 个到 8个不等。

前人对中国夏季降水的客观分型多以 EOF 方法为主, 同时考虑大气环流异常[3,5,8–13]。由于 EOF分解需要满足模态之间的正交性, 其结果不能完全反映中国夏季降水与大气环流和外强迫异常之间的关系。正如 Dommenget 等[14]指出的, EOF 分解得到的模态缺少物理含义, 即模态可能并不存在。

作为一种聚类和模式识别方法, 自组织映射(self-organizing maps, SOM)方法在20世纪90年代后期引入气象学和气候学研究中[1519]。人们发现, SOM 方法在不同方向和不同时空尺度的研究中都是一个有效的工具, 例如极端气候与降水模态分析、云型分类、气候变化分析等方面的研究[20]。Tadross 等[21]利用 SOM 方法, 提取南非和津巴布韦降水的特征模态。Nishiyama 等[22]使用 SOM 方法, 分析降水和 850 hPa 风场的联合分布。Lin 等[23]通过比较, 发现 SOM 方法的聚类结果优于 K-means 和Ward’s 方法。Hsu 等[24]使用 SOM 和小波分析法, 分析了台湾地区22年降水数据的时空变化特征。

前人的研究表明, 与EOF方法相比, SOM方法具有更多的优势。由于模态之间有内在的联系, 将SOM 分型结果以矩阵的形式排列, 是可视化方面的一个突破。Liu 等[2526]发现, SOM 分型往往比EOF 的前几个模态更准确和直观。Liu 等[27]发现, 在较复杂的模态集合中, SOM 方法能成功地提取所有模态, EOF 方法却不能。Reusch 等[28]发现, EOF方法有时会将多个模态混合成单个模态, 或者不能正确地分解不同部分的方差, 而 SOM 方法能够鲁棒性更强地提取不同模态及对应的方差。有研究认为, 当取特定参数时, SOM 方法即退化为 K-means方法[29], 并且更灵活[30]

本文基于 EOF 方法在中国东部夏季降水分型中的广泛应用以及 SOM 方法在其他地区降水分型中的应用, 使用这两种方法分析中国东部夏季降水异常, 藉此比较 EOF 和 SOM 方法的差异, 并考察SOM分型的天气和气候环流异常背景。

1 资料与方法

1.1 资料

中国东部地区降水数据来自中国气象局提供的1961—2010年中国日降水格点数据集, 空间分辨率为 0.5°×0.5°。大气风和水汽资料来自 NCEP Reana-lysis 1, 空间分辨率为 2.5°×2.5°。位势高度场资料来自 ERA Interim, 空间分辨率为 0.75°×0.75°。我们用总场变量减去对应日(30 年)的瞬时气候场, 得到逐日扰动场[31]

1.2 EOF分析

EOF 分析, 也称为主成分分析(principal compo-nent analysis, PCA), 最早由 Person[32]提出。20 世纪 50 年代, Lorenz[33]率先尝试将 EOF 方法应用于天气预报。通过 EOF 分析, 可以得到气象要素场变化的正交模态空间分布特征及其系数随时间的演变。它的前几个模态往往能够解释较多的时空变化方差, 因此该方法常用于气象要素场时空变化特征的研究。

EOF 方法的基本原理是将由m个空间点n次观测值(样本时间长度)构成的变量矩阵width=23.65,height=16.1分解为空间特征向量矩阵V以及对应的时间系数矩阵T两部分:

width=183.75,height=64.5。 (1)

对于第i个站点第j次观测值xij, EOF 可将其分解为空间函数和时间函数两部分。其中, 特征向量表示某区域要素场的变率分布结构, 可以代表该要素场的主要分布特征; 所对应的时间系数则反映实际分布与之相似或相反, 且绝对值越大, 表示该空间分布特征越显著。

EOF 的优势在于可以反映时空变率最大的模态, 但它的劣势也很明显: 1)分解得到的模态不稳定, 受选取的时间序列长度和空间区域大小影响; 2)选取的EOF前几个模态通常无法解释所有方差; 3)EOF分解要求各个模态是正交的, 这可能导致分解得到的模态没有物理意义。

1.3 SOM方法

SOM 方法是一种基于竞争学习的无监督式的神经网络方法[3436], 能够将高维空间的输入样本非线性地映射到一组二维格点(神经网络节点)中。每一个节点都有一个权重向量mi, 它可以被随机地初始化,i的取值从1到M, 其中M为SOM矩阵的大小。具体的训练方法为: 每次都选取其中一个输入样本(向量)Xk, 计算其到每个神经元节点的激活函数。通常将欧氏距离作为激活函数, 激活函数最小(与被选取的输入样本距离最小)的神经元将被激活。该过程可被表示为

ck= argmin||Xkmi||, (2)

其中,ck即为激活神经元的序号, argmin||Xkmi||表示||Xkmi||最小时i的取值。

我们可将激活神经元的权重向量移向被选取的输入样本。同样地, 激活神经元周围的邻近节点的权重向量也被调整并向输入样本移动。与此同时, 移动的距离与临近函数有关。该过程可被表示为

mi(t+1) =mi(t) +α(t)hci(t)[X(t) −mi(t)], (3)

其中,t表示当前的迭代次数,X表示当前选取的输入样本,α(t)为随时间衰减的学习参数,hci(t)为邻近函数。

不断重复上述迭代过程, 直到收敛, 即为自组织映射算法。SOM 节点的输出权重向量被改造为与输入数据有相同的特征。这种学习过程导致对输入数据有次序的映射, 相似的模态映射到临近区域, 而差异较大的模态则映射到相距较远的区域。

与传统方法相比, SOM 方法主要有以下优势: 1)SOM 分型结果为有内在联系的连续态, 而非离散的模态, 这能够帮助我们理解关键模态之间的过渡态, 并对关键模态之间转换的预报提供帮助; 2) SOM 方法是可视化方面的一个突破, 通过将 SOM分型结果以矩阵的形式排列, 使我们更容易理解这些分类结果。

本文使用降水距平资料进行 SOM 分型, 没有进行归一化处理, 选取 Ep 函数(Epanechnikov func-tion)作为邻近函数(neighborhood function), 即

hci(t) = max{0, 1 − (σtdci)2}, (4)

其中,σtt时刻的邻近半径,dci为激活神经元到邻近神经元的距离。选取最大训练步长为100步。

与所有动态聚类问题一样, SOM方法需要事先指定聚类数目。然而, 最优聚类数目难以客观选取, 并且尚无定论[3739]。在此, 可以用 Chattopadhyay[40]的链接网络概念来确定分型数目范围。在一个长度为(L+1)的时间序列中, 共有L种演变形态, 而每一种演变形态又对应 SOM 中一个节点到另一个节点的转换。那么, 有

N(N− 1)/2 =L, (5)

N即为神经元节点个数,L为演变形态数目。

对季节平均降水, 我们关注的是降水的年际及年代际变化, 因此选取 1961—2010 年共 50 年的数据,L可取为 50, 解得N≈10。对日平均降水, 我们关注的是夏季降水的日变化。由于夏季的时间尺度为 3~4 个月(90~120 天), 即L= 90~120, 解得N= 14~16。

2 中国东部夏季季节平均降水距平EOF与SOM模态的比较

2.1 空间形态分析

我们先用夏季 3 个月(6—8 月)的季节降水距平资料做 EOF 分析。图 1 是我国东部夏季降水距平EOF 分解得到的前 3 个模态的空间分布, 它们的解释方差分别为 16.8%, 15.9%和 9.4%。EOF 第一模态最大的异常中心在华南, 并表现为以长江为界的南北反向振荡(图 1(a)); 第二模态的异常带沿长江分布(图 1(b)); 第三模态表现为以环渤海为中心的北方异常以及东南地区的反向变化(图 1(c))。上述EOF特征与前人的分析结果[13,41]相似。

说明: width=457.8,height=155.85

右下角数字为该模态的解释方差; 实线表示降水偏多, 虚线表示降水偏少; 等值线范围为−3~3 mm, 间隔0.5 mm

图1 1961—2010年中国东部夏季(JJA)降水距平场前3个EOF模态空间分布(单位: mm)

Fig. 1 Spatial distributions of the first three EOF modes of summer (JJA) precipitation anomaly over Eastern China from 1961 to 2010 (unit: mm)

前人的研究表明, 中国东部季节尺度的夏季降水主要有 3 个 EOF 模态[45]。据图 1, 用 6 个 SOM 分型已经足以解释前 3 个 EOF 模态, 因此选取 6 个分型是比较合适的。

中国东部夏季降水距平 SOM 分型如图 2 所示。这 6 个(3×2)分布类型可以分为两两相反的 3 组。A 组包括 1 型和 6 型, 这组降水型主要反映以长江为界, 南、北方降水反向变化的特征, 但三北地区(西北、华北和东北)又与南方相同, 表现为南方偏旱(涝)时, 黄淮流域降水偏多(少), 三北地区偏旱(涝)。B 组包括 2 型和 5 型, 反映西北与其他地区的相反变化。C 组包括 3 型和 4 型, 与 A 组有相似之处, 但异常中心的位置发生变化。SOM 的 6 个分型中, 中心强度和分布范围是连续变化的, 有其内在的规律性。从 1→4→5→6 型看, 华南的干旱中心逐步北移到淮河; 从 6→3→2→1 型看, 南方的湿中心在北移。SOM 的 6 个分型中, 干(湿)中心的强度和位置是连续变化的, 这在 EOF 分析结果中是看 不到的。在 50 年的夏季降水中, 有 24%的年份降水分布与 4 型相似, 即长江及其以南降水偏少。各有 18%的年份, 江淮降水偏多(少)而华南降水偏少(多), 类似 1 型和 6 型。只有 10%的年份, 江淮夏季降水偏少(5型)。

进一步对比EOF分解结果和SOM分型可见, 1型对应EOF1的正相位, 6型对应EOF1的负相位; 3型对应EOF2的正相位, 4型和5型对应EOF2的负相位; EOF-3 在 SOM 分型中不明显, 即 EOF 的第三模态不是独立存在的。

2.2 时间序列分析

图 3 是 3 个 EOF 模态对应的主分量的时间序列。正如黄荣辉等[7]指出的, 中国东部夏季降水EOF 的前 3 个模态均呈现一定程度的周期性震荡。EOF 第一模态表现出明显的年代变化, 如 1980—1993 年期间以正值为主, 其前后则以负值为主, 存在年代际变化; EOF 第二模态以几年尺度和年际变化为主;EOF 第三模态也存在年代际和年际变化。但是, EOF主分量序列的时间变化特征不够直观。

说明: width=453.6,height=300.45

右下角数字为该降水型发生的频率; 实线表示降水偏多, 虚线表示降水偏少; 等值线范围为−3~3 mm, 间隔0.5 mm

图2 1961—2010年中国东部夏季降水距平场6个(3×2) SOM分型

Fig. 2 Six (3×2) SOM modes of summer precipitation anomaly over Eastern China from 1961 to 2010

说明: width=340.2,height=496.05

图3 中国东部夏季降水前3个EOF模态相对应的主分量时间序列

Fig. 3 Time series of the first three EOF modes for the summer precipitation over Eastern China

对每年夏季的降水空间分布, 我们可以通过计算其与图 2 所示 6 个 SOM 分型的欧氏距离, 得到最佳匹配神经元(best matching unit, BMU), 即与之最相似的降水分型。图 4 给出 1961—2010 年夏季BMU 出现的时间序列, 其中, 1, 4, 5 型为南方偏旱型, 用实心符号表示; 2, 3, 6 型为南方偏湿型, 用空心符号表示。A 组(1, 6 型)用圆形符号表示, B 组(2, 5型)用三角形符号表示, C组(3, 4 型)用正方形符号表示。1, 6 型是华南地区两个相反的干湿型, 对应的降水偏多(偏少)信号较强。从图 4 可以清楚地看到, 20 世纪 80 年代至 90 年代初期, 1 型居多(华南华北干, 降水偏少), 而 6 型在 90 年代中后期偏多(华南湿, 降水偏多), 这与黄荣辉等[1]的结论 一致。在 1995 年前后, 3 型连续出现, 长江流域 降水偏多。此外, 在图 4 中也展现出不同区域的年际变化。

说明: width=425.15,height=113.4

图4 6个(3×2) SOM 分型对应的BMU时间变化序列

Fig. 4 Temporal evolution of the BMU for the six (3×2) SOM modes

2.3 合成的环流和水汽扰动

根据图 4 中各个夏季降水异常分型对应的年份, 分别合成相应的 850hPa扰动风和 700hPa水汽扰动。比较图 2 与图 5 可以看出, 这些降水分型的空间特征与 850hPa 扰动风的辐合以及 700hPa 水 汽扰动中心有密切的联系。例如, 华南沿海降水偏 多的 6 型是华南地区 850hPa 扰动风的辐合与 700hPa 水汽扰动中心共同作用的结果。同样, 其他降水型的干湿分布都可用 850hPa 扰动风和 700hPa水汽扰动来解释。

说明: width=453.6,height=340.2

右上角数字为该降水型发生的频率; 实线代表正数, 虚线代表负数, 等值线间隔0.16 m/s

图5 SOM各个降水型对应的850 hPa扰动风(m/s)和700 hPa水汽比湿扰动(g/kg)的合成

Fig. 5 Composites of 850 hPa wind vectors anomaly (m/s) and 700 hPa specific humidity anomaly (g/kg) of the six SOM modes

3 中国东部夏季日平均降水距平 EOF与SOM模态的比较

3.1 空间形态分析

图 6 给出夏季日平均降水距平 EOF 分解得到的前 6 个模态的空间分布。EOF 第一模态反映长江南北相反的逐日降水异常分布, 第二模态反映沿长江降水与华南降水的相反分布, 第三模态反映长江下游与黄河中下游及华南的相反降水分布, 第四模态反映环渤海和东北与黄河中游的相反降水分布, 第五模态反映黄河和江南降水与淮河和华南的相反降水分布, 第六模态反映南方东、西部相反的降水分布。解释方差从第一模态的 9.1%逐渐下降到3.5%。前6个模态的总方差贡献为34.4%。

对比图 1 与图 2 可以看出, 对季节平均降水来说, 前 3 个 EOF 模态相当于 SOM 展开的 6 个型。对日平均降水来说, EOF 的第五和第六模态中的正负中心最多达到 5 个。逐日降水 SOM 分型的 16 个型主要反映 EOF 前 3 个模态的变化。在图 7 的1 型中, 大降水带在长江流域与淮河流域之间, 该大降水带以南和以北降水偏少。降水带的地理位置变化是有规律的, 按图 7 中灰色虚线箭头方向, 降水偏多的中心带从华北向华南沿海靠近。

为了得到各个降水型之间的转变规律, 我们对30年中的所有天数做统计分析, 得到各个降水型后一天出现的降水型概率的估计(图略)。比如, 在出现1型的后一天, 出现2型的概率是23.1%。但是, 出现 14 型的第 2 天再次出现 14 型的概率是33.2%。根据每个降水型后一天的最大转移概率, 我们在图7 中画出黑色实线的箭头环线, 以此反映中国东部逐日降水演变的最大概率, 也反映天气系统的转换规律。

3.2 降水异常型对应的高度异常

预报员通常关注在怎样的气压场分布下会出现图7中各降水型。我们很容易根据出现 1 型的那些天数的 850hPa 位势高度扰动, 合成出对应的高度异常场(图 8 中 1 型)。显而易见, 图 7 和 8 中 1 型 的江淮流域降水偏多带是 850hPa 的一个负扰动中心在黄海向西南延伸的扰动槽的产物。这个高度扰动中心和扰动槽在图 8 中的指向(灰色虚线箭头)与多雨带的指向一致。图 8 反映降水偏多区域对应的低层大气高度扰动负异常与 2012 年 7 月 21 日北京特大暴雨时出现的瞬时高度扰动垂直剖面低层负值分布[42]是一致的。

说明: width=453.6,height=300.45

右下角数字为该模态的解释方差; 实线代表正数,虚线代表负数, 等值线间隔0.01 mm/d

图6 1981—2010年中国东部夏季日平均降水距平场前6个EOF模态空间分布

Fig. 6 Spatial distributions of the six leading EOF modes of daily summer precipitation anomaly over Eastern China from 1981 to 2010

右上角数字为该型发生的频率; 实线表示降水偏多, 虚线表示降水偏少; 等值线范围为−30~30 mm/d, 间隔5 mm/d; 灰色虚线箭头指示降水偏多的地理位置, 黑色实线箭头指示后一天降水异常型的最大概率转移路径

图7 1981—2010 年中国东部夏季日平均降水距平场16个(4×4) SOM分型结果

Fig. 7 Sixteen (4×4) SOM modes of daily summer precipitation anomaly over Eastern China from 1981 to 2010

3.3 高度异常型对应的降水异常

从图 7 到图 8, 反映从降水异常到环流异常的正向对应关系, 即降水异常可以用气压(或环流)异常来解释。我们再考察一个反向问题, 即由高度扰动判断对应的降水异常。这相当于, 如果数值模式已预报未来时刻的高度异常, 是否有对应的降水异常。

说明: width=476.25,height=538.55

实线表示正高度扰动, 虚线表示负高度扰动; 等值线范围为−30~30 gpm, 间隔5 gpm

图8 降水距平SOM分型的850 hPa位势高度扰动(gpm)合成分析

Fig. 8 Composites of 850 hPa geopotential height anomaly (gpm) of the SOM patterns

图 9 给出中国东部地区 850hPa 高度扰动场SOM 的 16 个(4´4)分型结果。在左边一列从上向下1→2→3→4 型的顺序中, 中国大陆受到的正高度扰动影响在减弱, 而每一行从左到右的负高度扰动在增强, 右边一列的负高度扰动最强。对各型高度场进行降水距平的合成分析(图 10), 发现 13 型和 16型的合成降水偏多, 这两个降水型均位于右边一列, 有较强的负高度扰动。然而, 其他负高度扰动型并不对应强降水, 再次说明发生强降水时总是可以找到负高度扰动的信号(图 7 和 8)。但是, 用单一变量的高度扰动不能解释所有降水事件(图 9 和 10), 原因是高度扰动只是产生强降水的条件之一, 其他条件包括水汽扰动、温度扰动和风扰动等[4344]

说明: width=476.25,height=532.9

右上角数字为该型发生的频率; 实线表示正高度扰动, 虚线表示负高度扰动; 等值线范围为−30~30 gpm, 间隔5 gpm

图9 中国东部地区850 hPa日平均高度场扰动(gpm)场SOM的16个(4´4)分型结果

Fig. 9 Sixteen (4×4) SOM modes of daily 850 hPa geopotential height anomaly (gpm) over Eastern China

说明: width=472.05,height=479

实线表示降水偏多, 虚线表示降水偏少; 等值线范围为−30~30 mm/d, 间隔5 mm/d

图10 中国东部地区850 hPa高度扰动场SOM分型(图9)对应的日降水距平(mm/d)合成

Fig. 10 Composites of daily precipitation anomaly (mm/d) of each daily 850 hPa geopotential height anomaly SOM modes over Eastern China in Fig. 9

4 结果和讨论

本文基于 1961—2010 年中国东部夏季降水格点资料, 分析 SOM 方法在我国降水分型中的应用, 并与传统的 EOF 分解得到的结果做比较。在此基础上, 探讨 SOM 分型中降水型的年际变化及转换关系。

对中国东部夏季季节平均降水距平, 使用 SOM分型可得到 3 组两两相反的降水型, 它们的排序在空间分布上有较好的规律和连续性, 易于理解。与SOM 不同, EOF 分解得到的前 3 个模态只能解释约42%的方差, 不能全面地反映中国东部地区降水的真实情况。通过比较 SOM 分型与 EOF 分解结果, 发现 SOM 分型能体现 EOF 的前两个模态, 其时间序列也验证了前人的结论。EOF 第三模态在降水分型中是不存在的。SOM 方法得到的夏季降水分型能够很好地用 850hPa 的风扰动和 700hPa 的水 汽比湿扰动解释。作为倒向问题, 强降水的发生可以从 850hPa 的高度扰动负值中心得到解释。但是, 作为正向问题, 数值模式预报得到的高度负值扰动不一定对应强降水。这是由于强降水的影响因素除高度扰动外, 还有水汽和温度扰动等。

本文初步揭示了 SOM 方法在中国东部夏季降水分型中的优势。在对降水型的类型转换分析方面, 将来可以深入研究转换的时间尺度, 并解释转换的物理意义。在本文探讨的高度场扰动指示降水异常之外, 还可以寻找与预报相关的其他先期信号, 如风场异常、温度扰动和水汽扰动等。

参考文献

[1]黄荣辉, 徐予红, 周连童. 我国夏季降水的年代际变化及华北干旱化趋势. 高原气象, 1999, 18(4): 465‒476

[2]蔡榕硕, 谭红建, 黄荣辉. 中国东部夏季降水年际变化与东中国海及邻近海域海温异常的关系. 大气科学, 2012, 36(1): 35‒46

[3]廖荃荪, 赵振国. 我国东部夏季降水分布的季度预报方法. 应用气象学报, 1992, 3(增刊1): 1‒9

[4]魏凤英, 张先恭. 我国东部夏季雨带类型的划分及预报. 气象, 1988, 14(8): 15‒19

[5]王绍武, 赵宗慈. 近五百年我国旱涝史料的分析. 地理学报, 1979, 34(4): 329‒341

[6]孙林海, 赵振国, 许力, 等. 中国东部季风区夏季雨型的划分及其环流成因分析. 应用气象学报, 2005, 16(增刊1): 56‒62

[7]黄荣辉, 陈际龙, 黄刚, 等. 中国东部夏季降水的准两年周期振荡及其成因. 大气科学, 2006, 30(4): 545‒560

[8]龚振淞, 杨义文. 中国夏季旱涝气候预测相似模型. 气象, 2010, 36(5): 46‒50

[9]李栋梁, 王文. 中国西北夏季降水特征及其异常研究. 大气科学, 1997, 21(3): 331‒340

[10]宋正山, 杨辉. 夏季东亚季风区 500 hPa 月环流异常及与我国降水关系的向量 EOF 分析. 大气科学, 2001, 25(3): 401‒404

[11]黄山江, 王谦谦, 刘星燕. 西北地区春季和夏季降水异常特征分析. 大气科学学报, 2004, 27(3): 336‒346

[12]Zhou T J, Yu R C. Atmospheric water vapor transport associated with typical anomalous summer rainfall patterns in China. Journal of Geophysical Research Atmospheres, 2005, 110(8): 211‒211

[13]庞轶舒, 祝从文, 刘凯. 中国夏季降水异常 EOF 模态的时间稳定性分析. 大气科学, 2014, 38(6): 1137‒1146

[14]Dommenget D, Latif M. A cautionary note on the in-terpretation of EOFs. Journal of Climate, 2002, 15(2): 216‒225

[15]Hewitson B C. Neural nets: applications in geography (Vol. 29). New York: Springer Science & Business Media, 1994

[16]Hewitson B C, Crane R G. Self-organizing maps: app-lications to synoptic climatology. Climate Research, 2002, 22(1): 13‒26

[17]Cavazos T. Using self-organizing maps to investigate extreme climate events: an application to wintertime precipitation in the Balkans. Journal of Climate, 2000, 13(10): 1718‒1732

[18]Malmgren B A, Winter A. Climate zonation in Puerto Rico based on principal components analysis and an artificial neural network. Journal of Climate, 1999, 12(4): 977‒985

[19]Ambroise C, Sèze G, Badran F, et al. Hierarchical clustering of self-organizing maps for cloud classifi-cation. Neurocomputing, 2000, 30(1): 47‒52

[20]Liu Y, Weisberg R H. A review of self‐organizing map applications in meteorology and oceanography // Mwasiagi J I. Self-organizing maps: applications and novel algorithm design. Rijeka: Intech, 2011: 253–272

[21]Tadross M A, Hewitson B C, Usman M T. The interannual variability of the onset of the maize growing season over South Africa and Zimbabwe. Journal of Climate, 2005, 18(16): 3356‒3372

[22]Nishiyama K, Endo S, Jinno K, et al. Identification of typical synoptic patterns causing heavy rainfall in the rainy season in Japan by a self-organizing map. At-mospheric Research, 2007, 83(2): 185‒200

[23]Lin Gwo-Fong, Chen Lu-Hsien. Identification of ho-mogeneous regions for regional frequency analysis using the self-organizing map. Journal of Hydrology, 2006, 324(1): 1‒9

[24]Hsu Kuo-Chin, Li Sheng-Tun. Clustering spatial-temporal precipitation data using wavelet transform and self-organizing map neural network. Advances in Water Resources, 2010, 33(2): 190‒200

[25]Liu Y G, Weisberg R H. Patterns of ocean current variability on the West Florida Shelf using the self-organizing map. Journal of Geophysical Research: Oceans, 2005, 110: C06003

[26]Liu Y G, Weisberg R H. Ocean currents and sea surface heights estimated across the West Florida Shelf. Journal of Physical Oceanography, 2007, 37(6): 1697‒1713

[27]Liu Y G, Weisberg R H, Mooers C N. Performance evaluation of the self-organizing map for feature ex-traction. Journal of Geophysical Research: Oceans, 2006, 111: C05018

[28]Reusch D B, Alley R B, Hewitson B S. Relative performance of self-organizing maps and principal component analysis in pattern extraction from synthe-tic climatological data. Polar Geography, 2005, 29(3): 188‒212

[29]Lobo V J. Information fusion and geographic infor-mation systems. Berlin: Springer, 2009: 19‒36

[30]Solidoro C, Bandelj V, Barbieri P, et al. Under-standing dynamic of biogeochemical properties in the northern Adriatic Sea by using self-organizing maps and k-means clustering. Journal of Geophysical Research, 2007, 112: C07S90.1–C07S90.13

[31]Qian Weihong, Shan Xiaolong, Liang Haoyuan, et al. A generalized beta-advection model to improve unu-sual typhoon track prediction by decomposing total flow into climatic and anomalous flows. Journal of Geophysical Research: Atmospheres, 2014, 199(3): 1097–1117

[32]Pearson K. On lines and planes of closest fit to systems of points in space. The London, Edinburgh and Dublin Philosophical Magazine and Journal of Science, 1901, 2(11): 559‒572

[33]Lorenz E N. Empirical orthogonal functions and sta-tistical weather prediction [R]. Science Report 1. Cambridge, Massachusetts: Statistical Forecasting Department of Meteorology, MIT, 1956: NTIS AD 110268

[34]Kohonen T. Self-organized formation of topologically correct feature maps. Biological Cybernetics, 1982, 43(1): 59‒69

[35]Kohonen T. Self-organizing maps. 3rd ed. New York: Springer, 2001: 501‒505

[36]Vesanto J, Himberg J, Alhoniemi E, et al. SOM toolbox for Matlab 5 [R]. Finland: Helsinki Univ of Technol, 2000

[37]Christiansen B. Atmospheric circulation regimes: can cluster analysis provide the number?. Journal of Cli-mate, 2007, 20(10): 2229‒2250

[38]Michelangeli P A, Vautard R, Legras B. Weather regimes: recurrence and quasi stationarity. Journal of the atmospheric sciences, 1995, 52(8): 1237‒1256

[39]Riddle E E, Stoner M B, Johnson N C, et al. The impact of the MJO on clusters of wintertime circu-lation anomalies over the North American region. Cli-mate Dynamics, 2013, 40: 1749–1766

[40]Chattopadhyay R, Vintzileos A, Zhang C. A des-cription of the Madden-Julian Oscillation based on a self-organizing map. Journal of Climate, 2013, 26(5): 1716‒1732

[41]邓爱军, 陶诗言, 陈烈庭. 我国汛期降水的 EOF 分析. 大气科学, 1989, 13(3): 289‒295

[42]Jiang Ning, Qian Weihong, Du Jun, et al. A com-prehensive approach from the raw and normalized anomalies to the analysis and prediction of the Bei-jing extreme rainfall on July 21, 2012. Natural Ha-zards, 2016, 84(3): 1551‒1567

[43]Qian Weihong. Temporal Climatology and anomalous weather analysis. Singapore: Springer, 2017

[44]Qian Weihong, Jiang Ning, Du Jun. Anomaly based weather analysis vs. traditional total-field based wea-ther analysis for depicting regional heavy rain events. Weather and Forecasting, 2016, 31(1): 71–93

Application of SOM Method in Summer Precipitation Patterns in Eastern China

LUO Weimeng, QIAN Weihong, JIANG Ning, LEUNG Cheuk-Hin

Department of Atmospheric and Oceanic Sciences, School of Physics, Peking University, Beijing 100871; † Corresponding author, E-mail: qianwh@pku.edu.cn

AbstractBased on SOM(self-organizing maps) and EOF(empirical orthogonal function) methods, the daily-mean and seasonal-mean summer precipitation patterns in Eastern China are analyzed and compared. Results show that the SOM method, compared with EOF, describes precipitation distributions more realistically. The spatial structures of summer precipitation patterns can be well explained by 850hPa wind anomaly and 700hPa specific humidity anomaly. As a posterior problem, 850hPa height anomaly can well explain the corresponding precipitation area. However, as a prediction problem, due to other conditions such as moisture and temperature anomaly, the negative height anomaly in the numerical weather forecasting does not always indicate strong precipitation.

Key wordsChina summer precipitation; self-organizing maps (SOM); empirical orthogonal function (EOF)

中图分类号P461

doi:10.13209/j.0479-8023.2018.047

国家自然科学基金(41775067)资助

收稿日期:2017-06-12;

修回日期:2017-07-10;

网络出版日期:2018-06-29