摘要:
构建耦合自组织映射神经网络(SOFM)和随机森林(RF)的方法, 对中国63个湖泊11年的9种水质指标(5110条数据)进行模式识别。首先采用SOFM对湖泊进行聚类, 以识别污染状况, 然后采用RF分析水质指标对湖泊类别的决定效果, 以确定代表性指标。SOFM的结果显示, 湖泊可以按污染程度分为3类。RF的结果发现, 在分类准确率为80%时, 根据高锰酸盐指数和叶绿素a浓度即可判定湖泊污染程度。该方法可从庞杂的数据中识别出反映水体污染特征的水质指标, 为快速认知水体污染状况及选取监测指标提供参考。
任婷玉, 梁中耀, 陈会丽, 刘永. 基于模式识别方法的湖泊水质污染特征聚类研究[J]. 北京大学学报自然科学版, 2019, 55(2): 335-341.
REN Tingyu, LIANG Zhongyao, CHEN Huili, LIU Yong. Clustering of Lake Variables Based on Pattern Recognition Method[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2019, 55(2): 335-341.