摘要:
针对目前构建新闻脉络链只关注新闻脉络链的主题相似性和文档重要性, 而忽略新闻脉络链逻辑连贯性和可解释性的不足, 以及新闻数据集合指数级增长带来的算法复杂度问题, 从词覆盖的角度提出一种新闻脉络链构建方法, 利用新闻的评论信息来定位新闻事件转折点, 用主题相似与稀疏差异的思想以及RPCA 方法对文档进行逻辑建模, 利用随机游走以及图遍历的方法, 量化并生成可解释且具有很好逻辑连贯性的脉络链。双盲实验表明, 与其他算法相比, 该方法取得较好的效果。
中图分类号:
付佳兵, 董守斌. 一种基于词覆盖的新闻事件脉络链构建方法[J]. 北京大学学报(自然科学版), 2016, 52(1): 104-112.
FU Jiabing, DONG Shoubin. Constructing a News Story Chain from Word Coverage Perspective[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2016, 52(1): 104-112.