摘要: 为提高在线主题的检测效率,作者提出了一种基于实体识别技术的在线主题检测方法,利用新闻报道中的命名实体快速判断新到达报道与历史主题的关系,从而减少对报道间文本相似度的计算。实验结果显示,本文提出的方法能够在不牺牲检测准确率的基础上,显著提高在线主题检测的效率。
中图分类号:
付艳,杨冬青,唐世渭,伍伟,王腾蛟,高军. 基于实体识别的在线主题检测方法[J]. 北京大学学报(自然科学版).
FU Yan,YANG Dongqing,TANG Shiwei,WU Wei,WANG Tengjiao,GAO Jun. On-Line Topic Detection Using Named Entity Recognition[J]. Acta Scientiarum Naturalium Universitatis Pekinensis.