摘要: 采用一个自建的汉语篇章结构语料库(隐式关系占80%)进行隐式关系识别。语料中将篇章关系分成3个层次, 第一层包含因果、并列、转折、解说四大类。在此语料上, 利用上下文特征、词汇特征、依存树特征, 采用最大熵的分类方法对四大类关系进行识别。实验结果显示, 总正确率为62.15%, 其中并列类识别效果最好, F1值达到75.26%。
中图分类号:
孙静,李艳翠,周国栋,冯文贺. 汉语隐式篇章关系识别[J]. 北京大学学报(自然科学版).
SUN Jing,LI Yancui,ZHOU Guodong,FENG Wenhe. Research of Chinese Implicit Discourse Relation Recognition[J]. Acta Scientiarum Naturalium Universitatis Pekinensis.