摘要: 在标有复句逻辑语义关系的清华汉语树库上, 研究汉语篇章语义片段自动切分以及篇章关系的自动标注方法。通过比较不同序列标注模型对汉语篇章语义单元切分的性能, 提出基于最大熵模型的汉语篇章结构分析方法。实验结果表明, 篇章语义单元自动切分的F值能达到89.1%, 当篇章语义结构树的高度不超过6层时, 篇章语义关系标注的F值为63%。
中图分类号:
涂眉,周玉,宗成庆. 基于最大熵的汉语篇章结构自动分析方法[J]. 北京大学学报(自然科学版).
TU Mei,ZHOU Yu,ZONG Chengqing. Automatically Parsing Chinese Discourse Based on Maximum Entropy[J]. Acta Scientiarum Naturalium Universitatis Pekinensis.