摘要:
将篇章结构表示为小句关联结构, 与修辞结构等层次化篇章结构模式相比, 可以有效地刻画非连续和跨层级的小句之间的直接语义关联。首先, 提出篇章小句关联结构的形式表示、判断准则和形式限制, 并进行人工标注。然后, 对汉语篇章小句关联结构进行自动识别。在自建汉语篇章小句关联结构语料库上, 基于分类模型, 设计连接词和词汇等分类特征, 得到的最佳识别准确率达92.70%。实验结果表明, 语料整体取样比独立取样取得的去环效果好; 词汇、小句距离及句域等分类特征对识别的贡献较大; 远距离和跨大句是小句关联识别的难点, 但相邻小句和同一大句内的小句对的不相关识别难度更大。
冯文贺, 陈伊琳, 任亚峰, 任函. 汉语篇章小句关联结构的表示与识别[J]. 北京大学学报自然科学版, 2020, 56(1): 23-30.
FENG Wenhe, CHEN Yilin, REN Yafeng, REN Han. Representation and Recognition of Clauses Relevance Structure in Chinese Text[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2020, 56(1): 23-30.