摘要:
针对中文零指代问题, 从篇章视角进行理论分析, 并完成中文篇章零元素语料库(Chinese Discourse Zero Corpus, CDZC)的构建工作。首先, 整理和分析已有的理论研究以及语料资源, 探究篇章层面中文零元素语料库标注的必要性。然后, 采用自底向上、前向搜索的标注策略和人机结合的半自动标注方式, 完成CDZC语料库的构建。最后, 对该语料库进行一系列详细的统计分析。结果表明, CDZC能够充分反映出中文零元素省略的语言特点, 为相关研究提供语料资源支持。
盛晨, 孔芳, 周国栋. 中文篇章零元素语料库构建[J]. 北京大学学报自然科学版, 2019, 55(1): 15-21.
SHENG Chen, KONG Fang, ZHOU Guodong. Building Chinese Zero Corpus Form Discourse Perspective[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2019, 55(1): 15-21.