摘要: 介绍了北大计算语言学研究所开发的“唐宋诗计算机辅助研究系统”。该系统以全唐诗(481万字)和宋代部分名家诗(160万字)组成的语料库为基础,运用计算语言学方法对唐宋诗进行分析研究,提取了唐宋诗中的词汇,计5万余条目。在对诗文进行词语切分的基础上,建立了词汇的共现关系、对仗关系以及词汇的作者分布特征信息。系统除了提供面向诗文内容的全文检索功能外,还进一步开发了基于词汇的统计分析和诗句相似性检索等功能,实现了对全唐诗的自动注音。
中图分类号:
胡俊峰,俞士汶. 唐宋诗之计算机辅助深层研究[J]. 北京大学学报(自然科学版).
HU Junfeng,YU Shiwen. The Computer Aided Research Work of Chinese Ancient Poems[J]. Acta Scientiarum Naturalium Universitatis Pekinensis.