摘要:
基于《现代汉语语义词典》, 首先建立不同语义层次的词典, 根据词典分别构建模型并进行语义预测, 然后将各个模型进行集成, 通过集成模型再对未登录词进行语义预测, 得到较好的预测性能。利用预测模型对2000年《人民日报》语料进行未登录词语义预测和标注, 最终得到带有未登录词语义义项标注的语料资源。
中图分类号:
尚芬芬, 顾彦慧, 戴茹冰, 李斌, 周俊生, 曲维光. 基于《现代汉语语义词典》的未登录词语义预测研究[J]. 北京大学学报(自然科学版), 2016, 52(1): 10-16.
SHANG Fenfen, GU Yanhui, DAI Rubing, LI Bin, ZHOU Junsheng, QU Weiguang. Research on the Sense Guessing of Chinese Unknown Words Based on “Semantic Knowledge-base of Modern Chinese”[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2016, 52(1): 10-16.