宋文杰1,2,顾彦慧1,2,周俊生1,2,孙玉杰1,2,严杰1,曲维光1,2,3
SONG Wenjie1,2, GU Yanhui1,2, ZHOU Junsheng1,2, SUN Yujie1,2, YAN Jie1, QU Weiguang1,2,3
摘要: 提出一种多策略同义词获取方法, 一方面利用《同义词词林》、《中文概念词典》等现有语义词典中蕴含的同义关系获取同义词, 另一方面根据百度百科信息框(Bdbk)中特征词和汉典网(Zdic)中HTML标记获取同义词, 同时采用DIPRE自动获取模式的方法, 从百度百科文本中发现置信度较高的模式和同义关系。实验结果表明, 所提方法在NLP&CC 2012同义词评测数据集中取得较好结果。利用该方法, 以《现代汉语语法信息词典》名词部分为目标, 构建一部同义词词典并进行人工校对, 为《现代汉语语法信息词典》构建较为完善的语义关系体系做出尝试。
中图分类号: