北京大学学报(自然科学版) ›› 2016, Vol. 52 ›› Issue (1): 134-140.DOI: 10.13209/j.0479-8023.2016.017
王宝鑫, 郑德权, 王晓雪, 赵姗姗, 赵铁军#br#
WANG Baoxin, ZHENG Dequan, WANG Xiaoxue, ZHAO Shanshan, ZHAO Tiejun
摘要:
利用选择类问题具有明确候选项的特点, 简化问题分类过程, 并针对长文本语义蕴含短文本语义的语言现象, 提出一种根据文本蕴含强度大小对候选答案进行排序的方法。在没有大规模问答对的情况下, 采用维基百科中文语料库, 以全国各省市高考地理选择题作为实验数据, 通过句子相似度和文本蕴含两种方法来解答地理选择题。实验表明, 基于文本蕴含方法的准确率为36.93%, 比基于词嵌入的句子相似度方法提高2.44%, 比基于向量空间模型的句子相似度方法提高7.66%, 验证了该文本蕴含强度计算方法的有效性。
中图分类号: