摘要:
面向财税领域非事实型问题, 提出基于语义检索的方法来抽取答案。首先使用领域知识库对问题及领域文档进行语义标注, 引入语义相似度特征提高法规及案例的检索准确率; 其次使用排序学习算法融合领域文本的多种特征对法规检索结果优化; 最后使用法规特征对案例检索结果进行筛选, 并从相似案例中抽取相应答案。在真实数据集上的测试结果表明, 该方法在准确率和效率上比基准方法有显著提升。
仇瑜, 程力, Daniyal Alghazzawi. 特定领域问答系统中基于语义检索的非事实型问题研究[J]. 北京大学学报自然科学版, 2019, 55(1): 55-64.
QIU Yu, CHENG Li, Daniyal Alghazzawi. Semantic Search on Non-Factoid Questions for Domain-Specific Question Answering Systems[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2019, 55(1): 55-64.