摘要:
为了更好地评价阅读理解模型的鲁棒性, 基于Dureader数据集, 通过自动抽取和人工标注的方法, 对过敏感、过稳定和泛化3个问题分别构建测试数据集。还提出基于答案抽取和掩码位置预测的多任务学习方法。实验结果表明, 所提方法能显著地提高阅读理解模型的鲁棒性, 所构建的测试集能够对模型的鲁棒性进行有效评估。
李烨秋, 唐竑轩, 钱锦, 邹博伟, 洪宇. 中文机器阅读理解的鲁棒性研究[J]. 北京大学学报自然科学版, 2021, 57(1): 16-22.
LI Yeqiu, TANG Hongxuan, QIAN Jin, ZOU Bowei, HONG Yu. Robustness of Chinese Machine Reading Comprehension[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2021, 57(1): 16-22.