摘要:
针对摘要模型中总结并解释长篇上下文信息存在的困难, 提出一种基于细粒度可解释矩阵, 先抽取再生成的摘要模型(fine-grained interpretable matrix, FGIM), 提升长文本对显著度、更新性和相关度的可解释抽取能力, 引导系统自动生成摘要。该模型通过一个句对判别(pair-wise)抽取器对文章内容进行压缩, 捕获文章中心度高的句子, 将抽取后的文本与生成器相结合, 实现摘要生成。在生成端通过可解释的掩码矩阵, 控制生成摘要的内容属性, 在编码器端分别使用多层Transformer和预训练语言模型BERT来验证其适用性。在标准文本摘要数据集(CNN/DailyMail和NYT50)上的实验表明, 所提模型的ROUGE指标和人工评估结果均优于当前最好的基准模型。实验中还构建两个测试数据集来验证摘要的更新度和相关度, 结果表明所提模型在可控生成方面取得相应的提升。
王浩男, 高扬, 冯俊兰, 胡珉, 王惠欣, 柏宇. 基于细粒度可解释矩阵的摘要生成模型[J]. 北京大学学报自然科学版, 2021, 57(1): 23-30.
WANG Haonan, GAO Yang, FENG Junlan, HU Min, WANG Huixin, BAI Yu. Abstractive Summarization Based on Fine-Grained Interpretable Matrix[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2021, 57(1): 23-30.