摘要:
针对当前生成式文本摘要模型在解码时对摘要整体语义信息利用不充分的问题, 提出一种基于语义对齐的神经网络文本摘要方法。该方法以带注意力、Pointer机制和Coverage机制的Sequence-to-Sequence模型为基础, 在编码器与解码器之间加入语义对齐网络, 实现文本到摘要的语义信息对齐; 将获得的摘要整体语义信息与解码器的词汇预测上下文向量进行拼接, 使解码器在预测当前词汇时不仅利用已预测词汇序列的部分语义, 而且考虑拟预测摘要的整体语义。在中文新闻语料LCSTS上的实验表明, 该模型能够有效地提高文本摘要的质量, 在字粒度上的实验显示, 加入语义对齐机制可以使Rouge_L值提高5.4个百分点。
吴世鑫, 黄德根, 李玖一. 基于语义对齐的生成式文本摘要研究[J]. 北京大学学报自然科学版, 2021, 57(1): 1-6.
WU Shixin, HUANG Degen, LI Jiuyi. Abstractive Text Summarization Based on Semantic Alignment Network[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2021, 57(1): 1-6.