摘要:
针对对话语料的特点, 提出一种集成显著性话语上下文窗口采样方法的长对话摘要生成模型。该模型分为两个模块: 1) 显著性话语上下文窗口采样模块将对话话语进行显著性评估, 以显著性话语作为采样锚点, 然后设置采样窗口, 将采样锚点左右相邻的话语一起提取为片段, 提取出来的片段包含更丰富的话语关系; 2) 片段间信息融合摘要生成模块利用Transformer块, 将相互独立的片段进行信息融合, 加强片段之间的语义关系, 并且为片段在生成摘要期间分配混合权重。利用一致性损失机制, 鼓励显著性话语上下文窗口采样模块确定更佳的采样锚点。在基于查询的长对话摘要公开数据集QMSum上的实验结果表明, 该模型在ROUGE评估指标上的分数高于现有最好的模型。
吴杰, 王鹏鸣, 熊正坤. 集成显著性话语上下文窗口采样方法的长对话摘要生成模型[J]. 北京大学学报自然科学版, 2024, 60(1): 53-61.
WU Jie, WANG Pengming, XIONG Zhengkun. A Long Dialogue Summary Model Integrating Salience Discourse Context Window Sampling Methods[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2024, 60(1): 53-61.