摘要:
为进一步提升藏文文本自动摘要的性能, 针对DiffuSum模型在藏文摘要任务中因句子表征能力不足、参数规模过大导致的上下文建模受限以及训练成本高等问题, 提出一种融合CINO-LoRA与自调节(Self-condition)的藏文文本自动摘要模型TiDiffuSum。该模型在句子编码器中引入CINO-LoRA机制, 以增强藏文语义表征并显著减少训练参数量; 在扩散生成模块中集成Self-condition策略, 加强对上下文语义的理解与利用。实验结果表明, TiDiffuSum在藏文摘要数据集TSUM上能够将参数量有效压缩至基线模型的0.45%, 且ROUGE-1, ROUGE-2和ROUGE-L指标分别提升1.07, 0.78和1.08, 显著优于基线模型。
王蓉, 才智杰. 融合CINO-LoRA和Self-condition的DiffuSum藏文文本自动摘要[J]. 北京大学学报(自然科学版), 2026, 62(2): 266-274.
WANG Rong, CAI Zhijie. Automatic Summarization of Tibetan Texts Using DiffuSum with CINO-LoRA and Self-condition Integration[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2026, 62(2): 266-274.