摘要:
针对当前神经机器翻译在捕捉复杂句内小句间的语义和结构关系方面存在不足, 导致复杂句长文本翻译的篇章连贯性不佳的问题, 提出一种融合小句对齐知识的汉英神经机器翻译方法。首先提出手工和自动相结合的标注方案, 构建大规模小句对齐的汉英平行语料库, 为模型训练提供丰富的小句级别的汉英双语对齐知识; 然后设计一种基于小句对齐学习的神经机器翻译模型, 通过融合小句对齐知识, 增强模型学习复杂句内小句间语义结构关系的能力。在WMT17, WMT18和WMT19汉英翻译任务中的实验表明, 所提出的方法可以有效地提升神经机器翻译的性能。进一步的评测分析显示, 所提方法能有效地提高汉英神经机器翻译在复杂句翻译上的篇章连贯性。
苗国义, 刘明童, 陈钰枫, 徐金安, 张玉洁, 冯文贺. 融合小句对齐知识的汉英神经机器翻译[J]. 北京大学学报自然科学版, 2022, 58(1): 61-68.
MIAO Guoyi, LIU Mingtong, CHEN Yufeng, XU Jin’an, ZHANG Yujie, FENG Wenhe. Incorporating Clause Alignment Knowledge into Chinese-English Neural Machine Translation[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2022, 58(1): 61-68.