摘要:
针对由于数据的稀疏性和双语数据规模的局限性造成的大量高质量短语对没有生成的问题, 在基于短语的统计机器翻译系统中, 通过对传统短语抽取算法抽取的短语对进行分解、替换、生成等操作, 生成传统方法无法抽取的实例短语对。在汉英新闻和汉英口语翻译任务上, 与基线系统相比, 该方法在多个测试集上明显提高了翻译系统的翻译质量, 在部分测试集上BLEU 值可提高1%左右。
中图分类号:
李强, 李沐, 张冬冬, 朱靖波. 统计机器翻译中实例短语对研究[J]. 北京大学学报(自然科学版), 2016, 52(1): 113-119.
LI Qiang, LI Mu, ZHANG Dongdong, ZHU Jingbo. Research on Example-Based Phrase Pairs in Statistical Machine Translation[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2016, 52(1): 113-119.