摘要:
在维吾尔语到汉语等低资源语料库上, 神经机器翻译的拟合训练容易陷入局部最优解, 导致单一模型的翻译结果可能不是全局最优解。针对此问题, 通过集成策略, 有效整合多个模型预测的概率分布, 将多个翻译模型作为一个整体; 同时采用基于交叉熵的重排序方法, 将具有相反解码方向的翻译模型相结合, 最终选出综合得分最高的候选翻译作为输出。在CWMT2015维汉平行语料上的实验结果表明, 与单一的Transformer模型相比, 改进后的方法提升4.82个BLEU值。
张新路, 李晓, 杨雅婷, 王磊, 董瑞. 面向维汉神经机器翻译的双向重排序模型分析[J]. 北京大学学报自然科学版, 2020, 56(1): 31-38.
ZHANG Xinlu, LI Xiao, YANG Yating, WANG Lei, DONG Rui. Analysis of Bi-directional Reranking Model for Uyghur-Chinese Neural Machine Translation[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2020, 56(1): 31-38.