Translation Similarity Model Based on Bilingual Compositional Semantics

Abstract

Abstract: The authors propose a translation similarity model based on bilingual compositional semantics to integrate the bilingual semantic similarity feature into decoding process to improve translation quality. In the proposed model, monolingual compositional vectors for phrases are obtained at the source and target side respectively using distributional approach. These monolingual vectors are then projected onto the same semantic space and therefore transformed into bilingual compositional vectors. Base on this semantic space, translation similarity between source phrases and their corresponding target phrases is calculated. The similarities are integrated into the decoder as a new feature. Experiments on Chinese-to-English NIST06 and NIST08 test sets show that the proposed model significantly outperforms the baseline by 0.56 and 0.42 BLEU points respectively.

Key words: semantic compositionality, machine translation, distributed representations, neural network

摘要： 提出基于双语合成语义的翻译相似度模型, 通过在翻译过程中引入双语语义相似度特征提高翻译性能。首先利用分布式方法分别在源端和目标端获取短语的单语合成语义向量, 然后利用神经网络将它们映射到同一语义空间, 获得双语合成语义向量。在该语义空间, 计算源语言短语和对应的目标语言短语之间基于合成语义向量的翻译相似度, 将其作为一个新特征加入解码器。在汉英翻译NIST06和NIST08测试数据集上, 相较于基准系统, 基于双语合成语义的翻译相似度模型获得0.56和0.42 BLEU值的显著性提高。

关键词: 语义合成, 机器翻译, 分布式表示, 神经网络

CLC Number:

TP391

WANG Chaochao,XIONG Deyi,ZHANG Min. Translation Similarity Model Based on Bilingual Compositional Semantics[J]. Acta Scientiarum Naturalium Universitatis Pekinensis.

王超超,熊德意,张民. 基于双语合成语义的翻译相似度模型[J]. 北京大学学报（自然科学版）.

Add to citation manager EndNote|Ris|BibTeX

URL: https://xbna.pku.edu.cn/EN/

https://xbna.pku.edu.cn/EN/Y2015/V51/I2/335

[1]	LUO Wei, LIU Yu, HUANG Qiang, WU Zhihao. Leveraging Graph Structure and Simple Recurrence for Map Matching [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2024, 60(6): 979-988.
[2]	DING Yawei, CAO Jian, LI Qibin, FENG Shuo, YANG Chentao, WANG Yuan, ZHANG Xing. Design of Acceleration Unit of Encoding and Frame Generation for PAICORE2.0 [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2024, 60(5): 786-798.
[3]	WU Hui, CHEN Xu, JING Yongjun, WANG Shuyang. MFA-SGWNN: Botnet Detection Based on Multi-Feature Aggregation Spectral Graph Wavelet Neural Network [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2024, 60(3): 403-412.
[4]	LIU Lichao, HU Tianyue, LI Xixi, LIU Yimou, LIANG Shanglin, HUANG Jiandong. Prestack Surface Multiple Suppression Method Based on Matching Algorithm with Unsupervised Neural Network [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2024, 60(3): 453-463.
[5]	LI Dai, WANG Tianmu, ZHANG Si, QIN Yue, XIE Fugui, LIU Xinjun, NIE Zhenguo, HUANG Hongshi. Intelligent Diagnosis on Anterior Cruciate Ligament Deficiency Based on Plantar Pressure and ConvLSTM Neural Network [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2024, 60(1): 109-117.
[6]	LIU Jiaju, LI Jincheng, GUO Huaicheng, YUAN Peng, LI Zheng, ZHANG Yang, WANG Zhiyong. Study on Hydrochemical Change Trend of Yarlung Tsangpo River Based on Artificial Neural Network [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2023, 59(6): 1043-1051.
[7]	ZHANG Ling, CAO Jian, ZHANG Yuan, FENG Shuo, WANG Yuan. Reinforcement Learning of Spiking Neural Network Based on Knowledge Distillation [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2023, 59(5): 757-763.
[8]	LIU Xiangcheng, CAO Jian, YAO Hongyi, XU Pengtao, ZHANG Yuan, WANG Yuan. AdaPruner: Adaptive Channel Pruning and Effective Weights Inheritance [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2023, 59(5): 764-772.
[9]	ZHOU Xiangyu, MAO Shanjun, LI Mei. Bearing Fault Diagnosis Method Based on Down-Sampling in Frequency Domain and CNN [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2023, 59(2): 251-260.
[10]	ZHAO Dandan, ZHANG Junpeng, MENG Jiana, ZHANG Zhihao, SU Wen. Medical Entity Relation Extraction Based on Pre-trained Model and Hybrid Neural Network [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2023, 59(1): 65-75.
[11]	XIE Hao, CAO Jian, LI Pu, ZHAO Xiongbo, ZHANG Xing. A Hardware Accelerator for SSD Object Detection Algorithm Based on FPGA [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2022, 58(6): 1015-1022.
[12]	XU Pengtao, CAO Jian, SUN Wenyu, LI Pu, WANG Yuan, ZHANG Xing. Layer Pruning via Fusible Residual Convolutional Block for Deep Neural Networks [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2022, 58(5): 801-807.
[13]	XU Pengtao, CAO Jian, CHEN Weiqian, LIU Shengrong, WANG Yuan, ZHANG Xing. Post Training Quantization Preprocessing Method of Convolutional Neural Network via Outlier Removal [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2022, 58(5): 808-812.
[14]	QU Yonglin, WEN Xinyu, ZHANG Muqi, LIU Zhe. Develop an Objective Post-processing System with Artificial Neural Network to Improve Numerical Weather Prediction for the Olympic Winter Games Beijing 2022 [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2022, 58(2): 210-220.
[15]	ZHANG Muqi, WEN Xinyu, BAO Yun, QU Yonglin. Statistical Downscaled Climate Projection Dataset for China Using Artificial Neural Network [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2022, 58(2): 221-233.

Translation Similarity Model Based on Bilingual Compositional Semantics

基于双语合成语义的翻译相似度模型

PDF

Knowledge

Abstract

Cite this article

share this article

References

Related Articles 15

Recommended Articles

Metrics