Chinese-Slavic Mongolian Named Entity Translation Based on Word Alignment

doi:10.13209/j.0479-8023.2016.006

Acta Scientiarum Naturalium Universitatis Pekinensis ›› 2016, Vol. 52 ›› Issue (1): 148-154.DOI: 10.13209/j.0479-8023.2016.006

Previous Articles Next Articles

Chinese-Slavic Mongolian Named Entity Translation Based on Word Alignment

YANG Ping^1,2, HOU Hongxu¹, JIANG Yupeng¹, SHEN Zhipeng¹, DU Jian¹

1. College of Computer Science, Inner Mongolia University, Hohhot 010021
2. Department of Computing, Linfen Vocational and Technical College, Linfen 041000

Received:2015-06-07 Online:2016-01-20 Published:2016-01-20
Contact: HOU Hongxu, E-mail: cshhx(at)imu.edu.cn

基于双语对齐的汉语–新蒙古文命名实体翻译

杨萍^1,2, 侯宏旭¹, 蒋玉鹏¹, 申志鹏¹, 杜健¹

1. 内蒙古大学计算机学院, 呼和浩特 010021
2. 临汾职业技术学院计算机系, 临汾 041000

通讯作者: 侯宏旭, E-mail: cshhx(at)imu.edu.cn
基金资助:
国家自然科学基金(61362028)资助

Abstract

Abstract:

Chinese to Slavic Mongolian Named Entity Translation in cross Chinese and Slavic Mongolian information processing has a very important significance. However, using the machine translation method directly cannot achieve satisfactory result. In order to solve the above problem, a novel approach was proposed to extract Chinese-Slavic Mongolian Named Entity pairs automatically. Only the Chinese named entities need to be identified, then extracting all of the candidate named entity pairs using sliding window method based on HMM word alignment result. Finally filtering all of the candidate named entity translation units based on Max Entropy Model integrated with five features, and choose the most probable aligned Slavic Mongolian NEs to the Chinese NEs. Experimental results show that this approach outperforms HMM model, achieves high quality of Chinese-Slavic Mongolian named entity pairs with relatively high precision, even though sometimes the word alignment result is partially correct.

Key words: named entity, recognition, translation, bilingual word alignment

摘要：

汉语–新蒙古文命名实体翻译在跨汉语–新蒙古文信息处理中具有重要意义, 而直接使用机器翻译的方法不能达到满意的结果。针对上述问题, 提出一种从汉语–新蒙古文平行语料中自动抽取汉语–新蒙古文命名实体翻译对的方法。该方法只需对汉语端进行命名实体标注; 然后基于双语HMM词对齐结果, 利用滑动窗口的方法抽取所有候选命名实体翻译对; 最后基于融合5 种特征的最大熵模型, 对所有候选翻译单位进行过滤, 选取与汉语端命名实体相对应的置信度最高的新蒙古文命名实体翻译单位。实验结果表明, 该方法优于基于HMM的方法, 在对齐模型只是部分准确的情况下, 也获得较高准确率的汉语–新蒙古文命名实体翻译对。

关键词: 命名实体, 识别, 翻译, 双语对齐

CLC Number:

TP391

YANG Ping, HOU Hongxu, JIANG Yupeng, SHEN Zhipeng, DU Jian. Chinese-Slavic Mongolian Named Entity Translation Based on Word Alignment[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2016, 52(1): 148-154.

杨萍, 侯宏旭, 蒋玉鹏, 申志鹏, 杜健. 基于双语对齐的汉语–新蒙古文命名实体翻译[J]. 北京大学学报（自然科学版）, 2016, 52(1): 148-154.

Add to citation manager EndNote|Ris|BibTeX

URL: https://xbna.pku.edu.cn/EN/10.13209/j.0479-8023.2016.006

https://xbna.pku.edu.cn/EN/Y2016/V52/I1/148

[1]	YU Xiangqian, HE Donghua, SHI Weihong, XIAO Chijie, LIU Si, ZONG Qiugang, CHEN Hongfei, WANG Linghua, ZOU Hong, WANG Yongfu. A Large Range and Low Noise Vector Magnetometer for Magnetic Target Recognition [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2025, 61(3): 451-455.
[2]	ZHANG Yue, WANG Changzheng, SU Xuefeng, YAN Zhichao, ZHANG Guangjun, SHAO Wenyuan, LI Ru. Few-shot Named Entity Recognition Method Based on Semantic Information Awareness of Labels [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2024, 60(3): 413-421.
[3]	LI Chao, HOU Xia, QIAO Xiuming. A Low-Resource Named Entity Recognition Method for Cultural Heritage Field Incorporating Knowledge Fusion [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2024, 60(1): 13-22.
[4]	ZHANG Yazhou, WANG Mengyao, RONG Lu, YU Yang, ZHAO Dongming, QIN Jing. Can ChatGPT Be Served as the Sentiment Expert? An Evaluation of ChatGPT on Sentiment and Metaphor Analysis [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2024, 60(1): 43-52.
[5]	ZHOU Bohan, CAO Jian, WANG Yuan. A Transformer-based Syntax Tree Decoder for Handwritten Mathematical Expression Recognition [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2023, 59(6): 909-914.
[6]	FENG Qin, GONG Zhengxian, YE Heng, ZHOU Guodong. Document Constrained Translation Quality Estimation Model [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2023, 59(1): 39-47.
[7]	YOU Xindong, GE Haojie, HAN Junmei, LI Yuxian, LÜ Xueqiang. Recognition of Complex Entities in Weapons and Equipment Field [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2022, 58(3): 391-404.
[8]	WANG Qian, LI Maoxi, WU Shuixiu, WANG Mingwen. Neural Machine Translation Based on XLM-R Cross-lingual Pre-training Language Model [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2022, 58(1): 29-36.
[9]	MIAO Guoyi, LIU Mingtong, CHEN Yufeng, XU Jin’an, ZHANG Yujie, FENG Wenhe. Incorporating Clause Alignment Knowledge into Chinese-English Neural Machine Translation [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2022, 58(1): 61-68.
[10]	LIN Zijie, LONG Yunfei, DU Jiachen, XU Ruifeng. A Multi-modal Sentiment Recognition Method Based on Multi-task Learning [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2021, 57(1): 7-15.
[11]	WANG Yasong, LIU Mingtong, ZHANG Yujie, XU Jin’an, CHEN Yufeng. Research on the Construction and Application of Paraphrase Parallel Corpus [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2021, 57(1): 68-74.
[12]	LI Tianran, LIU Mingtong, ZHANG Yujie, XU Jin’an, CHEN Yufeng. A Review of Entity Linking Research Based on Deep Learning [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2021, 57(1): 91-98.
[13]	BAN Yikun, ZHANG Weiqi, ZHOU Yuchen, YI Jiangfang. Evaluation of Technologies Improving Translation Coverage of TLB Using Continuity of Memory Mapping [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2020, 56(6): 1165-1168.
[14]	HAN Jiayuan, ZHANG Xianbing, ZHOU Shiyong. Relocation and Focus Mechanism Estimation of the Strong Earthquake Ms≥7.0 from 1918 to 1970 around Asia and Analysis of Their Uncertainties [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2020, 56(5): 867-874.
[15]	ZHANG Xinlu, LI Xiao, YANG Yating, WANG Lei, DONG Rui. Analysis of Bi-directional Reranking Model for Uyghur-Chinese Neural Machine Translation [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2020, 56(1): 31-38.

Chinese-Slavic Mongolian Named Entity Translation Based on Word Alignment

基于双语对齐的汉语–新蒙古文命名实体翻译

RichHTML

PDF

Knowledge

Abstract

Cite this article

share this article

References

Related Articles 15

Recommended Articles

Metrics