Integrating of Grapheme-Based and Phoneme-Based Transliteration Unit Alignment Method

doi:10.13209/j.0479-8023.2016.001

Acta Scientiarum Naturalium Universitatis Pekinensis ›› 2016, Vol. 52 ›› Issue (1): 75-80.DOI: 10.13209/j.0479-8023.2016.001

Previous Articles Next Articles

Integrating of Grapheme-Based and Phoneme-Based Transliteration Unit Alignment Method

LIU Bojia,XU Jin’an, CHEN Yufeng, ZHANG Yujie

School of Computer and Information, Beijing Jiaotong University, Beijing 100044

Received:2015-06-18 Online:2016-01-20 Published:2016-01-20
Contact: XU Jin’an, E-mail: jaxu(at)bjtu.edu.cn

基于字形与语音的音译单元对齐方法

刘博佳, 徐金安, 陈钰枫, 张玉洁

北京交通大学计算与信息技术学院, 北京 100044

通讯作者: 徐金安, E-mail: jaxu(at)bjtu.edu.cn
基金资助:
国家自然科学基金(61370130, 61473294)、中央高校基本科研业务费专项资金(2014RC040)和国家国际科技合作专项(2014DFA11350)资助

Abstract

Abstract:

In order to solve the errors caused by only using the pheneme-based method or the grapheme-based method, applying the theory of statistics and rules, this paper proposes a new method for transliteration unit alignment which integrates the two main transliteration methods. Four experiments are designed to compare with the traditional methods. Experimental results show that proposed method outperforms other methods in terms of performance in machine transliteration.

Key words: machine transliteration, alignment, N-gram model, grapheme-based method, phoneme-based method

摘要： 为了解决仅采用基于语音或基于字形的音译方法造成的误差过大问题, 以汉英音译为主要研究对象, 运用统计与规则的理论思想, 提出融合基于语音和字形的音译单元对齐方法, 设计了4个实验, 与传统方法进行对比。实验结果显示, 该方法能够很好地提高机器音译的准确性。

关键词: 机器音译, 对齐, N-gram 模型, 基于语音的音译方法, 基于字形的音译方法

CLC Number:

TP391

LIU Bojia, XU Jin’an, CHEN Yufeng, ZHANG Yujie. Integrating of Grapheme-Based and Phoneme-Based Transliteration Unit Alignment Method[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2016, 52(1): 75-80.

刘博佳, 徐金安, 陈钰枫, 张玉洁. 基于字形与语音的音译单元对齐方法[J]. 北京大学学报（自然科学版）, 2016, 52(1): 75-80.

Add to citation manager EndNote|Ris|BibTeX

URL: https://xbna.pku.edu.cn/EN/10.13209/j.0479-8023.2016.001

https://xbna.pku.edu.cn/EN/Y2016/V52/I1/75

[1]	MIAO Guoyi, LIU Mingtong, CHEN Yufeng, XU Jin’an, ZHANG Yujie, FENG Wenhe. Incorporating Clause Alignment Knowledge into Chinese-English Neural Machine Translation [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2022, 58(1): 61-68.
[2]	WU Shixin, HUANG Degen, LI Jiuyi. Abstractive Text Summarization Based on Semantic Alignment Network [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2021, 57(1): 1-6.
[3]	Enting GAO, Xiangyu DUAN. A Comparative Study on English-Chinese Machine Transliteration [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2017, 53(2): 287-294.
[4]	YANG Ping, HOU Hongxu, JIANG Yupeng, SHEN Zhipeng, DU Jian. Chinese-Slavic Mongolian Named Entity Translation Based on Word Alignment [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2016, 52(1): 148-154.
[5]	LIU Yingbin, SUN Yannan, XUN Endong. Chinese Calligraphy Alignment Based on 3D Point Set Registration [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2016, 52(1): 81-88.
[6]	LUO Wei. Research on Fast Incremental Training Algorithm for Word Alignment [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2013, 49(1): 88-94.

Integrating of Grapheme-Based and Phoneme-Based Transliteration Unit Alignment Method

基于字形与语音的音译单元对齐方法

RichHTML

PDF

Knowledge

Abstract

Cite this article

share this article

References

Related Articles 6

Recommended Articles

Metrics