基于字形与语音的音译单元对齐方法

doi:10.13209/j.0479-8023.2016.001

北京大学学报（自然科学版） ›› 2016, Vol. 52 ›› Issue (1): 75-80.DOI: 10.13209/j.0479-8023.2016.001

基于字形与语音的音译单元对齐方法

刘博佳, 徐金安, 陈钰枫, 张玉洁

北京交通大学计算与信息技术学院, 北京 100044

收稿日期:2015-06-18 出版日期:2016-01-20 发布日期:2016-01-20
通讯作者: 徐金安, E-mail: jaxu(at)bjtu.edu.cn
基金资助:
国家自然科学基金(61370130, 61473294)、中央高校基本科研业务费专项资金(2014RC040)和国家国际科技合作专项(2014DFA11350)资助

Integrating of Grapheme-Based and Phoneme-Based Transliteration Unit Alignment Method

LIU Bojia,XU Jin’an, CHEN Yufeng, ZHANG Yujie

School of Computer and Information, Beijing Jiaotong University, Beijing 100044

Received:2015-06-18 Online:2016-01-20 Published:2016-01-20
Contact: XU Jin’an, E-mail: jaxu(at)bjtu.edu.cn

摘要/Abstract

摘要： 为了解决仅采用基于语音或基于字形的音译方法造成的误差过大问题, 以汉英音译为主要研究对象, 运用统计与规则的理论思想, 提出融合基于语音和字形的音译单元对齐方法, 设计了4个实验, 与传统方法进行对比。实验结果显示, 该方法能够很好地提高机器音译的准确性。

关键词: 机器音译, 对齐, N-gram 模型, 基于语音的音译方法, 基于字形的音译方法

Abstract:

In order to solve the errors caused by only using the pheneme-based method or the grapheme-based method, applying the theory of statistics and rules, this paper proposes a new method for transliteration unit alignment which integrates the two main transliteration methods. Four experiments are designed to compare with the traditional methods. Experimental results show that proposed method outperforms other methods in terms of performance in machine transliteration.

Key words: machine transliteration, alignment, N-gram model, grapheme-based method, phoneme-based method

中图分类号:

TP391

刘博佳, 徐金安, 陈钰枫, 张玉洁. 基于字形与语音的音译单元对齐方法[J]. 北京大学学报（自然科学版）, 2016, 52(1): 75-80.

LIU Bojia, XU Jin’an, CHEN Yufeng, ZHANG Yujie. Integrating of Grapheme-Based and Phoneme-Based Transliteration Unit Alignment Method[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2016, 52(1): 75-80.

导出引用管理器 EndNote|Ris|BibTeX

链接本文: https://xbna.pku.edu.cn/CN/10.13209/j.0479-8023.2016.001

https://xbna.pku.edu.cn/CN/Y2016/V52/I1/75

[1]	苗国义, 刘明童, 陈钰枫, 徐金安, 张玉洁, 冯文贺. 融合小句对齐知识的汉英神经机器翻译[J]. 北京大学学报自然科学版, 2022, 58(1): 61-68.
[2]	吴世鑫, 黄德根, 李玖一. 基于语义对齐的生成式文本摘要研究[J]. 北京大学学报自然科学版, 2021, 57(1): 1-6.
[3]	高恩婷, 段湘煜. 英汉机器音译系统对比研究[J]. 北京大学学报自然科学版, 2017, 53(2): 287-294.
[4]	杨萍, 侯宏旭, 蒋玉鹏, 申志鹏, 杜健. 基于双语对齐的汉语–新蒙古文命名实体翻译[J]. 北京大学学报（自然科学版）, 2016, 52(1): 148-154.
[5]	罗维. 词语对齐的快速增量式训练方法研究[J]. 北京大学学报（自然科学版）, 2013, 49(1): 88-94.

基于字形与语音的音译单元对齐方法

Integrating of Grapheme-Based and Phoneme-Based Transliteration Unit Alignment Method

RichHTML

PDF

PDF (翻译版)

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 5

编辑推荐

Metrics

留言