摘要: 通过对藏文数词内部构词规律及外部边界信息进行分析, 提出对藏文数词基本构件定义的方案。采取最优路径决策模型判断数词构件边界, 然后通过有限自动机模型识别并翻译基本数词, 最后用模板匹配算法处理复杂数词。结果表明,提出的方法对数词识别与翻译的F值达到98.73%, 在藏汉机器翻译的测试集上的BLEU提高了2.64%。
中图分类号:
孙萌,华却才让,刘凯,吕雅娟,刘群. 藏文数词识别与翻译[J]. 北京大学学报(自然科学版).
SUN Meng,HUA Quecairang,LIU Kai,Lü Yajuan,LIU Qun. Tibetan Number Identification and Translation[J]. Acta Scientiarum Naturalium Universitatis Pekinensis.