Japanese Time Expression Recognition and Translation

Abstract

Abstract: Based on the defined knowledge base, the authors presented a Japanese time expression recognition method through combining rules set strengthened by knowledge base with statistical model. In order to increase recognition accuracy, according to the Timex2 standards’ granular classification on time, the knowledge base was progressively expanded and reconstructed given the Japanese time characteristic to achieve rules set optimization and update. Simultaneously, CRF model was fused to enhance the generalization ability of Japanese time expression recognition. The authors studied the time translation accuracy of phrase-based translation model and proved the necessity of combing rules with statistical machine translation (SMT). Experiment results show that the F1 value of Japanese time expression recognition reaches 0.8987 on open test, and both the precision and recall by the method based on rules and parallel dictionary of Japanese to Chinese time expression are a bit higher than those by the method based on statistical translation model.

Key words: knowledge base, rule, statistical model, statistical machine translation, time parallel dictionary

摘要： 基于自定义知识库, 提出一种知识库强化规则集以及与统计模型相结合的日语时间表达式识别方法,旨在不断提高时间表达式的识别精准度。按照Timex2标准对时间表现的细化分类, 结合日语时间词的特点, 渐进地扩展重构日语时间表达式知识库, 实现基于知识库获取的规则集的优化更新。同时, 融合条件随机场CRF统计模型, 提高日语时间表达式识别的泛化能力。通过考察基于短语的翻译模型翻译时间词的精度, 提出统计机器翻译(SMT)结合规则翻译日语时间词的必要性。实验结果显示, 日语时间表达式识别的开放测试F1值达到0.8987, 基于《日汉时间词平行字典》与规则的翻译精度和召回率都略高于基于统计机器翻译模型。

关键词: 知识库, 规则, 统计模型, 统计机器翻译, 时间词平行字典

CLC Number:

TP391

ZHAO Ziyu,XU Jin’an,ZHANG Yujie,LIU Jiangming. Japanese Time Expression Recognition and Translation[J]. Acta Scientiarum Naturalium Universitatis Pekinensis.

赵紫玉,徐金安,张玉洁,刘江鸣. 日语时间表达式识别与日汉翻译研究[J]. 北京大学学报（自然科学版）.

Add to citation manager EndNote|Ris|BibTeX

URL: https://xbna.pku.edu.cn/EN/

https://xbna.pku.edu.cn/EN/Y2014/V50/I1/180

[1]	YOU Xindong, GE Haojie, HAN Junmei, LI Yuxian, LÜ Xueqiang. Recognition of Complex Entities in Weapons and Equipment Field [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2022, 58(3): 391-404.
[2]	WANG Yinmiao, HAN Zhimin. Knowledge Bases Completion Based on Multi-hop Paths [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2022, 58(1): 7-12.
[3]	LI Juan. A study on the Construction of Chinese Near-Synonyms Knowledge Base [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2022, 58(1): 106-112.
[4]	LI Tianran, LIU Mingtong, ZHANG Yujie, XU Jin’an, CHEN Yufeng. A Review of Entity Linking Research Based on Deep Learning [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2021, 57(1): 91-98.
[5]	ZHANG Shanfa, WANG Qian, GUAN Chunya, SHEN Xiaoxue, LI Ruili. Study on the Occurrence Law of Red Tide and Its Influencing Factors in the Offshore Waters of China from 2001 to 2017 [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2020, 56(6): 1129-1140.
[6]	QIU Yu, CHENG Li, Daniyal Alghazzawi. Semantic Search on Non-Factoid Questions for Domain-Specific Question Answering Systems [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2019, 55(1): 55-64.
[7]	LIU Qiuhui, ZHANG Kunli, XU Hongfei, YU Shiwen, ZAN Hongying. Research on Automatic Recognition of Auxiliary “DE” [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2018, 54(3): 466-474.
[8]	ZHOU Botong, SUN Chengjie, LIN Lei, LIU Bingquan. LSTM Based Question Answering for Large Scale Knowledge Base [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2018, 54(2): 286-292.
[9]	Jie JIANG, Rui XIA. Microblog Sentiment Classification via Combining Rule-based and Machine Learning Methods [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2017, 53(2): 247-254.
[10]	Nan WANG, Jin’an XU, Fang MING, Yufeng CHEN, Yujie ZHANG. Integrating Voice Features into Japanese-English Hierarchical Phrase Based Model [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2017, 53(2): 305-313.
[11]	ZHAO Zhen, LIU Caishan, LU Jiandong. On Nonholonomic Constraints about the Pure Rolling of Point Contact [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2016, 52(4): 713-716.
[12]	LI Qiang, LI Mu, ZHANG Dongdong, ZHU Jingbo. Research on Example-Based Phrase Pairs in Statistical Machine Translation [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2016, 52(1): 113-119.
[13]	Turdi Tohti, Winira Musajan, Askar Hamdulla. Uyghur Text Automatic Segmentation Method Based on Inter-Word Association Degree Measuring [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2016, 52(1): 155-164.
[14]	BAI Linnan,HU Renfen,LIU Zhiying. Recognition of Comparative Sentences Based on Syntactic and Semantic Rules-System [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2015, 51(2): 275-281.
[15]	YIN Youquan,DI Yuan. On the Plastic Potential Theory of Elasto-plastic Constitutive Relation for Geomaterials [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2014, 50(2): 201-206.

Japanese Time Expression Recognition and Translation

日语时间表达式识别与日汉翻译研究

PDF

Knowledge

Abstract

Cite this article

share this article

References

Related Articles 15

Recommended Articles

Metrics