摘要: 针对条件随机场模型面对大规模数据传统训练算法单机处理性能不高的问题, 提出一种基于MapReduce框架的条件随机场模型训练并行化方法, 设计了条件随机场模型特征提取及参数估计的并行算法, 实现了迭代缩放算法的并行。实验表明, 所提出的并行化方法在保证训练结果正确性的同时, 大大减少了训练时间, 效率得到较大提升。
中图分类号:
刘滔,雷霖,陈荦,熊伟. 基于MapReduce的中文词性标注CRF模型并行化训练研究[J]. 北京大学学报(自然科学版).
LIU Tao,LEI Lin,CHEN Luo,XIONG Wei. A Parallel Training Research of Chinese Part-of-Speech Tagging CRF Model Based on MapReduce[J]. Acta Scientiarum Naturalium Universitatis Pekinensis.