摘要:
基于藏文La格例句的自动分类在藏语自然语言处理领域的重要性, 根据藏文La格的用法和添接规则, 在对藏文La格例句进行分类并定义分类概念的基础上, 提出一种融合双通道音节特征的藏文La格例句自动分类模型。该模型首先使用word2vec和 Glove构建双通道藏文音节嵌入, 分别在每路卷积中融合双通道音节特征, 丰富输入特征的表达和提高卷积层的空间表征能力; 然后在每一路卷积均使用结合层级注意力机制的Bi-LSTM学习时序特征后, 拼接多路特征, 提高上下文时序特征的学习能力; 最后通过全链接层和Softmax层实现藏文La格例句自动分类。实验结果表明, 该模型在测试集上的藏文La格例句分类准确率达到 90.26%。
班玛宝, 才让加, 张瑞, 色差甲, 卓玛扎西. 融合双通道音节特征的藏文La格例句自动分类模型[J]. 北京大学学报自然科学版, 2022, 58(1): 91-98.
BAN Mabao, CAI Rangjia, ZHANG Rui, SE Chajia, ZHUO Mazhaxi.
An Automatic Classification Model of Tibetan La Case Example Sentences with Fusion Dual-channel Syllable Features
[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2022, 58(1): 91-98.