摘要:
针对武器装备领域复杂实体的特点, 提出一种融合多特征后挂载武器装备领域知识的复杂命名实体识别方法。首先, 使用BERT 模型对武器装备领域数据进行预训练, 得到数据向量, 使用Word2Vec模型学习郑码、五笔、拼音和笔画的上下位特征, 获取特征向量。然后, 将数据向量与特征向量融合, 利用Bi-LSTM模型进行编码, 使用CRF解码得到标签序列。最后, 基于武器装备领域知识, 对标签序列进行复杂实体的触发检测, 完成复杂命名实体识别。使用环球军事网数据作为语料进行实验, 分析不同的特征组合、不同神经网络模型下的识别效果, 并提出适用于评价复杂命名实体识别结果的计算方法。实验结果表明, 提出的挂载领域知识且融合多特征的武器装备复杂命名实体识别方法的F1值达到95.37%, 优于现有方法。
游新冬, 葛昊杰, 韩君妹, 李育贤, 吕学强. 面向武器装备领域的复杂实体识别[J]. 北京大学学报自然科学版, 2022, 58(3): 391-404.
YOU Xindong, GE Haojie, HAN Junmei, LI Yuxian, LÜ Xueqiang. Recognition of Complex Entities in Weapons and Equipment Field[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2022, 58(3): 391-404.