摘要:
在少样本命名实体识别方法中, 目前广泛应用的方法是基于原型网络的两阶段模型。但是, 该方法未充分利用实体标签中的语义信息, 且在距离计算中过度依赖实体类型原型向量, 导致模型泛化能力差。针对这些问题, 提出一种基于标签语义信息感知的少样本命名实体识别方法。该方法是一种先进行实体跨度检测, 再判断实体类型的两阶段方法。在构建实体类型原型向量时, 将对应实体类型包含的语义信息考虑在内, 通过维度转换层将其与原型向量相融合。在对新样本进行实体识别时, 将实体类型的正负样本与实体类型原型向量组成实体类型三元组, 依据样本到三元组的距离对其进行分类。在多个数据集上的实验结果证明, 该模型的性能比以往的模型有较大的提升。
张越, 王长征, 苏雪峰, 闫智超, 张广军, 邵文远, 李茹. 基于标签语义信息感知的少样本命名实体识别方法[J]. 北京大学学报自然科学版, 2024, 60(3): 413-421.
ZHANG Yue, WANG Changzheng, SU Xuefeng, YAN Zhichao, ZHANG Guangjun, SHAO Wenyuan, LI Ru. Few-shot Named Entity Recognition Method Based on Semantic Information Awareness of Labels[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2024, 60(3): 413-421.