摘要:
针对由于藏医药术语的特殊性、文本资源的稀缺以及语言处理的复杂性, 传统的实体关系抽取方法难以直接应用于藏医药领域的问题, 提出一种基于跨度表示的藏医药文献实体关系抽取方法, 该方法使用跨度表示和TibetanAI_ALBERT_v2.0预训练语言模型进行编码, 通过枚举潜在候选的实体, 解决实体嵌套不能充分识别的问题。同时, 引入KL散度来约束模型在训练和推理阶段不一致的问题。在藏医药领域实体关系抽取数据集TibetanAI_TMDisRE_v1.0上的实验结果表明, 该方法取得显著的性能提升, 精确率、召回率和F1值分别达到84.85%, 77.35%和80.81%。
周青, 拥措, 拉毛东只, 尼玛扎西. 基于跨度表示的藏医药文献实体关系抽取[J]. 北京大学学报(自然科学版), 2025, 61(5): 860-868.
ZHOU Qing, YONG Tso, LAMAO Dongzhi, NYIMA Trashi. Entity Relation Extraction Based on Span Representation for Tibetan Medicine Literature[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2025, 61(5): 860-868.