摘要:
基于预训练语言模型(LM)和知识图谱(KG)的联合推理在应用于生物医学领域时, 因其专业术语表示方式多样、语义歧义以及知识图谱存在大量噪声等问题, 联合推理模型并未取得较好的效果。基于此, 提出一种面向生物医学领域的可解释推理方法DF-GNN。该方法统一了文本和知识图谱的实体表示方式, 利用大型生物医学知识库构造子图并进行去噪, 改进文本和子图实体的信息交互方式, 增加对应文本和子图节点的直接交互, 使得两个模态的信息能够深度融合。同时, 利用知识图谱的路径信息对模型推理过程提供了可解释性。在公开数据集MedQA-USMLE和MedMCQA上的测试结果表明, 与现有的生物医学领域联合推理模型相比, DF-GNN可以更可靠地利用结构化知识进行推理并提供解释性。
徐寅鑫, 杨宗保, 林宇晨, 胡金龙, 董守斌. 基于知识图谱和预训练语言模型深度融合的可解释生物医学推理[J]. 北京大学学报自然科学版, 2024, 60(1): 62-70.
XU Yinxin, YANG Zongbao, LIN Yuchen, HU Jinlong, DONG Shoubin. Interpretable Biomedical Reasoning via Deep Fusion of Knowledge Graph and Pre-trained Language Models[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2024, 60(1): 62-70.