摘要:
针对在线医疗文本, 设计考虑医疗领域特性的识别特征, 并在自建数据集上进行实体识别实验。针对常见的5 类疾病: 胃炎、肺癌、哮喘、高血压和糖尿病, 采用近年来较先进的机器学习模型条件随机场, 进行训练和测试, 抽取目标实体包括疾病、症状、药品、治疗方法和检查5类。通过采用逐一添加特征的实验方式, 验证所提特征的有效性, 取得总体上81.26%的准确率和60.18%的召回率, 随后对识别特征给出进一步分析。
中图分类号:
苏娅, 刘杰, 黄亚楼. 在线医疗文本中的实体识别研究[J]. 北京大学学报自然科学版, 2016, 52(1): 1-9.
SU Ya, LIU Jie, HUANG Yalou. Entity Recognition Research in Online Medical Texts[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2016, 52(1): 1-9.