摘要:
提出一种融合多模型和高置信度词典的事件线索识别方法, 将高置信度词典特征分别加入最大熵模型和条件随机场模型, 然后融合两个模型的结果, 旨在提高触发词识别的召回率和整体性能。针对事件真伪性识别任务, 进一步考察否定词或不确定词与触发词的物理位置距离和依存路径距离等特征, 提高事件真伪性识别的性能。实验结果显示, 针对触发词识别和事件真伪性识别任务, 与仅使用最大熵模型相比, 所提出的融合多模型与高置信度词典的方法能够提高触发词识别的性能6.43%, 提高事件真伪性识别的性能1.69%。
陈亚东, 洪宇, 王潇斌, 杨雪蓉, 姚建民, 朱巧明. 融合多模型与高置信度词典的事件线索检测[J]. 北京大学学报自然科学版, 2017, 53(3): 412-420.
Yadong CHEN, Yu HONG, Xiaobin WANG, Xuerong YANG, Jianmin YAO, Qiaoming ZHU. Combining Multiple Models and High-Confidence Dictionary
for Event Nugget Detection[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2017, 53(3): 412-420.