摘要: 针对面向中文网络百科条目文章的属性和属性值抽取, 提出一种无监督方法。此方法将属性值看做命名实体, 利用频繁模式挖掘和关联分析, 从文本中抽取类别属性; 采用自扩展方法为属性建立触发词表; 基于属性触发词和属性值实体标注挖掘属性值抽取模式, 利用层次聚类算法获取高质量的模式。在互动百科中采集的数据集上进行实验, 结果表明所提方法行之有效。
中图分类号:
贾真,杨宇飞,何大可,刘胜久,尹红风. 面向中文网络百科的属性和属性值抽取[J]. 北京大学学报(自然科学版).
JIA Zhen,YANG Yufei,HE Dake,LIU Shengjiu,YIN Hongfeng. Attribute and Attribute Value Extracted from Chinese Online Encyclopedia[J]. Acta Scientiarum Naturalium Universitatis Pekinensis.