摘要: 为了提高RDF知识库的数据质量, 提出RDF图数据的异常检测及其自动修复的方法。首先, 原创性地定义了基于图的条件函数依赖(GCFD), 能够将属性值和语义结构的依赖关系统一表示; 然后, 提出有效的算法框架以及优化策略, 挖掘RDF数据中的GCFD, 并给出异常数据的自动修复流程; 最后, 在真实的数据集上, 通过大量实验确认解决方案的可行性和优越性。
中图分类号:
贺彬彬,邹磊,赵东岩. 语义知识库构建中的异常数据发现[J]. 北京大学学报(自然科学版).
HE Binbin,ZOU Lei,ZHAO Dongyan. Discovering Abnormal Data in RDF Knowledge Base[J]. Acta Scientiarum Naturalium Universitatis Pekinensis.