摘要: 针对位置语言模型没有考虑词与词之间语义关系的问题, 提出一种结合语义的位置语言模型。首先采用高斯核函数来度量词与词之间的位置关系; 然后提出一种平滑互信息的技术来度量词与词之间的语义关系, 证明了平滑互信息能够有效解决大量词对之间无法通过互信息来计算转移概率的问题; 还证明了位置语言模型是结合语义位置语言模型的一个特例; 最后将结合语义的位置语言模型应用于信息检索, 得到一个基于该模型的检索模型。实验结果表明, 基于该模型的检索模型在性能方面要优于基于位置语言模型的检索模型。
中图分类号:
余伟,王明文,万剑怡,左家莉. 结合语义的位置语言模型[J]. 北京大学学报(自然科学版).
YU Wei,WANG Mingwen,WAN Jianyi,ZUO Jiali. Positional Language Models with Semantic Information[J]. Acta Scientiarum Naturalium Universitatis Pekinensis.