摘要:
针对基于预训练得到的词向量在低频词语表示质量和稳定性等方面存在的缺陷, 提出一种基于Hownet的词向量表示方法(H-WRL)。首先, 基于义原独立性假设, 将 Hownet中所有N个义原指定为欧式空间的一个标准正交基, 实现Hownet义原向量初始化; 然后, 根据Hownet中词语与义原之间的定义关系, 将词语向量表示视为相关义原所张成的子空间中的投影, 并提出学习词向量表示的深度神经网络模型。实验表明, 基于Hownet的词向量表示在词相似度计算和词义消歧两项标准评测任务中均取得很好的效果。
陈洋, 罗智勇. 一种基于Hownet的词向量表示方法[J]. 北京大学学报自然科学版, 2019, 55(1): 22-28.
CHEN Yang, LUO Zhiyong. A Word Representation Method Based on Hownet[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2019, 55(1): 22-28.