摘要:
为解决已有复述语义计算方法未考虑句法结构的问题, 提出基于句法结构的神经网络复述识别模型, 设计基于树结构的神经网络模型进行语义组合计算, 使得语义表示从词语级扩展到短语级。进一步地, 提出基于短语级语义表示的句法树对齐机制, 利用跨句子注意力机制提取特征。最后, 设计自注意力机制来增强语义表示, 从而捕获全局上下文信息。在公开英语复述识别数据集Quora上进行评测, 实验结果显示, 复述识别性能得到改进, 达到89.3%的精度, 证明了提出的基于句法结构的语义组合计算方法以及基于短语级语义表示的跨句子注意力机制和自注意力机制在改进复述识别性能方面的有效性。
刘明童, 张玉洁, 徐金安, 陈钰枫. 基于句法结构的神经网络复述识别模型[J]. 北京大学学报自然科学版, 2020, 56(1): 45-52.
LIU Mingtong, ZHANG Yujie, XU Jin’an, CHEN Yufeng. A Neural Paraphrase Identification Model Based on Syntactic Structure[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2020, 56(1): 45-52.