Similar Legal Case Retrieval Based on Improved Siamese Network

doi:10.13209/j.0479-8023.2018.059

Acta Scientiarum Naturalium Universitatis Pekinensis ›› 2019, Vol. 55 ›› Issue (1): 84-90.DOI: 10.13209/j.0479-8023.2018.059

Previous Articles Next Articles

Similar Legal Case Retrieval Based on Improved Siamese Network

LI Lanjun, ZHOU Junsheng^†, GU Yanhui, QÜ Weiguang

School of Computer Science and Technology, Nanjing Normal University, Nanjing 210023

Received:2018-04-15 Revised:2018-08-13 Online:2019-01-20 Published:2019-01-20
Contact: ZHOU Junsheng, E-mail: zhoujs(at)njnu.edu.cn

基于改进孪生网络结构的相似法律案例检索研究

李兰君, 周俊生^†, 顾颜慧, 曲维光

南京师范大学计算机科学与技术学院, 南京 210023

通讯作者: 周俊生, E-mail: zhoujs(at)njnu.edu.cn
基金资助:
国家自然科学基金(61472191, 61772278, 41571382)、福建省信息处理与智能控制重点实验室开放基金(MJUKF201705)、江苏省高校哲学社会科学研究项目(2016SJB740004)和江苏省高校自然科学研究重大项目(15KJA420001)资助

Abstract

Abstract:

In view of the existing research about document similarity calculation methods based on siamese networks, the entire document is regarded as the input sequence of model that may lead to sparse data. Hierarchical attention mechanism is used to improve the document representation in the siamese network. For the siamese network computing model based on hierarchical attention mechanism may ignore the important sentence in the document when inputting, a two-step document similarity calculation method that introduces the compression of document content is further proposed. The experimental results show that the proposed method is obviously superior to the siamese network computing model based on the Long Short-Term Memory.

Key words: document similarity calculation, siamese network, attention mechanism, document content compression

摘要：

针对现有的基于孪生网络结构的文档相似度计算方法大多将整个文档看成模型的输入序列, 易导致数据稀疏的问题, 提出利用层级注意力机制来改进孪生网络结构中的文档表示。针对基于层级注意力机制的孪生网络计算模型在输入时有可能忽略文档中重要句子的问题, 进一步提出一种引入文档内容压缩的两步骤文档相似度计算方法。利用开发的法律案例文档相似度标注数据集进行实验, 结果表明所提方法明显优于基于长短期记忆模型的孪生网络计算模型。

关键词: 文档相似度计算, 孪生网络, 注意力机制, 文档内容压缩

LI Lanjun, ZHOU Junsheng, GU Yanhui, Qü Weiguang. Similar Legal Case Retrieval Based on Improved Siamese Network[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2019, 55(1): 84-90.

李兰君, 周俊生, 顾颜慧, 曲维光. 基于改进孪生网络结构的相似法律案例检索研究[J]. 北京大学学报自然科学版, 2019, 55(1): 84-90.

Add to citation manager EndNote|Ris|BibTeX

URL: https://xbna.pku.edu.cn/EN/10.13209/j.0479-8023.2018.059

https://xbna.pku.edu.cn/EN/Y2019/V55/I1/84

[1]	ZHAO Yulan, WAN Guangwen, LIU Zhongbao. Sentiment Analysis of Chinese Ancient Poetry by Fusing Explicit Knowledge and Implicit Knowledge [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2025, 61(3): 420-430.
[2]	DING Na, LIU Peng, SHAO Huipeng, WANG Xuekui. Bi-Attention Text-Keyword Matching for Law Recommendation [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2024, 60(1): 79-88.
[3]	WANG Rui, LIANG Jianguo, HUA Rong. Radiology Report Generation Method Based on Multi-scale Feature Parsing [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2024, 60(1): 71-78.
[4]	LI Chao, HOU Xia, QIAO Xiuming. A Low-Resource Named Entity Recognition Method for Cultural Heritage Field Incorporating Knowledge Fusion [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2024, 60(1): 13-22.
[5]	TIAN Yuan, PANG Xiao, ZHAO Wenyi, CHANG Xiaoyin, CHENG Chuyun, ZOU Pei, CAO Xiaocheng. A Transformer-Based Model for Short-Term Landslide Displacement Prediction [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2023, 59(2): 197-210.
[6]	GAO Xiaoqian, ZHOU Xiabing, ZHANG Min. A Multi-information Perception Based Method for Question Answering in Multi-party Conversation [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2023, 59(1): 21-29.
[7]	SU Fenglong, SUN Chengzhe, JING Ning. A Context-Fusion Method for Entity Extraction Based on Residual Gated Convolution Neural Network [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2022, 58(1): 69-76.
[8]	WANG Yinmiao, HAN Zhimin. Knowledge Bases Completion Based on Multi-hop Paths [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2022, 58(1): 7-12.
[9]	WAN Zhang, ZHANG Yujie, LIU Mingtong, XU Jin’an, CHEN Yufeng. Object Space Relation Mechanism Fused Image Caption Method [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2021, 57(1): 75-82.
[10]	WU Ruiying, KONG Fang. Event Coreference Resolution with Document Representation [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2020, 56(1): 82-88.
[11]	JIA Yunlong, HAN Donghong, LIN Haiyuan, WANG Guoren, XIA Li. Consumption Intent Recognition Algorithms for Weibo Users [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2020, 56(1): 68-74.
[12]	LIU Mingtong, ZHANG Yujie, ZHANG Shu, MENG Yao, XU Jin’an, CHEN Yufeng. A Multi-Mechanism Fused Paraphrase Generation Model with Joint Auto-Encoding Learning [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2020, 56(1): 53-60.
[13]	HUANG Yan, SUN Haili, XU Ke, YU Xiaoyang, WANG Tongyang, ZHANG Xinfang, LU Songfeng. Discourse-Level Text Generation Method Based on Topical Constraint [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2020, 56(1): 9-15.
[14]	ZHANG Qinglin, DU Jiachen, XU Ruifeng. Sarcasm Detection Based on Adversarial Learning [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2019, 55(1): 29-36.
[15]	ZHOU Botong, SUN Chengjie, LIN Lei, LIU Bingquan. LSTM Based Question Answering for Large Scale Knowledge Base [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2018, 54(2): 286-292.

Similar Legal Case Retrieval Based on Improved Siamese Network

基于改进孪生网络结构的相似法律案例检索研究

RichHTML

PDF

Knowledge

Abstract

Cite this article

share this article

References

Related Articles 15

Recommended Articles

Metrics