摘要:
针对中文词语具体度资源的匮乏, 提出一种自动的中文词语具体度词典构造方法。该方法充分利用已有的英文词语具体度资源, 基于在线翻译工具和预训练词向量, 训练出中文词语具体度的多层感知器回归模型, 构造大规模的中文词语具体度词典。为了评估该中文词语具体度词典的性能, 设计两项基本的具体度推理任务: 词语级具体度推理和句子级具体度推理, 并通过人工标注的方式构造相应的评测数据集。实验结果表明构造的词语具体度词典可以有效地完成这两项推理任务。
谢志鹏, 毕冉. 大规模中文具体度词典的构建及推理技术[J]. 北京大学学报自然科学版, 2022, 58(1): 1-6.
XIE Zhipeng, BI Ran. Construction and Inference Technique of Large-Scale Chinese Concreteness Lexicon[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2022, 58(1): 1-6.