当期目录

        
    2023年 第59卷 第1期 刊出日期:2023-01-20
    2023年第1期目次
    2023, 59(1):  0. 
    摘要 ( )   HTML   PDF (2093KB) ( )  
    相关文章 | 计量指标
    基于单词领域特征敏感的多领域神经机器翻译
    黄增城, 满志博, 张玉洁, 徐金安, 陈钰枫
    2023, 59(1):  1-10.  DOI: 10.13209/j.0479-8023.2022.063
    摘要 ( )   HTML   PDF (802KB) ( )  
    相关文章 | 计量指标
    鉴于现有基于单词的领域特征学习方法在领域识别上的精度较低, 为提高领域判别和提供准确的翻译, 提出一种单词级别的领域特征敏感学习机制, 包括两方面: 1) 编码器端的上下文特征编码, 为了扩展单词级别的领域特征学习范围, 引入卷积神经网络, 并行提取不同大小窗口的词串作为单词的上下文特征; 2) 强化的领域特征学习, 设计基于多层感知机的领域判别器模块, 增强从单词上下文特征中获取更准确领域比例的学习能力, 提升单词的领域判别准确率。在多领域UM-Corpus英–汉和OPUS英–法翻译任务中的实验结果显示, 所提方法平均BLEU值分别超过强基线模型0.82和1.06, 单词的领域判别准确率比基线模型分别提升10.07%和18.06%。对实验结果的进一步分析表明, 所提翻译模型性能的提升得益于所提出的单词领域特征敏感的学习机制。
    依据《中国图书馆分类法》的英文图书分类探索
    蒋彦廷
    2023, 59(1):  11-20.  DOI: 10.13209/j.0479-8023.2022.070
    摘要 ( )   HTML   PDF (797KB) ( )  
    相关文章 | 计量指标
    针对带有中图分类号的英文图书数据量小以及类别不平衡的问题, 将图情领域的文本增强策略(《美国国会图书馆分类法》到《中国图书馆分类法》的类目映射方法和基于中-英文平行的《汉语主题词表》的语义增强方法)与一般领域文本增强策略(向原始英文文本插入标点或连词)相结合, 旨在增强模型泛化能力。实验表明, 综合后的策略能有效地提高模型在测试集的表现, 正确率和宏F1值分别上升3.61和3.35个百分点, 效果优于其他单一的文本增强方法。最后, 通过BERT词向量可视化与词语信息熵计算, 分析出丰富的邻近词和语法上的连缀功能是插入标点或连词方法有效的原因。
    基于多信息感知的多方对话问答方法
    高晓倩, 周夏冰, 张民
    2023, 59(1):  21-29.  DOI: 10.13209/j.0479-8023.2022.069
    摘要 ( )   HTML   PDF (750KB) ( )  
    相关文章 | 计量指标
    目前基于多方对话文本的自动问答任务侧重于探索对话结构信息或说话者角色信息, 忽视问题文本和对话文本的交互。针对这一问题, 提出一个融合多信息的全新模型。该模型使用图卷积神经网络, 对多方对话文本中的话语结构、说话者角色以及问题–上下文信息进行分层次建模, 并设计合理的基于注意力机制的交互层, 通过选择更有帮助的信息, 加强对多方对话文本的理解。此外, 该模型首次对问题和上下文间的显式交互给予关注。实验结果表明, 所提模型的性能优于多个基线模型, 实现对多方对话文本的深层次理解。
    融合语境语义差异特征的短文本匹配模型
    张文慧, 汪美玲, 侯志荣
    2023, 59(1):  30-38.  DOI: 10.13209/j.0479-8023.2022.071
    摘要 ( )   HTML   PDF (1580KB) ( )  
    相关文章 | 计量指标
    在字面相同语义不同和字面不同语义相同的情况下, 短文本匹配往往不能准确地得到语句间语义的相似程度。针对这一问题, 提出一种融合语境语义差异特征的短文本匹配模型。该模型以BERT系列的语言模型作为基础匹配模型, 采用一种新的Diff Transformer 结构作为差异特征提取器, 并以门控方式融合基础语义表示和差异特征表示来提升匹配效果。在中文测试数据集上的实验结果表明, 所提出的模型可以达到先进模型的效果。
    篇章约束的译文质量评估模型
    冯勤, 贡正仙, 叶恒, 周国栋
    2023, 59(1):  39-47.  DOI: 10.13209/j.0479-8023.2022.067
    摘要 ( )   HTML   PDF (941KB) ( )  
    相关文章 | 计量指标
    提出一种新的篇章约束辅助的译文质量评估模型, 不依赖参考译文, 为源文篇章中的每条句子的译文进行打分。首先从句子级别的语义表示和词级别的指代特征的角度建模源文和译文上下文之间的差异, 然后设计额外的损失函数, 使得模型在预测分数的同时, 尽可能地约束两者之间的差异。实验结果表明, 所提方法能有效提高译文质量评估的性能, 在Pearson相关系数上较基线系统最高可提升6.68个百分点。
    多模态与文本预训练模型的文本嵌入差异研究
    孙宇冲, 程曦苇, 宋睿华, 车万翔, 卢志武, 文继荣
    2023, 59(1):  48-56.  DOI: 10.13209/j.0479-8023.2022.074
    摘要 ( )   HTML   PDF (2107KB) ( )  
    相关文章 | 计量指标
    为了详细地分析文本单模态预训练模型RoBERTa和图文多模态预训练模型WenLan文本嵌入的差异, 提出两种定量比较方法, 即在任一空间中, 使用距离一个词最近的k近邻词集合表示其语义, 进而通过集合间的Jaccard相似度来分析两个空间中词的语义变化; 将每个词与其k近邻词组成词对, 分析词对之间的关系。实验结果表明, 图文多模态预训练为更抽象的词(如成功和爱情等)带来更多的语义变化, 可以更好地区分反义词, 发现更多的上下义词, 而文本单模态预训练模型更擅长发现同义词。另外, 图文多模态预训练模型能够建立更广泛的词之间的相关关系。
    基于联合学习的少样本多类别情感分类方法
    李子成, 常晓琴, 李雅梦, 李寿山, 周国栋
    2023, 59(1):  57-64.  DOI: 10.13209/j.0479-8023.2022.068
    摘要 ( )   HTML   PDF (788KB) ( )  
    相关文章 | 计量指标
    对于多类别的细粒度情感分类任务, 目前主流的少样本学习方法不能取得较好的性能。针对这一问题, 提出一种基于联合学习的少样本多类别情感分类方法。采用基于替换词检测任务的少样本学习方式, 将回归和分类的替换词检测模板以及标签描述词同时添加至输入语句, 从而将细粒度情感分类任务同时建模为分类问题和回归问题。在此基础上, 设计了不同的融合方法进行联合学习。实验结果表明, 与主流少样本学习方法相比, 该方法在 F1-Score 和正确率上都取得更优的结果。
    基于预训练模型和混合神经网络的医疗实体关系抽取
    赵丹丹, 张俊朋, 孟佳娜, 张志浩, 苏文
    2023, 59(1):  65-75.  DOI: 10.13209/j.0479-8023.2022.065
    摘要 ( )   HTML   PDF (733KB) ( )  
    相关文章 | 计量指标
    医疗文本具有实体密度高、句式冗长等特点, 简单的神经网络方法不能很好地捕获其语义特征, 因此提出一种基于预训练模型的混合神经网络方法。首先使用预训练模型获取动态词向量, 并提取实体标记特征; 然后通过双向长短期记忆网络获取医疗文本的上下文特征, 同时使用卷积神经网络获取文本的局部特征; 再使用注意力机制对序列特征进行加权, 获取文本全局语义特征; 最后将实体标记特征与全局语义特征融合, 并通过分类器得到抽取结果。在医疗领域数据集上的实体关系抽取实验结果表明, 新提出的混合神经网络模型的性能比主流模型均有提升, 说明这种多特征融合的方式可以提升实体关系抽取的效果。
    知识驱动的事件双曲嵌入时序关系抽取方法研究
    段建勇, 戴诗伟, 王昊, 何丽, 李欣
    2023, 59(1):  76-82.  DOI: 10.13209/j.0479-8023.2022.066
    摘要 ( )   HTML   PDF (542KB) ( )  
    相关文章 | 计量指标
    针对事件时间关系不对称的问题, 采用将事件表示映射到双曲空间的方法, 进行事件时序关系抽取。通过简单的运算, 用预训练的词向量与外部知识构建事件的词嵌入表示。在公开发布的数据集上的实验结果表明, 模型的F1值比基线模型普遍高2%, 能够提升事件时序关系抽取的效果。
    基于角色信息引导的多轮事件论元抽取
    于媛芳, 张勇, 左皓阳, 张连发, 王婷婷
    2023, 59(1):  83-91.  DOI: 10.13209/j.0479-8023.2022.064
    摘要 ( )   HTML   PDF (685KB) ( )  
    相关文章 | 计量指标
    针对通用领域的事件论元抽取研究中角色信息利用不足和论元间缺少交互两个问题, 提出角色信息引导的多轮事件论元抽取模型, 用于增强文本的语义信息和论元之间的交互能力, 提升事件论元抽取的性能。首先, 为了更好地利用角色知识来引导论元的抽取, 该模型根据角色定义构造角色知识, 对角色信息和文本独立编码, 并采用基于注意力机制的方法获取标签知识增强的文本表示, 进而采用增强嵌入来预测各角色论元的起始和结束位置。同时, 为了在抽取过程中充分利用事件论元之间的交互, 受多轮对话模型的启发, 设计一种多轮事件论元抽取算法。该算法参照“先易后难”的自然逻辑, 每次选择预测概率最大, 也是最容易确定的角色进行抽取。在论元抽取过程中, 为了对论元之间的交互进行建模, 模型引入历史嵌入, 并在每一次预测结束后更新历史嵌入, 帮助下一轮事件论元的抽取。实验结果表明, 角色信息的引导和多轮抽取算法均有效地提升了论元抽取的性能, 使得该模型的表现优于其他基线模型。
    湟水河西宁段水体和沉积物中氮素转化关键过程与影响因素分析
    尚韵依, 李治龙, 孙立宇, 陈倩
    2023, 59(1):  92-104.  DOI: 10.13209/j.0479-8023.2022.122
    摘要 ( )   HTML   PDF (4042KB) ( )  
    相关文章 | 计量指标
    于丰水期(2018年7月)和枯水期(2019年4月)分别在湟水河西宁段典型断面采集水体和沉积物样品共58个, 枯水期同时采集污水处理厂出水样6个。利用实时荧光定量PCR方法, 对 12 种氮转化功能基因进行定量分析。结果表明, 湟水河平均总氮浓度为3.06±1.23 (1.308~6.51) mg/L。水体和沉积物中相对丰度较高的氮转化功能基因是narG, nirSnosZ。氮转化功能基因的丰度和组成在沉积物中存在明显的季节差异, 在水体中无明显季节差异。关键氮素转化过程是反硝化, 对水体和沉积物氮素的去除贡献率分别为88%和 98%。水体氮素转化主要受pH值、总氮及NO3--N调控, 其中, 氨氧化与NO3--N浓度负相关, 反硝化与pH负相关。沉积物氮素转化与水体氮素浓度、沉积物pH值、总氮、总磷和有机碳等相关, 其中, 氨氧化与水体氮素浓度负相关, 而反硝化主要受沉积物性质影响。进一步的分析结果表明, 污水处理厂排放会显著降低水体中AOA-amoA, CMX-amoA, nirS, nxrB, napA, narGhzsA等基因的丰度, 增加nrfA基因的丰度, 使反硝化、厌氧氨氧化、硝化和完全硝化等过程受到抑制, 硝酸盐异化还原成铵(DNRA)对水体氮素去除的贡献提高。受影响河段沉积物中, AOA-amoA, nxrB和CMX-amoA等基因丰度显著降低, 硝化和完全硝化过程受到抑制。研究结果可为湟水河西宁段氮素污染控制提供科学依据。 
    城市立交桥洞内涝过程的精细化模拟研究
    叶裕佳, 秦华鹏, 毛俊祺
    2023, 59(1):  105-114.  DOI: 10.13209/j.0479-8023.2022.105
    摘要 ( )   HTML   PDF (4518KB) ( )  
    相关文章 | 计量指标
    为科学地指导城市立交桥区的排水防涝改造, 降低内涝风险, 以深圳市某立交桥为研究对象, 构建高分辨率城市内涝模型, 采用地表积水实测资料进行模型率定及验证, 模拟立交桥洞在雨水口防堵、下凹式绿地以及两者的组合措施改造前后不同降雨情景下的积水情况。结果表明, 1) 高分辨率城市内涝模型可以实现城市立交积水动态变化过程的准确模拟; 2) 5年、20年和100年重现期降雨情景下, 立交桥洞内涝严重, 积水时空变化速率快, 当降雨重现期为100年时, 最大积水深度和面积分别高达1.52 m和1833 m2, 积水深度随时间和空间的最大增长速率分别高达0.04 m/min和0.23 m/10 m; 3) 组合措施的内涝削减效果优于不同改造措施单独使用时的削减效果, 100年重现期降雨情景下, 单独采用雨水口防堵和绿地下凹措施, 仍然存在0.6 m以上深度的积水, 而组合措施可使内涝积水深度小于0.5 m, 内涝持续时间缩短至30 min内, 可有效地缓解桥洞内涝。
    重组大肠杆菌利用醋酸及乳酸为碳源合成PHB
    肖萌, 蒋莹, 崔逸璇, Sadaf Riaz, Maurycy Daroch
    2023, 59(1):  115-124.  DOI: 10.13209/j.0479-8023.2022.100
    摘要 ( )   HTML   PDF (7573KB) ( )  
    相关文章 | 计量指标
    以廉价的工业副产物醋酸及乳酸为碳源, 对产PHB重组大肠杆菌进行培养, 考察醋酸及乳酸的添加对重组大肠杆菌生长及PHB产量的影响。将来自Cupriavidus necator的PHB合成操纵子phaCAB基因簇克隆至pBAD载体, 得到产PHB菌株BL21_pBAD_phaCAB, 以阿拉伯糖为诱导剂, 在大肠杆菌中进行重组表达。分别使用LB及M9培养基, 对重组菌株BL21_pBAD_phaCAB进行培养, 研究其生长速度及PHB产量, 探索产PHB重组大肠杆菌最适培养基。以添加0.04 g/L乳酸、1.2 g/L乳酸、0.02 g/L醋酸、0.6 g/L醋酸、0.04 g/L乳酸+0.02 g/L醋酸、1.2 g/L乳酸+0.4 g/L醋酸的M9培养基(均含2 g/L葡萄糖)为实验组, 以M9培养基(含2 g/L葡萄糖)为对照组, 考察醋酸及乳酸的添加对重组大肠杆菌生长及PHB产量的影响。分别取第6, 12, 24和36小时的培养液, 分析其葡萄糖、醋酸及乳酸含量的变化。结果表明, 低氮型M9培养基更适合产PHB重组大肠杆菌在低糖培养环境中生长。在葡萄糖消耗殆尽后, 大肠杆菌能够以醋酸及乳酸为碳源进行代谢, 因此在培养基中添加一定浓度的醋酸及乳酸能够有效地提高重组菌株BL21_pBAD_phaCAB产PHB能力, 在乳酸添加量为1.2 g/L时, PHB产量达到最高(1.43 g/L), 比对照组提高78%。 
    汉江水体和沉积物中噬菌体特征研究
    孙立宇, 尚韵依, 李治龙, 薛泽环, 刘唐
    2023, 59(1):  125-132.  DOI: 10.13209/j.0479-8023.2022.124
    摘要 ( )   HTML   PDF (5328KB) ( )  
    相关文章 | 计量指标
    基于2014年3月和10月汉江中下游6个断面的水体和沉积物监测样品, 获得384个高质量vOTUs (viral Operational Taxonomic Units)。研究表明, vOTUs中95%以上隶属Caudovirales(有尾噬菌体目), 丰度居前3位的科分别为Myoviridae(肌尾噬菌体科)、Siphoviridae(长尾噬菌体科)和Podoviridae(短尾噬菌体科)。主坐标分析和相似性分析结果表明, 沉积物中病毒群落结构相对稳定, 而水体中群落易随季节发生变化, 同流域的水体和沉积物中群落可能具有连通性。宿主来自2域(界)19门, 丰度最高的宿主是 Proteobacteria门(变形菌门)。88%的vOTUs具有单一的门水平的宿主, 有3个vOTUs 跨越5个门。跨域(界)感染的vOTUs在感染古菌界Thermoproteota门的同时, 最常见的是感染细菌界的Bacteroidota门(拟杆菌门)。与水体相比, 沉积物中宿主的群落组成更加多样。Pearson相关分析表明, 噬菌体与其宿主的组成在门水平上一致。
    吉木萨尔陆相页岩油微观赋存类型
    丁振华, 师翔, 宋平, 师巍锋, 张记刚, 李绪涛, 师永民, 李炜
    2023, 59(1):  133-142.  DOI: 10.13209/j.0479-8023.2022.114
    摘要 ( )   HTML   PDF (47214KB) ( )  
    相关文章 | 计量指标
    为了更好地认识页岩油微观赋存状态及类型, 避免实验过程中水钻取样对原油分布的影响, 选取吉木萨尔页岩典型含油岩芯, 采用全程液氮钻、切、磨制样工序, 通过全能谱扫描电子显微镜、二次电子成像及背散射相结合的技术手段, 获得微观储层矿物类型和结构、储集空间类型、形貌以及C, O, Si, Al, Ca, K, Na, Mg等元素在微、纳米尺度的分布。依据去除矿物因素后的C元素含量分布, 判别原油在微、纳米空间尺度的富集程度。结合矿物岩石组构和储集空间形貌, 对微、纳米尺度页岩油原油的赋存状态及分布类型进行直观的定量表征, 并基于C元素含量推测微观含油饱和度的相对变化。针对原油与孔喉的配置关系, 进行储层微观孔喉结构与原油赋存状态的表征, 明确原油赋存类型。总结出研究区4种微观原油赋存类型: 白云质溶蚀微米级大孔道中的可动油、砂质粒间微纳米级孔中可动油、砂质粒间孔喉壁吸附的半束缚状态的油膜以及自生黏土矿物晶间孔内束缚油。
    华北克拉通恒山地区晚太古代变质火山岩的地球化学特征及构造意义
    高山松, 李秋根, 胡鹏月, Yasin Rahim, 李泓莹
    2023, 59(1):  143-160.  DOI: 10.13209/j.0479-8023.2022.102
    摘要 ( )   HTML   PDF (12920KB) ( )  
    相关文章 | 计量指标
    对恒山地区出露的变质火山岩开展岩相学、地球化学、锆石U-Pb年代学和Hf同位素研究, 旨在确定其形成时代, 探讨岩石成因及地球动力学意义。锆石U-Pb定年结果表明, 这些变质火山岩喷发于新太古代晚期(2508±20 Ma)。地球化学分析结果显示, 恒山变质火山岩由变质玄武岩和变质玄武安山岩组成, SiO2(45.51%~62.67%)、FeOT (4.43%~15.72%)和MgO (3.75%~8.14%)含量变化幅度大, 是幔源岩浆经单斜辉石、角闪石和磁铁矿分离结晶的产物。这些变质火山岩富集轻稀土(LREE)和大离子亲石元素(LILE), 亏损重稀土(HREE)和高场强元素(HFSE), 具有相对高的Th含量和Th/Yb比值, 呈现钙碱性岛弧火山岩的特征。结合不相容元素比值 Nb/Yb, Zr/Yb和(Nb/La)N的特点, 推测其来源于俯冲带具流体交代特征的富集地幔源区。结合区域构造背景, 推断恒山变质火山岩形成于新太古晚期大陆弧环境。
    老年人和青年人的共情差异——积极与消极情绪的分离
    庞芳芳, 陈玮, 苏英, 官锐园
    2023, 59(1):  161-169.  DOI: 10.13209/j.0479-8023.2022.099
    摘要 ( )   HTML   PDF (462KB) ( )  
    相关文章 | 计量指标
    结合自评问卷和行为任务两种测量方式, 比较老年人与青年人的共情差异。研究1采用人际反应指数量表(IRI), 以280名老年人和 304名青年人为研究对象, 探究两个年龄组被试基于自评问卷的共情差异。研究2使用多维共情测试(MET), 以71名老年人和74名青年人为研究对象, 进一步比较两个年龄组被试基于行为任务的共情差异。研究结果显示: 1) 与青年人相比, 无论是基于自评问卷还是行为任务, 老年人的认知共情均显著下降; 2) 与青年人相比, 老年人对消极情绪的情绪共情显著下降, 但对积极情绪的情绪共情无显著变化; 3) 老年人对积极情绪的情绪共情显著高于消极情绪, 青年人对这两种效价情绪的认知共情和情绪共情均无显著差异。结果表明, 从青年期到老年期, 对积极情绪和消极情绪的共情能力存在分离性的发展特征。 
    自我聚焦对社交焦虑个体外部注意与状态焦虑的作用——来自眼动与生理指标的证据
    陈慧菁, 林沐雨, 钱铭怡
    2023, 59(1):  170-178.  DOI: 10.13209/j.0479-8023.2022.117
    摘要 ( )   HTML   PDF (612KB) ( )  
    相关文章 | 计量指标
    为模拟真实的社会化场景, 探究自我聚焦如何影响社交焦虑个体对外部社交反馈信息的注意与状态焦虑, 采用演讲与自由观看任务, 105名被试在实验室中面对屏幕进行即兴演讲, 同时自由观看提前录制的包含12位听众的录像, 听众分别表现出正性、中性和负性的反馈。研究中操纵被试的自我聚焦(高自我聚焦条件或低自我聚焦条件), 采用眼动仪测量被试在演讲中对正性、中性和负性反馈的注意, 并使用生理仪测量皮肤电和心率。结果显示, 自我聚焦在整体上减少了高、低社交焦虑组对外部社交反馈信息的注意, 高、低社交焦虑组的心率在高自我聚焦条件下均比低自我聚焦条件下快。研究结果表明, 自我聚焦削弱了社交焦虑个体对外部刺激的注意加工。