第60 卷 第4 期 2024 年7 月

Acta Scientiarum Naturalium Universitatis Pekinensis, Vol. 60, No. 4 (July 2024)

doi: 10.13209/j.0479-8023.2023.061

国家重点研发计划(2021YFA1202500)、国家自然科学基金(52100171和41907203)和中国博士后科学基金(2021T140010)资助

收稿日期: 2023–05–13;

修回日期: 2023–06–06

给水系统病毒群落及其潜在宿主和功能基因的分布特征

莫秋月1 晏思岑1 陈琪1 陈天一2,3 吴宗治3 刘唐1,3 陈倩3 刘树枫3,†

1.深圳大学化学与环境工程学院, 深圳 518060; 2.北京大学深圳研究生院环境与能源学院, 深圳 518055; 3.教育部水沙科学重点实验室, 北京大学环境工程系, 北京 100871; † 通信作者, E-mail: liushufeng@pku.edu.cn

摘要 基于宏基因组测序, 对饮用水供应系统重要监测断面的病毒群落结构、潜在宿主和特定功能基因开展研究。结果表明, 该类系统中存在大量未知分类的病毒, 双链 DNA 病毒丰度为 94%~100%。SiphoviridaeMyoviridae 等噬菌体是已知病毒的主要类群。常规净水工艺和深度处理可降低病毒物种丰富度、多样性和潜在活跃度, 经过输配管网后, 丰富度和多样性有所回升。水处理过程抑制了病毒作为辅助代谢基因交换媒介的作用, 水源地病毒主要携带与能量代谢、糖类/氨基酸/辅因子合成有关的多样化基因, 可提高细菌宿主的新陈代谢能力。常规净水工艺处理后, 病毒主要编码青霉素结合蛋白辅助代谢基因。值得注意的是, 长期置于医院环境的样本中携带抗生素抗性基因的病毒丰度(35%)远远高于其他样本(≤ 2.6%), 且抗性基因种类更加多样化。研究结果阐释了饮用水处理过程、管网输配和环境风险暴露对病毒群落和功能的显著影响, 可为给水系统后续运营管理的优化提供理论依据。

关键词 给水系统; 病毒群落; 潜在宿主; 辅助代谢基因; 抗生素抗性基因; 宏基因组

病毒是一类形态微小, 无完整细胞结构(通常由核酸和蛋白质外壳构成), 专性寄生于细胞生命,并以复制方式增殖的生物[1–2], 在土壤、荒漠、森林、河流、湖泊和海洋等各类生境中广泛存在[3],是生物圈中数量最多的生命体[1–4]。据估计, 地球上总病毒数量超过 1031[5]。病毒能够侵染所有已知的生物类型[4], 在调控宿主丰度、维持生物多样性、介导基因水平转移和生物地球化学循环中发挥着重要作用[1–3,5–7]。环境中的病毒以侵染微生物的噬菌体为主[2,8], 部分病毒对植物、动物和人类具有致病性[4]。绝大多数病毒不可培养, 无法通过传统技术得以鉴别, 因此过去对病毒的研究始终不够全面和深入[1]

21 世纪初兴起的宏基因组测序技术克服了传统纯培养研究方式的局限性, 通过对环境样本中所有微生物的遗传物质进行高通量测序, 拓展了人们对未培养微生物资源的认知范畴[9]。近几年, 病毒宏基因组学蓬勃发展, 从众多生态系统中获取的未培养病毒序列对公开数据库的贡献率超过 95%[10],目前最大的未培养病毒数据库 IMG/VR 拥有超过1500 万个的病毒基因组[11], 说明环境病毒拥有极高的遗传多样性。利用基于计算机模拟的生物信息学方法, 可揭示病毒更广泛的宿主范围[12–13], 使得病毒与宿主、环境之间的相互作用关系更加明确[1]。此外, 病毒编码的除核心基因以外的辅助代谢基因(auxiliary metabolic genes, AMGs)[14]和抗生素抗性基因(antibiotic resistance genes, ARGs)[15]是调节宿主细胞代谢和耐药性、参与微生物驱动的元素循环的重要工具, 突显病毒在基因交换中的“媒介”作用。宏基因组技术已经成为深入研究病毒群落和功能的重要手段。

给水系统是世界经济发展的重要基础设施, 惠及工农业生产、居民生活保障和公共卫生事业等各个领域。随着科技的进步和人们生活水平的提高,饮用水安全已成为国际社会特别是发展中国家关注的焦点问题之一[16]。相比于对化学污染物的严控,人们对饮用水生物安全的重视程度远远不够[17]。饮用水的生物安全风险主要体现在微生物的引入、增殖、传播和毒素积累方面[18], 对公众健康构成较大的威胁。目前, 多数饮用水厂对微生物的监控仍然以细菌指标为主[16,18–22], 对原水和出水的病毒群落和功能不甚了解。供水系统长距离的输配管道和用水终端的环境风险暴露也给出厂水质的保持增加了难度[22–23]。考虑到病毒在水环境中的稳定性、潜在传播和致病风险[4,17], 利用先进技术对从水源地到用户各个环节的饮用水中病毒开展相关研究十分必要。

为解决上述问题, 本文基于宏基因组学原理解析典型给水系统中重要监测断面的病毒群落结构、潜在宿主和特定功能基因, 探究水处理过程、管网输配和环境风险暴露对病毒多样性的影响, 以期为给水系统运营管理的优化提供科学依据。

1 材料和方法

1.1 样品来源

本研究使用的样本来源于巴西米纳斯吉拉斯州(NCBI BioProject: PRJNA565011)[22]。如图1 所示,原水(raw water, RW)采集于一座较大规模饮用水处理厂附近的河流(水质良好), 依次经过预氧化、混凝、絮凝、倾析、过滤、气态氯消毒、pH 调节和加氟处理等常规工艺, 得到消毒处理后出水(disinfected water, DW)。为了研究输配管网的影响, 在依赖该水厂供水的米纳斯联邦大学采集水龙头出水(tap water, TW)。上述 3 类水样均采集 20 L, 并用无菌的 0.22 µm 滤膜(Millipore, 美国)进行过滤。为研究环境风险暴露的影响, 在一家使用该水厂供水的医院透析室里采集超滤膜(ultrafiltration membrane,UM)样品, 该超滤膜用于截留透析液中潜在的污染物, 每 3 个月更换一次(过滤约 28000 L 透析液)。透析液由纯水和特定无菌电解质溶液混合而成, 纯水由自来水依次经过 5 µm 膜滤、木炭过滤和反渗透深度处理而制成。所有样本均保存在−20℃条件下直至后续使用。

图1 给水系统采样点分布示意图
Fig.1 Sampling sites in a water supply system

利用 ZymoBIOMICS™DNA Miniprep Kit 试剂盒(Zymo Research, 美国)提取每个样本的总 DNA,并用 Qubit®荧光计和 Nanodrop 2000®分光光度计测定 DNA 浓度以及质量(Thermo Fisher Scientific, 美国)。使用 Illumina Nextera DNA Flex Library Prep Kit 试剂盒构建宏基因组文库, 随后用 NextSeq®500平台(Illumina, 美国)进行高通量测序。

1.2 数据处理与分析

利用 Trim Galore (https://www.bioinformatics.ba braham.ac.uk/projects/trim_galore/)对下机原始序列进行质量控制, 得到优化序列, 通过 metaSPAdes[24]对优化序列进行拼接。为了获得尽可能多的病毒序列, 充分考虑不同方法之间的差异, 使用 Earth virome pipeline[25]、METAVIRALSPADES 中的 VIRALVERIFY 模块[26]、VIBRANT [27]、VirSorter2 [28]、DeepVirFinder[29]和 PPR-Meta[30]等 6 种近 5 年发布的权威方法, 对拼接序列进行病毒识别, 得到潜在病毒序列。随后, 对 6 种方法所得序列取并集, 利用 CheckV 软件[31]进行质量评估, 保留评估结果为“中高质量及完整”且长度大于 1500 bp 的序列以及虽然为“低质量”但长度大于 3000 bp 的序列, 得到最终病毒序列。

利用 CD-HIT 软件[32]进行病毒操作分类单元(viral operational taxonomic units, vOTUs)聚类, 阈值设置为 95%的平均核苷酸相似度和 85%的序列覆盖度, 得到 vOTUs 代表序列。随后利用 vConTACT[33]将 vOTUs 与 NCBI Viral RefSeq 参考数据库(版本v201)进行比对, 并使用 Gephi (https://gephi.org/)进行共享基因网络的可视化。利用 VPF-Class[34]对vOTUs 进行物种分类学注释, 隶属度和置信度均为0.5。使用 VIBRANT[27]对 vOTUs 进行AMGs注释。利用 Prodigal[35]预测 vOTUs 的基因开放阅读框, 并将其与 SARG 数据库[36]进行 BLAST 比对, 筛选参数为 40%的相似度和 80%的覆盖度(e-value 取 1×10−5)[37], 由此得到 ARGs 的注释结果。对于病毒宿主的预测, 首先使用 MetaWRAP[38]对上述拼接序列进行分箱, 获得组装基因组, 保留完整度≥70%且污染度≤10%的基因组, 使用 GTDB-Tk (release 95)[39]对每个基因组进行分类学注释, 随后采用以下 3 种方法[40–41]对病毒进行宿主预测。

1) 基于基因组相似性原理, 将宿主基因组序列和病毒基因组序列进行 BLAST 比对, e-value 取1×10−3, 相似度取 90%。

2) 基于 tRNA 结合位点匹配原理, 使用 ARAGORN[42]预测病毒中的 tRNA, 将宿主的 tRNA 序列和病毒的 tRNA 进行 BLAST 比对, 相似度取 100%,覆盖度取 100%。

3) 基于 CRISPR 间隔子匹配的原理, 使用 Min-CED[43]识别宿主中的 CRISPR, 将病毒序列与宿主中的 CRISPR 进行 BLAST 比对, e-value 取 1×10−5,mismatch≤1, 覆盖度取 100%。

使用 Bowtie 2[44]、SAMtools[45]和 CoverM (https://github.com/wwood/CoverM), 将优化序列匹配到病毒、宿主和功能基因中, 计算 RPKM 值(Reads Per Kilobase per Million mapped reads)作为丰度, CoverM的阈值为 95%的同一性和 90%的覆盖率。

2 结果与讨论

2.1 给水系统病毒群落的多样性

从给水系统及其用水终端 4 个宏基因组数据集中识别到 8406 个潜在病毒序列(不含重复序列), 其中 PPR-Meta, VirSorter2, DeepVirFinder, VIRALVERIFY, VIBRANT 和 Earth virome pipeline 各自识别到 4735, 3809, 1986, 633, 463 和 244 条序列, 经过CheckV 质量评估, 分别保留 908, 1146, 519, 474,458 和 198 条序列, 其保留率依次为 19.2%, 30.1%,26.1%, 74.9%, 98.9%和 81.1% (图2(a))。本研究中PPR-Meta, VirSorter2 和 DeepVirFinder 贡献了较多的病毒序列数量, 而其余 3 种方法识别的序列经CheckV 校验后保留率较高。对上述病毒序列进行聚类, 共获得 727 个 vOTUs。双链DNA病毒在各样本中的丰度均大于 94% (平均 98.5%), 单链 DNA 病毒仅在 UM 样本中占比较高(5.1%), 在所有样本中均未检测到 RNA 病毒(图2(b))。

图2 6种识别方法得到的潜在(CheckV 校验前)和最终(CheckV 校验后)病毒序列数量(a)以及每个样本单/双链病毒序列相对丰度(b)
Fig.2 Number of potential (before verification by CheckV) and final (after verification by CheckV) viral sequences obtained by six identification methods (a) and relative abundance of single-stranded (ss) or double-stranded (ds)viral sequences in each sample (b)

利用 vConTACT 软件, 基于病毒之间共享的基因含量, 对 vOTUs 与 NCBI Viral RefSeq 参考序列进行网络可视化, 点与点之间的连线说明二者共享基因含量较高[33], 可能属于同一病毒属。如图3 所示,给水系统中有 142 个 vOTUs 与参考序列之间有连线, 仅占总 vOTUs 数量的 19.5%, 有 61, 70 和 6 个vOTUs 分别与长尾噬菌体科(Siphoviridae)、肌尾噬菌体科(Myoviridae)和短尾噬菌体科(Podoviridae)之间存在连线, 534 个 vOTUs 与其他物种之间没有任何连线。在所有样本中共识别出 607 个病毒聚类簇(Viral Clusters, VCs), 样本与数据库共享 VCs 数量占所识别 VCs 的 10.2%。上述结果说明, 该给水系统中存在大量未知病毒, 遗传多样性较高, SiphoviridaeMyoviridae 是物种数量最多的已知病毒群体。Roux 等[46]、Mohiuddin 等[47]、Li 等[48]和 Hegarty 等[49]利用宏基因组方法研究湖泊、河流和饮用水等淡水系统中的病毒, 显示大部分病毒因与现有已知蛋白质数据库同源性较低而被归为未知类群。由此说明, 宏基因组学有助于挖掘更多未知的病毒序列, 使人们更全面地了解这一特殊生物群体在淡水环境中的作用[10]

图3 给水系统病毒群落与NCBI Viral Refseq参考序列的共享基因网络
Fig.3 Gene-sharing network of viral community in the water supply system and the reference sequences in NCBI Viral RefSeq database

进一步统计 4 个样本的 vOTUs 多样性及科/属水平分类, 结果如图4(a)所示。水源地河流中 RW样本 vOTUs 数量(548 个)及香农–威纳指数(5.65)最高。经过常规净水工艺处理后, DW 样本 vOTUs 数量和香农–威纳指数与 RW 相比分别下降 68.6%和24.2%。随后通过管网输配, 二者在 TW 中出现一定程度的回升, 可能与管网生物膜或管网破损引入的生物污染有关[50–51]。在医院经过进一步处理后,UM 上 vOTUs 的数量和香农–威纳指数降至最低,分别为 134 和 3.03, 相比于 TW 分别下降 43.7%和38.8%。从总体上看, 常规净水工艺和深度处理过程均可抑制病毒的物种丰富度及多样性。通过计算病毒与潜在宿主丰度比(图4(b))发现, 该比例在RW中最高(2.00), 随后在 DW 中降至 0.72 (降幅为64%), 在 TW 中进一步降至 0.57 (相比于 DW 降幅为 20.8%), 在 UM 中降到最低(相比于 TW 降幅为42.1%)。病毒与潜在宿主丰度比大于 1, 意味着病毒可能正在进行较活跃的增殖过程, 且在采集样本时病毒可能已将宿主裂解[52], 因此推测常规净水工艺和深度处理过程对病毒的活跃度亦有较强的抑制性。利用 VPF-Class 软件共注释得到 6 个病毒科 24个病毒属(图4(c)和(d)), 其中 RW 中有 5 科 13 属的RPKM 值≥100, DW, TW 和 UM 各自检测到 2~3 科2~4 属的 RPKM 值≥100, 说明 RW 具有最高的已知病毒多样性, 与图4(a)中结果一致。在科水平上,SiphoviridaeMyoviridae 是所有样本已知病毒的主要群体(占比为 77%~100%), 与图3 中结果大体上一致, Podoviridae 在 RW 中的丰度(19.9%)高于其他样本, Microviridae (微小噬菌体科)和 Lavidaviridae仅在 RW 中检测到, 丰度极低(3.1%)。有研究证明,Siphoviridae, MyoviridaePodoviridae 在其他淡水环境病毒群落中亦处于优势地位[49,53–54]。常规净水工艺和深度处理均对已知病毒的丰度有一定的抑制作用(图4(c)和(d)), 前者对 Myoviridae, Podoviridae,MicroviridaeLavidaviridae 有良好的抑制效果, 对Siphoviridae 无明显影响, 后者可降低 Siphoviridae的丰度。这可能是由于 Siphoviridae 对常规工艺的消毒过程具有较强的抵抗能力和对贫营养环境的适应能力[53–54], 而膜滤、吸附等处理可能对 Siphoviridae 的去除效果更好, 不同方法对病毒的去除效率存在差异[55], 未来需要实验的进一步证明。在属水平上, 各样本间已知病毒群落存在较大的差异, RW以 Cba41virus, T4virus, E125virusPhic31virus 噬菌体为主, DW 以 Pa6virus 噬菌体为主, TW 以 Muvirus 噬菌体为主, UM 以 P2virusInovirus 噬菌体为主。值得注意的是, 隶属 Inoviridae (丝状噬菌体科)的 Inovirus (丝状噬菌体属)仅在 UM 中检测到, 通常可感染引起人类疾病(如霍乱、黑死病、淋病或脑膜炎)的致病菌[56–57], 说明医院可能存在较高的环境健康风险, 影响给水系统的病毒群落。尽管在所有样本的已知群落中并未发现可直接引起人类、动物或植物疾病的病毒, 但考虑到大量未知病毒的存在, 饮用水中病毒导致的潜在健康风险仍然不可忽视。

图4 给水系统病毒群落多样性
Fig.4 Diversity of viral community in the water supply system

(a) vOTUs数量和香农-威纳指数; (b) 病毒与潜在宿主的丰度比; (c) 病毒在科水平上的群落组成; (d) 病毒在属水平上的群落组成

2.2 给水系统病毒潜在宿主的群落组成

我们对所有病毒物种进行宿主预测, 共有 107个 vOTUs 预测到宿主, 数量占比为 14.7%。由图5可知, 常规净水工艺、深度处理和输配管网均会引起病毒潜在宿主在门、纲、科和属水平群落结构的改变。在门和纲水平上(图5(a)和(b)), RW 病毒宿主以拟杆菌门(Bacteroidota)拟杆菌纲(Bacteroidia)为主(76.2%, 宿主在门或纲水平上的相对丰度, 下同),其次是变形菌门(Proteobacteria) (23.8%); DW 病毒宿主以 Gamma-Proteobacteria (71.0%)为主, 而 Bacteroidota Bacteroidia 受到抑制(24.2%); TW 病毒宿主以放线菌门(Actinobacteriota)放线菌纲(Actinomycetia)为主(75.8%), 随后在 UM 中二者的相对丰度明显下降(23.1%), Gamma-Proteobacteria 重新主导了病毒宿主群落(67.1%)。已有研究证明, Gamma-Proteobacteria 具有良好的环境胁迫抗性, 包括对氯化物的抗性[58–59], 对饮用水处理的消毒过程有良好的耐受能力[59–60]。尽管 Gamma-Proteobacteria 在DW 和 UM 原核微生物中的丰度高于其他样本, 但仅在 UM 中为丰度最高的纲[22]。Bacteroidota和 Actinobacteriota 分别在 RW 和 TW 原核微生物中的丰度高于其他样本, 但均不是丰度最高的门[22]。由此说明, 该给水系统中的病毒并非会感染丰度最高的宿主群体。进一步基于科和属水平剖析病毒潜在宿主(图5(c)和(d)), 4 个样本之间的宿主群落结构存在较大的差异: RW 以黄杆菌属(Flavobacterium)为主(75.6%, 宿主在科或属水平上的相对丰度, 下同),其次是新鞘脂菌属(Novosphingobium) (9.3%)和栖湖菌属(Limnohabitans) (7.5%), 上述菌属在典型淡水环境中广泛存在且鲜有致病的报道[22]; DW 以军团菌科(Legionellaceae)中以 UBA2653 属为主(71.0%),Legionellaceae 包含较多可以引起军团病的典型菌属[61], 尽管 UBA2653 的致病性仍然不清楚, 但存在一定的风险; TW 以分枝杆菌属(Mycobacterium)为主(75.5%), 其次是涅瓦菌属(Nevskia) (15.8%), 前者包含多样化的致病菌种, 可以在世界范围内引起结核病[62]; UM 以嗜盐单胞菌属(Halomonas)为主(66.9%), 其次是丙酸杆菌属(Cutibacterium) (23.1%),二者均可对人类致病, 前者可在医院透析室内通过医疗器械引发感染[22,63], 后者可引起乳房感染、皮肤脓肿和心内膜炎等[64]HalomonasCutibacterium 在 UM 中对生物膜的形成起主要作用, 易造成污染, 考虑到 TW 样本中并未检测到上述菌属,且透析液使用的是无菌电解质[22], 推测上述致病菌来源于医院。在除 UM 之外的其他样本中, 宿主群落丰度最高的属在整个原核微生物群落中并非丰度最高[22], 再次说明给水系统中的病毒并非会感染丰度最高的宿主群体。此外, 相比于 RW 样本, 给水系统中的病毒在 DW, TW 和 UM 中主要以感染人类致病菌或存在一定致病风险的细菌为主, 说明常规净水工艺以及深度处理并不能充分去除有害微生物, 输配管网以及风险环境暴露对病毒、潜在宿主以及二者的相互作用关系具有深刻的影响。

图5 给水系统病毒潜在宿主的群落组成
Fig.5 Community compositions of the potential hosts of viruses in the water supply system

2.3 给水系统病毒携带的辅助代谢基因及抗生素抗性基因

分析该给水系统病毒携带的 AMGs, 结果如图6(a)所示。RW 中携带 AMGs 的病毒丰度最高(3.4%), 其次是 TW 样本(1.2%), 而 DW 和 UM 的病毒携带 AMGs 比例极低(≤0.02%), 说明水处理过程可抑制病毒作为 AMGs 交换媒介的作用。进一步解析 AMGs 的组成(图6(b)), 共发现 10 种 AMGs。RW中病毒携带的 AMGs 多样性(9 种)高于其他样本(1~2 种), 包括 beta-1,4-N-acetylglucosaminyltransferase(K00737, 参与 N-聚糖合成)、[CysO sulfur-carrier protein]-S-L-cysteine hydrolase (K21140, 参与半胱氨酸合成)、cobaltochelatase (K09882, 参与辅因子合成)、DNA (cytosine-5)-methyltransferase (K00558,参与半胱氨酸或蛋氨酸代谢)、photosystem II P680 reaction center D1 protein (K02703, 参与光合作用)、UDP-3-O-[3-hydroxymyristoyl] glucosamine N-acyltransferase (K02536, 参与脂多糖合成)、dTDPglucose 4,6-dehydra-tase (K01710, 参与鼠李糖合成)、nicotinamide phospho-ribosyltransferase (K03462, 参与烟酸盐和烟酰胺代谢)、GDP-L-fucose synthase(K02377, 参与海藻糖合成); DW, TW 和 UM 则以参与肽聚糖合成或 β-内酰胺抗性的 penicillin-binding protein 1A (K05366)为主。病毒通过携带 AMGs 来增强其适应性和自主性, 克服宿主施加的限制, 促进宿主相关代谢过程, 保证病毒的自我复制和增殖[65]。本研究中水源地河流病毒主要携带参与能量代谢、糖类/氨基酸/辅因子合成的 AMGs, 推测病毒借助宿主的新陈代谢维持较高的活跃度, 与图4(b)的结果基本上一致。与水质良好的水源地河流相比, 处于自然状态下的湖泊病毒携带的 AMGs 更为多样, 几乎涉及细菌生命活动的所有方面[66]。经过常规净水工艺处理后的病毒主要编码青霉素结合蛋白辅助代谢基因, 而水源地病毒并未携带该类基因。青霉素结合蛋白广泛存在于细菌细胞膜中, 是维持细菌正常形态及功能的必要酶类, 亦是 β-内酰胺类抗生素的主要作用靶位, 其种类和数量的增加是细菌对 β-内酰胺产生耐药性的原因之一[67]。已有研究证实饮用水氯化消毒可导致细菌 β-内酰胺抗性的累积[68], 本研究则表明病毒介导的基因转移或许是 β-内酰胺耐药性增强的方式之一, 目标宿主可能是对人类具有致病性的细菌 Mycobacterium, HalomonasCutibacterium 等(图5(d))。

图6 给水系统病毒携带的辅助代谢基因(AMGs)及抗生素抗性基因(ARGs)的多样性
Fig.6 Diversity of the auxiliary metabolic genes (AMGs) and antibiotic resistance genes (ARGs) carried by viruses in the water supply system

(a) 携带AMGs的病毒丰度占比; (b) 病毒AMGs组成; (c) 携带ARGs的病毒丰度占比; (d) 病毒ARGs组成

分析该给水系统病毒携带的 ARGs, 结果如图6(c)所示。常规净水工艺抑制病毒携带 ARGs (RW:1.2%; DW: 0.1%), 但经过管网后病毒携带ARGs 的现象复现, 且丰度升高(2.6%)。值得注意的是, UM样本中携带 ARGs 的病毒丰度高达 35.0%, 远高于其他样本。进一步解析 ARGs 的组成(图6(d)), 共发现 8 类 ARGs。其中, UM 样本中病毒携带的 ARGs种类(6 类)高于其他样本(2~3 类), 包括 ATP-binding cassette (ABC)抗生素外排泵、cob(I)alamin 腺苷转移酶、转录调节蛋白 cpxR、ABC 大环内酯类转运蛋白 macB、春日霉素抗性蛋白 ksgA (仅发现于 UM)以及可移动的磺胺类抗性基因 sul4 (仅发现于 UM);TW 样本中病毒以携带万古霉素抗性调节蛋白 vanR和多药转运蛋白为主, 这两类ARGs 仅发现于 TW。上述结果说明, 在医院环境中, 病毒携带更丰富多样的 ARGs。尽管自来水在进入 UM 前经过深度处理, 但 UM 长期置于医院临床环境中, 存在较高的抗生素暴露风险[22], 对微生物具有潜在威胁, 医院环境 ARGs 种类通常比普通水体环境更丰富[69], 病毒可能通过携带多样的 ARGs, 使宿主耐药性增强的几率变大, 从而保证其“增殖场所”得以存在。此外, 输配水管网对病毒 ARGs 的贡献亦不可忽略,已有研究表明自来水输配系统是 ARGs 的重要存储区[70]。考虑到饮用水病毒群落丰富度及多样性在经过管网后有所提高(图4(a)), 且仍然出现致病微生物 Mycobacterium (图5(d)), 未来应在水龙头出水前加装微生物深度处理微系统, 进一步降低居民用水的生物安全风险。

3 结论

本文基于宏基因组测序技术, 对饮用水供给系统不同监测断面病毒群落的多样性、潜在宿主和携带的 AMGs 和 ARGs 开展全面的探索, 得到如下主要结论。

1) 给水系统中存在大量未知分类的病毒物种,双链 DNA 病毒的丰度为 94%~100%, 已知病毒中SiphoviridaeMyoviridae 是主要的类群。

2) 常规净水工艺(预氧化–混凝–絮凝–倾析–过滤–气态氯消毒–pH 调节–加氟)和深度处理(膜滤–木炭过滤–反渗透)可抑制病毒物种的丰富度、多样性和潜在活跃度, 经过输配管网后, 物种的丰富度和多样性有所回升。

3) 与水源地环境相比, 管网和长期置于医院的样本中, 病毒潜在宿主多为具有人类致病风险的细菌, 例如 Mycobacterium, HalomonasCutibacterium

4) 水处理过程抑制了病毒作为AMGs交换媒介的作用, 水源地环境病毒携带较多样化的 AMGs,主要与能量代谢、糖类/氨基酸/辅因子合成有关,可用于提升宿主的新陈代谢。经常规净水工艺处理后, 病毒主要编码青霉素结合蛋白辅助代谢基因。

5) 尽管经过深度处理, 但长期置于医院的样本中携带 ARGs 的病毒丰度(35%)远远高于其他样本(≤2.6%), 且 ARGs 种类更加多样化。

参考文献

[1] 徐志伟, 陈学梅, 魏云林, 等.基于病毒宏基因组纳帕海高原湿地病毒种群结构研究.基因组学与应用生物学, 2022, 41(2): 305–314

[2] 郭迅.红树林和海山沉积物病毒多样性及其潜在的生态意义研究[D].厦门: 自然资源部第三海洋研究所, 2020

[3] 夏蓉, 郑晓璇, 叶茂, 等.噬菌体对土壤碳氮元素循环转化影响的研究进展.土壤, 2021, 53(4): 661–671

[4] 芦娟.长江水体病毒群落解析及遗传多样性研究[D].镇江: 江苏大学, 2022

[5] Suttle C A.Viruses in the sea.Nature, 2005, 437: 356–361

[6] Emerson J B, Roux S, Brum J R, et al.Host-linked soil viral ecology along a permafrost thaw gradient.Nature Microbiology, 2018, 3(8): 870–880

[7] Coutinho F H, Cabello-Yeves P J, Gonzalez-Serrano R,et al.New viral biogeochemical roles revealed through metagenomic analysis of Lake Baikal.Microbiome,2020, 8(1): No.163

[8] Weinbauer M G.Ecology of prokaryotic viruses.FEMS Microbiology Reviews, 2004, 28(2): 127–181

[9] Zhang Y Z, Shi M, Holmes E C.Using Metagenomics to Characterize an Expanding Virosphere.Cell, 2018,172(6): 1168–1172

[10] Roux S, Adriaenssens E M, Dutilh B E, et al.Minimum information about an Uncultivated Virus Genome(MIUViG).Nature Biotechnology, 2019, 37(1): 29–37

[11] Camargo A P, Nayfach S, Chen I A, et al.IMG/VR v4:an expanded database of uncultivated virus genomes within a framework of extensive functional, taxonomic, and ecological metadata.Nucleic Acids Research,2023, 51(D1): D733–D743

[12] Brum J R, Sullivan M B.Rising to the challenge:accelerated pace of discovery transforms marine virology.Nature Reviews Microbiology, 2015, 13(3): 147–159

[13] Edwards R A, McNair K, Faust K, et al.Computational approaches to predict bacteriophage-host relationships.FEMS Microbiology Reviews, 2016, 40(2): 258–272

[14] Chen Y, Wang Y, Paez-Espino D, et al.Prokaryotic viruses impact functional microorganisms in nutrient removal and carbon cycle in wastewater treatment plants.Nature Communications, 2021, 12(1): 5398

[15] Debroas D, Siguret C.Viruses as key reservoirs of antibiotic resistance genes in the environment.The ISME Journal, 2019, 13(11): 2856–2867

[16] 侯鸾凤.饮用水给水处理系统微生物多样性研究[D].广州: 华南理工大学, 2018

[17] 蒋增辉.新型冠状病毒疫情下饮用水生物安全的分析与对策.净水技术, 2020, 39(5): 1–6

[18] 葛英亮.净水工艺单元微生物群落结构及其生物风险研究[D].哈尔滨: 哈尔滨工业大学, 2018

[19] 任红星.饮用水给水系统中微生物群落时空分布及其动态变化规律研究[D].杭州: 浙江大学, 2016

[20] 蔡广强, 张金松, 刘彤宙, 等.饮用水常规处理工艺中细菌群落的时空分布.中国环境科学, 2020,40(10): 4402–4410

[21] 蔡广强, 张金松, 刘彤宙, 等.活性炭–超滤深度处理工艺中细菌群落时空分布及动态变化规律.环境工程学报, 2021, 15(4): 1465–1472

[22] Dias M F, da Rocha Fernandes G, de Paiva M C, et al.Exploring the resistome, virulome and microbiome of drinking water in environmental and clinical settings.Water Research, 2020, 174: 115630

[23] Nescerecka A, Rubulis J, Vital M, et al.Biological instability in a chlorinated drinking water distribution network.PLOS ONE, 2014, 9(5): e96354

[24] Nurk S, Meleshko D, Korobeynikov A, et al.meta-SPAdes: a new versatile metagenomic assembler.Genome Research, 2017, 27(5): 824–834

[25] Paez-Espino D, Eloe-Fadrosh E A, Pavlopoulos G A,et al.Uncovering Earth’s virome.Nature, 2016, 536:425–430

[26] Antipov D, Raiko M, Lapidus A, et al.METAVIRALSPADES: assembly of viruses from metagenomic data.Bioinformatics, 2020, 36(14): 4126–4129

[27] Kieft K, Zhou Z C, Anantharaman K.VIBRANT: automated recovery, annotation and curation of microbial viruses, and evaluation of viral community function from genomic sequences.Microbiome, 2020, 8(1): No.90

[28] Guo J, Bolduc B, Zayed A A, et al.VirSorter2: a multiclassifier, expert-guided approach to detect diverse DNA and RNA viruses.Microbiome, 2021, 9(1): No.37

[29] Ren J, Song K, Deng C, et al.Identifying viruses from metagenomic data using deep learning.Quantitative Biology, 2020, 8(1): 64–77

[30] Fang Z, Tan J, Wu S, et al.PPR-Meta: a tool for identifying phages and plasmids from metagenomic fragments using deep learning.GigaScience, 2019, 8(6): giz066

[31] Nayfach S, Camargo A P, Schulz F, et al.CheckV assesses the quality and completeness of metagenomeassembled viral genomes.Nature Biotechnology, 2021,39(5): 578–585

[32] Fu L, Niu B, Zhu Z, et al.CD-HIT: accelerated for clustering the next-generation sequencing data.Bioinformatics, 2012, 28(23): 3150–3152

[33] Jang H B, Bolduc B, Zablocki O, et al.Taxonomic assignment of uncultivated prokaryotic virus genomes is enabled by gene-sharing networks.Nature Biotechnology, 2019, 37(6): 632–639

[34] Pons J C, Paez-Espino D, Riera G, et al.VPF-Class:taxonomic assignment and host prediction of uncultivated viruses based on viral protein families.Bioinformatics, 2021, 37(13): 1805–1813

[35] Hyatt D, Chen G L, Locascio P F, et al.Prodigal:prokaryotic gene recognition and translation initiation site identification.BMC Bioinformatics, 2010, 11: No.119

[36] Yin X, Jiang X T, Chai B, et al.ARGs-OAP v2.0 with an expanded SARG database and Hidden Markov Models for enhancement characterization and quantification of antibiotic resistance genes in environmental metagenomes.Bioinformatics, 2018, 34(13): 2263–2270

[37] Chen M L, An X L, Liao H, et al.Viral Community and virus-associated antibiotic resistance genes in soils amended with organic fertilizers.Environmental Science & Technology, 2021, 55(20): 13881–13890

[38] Uritskiy G V, Diruggiero J, Taylor J.MetaWRAP —a flexible pipeline for genome-resolved metagenomic data analysis.Microbiome, 2018, 6: No.158

[39] Chaumeil P, Mussig A J, Hugenholtz P, et al.GTDBTk: a toolkit to classify genomes with the Genome Taxonomy Database.Bioinformatics, 2019, 36(6): 1925–1927

[40] Tominaga K, Morimoto D, Nishimura Y, et al.In silico prediction of virus-host interactions for marine bacteroidetes with the use of metagenome-assembled genomes.Frontiers in Microbiology, 2020, 11: No.738

[41] 徐步, 邹雪蓉, 朱元清, 等.环境病毒的宿主鉴定技术进展.微生物学报, 2022, 62(12): 4663–4683

[42] Laslett D, Canback B.ARAGORN, a program to detect tRNA genes and tmRNA genes in nucleotide sequences.Nucleic Acids Research, 2004, 32(1): 11–16

[43] Bland C, Ramsey T L, Sabree F, et al.CRISPR recognition tool (CRT): a tool for automatic detection of clustered regularly interspaced palindromic repeats.BMC Bioinformatics, 2007, 8: No.209

[44] Langmead B, Salzberg S L.Fast gapped-read alignment with Bowtie 2.Nature Methods, 2012, 9(4): 357–359

[45] Li H, Handsaker B, Wysoker A, et al.The sequence alignment/map format and SAMtools.Bioinformatics,2009, 25(16): 2078–2079

[46] Roux S, Enault F, Robin A, et al.Assessing the diversity and specificity of two freshwater viral communities through metagenomics.PLOS ONE, 2012, 7(3):e33641

[47] Mohiuddin M, Schellhorn H E.Spatial and temporal dynamics of virus occurrence in two freshwater lakes captured through metagenomic analysis.Frontiers in Microbiology, 2015, 6: No.960

[48] Li R, Zhu L, Cui L, et al.Viral diversity and potential environmental risk in microplastic at watershed scale:evidence from metagenomic analysis of plastisphere.Environment International, 2022, 161: 107146

[49] Hegarty B, Dai Z, Raskin L, et al.A snapshot of the global drinking water virome: diversity and metabolic potential vary with residual disinfectant use.Water Research, 2022, 218: 118484

[50] Chao Y, Ma L, Yang Y, et al.Metagenomic analysis reveals significant changes of microbial compositions and protective functions during drinking water treatment.Scientific Reports, 2013, 3: No.3550

[51] Kauppinen A, Pitkänen T, Al-Hello H, et al.Two drinking water outbreaks caused by wastewater intrusion including sapovirus in Finland.International Journal of Environmental Research and Public Health,2019, 16(22): No.4376

[52] Li Z, Pan D, Wei G, et al.Deep sea sediments associated with cold seeps are a subsurface reservoir of viral diversity.The ISME Journal, 2021, 15(8): 2366–2378

[53] Muniesa M, Lucena F, Jofre J.Study of the potential relationship between the morphology of infectious somatic coliphages and their persistence in the environment.Journal of Applied Microbiology, 1999, 87(3):402–409

[54] Colombet J, Robin A, Sime-Ngando T.Genotypic, size and morphological diversity of virioplankton in a deep oligomesotrophic freshwater lake (Lac Pavin, France).Journal of Environmental Sciences, 2017, 53: 48–59

[55] Chen C, Guo L, Yang Y, et al.Comparative effectiveness of membrane technologies and disinfection methods for virus elimination in water: a review.Science of the Total Environment, 2021, 801: 149678

[56] Mahy B W J, Van Regenmortel M H V.Encyclopedia of Virology.Oxford: Academic Press, 2008

[57] Roux S, Krupovic M, Daly R A, et al.Cryptic inoviruses revealed as pervasive in bacteria and archaea across Earth’s biomes.Nature Microbiology, 2019, 4(11): 1895–1906

[58] Kamal S M, Simpson D J, Wang Z, et al.Horizontal transmission of stress resistance genes shape the ecology of beta-and gamma-Proteobacteria.Frontiers in Microbiology, 2021, 12: No.696522

[59] Zhu Z, Wu C, Zhong D, et al.Effects of pipe materials on chlorine-resistant biofilm formation under longterm high chlorine level.Applied Biochemistry and Biotechnology, 2014, 173(6): 1564–1578

[60] Su Z, Liu T, Men Y, et al.Understanding point-of-use tap water quality: from instrument measurement to intelligent analysis using sample filtration.Water Research, 2022, 225: 119205

[61] Palusińska-Szysz M, Cendrowska-Pinkosz M.Pathogenicity of the family Legionellaceae.Archivum Immunologiae et Therapiae Experimentalis, 2009, 57(4):279–290

[62] Good R C.Opportunistic pathogens in the genus Mycobacterium.Annual Review of Microbiology, 1985, 39:347–369

[63] Stevens D A, Hamilton J R, Johnson N, et al.Halomonas, a newly recognized human pathogen causing infections and contamination in a dialysis center three new species.Medicine, 2009, 88(4): 244–249

[64] Corvec S.Clinical and biological features of Cutibacterium (formerly Propionibacterium) avidum, an underrecognized microorganism.Clinical Microbiology Reviews, 2018, 31(3): e00064-17

[65] Koonin E V, Dolja V V, Krupovic M.The logic of virus evolution.Cell Host & Microbe, 2022, 30(7): 917–929

[66] Arkhipova K, Skvortsov T, Quinn J P, et al.Temporal dynamics of uncultured viruses: a new dimension in viral diversity.The ISME Journal, 2018, 12(1): 199–211

[67] 苏思婷, 毛丹丹, 许师文, 等.青霉素结合蛋白及其介导细菌耐药的研究进展.微生物学通报, 2017,44(4): 902–910

[68] Pang Y, Huang J, Xi J, et al.Effect of ultraviolet irradiation and chlorination on ampicillin-resistant Escherichia coli and its ampicillin resistance gene.Frontiers of Environmental Science & Engineering,2016, 10(3): 522–530

[69] Chng K R, Li C, Bertrand D, et al.Cartography of opportunistic pathogens and antibiotic resistance genes in a tertiary hospital environment.Nature Medicine,2020, 26(6): 941–951

[70] Xu L, Ouyang W, Qian Y, et al.High-throughput profiling of antibiotic resistance genes in drinking water treatment plants and distribution systems.Environmental Pollution, 2016, 213: 119–126

Distribution Characteristics of Viral Community and Their Potential Hosts and Functional Genes in a Water Supply System

MO Qiuyue1, YAN Sicen1, CHEN Qi1, CHEN Tianyi2,3, WU Zongzhi3,LIU Tang1,3, CHEN Qian3, LIU Shufeng3,†

1.School of Chemistry and Environmental Engineering, Shenzhen University, Shenzhen 518060; 2.School of Environment and Energy,Peking University Shenzhen Graduate School, Shenzhen 518055; 3.Key Laboratory of Water and Sediment Sciences (MOE), Department of Environmental Engineering, Peking University, Beijing 100871; † Corresponding author, E-mail: liushufeng@pku.edu.cn

Abstract Based on metagenomic shotgun sequencing, the viral community structure, potential hosts, and specific functional genes in key monitoring sites of a typical drinking water supply system were explored.The result revealed the presence of massive unclassified viral species, with the dominance of double-stranded DNA viruses occupying 94%–100% of viral abundance.The phages Siphoviridae and Myoviridae were identified as the major known taxa.Conventional and advanced treatment processes reduced viral richness, diversity, and replication potentials, while the richness and diversity slightly increased after passing water supply pipe network.Both treatment processes restrained the roles of viruses in mediating the exchange of auxiliary metabolic genes (AMGs).Viral genomes in source water possessed various AMGs involved in energy metabolism and biosynthesis of carbohydrates, amino acids, and cofactors, which could contribute to bacterial host metabolization.However, after conventional treatment,they mainly encoded penicillin-binding proteins.Notably, in the water sample with a long-term exposure to hospital clinic settings, the abundance of viruses (35%) carrying antibiotic resistance genes (ARGs) was much higher than those (≤ 2.6%) of other samples.This study highlighted the significant impacts of drinking water treatment processes,transport pipe networks, and environmental risk exposure on viral guilds and functions, and provided a theoretical basis for optimizing operation and management of water supply systems.

Key words water supply system; viral community; potential hosts; auxiliary metabolic genes (AMGs); antibiotic resistance genes (ARGs); metagenomics