特色专题:2024年科技热点回眸

2024年AI在环境领域的应用热点回眸

  • 郑祥 , 1, 2, 3 ,
  • 杨清雯 1 ,
  • 石磊 4 ,
  • 程荣 , 1, 2, 3, *
展开
  • 1. 中国人民大学化学与生命资源学院, 北京 100872
  • 2. 中国人民大学膜技术创新与产业发展研究中心, 北京 100872
  • 3. 北京碧水源科技股份有限公司国家企业技术中心, 北京 102206
  • 4. 中国人民大学生态环境学院, 北京 100872
程荣(通信作者),教授,研究方向为环境公共卫生、环境功能材料,电子信箱:

郑祥,教授,研究方向为环境公共卫生与膜分离,电子信箱:

收稿日期: 2025-01-02

  网络出版日期: 2025-02-10

基金资助

国家自然科学基金项目(52470224)

北京市自然科学基金项目(8232036)

版权

版权所有,未经授权,不得转载。

Review of hot applications of AI in the environmental field in 2024

  • Xiang ZHENG , 1, 2, 3 ,
  • Qingwen YANG 1 ,
  • Lei SHI 4 ,
  • Rong CHENG , 1, 2, 3, *
Expand
  • 1. School of Chemistry and Life Resources, Renmin University of China, Beijing 100872, China
  • 2. Collaborative Innovation and Industrial Development Research Center for Membrane Technology, Renmin University of China, Beijing 100872, China
  • 3. National Enterprise Technology Center, Beijing Originwater Technology Co., Ltd., Beijing 102206, China
  • 4. School of Ecology & Environment, Renmin University of China, Beijing 100872, China

Received date: 2025-01-02

  Online published: 2025-02-10

Copyright

All rights reserved. Unauthorized reproduction is prohibited.

摘要

人工智能技术具有强大、高效和灵活的数据分析处理能力和模式识别与预测能力,能够很好地适应复杂变化的环境系统,已成为环境领域备受关注的新兴工具。以发表在国际顶级学术期刊或具有重要影响的研究成果为基础,盘点了2024年人工智能技术在环境监测、气候变化、公共卫生安全等领域的重要研究及应用,并展望了生成式人工智能在环境领域的发展前景,为推动环境领域人工智能技术的研究和应用提供参考。

本文引用格式

郑祥 , 杨清雯 , 石磊 , 程荣 . 2024年AI在环境领域的应用热点回眸[J]. 科技导报, 2025 , 43(1) : 81 -95 . DOI: 10.3981/j.issn.1000-7857.2025.01.00029

随着人工智能(AI)技术的迅猛发展,其在环境领域的应用已成为科学研究和实践应用中的一个热点。人工智能技术可以追溯到20世纪50年代,“人工智能”这一名词被提出[1],相继取得了一批令人瞩目的研究成果。20世纪70年代出现的专家系统通过模拟人类专家的知识和经验解决特定领域的问题,实现了人工智能从理论研究走向实际应用的重大突破。
20世纪80年代,人工智能技术开始被应用于环境科学领域[2]。面对复杂的环境数据,人工智能技术提供了一种实现精确预测、持续监测和风险评估的解决方案[3]。随着深度学习算法在2010年的出现,利用人工智能工具进行环境任务的研究呈爆炸式增长。传统的鉴别式人工智能侧重于学习不同类别数据之间的决策边界,并已广泛应用于环境科学和工程领域,如水质预测和污染监测[4]。但是,鉴别式人工智能对数据集要求较高,对缺少数据的环境问题很难获取足够的信息以完善模型。而生成式人工智能能够基于学习到的数据分布生成新的数据实例,解决了鉴别式人工智能面临的问题[5],能为气候变化等相互关联的可持续性问题提供创新的解决方案,被认为是未来环境领域人工智能技术发展的新方向[6]
本文在Web of Science核心合集数据库采用主题词(artificial intelligence OR AI OR machine learning)AND(environment* OR ecological OR sustainability)进行检索,得到58154条文献(截至2024年12月29日),其出版年分布如图 1所示。可以看到,2016年以来,人工智能在环境领域的应用研究不断增加,2019年至今一直保持着极高的增速。可以认为,目前处在环境领域人工智能应用研究的指数增长期。
图1 Web of Science核心合集中与环境中人工智能相关论文的发表时间分布
人工智能在环境领域的应用涉及环境质量监测、环境建模和预测、设计新型处理技术、环境政策评估和风险评估等多个方面。本文以2024年度发表在国际顶级学术期刊或具有重要影响的研究成果为基础,系统梳理人工智能技术在环境领域应用的最新进展,盘点2024年人工智能技术在环境监测、气候变化、公共卫生安全等领域的重要研究及应用,并展望生成式人工智能的发展前景,为厘清环境领域人工智能技术的发展脉络、推动适应环境领域需求的人工智能技术的研究和应用提供参考。

1 人工智能与环境监测

环境监测的基本过程需要对自然环境及其所有组成部分进行系统观察、测量和评估。传统的环境监测技术包括人工采样、实验室分析和统计分析。但是,这些方法存在成本高、程序冗长和准确性差等局限性。因AI技术可以执行传感、推理、学习和决策等活动,已被广泛应用于环境监测领域。目前,空气和水质监测以及识别土壤污染物领域都有人工智能技术的出现[7]。人工智能相比传统监测手段在提高环境监测效率和有效性方面有着显著优势,但是人工智能技术的初始成本较高,在使用时需要在成本和长期效益之间做出选择。

1.1 水环境监测

传统水质监测方法依赖于劳动密集型、昂贵且范围受限的手动采样和实验室分析。此外,通过传统方法实现可靠的预测需漫长处理时间和大量的计算工作,监测成本较高。人工智能技术能有效克服这些限制,利用来自各种来源的数据,发现水质变化的模式和趋势,并提供精确、实时的水质监测结果。
人工智能技术可以用于污水处理过程的管理,优化污水处理技术,简化技术选择过程。华中科技大学郭刚团队[8]引入一种可解释的XGBoost-CatBoost机器学习方法来预测反硝化硫(S)转化相关的强化生物除磷(DS-EBPR)工艺处理含盐废水中S转换驱动的磷去除效率,并优化DS-EBPR流程(图 2[8])。该研究确定了DS-EBPR过程中关键环境因素的最佳范围,并开发了一个用户友好的图形界面,简化了在DS-EBPR过程中增强磷去除的最佳条件的确定。
图2 使用机器学习方法优化生物除磷工艺过程
在地表水管理中,准确预测河流水质对可持续水资源管理至关重要,人工智能技术通过与新型方法或传统水质模型耦合,取得了更好的预测效果。厦门大学的黄金良团队[9]创新性地将小波分析(WA)和迁移学习(TL)方法与长短期记忆网络(LSTM)相结合,同时解决了河流水质预测中的非平稳性和数据限制性问题。结果表明,WA-LSTM-TL耦合方法可以显著提高预测精度,是一种可靠的河流水质预测工具。武汉大学的夏军团队[10]将传统水质(HWQ)模型与机器学习(ML)方法相结合,以分析2014— 2018年长江中下游的每日污染负荷(即化学需氧量COD和总磷TP)及其来源(图 3[10])。耦合HWQ-ML模型的性能优于独立的ML模型,同时还降低了参数不确定性。该研究证明了物理建模和机器学习之间较好的协同作用,为长江污染负荷动态管理提供新见解。
图3 使用机器学习方法分析长江中下游每日污染负荷
人工智能技术还可以用于地下水的管理。不同于地表水,地下水监测需要在地下建设监测井,而监测井和监测设备如水位计、水质传感器等的建设成本较高,且监测过程易受干扰,往往难以实现高频率的监测。同时,受限于地下水监测系统完备程度,部分可能给人类健康造成威胁的污染物尚未被纳入监测范围,机器学习方法能够很好地弥补这种缺口。New England Water Science Center的Lombard团队[11]创新性地采用机器学习方法估算美国本土用作饮用水的地下水中的锂浓度,输出了美国地下水锂分布地图。由于锂浓度并未被美国政府管制,该研究还分析了地下水中锂的健康影响。该模型输出的地下水锂分布地图整体准确率可达60%,很好地解决了部分地区缺少监测数据的问题,对美国饮用水用地下水健康管理提供了数据支持。

1.2 空气质量监测

长期生活在空气污染中会导致癌症、心血管疾病和呼吸系统疾病等严重疾病[12],准确的空气质量监测有助于改善城市居民的健康状况。由AI提供支持的系统可以提供精确、实时的空气质量数据,协助政府制定有效的政策和干预措施,以最大限度地减少空气污染,优化空气质量。
人工智能技术能够用于空气中具体污染物动态变化的监测和预测。南方科技大学的沈惠中团队[13]采用卷积神经网络(CNN)来研究气象场的三维空间变化对深圳大气中臭氧的日动态、季节性和年际动态的影响(图 4[13])。该研究优化的CNN模型有效地解释了超过70% 的日常臭氧变化,揭示了深圳臭氧变化的主要驱动因素,并成功复制了臭氧的历史动态变化。除深圳外,该研究还将模型扩展到北京、上海和成都,有助于理解特大城市的臭氧污染成因。
图4 基于CNN的城市臭氧动态变化研究
此外,AI技术还可与其他技术结合,进而为空气质量管理提供有效建议。复旦大学周斌团队[14]创新性地将多轴微分光学吸收光谱(MAX-DOAS)和机器学习(ML)技术相结合,以极高的分钟级时间分辨率和达到百米尺度的垂直分辨率检索垂直剖面O3浓度,首次实现了从地面到平流层顶(0~60 km)高时高分辨臭氧分布的地面被动遥感(图 5[14])。该研究为加强对大气环境中臭氧动力学的理解开辟了新的途径。此外,具有成本效益和便携性的MAX-DOAS与ML方法相结合,也可以实现对其他微量气体的立体观察,具有良好的普适性。
图5 使用机器学习和MAX-DOAS方法立体监测臭氧分布
除管理单一环境介质如水、空气质量外,人工智能技术还能够实现2种以上环境介质的同步监测。南京农业大学的高翔团队[15]开发了一种基于物联网(IoT)的新型监测系统(WG-IoT-MS),同步监测稻谷种植区的水质和温室气体排放。该系统配备了低成本的传感器和集成的智能算法,结合空气-水气体交换模型,实现了对农业水体CO2和N2O排放的有效监测和模拟,同时将监测成本降低了约60%(图 6[15])。该方法为稻谷种植区水质和温室气体排放的定量评估提供了重要的技术支持,为制定有效的减排策略奠定了基础。
图6 WG-IoT-MS系统用于监测稻谷种植区的水质和温室气体排放

1.3 土壤质量监测

人工智能在土壤监测中的应用代表了农业管理、环境保护和土地利用规划的重大进步[16]。传统的土壤监测方法涉及人工取样和实验室分析,通常耗时、劳动密集且范围有限。然而,人工智能提供了创新解决方案,可以提高准确性、效率和可扩展性,彻底改变土壤健康的监测和管理方式。康奈尔大学的Woolf团队[17]使用深度学习方法探讨了各种协变量对局部(长达1.25 km)和大陆(美国)尺度土壤有机碳(SOC)空间分布的重要性(图 7[17])。该研究结果表明,不同尺度的土壤有机碳主要影响因素不同,对改进SOC映射、决策支持工具和土地管理策略具有重要意义,有助于制定有效的碳封存计划并加强气候变化缓解工作[17]
图7 深度学习方法用于分析土壤有机碳影响因素
深度学习工具还可用于农业领域,为智慧农业改革提供新颖的技术解决方案。Yeungnam University的Ashraf团队[18]使用梯度提升、支持向量机(SVM)、递归神经网络(RNN)和长短期记忆(LSTM)等算法,分析不同农作物对干旱的抗性,揭示了植物(主要是作物)对干旱胁迫的典型生理反应。该研究能够帮助农业相关部门确定更加适应干旱环境的农作物品种,在气候变化背景下更好地指导精准农业以及支持全球粮食安全计划。

2 人工智能与气候变化

气候变化已成为全球面临的最紧迫环境问题之一。随着全球气温的持续上升,极端天气事件频发,以及生态系统的脆弱性日益增加,人类社会正面临着前所未有的挑战。为了更好地应对由气候变化带来的天气变化和极端天气事件,已经有很多基于物理的传统预测模型被开发出来。例如,世界气候研究计划(World Climate Research Programme)的耦合模式比较项目(CMIP)汇集了多模式气候预测,以了解过去、现在和未来的气候变化[19]。CMIP模拟了各种情景下的物理气候以及生物地球化学循环,但仍然存在很大的不确定性,限制了模型在年代际和多年代际时间尺度上准确预测全球和区域气候变化,以及气候变异性、极端事件及其对生态系统的影响的能力。此外,不断增长的数据量也使得检测和理解可变性和极端事件的模式变得困难[20]
在此背景下,ML方法有望应对这些挑战。目前,机器学习方法已应用于天气预报,以及其他气候变化问题如自然灾害预测等,以其强大的数据处理能力、模式识别和预测分析功能,在气候模型构建、灾害预警、能源管理以及环境政策制定等方面展现出了巨大潜力。

2.1 天气预测

天气预报总是会有一些不确定性,即使是当前最优秀的天气模型,也只能部分地观察当前的天气[21]。传统的天气预报基于数值天气预报(NWP)算法,欧洲中期天气预报中心(ECMWF)的ENS4系统是目前最先进的基于NWP的集成预报,但是,ENS以及其他基于NWP的集成预报仍然容易出错,运行速度慢,并且耗时。
基于ML的天气预报(MLWP)的最新研究成果已被证明在非概率天气预报领域拥有比NWP更高的准确性和效率[22]。然而,由于ML方法不是预测单一的天气轨迹或轨迹的分布,较少强调量化与预测相关的不确定性,因此往往会产生模糊的预报,对概率天气预报的表现不如ENS模型。为了提高机器学习方法概率天气预报的准确性,来自Google Deep-Mind公司的Willson团队[23]首次提出了一种MLWP方法GenCast,在概率天气预测上,它的性能明显优于顶级集成NWP模型ENS。在该研究评估的1320个目标中,GenCast比ENS在97.2% 的目标上具有更好的表现(图 8[23]),并且可以更好地预测极端天气、热带气旋路径和风力发电。该团队的研究结果表明,尖端的生成式人工智能方法可以在丰富的时间动态中捕获非常高维和复杂的数据分布,具有足够的准确性和可靠性,能够作为现实生活中的决策依据。
图8 GenCast预测的集合RMSE均值与ENS相同甚至更好
在次季节性预测上,ML方法也有比传统天气预测模型更好的表现。复旦大学的李昊团队[24]首次开发了一个用于次季节性天气预报的ML模型FuXi Subseasonal-to-Seasonal(FuXi-S2S)(图 9[24]),可提供长达42 d的全球日平均预报,在总降水和出射长波辐射的集成均值和集成预报方面均优于ECMWF最先进的次季节-季节模型。这也是第一个在次季节性预测表现上优于传统模型的ML模型。该团队将FuXi-S2S系统用于研究2022年巴基斯坦洪水,分析了FuXi-S2S模型的预测结果,认为FuXi-S2S在准确性和速度方面超越了传统的NWP模型,有可能揭示地球系统内以前未被预测到的次季节过程。
图9 FuXi Subseasonal-to-Seasonal(FuXi-S2S)模型的结构示意
除了全面的天气系统预测外,ML方法还可用于闪电等特殊天气现象的预测。目前,对闪电的具体生成微过程仍存在分歧,且由于闪电属于较为罕见的现象,现有观测数据无法满足设置所有自由参数的要求。对此,基于统计和AI的预测方法能够很好地解决闪电生成机制不明和参数难以确定的问题。来自意大利的Mazzino团队[25]提出了一种集成AI和NWP模型的方法FlashNet,使用人工智能增强NWP对闪电的预测(图 10[25])。结果表明,人工智能增强算法的预测能力明显高于ECMWF模型中采用的完全确定性算法。在0~24 h的预测区间内,获得了95% 左右的召回峰。在与AI算法相同的精度下,该性能超过了ECMWF模型达到的85%。在更长的预测时间范围内,FlashNet的优势持续存在,有望在未来实现更长时间尺度的闪电或其他天气现象的准确预测。
图10 FlashNet集成网络的示意
此外,机器学习方法在全球尺度的气候预测领域也有着亮眼的表现。厄尔尼诺(ENSO)现象作为一种全球性气候异常事件,对全球气候模式和生态系统产生深远影响。准确预测厄尔尼诺现象的发生、强度和持续时间,对于减轻其负面影响、制定应对策略和优化资源配置至关重要。来自University of Hawai ‘i at Mānoa的Jin团队[26]开发了一种扩展的非线性补给振荡器(XRO)模型,实现了对ENSO现象的精准预测。在此之前,AI技术虽然能够在18~24个月的时间内预测ENSO现象,但是将AI模型的预测技能与特定的物理过程联系起来仍然非常困难。该团队开发的低阶XRO模型将ENSO补给振荡器与其他模态的自回归模型耦合,既可以预测ENSO事件,又可以量化气候模式相互作用中ENSO可预测性的各种来源。该研究发现,XRO模型在长达16~18个月的时间内提供了巧妙且可解释的预测(图 11[26]),并优于全球气候模型。
图11 XRO模型在模拟和预测ENSO现象上的卓越表现

2.2 自然灾害预测

近年来,随着温室效应的逐渐加剧,飓风、地震和野火等极端天气和自然灾害现象层出不穷,对人类的健康和财产安全带来了严重威胁。基于AI的解决方案通过学习历史数据,从中总结归纳数据变化规律,无须过多了解数据变化背后的机制,即可提供有关自然灾害的精确、实时数据,协助当局制定有效的响应计划并降低对公共安全的危险。
目前,包括地震、海啸和洪水在内的自然灾害已使用AI进行预测和管理。韩国Koo团队[27]开发了一种专为小溪量身定制的新型洪水预警系统(SSFEWS)(图 12[27])。通过融合基于物联网的传感器网络、利用测量数据的统计模型、稳健的约束非线性优化算法(RCNOA)和四参数逻辑方法(4PL),该团队将实时水动力数据收集、洪水概率预测和主动预警发布集成于SSFEWS一体。此外,自动化迭代过程增强了系统的准确性和可靠性,准确预测降雨量也成为该系统成功预测小溪流量和深度,进而有效预测洪水的关键。试点应用结果表明,SSFEWS系统有望为社区的安全作出贡献,并通过实现高效的灾害响应来防止可能与溪流相关的伤亡。
图12 用于水深、流量排放和速度预警的SSFEWS系统概念图
随着极端降雨事件的不断增多,洪水发生的频率也在不断增加。人工智能技术可以与天气预报系统相结合,在暴雨来临前发出预警,帮助相关部门和居民及时反应,降低财产和生命损失。来自North⁃eastern University的Ganguly团队[28]评估了生成式深度学习模型用于强降水事件预测的能力。评估结果表明,最先进的嵌入物理的深度生成模型,特别是Nowcast Net[29],优于最新一代NWP的高分辨率快速刷新(HRRR)模型,进一步证实了机器学习模型方法在改善洪水应急响应和水电管理方面的巨大潜力[28]
在地震预测领域,Georgia Southern University的Yavas团队[30]利用机器学习和神经网络模型,构建了一个全面的特征矩阵以预测洛杉矶的地震(图 13[30])。通过综合现有研究和整合新的预测特征,该团队开发了一个能够估计最大潜在地震震级的稳健子集,当与随机森林模型一起应用时,可以预测未来30 d内6个不同类别的地震,准确率高达97.97%。在易受地震活动影响的洛杉矶地区,实现高准确性地震预测对于加强备灾和响应战略至关重要。
图13 用于地震预测的机器学习方法论
机器学习方法还可以有效识别山火的发生并及时提醒相关部门做出反应。来自Emory University的Liu团队[31]通过优化模型输入开发了一种计算成本更低的机器学习模型,创新性地将AOD空白填充、小波变换和随机森林算法相结合(图 14[31]),用于1 km高空间分辨率下无空间差距的每小时PM2.5水平预测。该方法评估了模型推广到未监测地点的能力,模拟了在缺乏地面监测站的地区需要PM2.5预测的真实场景,在数据不足时,也可以实现对山火的有效预测。同时,该模型可以实现对由野火导致的PM2.5升高的预测,通过将模型应用于2020和2021年发生在加利福尼亚州的重大野火事件,证实了该模型不仅能够捕获大型的山火烟柱,小型的火灾事件也可以监测到。该模型输出的高分辨率PM2.5地图提供了有关烟柱扩散模式及其对空气质量影响的见解,从而有助于就公共卫生建议、排放缓解策略和野火管理计划做出明智的决策。
图14 基于机器学习的PM2.5预测工作流程
干旱同样被认为是一种重大的自然灾害,可导致严重的经济和社会影响。干旱指数在世界范围内用于干旱监测和管理。然而,由于干旱现象的内在复杂性和水文气候条件的差异,没有通用的干旱指数可用于有效监测世界各地的干旱。因此,来自University of Sharjah的Abdallah团队[32]开发了一种新的基于AI的干旱指数,与各种人工智能模型配合使用以描述和预测干旱(图 15[32])。该团队开发的基于AI的干旱指数优于传统指数,研究所使用的几种机器学习算法也都实现了较高的预测精度,有效地促进了更准确的干旱监测和预测。研究结果强调,人工智能可以成为一种有前途且可靠的预测方法,以实现更好的干旱评估和管理。
图15 基于AI的干旱预测方法框架示意

3 人工智能与公共卫生安全

在新冠疫情全球大流行之后,世界对于公共卫生和环境健康的关注达到了前所未有的高度。疫情揭示了病原微生物对人类社会的巨大威胁,同时也暴露了现有环境病原微生物管理的不足。复杂的环境因素也引发了各种新型疾病,随着临床医学的发展,如何实现大量患者信息的管理和新型药物的正确应用也是临床医学面临的新挑战。在疫情后的新常态下,基于人工智能的环境病原微生物管理不仅能够识别和预测病原微生物的分布和传播模式,还能够提高相关部门对环境健康风险的响应能力,革新医生在疾病诊断、治疗方案制定、手术实施以及患者健康管理等方面的工作模式,在预防和控制未来可能的疫情中发挥关键作用。因此,人工智能技术在公共卫生安全领域的应用对保护人类健康和维护生态平衡具有重要意义。

3.1 病原菌监测和管理

人工智能技术可以用于监测环境中具体种类的病原微生物。例如,来自The Ohio State University的Weir团队[33]开发了一种可以用于预测军团菌(Legionella pneumophila)浓度的低成本实时监控机器学习模型(图 16[33])。该研究通过结合理化水质参数和统计学习理论,构建了机器学习模型,以快速准确预测军团菌基因拷贝数在一定范围内出现的概率。研究结果表明,机器学习方法,特别是PCA和LASSO算法,在实时监测军团菌方面具有准确性和可行性,强调了水质对宿主细胞和军团菌浓度的影响。这项研究为公共卫生领域提供了一种新的工具,以改善军团菌的管理策略。
图16 基于机器学习的军团菌浓度实时监测模型
食源性疾病是公共卫生管理的紧迫问题,监测食源性疾病以确定其流行率和流行病学特征,并监测新发或变种病原体的出现,对于维护公共卫生非常重要。为了实现对食源性传染病的有效监测,来自Kyung Hee University的Seungdae Oh团队[34]开发了一个数据驱动的机器学习模型,用于与产气荚膜梭菌(CP)相关疾病的监测。该模型合并城市污水、环境和众包网络数据集作为输入变量,创建了一个包含污水微生物组的高通量测序(HTS)数据、40个气象指数和9个与CP疾病症状相关的在线搜索条目数据在内的结构化数据集(图 17[34])。研究结果揭示了污水中CP的存在及其基因型/毒素型,验证了微生物组数据支持的ML监测对食源性疾病的效用。因此,这种基于ML的框架在补充和加强现有疾病监测系统方面具有巨大潜力。
图17 基于机器学习模型的食源性传染病监测系统
在全球化的背景下,疫苗作为预防和控制传染病的重要工具,对维护公共卫生安全起着至关重要的作用。然而,随着疫苗需求的增加,市场上出现了假冒伪劣疫苗的非法疫苗,不仅无效,还可能对接种者的健康造成严重威胁,甚至加剧疫情的传播。为了有效鉴定疫苗真伪,来自University of Oxford的McCullagh团队[35]开发了基质辅助激光解吸/电离-质谱(MALDI-MS)(图 18[35]),并结合开源机器学习和统计分析方法来区分疫苗的真伪。该团队在世界范围内用于临床应用的2种不同的MALDI-MS仪器上验证了该方法。研究结果表明,MALDI-MS可以用作监测疫苗供应链的筛选工具。
图18 基质辅助激光解吸/电离-质谱(MALDI-MS)样品制备和分析工作流程

3.2 医疗中的人工智能技术

在环境与医学紧密相连的大背景下,AI技术在临床医学中的应用具有深远意义。环境因素诸如空气污染、水污染、土壤污染以及气候变化等,都与人体健康息息相关,可引发多种疾病,包括呼吸系统疾病、心血管疾病、消化系统疾病乃至某些癌症等。长期暴露在不良环境中,人体患病风险显著增加,这也给临床医学带来了诸多复杂病症的挑战。AI技术的应用正在改变医生诊断疾病、制定治疗方案、进行手术以及管理患者健康的方方面面。随着大数据、机器学习、深度学习和自然语言处理等AI子领域的快速发展,医疗数据的分析和解读能力得到了前所未有的提升,有助于医生更好地分析病因和管理患者。
AI技术在临床医学中的应用背景是多方面的。首先,AI技术能够处理和分析大量复杂数据,识别模式和趋势,这在疾病的早期诊断、精准治疗和预后发展中显示出巨大潜力。在预后管理方面,引入AI技术能够更好地帮助医生监管患者预后发展情况,有利于患者康复。以呼吸道疾病为例,考虑到环境因素对患者的康复进程有着显著影响,且不同患者的生活环境差异较大,AI技术可以收集患者所处环境的信息,结合患者的病情恢复指标,如肺功能检测数据、呼吸道症状改善情况等,为医生提供个性化的康复建议。医生可依据这些建议,调整患者的治疗方案,如是否需要增加呼吸道防护措施、调整药物剂量等,以更好地促进患者康复。来自皖南医学院第一附属医院的邵雪非团队[36]选择3种常用的机器学习算法(决策树(DT)、随机森林(RF)和多层感知器(MLP))来预测血肿,展示了机器学习方法在预后管理中的重要作用。创伤性脑损伤(TBI)是一个全球性问题,也是患者死亡的主要原因,脑挫伤(CC)是一种常见的原发性TBI。挫伤出血进展(HPC)对患者的生命构成重大风险,有效预测血肿体积的变化是一项亟待解决的临床挑战。该团队的研究结果表明,DT模型是预测效果最好的机器学习算法,可以科学有效地预测患者预后的血肿变化,通过充分检查与HPC相关的因素,为临床医生提供科学合理的预测模型,以实现及时有效的预后血肿干预。
此外,AI还可以辅助医生进行决策,通过预测模型减少医疗错误,提高治疗效果。一方面,环境因素会导致疾病的多样性和复杂性增加。例如,不同地区的环境污染程度和类型不同,所引发的疾病谱也存在差异。机器学习算法可以整合患者所在地区的环境数据,如空气质量指数、水质污染指标以及土壤中有害物质含量等,结合患者的临床症状、病史和基因数据等,构建更精准的疾病预测和诊断模型。这有助于医生在面对复杂病情时,更准确地判断疾病的成因和发展趋势,从而制定更合理的治疗方案。另一方面,环境中的细菌耐药性问题日益严峻,这与抗生素的滥用以及环境中抗生素残留等因素密切相关。机器学习方法可以帮助医生优化抗生素使用方案,减少抗生素滥用。例如,来自Germany University of Koblenz的Kschischo团队[37]开发了抗生素选择模型OptAB,这是第一个完全由数据驱动的基于人工智能的适用于脓毒症患者的在线可更新抗生素选择模型(图 19[37])。OptAB通过不断迭代对脓毒症患者提供最佳的抗生素选择,重点是最小化脓毒症相关器官衰竭评分(SOFA-Score),同时重点关注抗生素可能带来的肾毒性和肝毒性,以预测不同抗生素治疗下的未来病程。研究结果表明,由于OptAB能够实时监测患者病情发展,可以帮助医生更好地选择适应患者病情的抗生素,比传统服用抗生素疗法获得更好的效果。
图19 在线可更新的最佳治疗选择模型OptAB示意
最后,人工智能技术还可用于预测癌症患者的生存率。例如,来自Shahid Beheshti University of Medical Sciences的Aria团队[38]开创性地使用深度神经网络(DNN)和其他11种传统ML方法来预测伊朗乳腺癌女性的5年生存率。乳腺癌预后仍然是一个复杂的问题,受多种因素影响,包括患者人口统计学、肿瘤特征、生物标志物概况和生活习惯等。该团队综合考虑了各种变量,训练的ExtraTrees和GBoost模型实现了最高的交叉验证准确率,达到95.43%。此外,DNN模型表现出最高的外部验证准确率,为85.56%,DNN模型在所有评估指标上都表现出色,能够优化医疗决策并改善伊朗女性乳腺癌的预后管理。

4 生成式人工智能的发展前景

目前,生成式人工智能在环境科学和工程中的应用大多局限于生成训练数据和专门的聊天机器人。然而,生成式人工智能,如大语言模型(LLM),具有自主决策的能力,这使它们有可能成为环境研究人员的有价值的助理或合作伙伴。面对气候变化、获得清洁水和生物多样性丧失等全球可持续性挑战,生成式人工智能可能为这些相互关联和大规模的可持续性问题提供创新的解决方案[6]

4.1 解决传统鉴别式人工智能的数据困境

生成式人工智能能够弥补数据不足的缺陷,解决鉴别式人工智能面临的“数据困境”。在环境监测领域,由于恶劣的监测环境和较高的设备布置成本,监测站无法实现全覆盖,很多数据难以获得。数据的稀缺为传统鉴别式人工智能模型的构建带来了重大挑战,特别是对于需要大数据集的深度学习模型。生成式人工智能,如生成式对抗网络(GANs),可以基于学习到的数据分布生成额外的训练数据(例如,时间序列和图像)来增强鉴别式人工智能模型数据不足的性能。例如,来自The Hong Kong Polytechnic University的Xiao团队[39]提出了一种LSTM-GAN方法来实现对供水管网中的漏水检测。该团队从供水管网中收集声信号训练LSTM-GAN模型,生成合成泄漏信号以增强数据集(图 20[39])。在该系统中,生成器负责创建新的样本,而鉴别器则负责评估它们的真实性。生成器不断改进,直到其生成的样本与真实数据难以区分,从而实现数据增强。结果表明,增强的数据提高了供水管网泄漏检测的性能,这代表了生成式人工智能在解决数据不足问题上的巨大潜力。
图20 用于供水管网泄漏检测的LSTM-GAN模型框架示意

4.2 基于大语言模型的环境聊天机器人

可以使用特定学科的知识构建适用于环境的LLM(聊天机器人)。这种专门的LLM可以作为研究、教学和培训的知识问答库,帮助环境研究人员和从业者快速获取专业知识。此外,利用LLM的上下文学习能力,聊天机器人可以快速开发新的能力,例如,在提示中加入一些标记拉曼光谱,使其能够识别有机污染[6]。此外,聊天机器人可以通过API调用嵌入工具,使用户能够通过会话接口而不是通过编码来调用现有的有区别的AI模型或专门的工具[40]
Kaiwu GPT是环境聊天机器人的典型例子,它可以给出专业的响应、分析数据和代码。它是在清华大学教授徐明发起的天宫人工智能开源项目的基础上开发的,重点聚焦可持续发展[41]。该聊天机器人能够通过利用外部知识来提高生成内容的准确性和相关性。通过引入相关的外部文档,它可以在少量甚至零信息的场景中生成更准确的答案。此外,该聊天机器人还能够通过在不改变LLM的情况下更新外部数据源来实现聊天机器人的动态更新[6]

4.3 LLM驱动的环境智能代理

由LLM驱动的智能代理领域正在迅速发展。具体来说,代理是由LLM创建的,能够根据LLM的知识自主做出决策,并自主行动(例如,编写代码通过API调用其他应用程序)。LLM可以处理多模态数据(例如文本、声音和图像),允许代理感知外部环境或人类指令。在处理信息、做出决策、推理和计划之后,代理可以文本形式提供结果和反馈,或者直接调用嵌入式工具。这和聊天机器人之间的关键区别在于,给定一个任务或环境刺激,代理可以自主地计划和执行任务。除了自主地完成单个任务之外,一个由LLM驱动的代理还可与其他代理进行交互,从而展示出一定程度的社交能力。在此基础上,还可使用多代理技术模拟多代理之间的交互,能够促进知识的创建和发现,如软件开发、科学发现和政策制定[42]

5 结论

作为一项新兴技术,人工智能技术,尤其是机器学习、深度学习和神经网络模型,因强大的数据分析、预测和模拟能力而尤其适配环境领域的复杂数据。目前,人工智能技术在环境监测、天气和自然灾害预测、公共卫生安全管理以及临床医疗等方面都有着广泛的应用,更多先进且精确的人工智能方法被开发出来以更好地解决环境问题。在气候变化背景下,环境本身也在快速变化,展望未来,人工智能技术在环境领域有着巨大的发展潜力,特别是生成式人工智能,不仅能够模拟和预测环境变化,还能够创造新的数据和解决方案,为环境问题提供创新的解决思路。随着技术的不断进步,AI在环境领域的应用将继续扩大,为全球应对气候变化、改善环境做出重要贡献。
1
McCarthy J , Minsky M , Rochester N , et al. A proposal for the Dartmouth summer research project on artificial intelligence, August 31, 1955[J]. AI Magazine, 2006, 27 (4): 12- 14.

2
Haupt S E , Gagne D J , Hsieh W W , et al. The history and practice of AI in the environmental sciences[J]. Bulletin of the American Meteorological Society, 2022, 103 (5): E1351- E1370.

DOI

3
Konya A , Nematzadeh P . Recent applications of AI to environmental disciplines: A review[J]. Science of the Total Environment, 2024, 906: 167705.

DOI

4
Zhi W , Appling A P , Golden H E , et al. Deep learning for water quality[J]. Nature Water, 2024, 2: 228- 241.

DOI

5
Zhu J J , Jiang J Y , Yang M Q , et al. ChatGPT and environmental research[J]. Environmental Science & Technology, 2023, 57 (46): 17667- 17670.

6
Wu Y P , Xu M , Liu S M . Generative artificial intelligence: A new engine for advancing environmental science and engineering[J]. Environmental Science & Technology, 2024, 58 (40): 17524- 17528.

7
Subramaniam S , Raju N , Ganesan A , et al. Artificial intelligence technologies for forecasting air pollution and human health: A narrative review[J]. Sustainability, 2022, 14 (16): 9951.

DOI

8
Jiang J Q , Xiang X , Zhou Q H , et al. Optimization of a novel engineered ecosystem integrating carbon, nitrogen, phosphorus, and sulfur biotransformation for saline wastewater treatment using an interpretable machine learning approach[J]. Environmental Science & Technology, 2024, 58 (29): 12989- 12999.

9
Chen S Y , Huang J L , Wang P , et al. Acoupled model to improve river water quality prediction towards addressing non-stationarity and data limitation[J]. Water Research, 2024, 248: 120895.

10
Huang S , Xia J , Wang Y L , et al. Pollution loads in the middle-lower Yangtze River by coupling water quality models with machine learning[J]. Water Research, 2024, 263: 122191.

11
Lombard M A , Brown E E , Saftner D M , et al. Estimating lithium concentrations in groundwater used as drinking water for the conterminous United States[J]. Environmental Science & Technology, 2024, 58 (2): 1255- 1264.

12
Manisalidis I , Stavropoulou E , Stavropoulos A , et al. Environmental and health impacts of air pollution: Areview[J]. Frontiers in Public Health, 2020, 8: 14.

13
Mai Z L , Shen H Z , Zhang A X , et al. Convolutional neural networks facilitate process understanding of megacity ozone temporal variability[J]. Environmental Science & Technology, 2024, 58 (35): 15691- 15701.

14
Zhang S B , Wang S S , Zhu J , et al. Stacking machine learning models empowered high time-height-resolved ozone profiling from the ground to the stratopause based on MAX-DOAS observation[J]. Environmental Science & Technology, 2024, 58 (17): 7433- 7444.

15
Zhang H Z , Ren R , Gao X , et al. Synchronous monitoring agricultural water qualities and greenhouse gas emissions based on low-cost internet of things and intelligent algorithms[J]. Water Research, 2025, 268: 122663.

DOI

16
Abdulraheem M I , Zhang W , Li S X , et al. Advancement of remote sensing for soil measurements and applications: A comprehensive review[J]. Sustainability, 2023, 15 (21): 15444.

DOI

17
Tan T H , Genova G , Heuvelink G B M , et al. Importance of terrain and climate for predicting soil organic carbon is highly variable across local to continental scales[J]. Environmental Science & Technology, 2024, 58 (26): 11492- 11503.

18
Ali T , Rehman S U , Ali S , et al. Smart agriculture: Utilizing machine learning and deep learning for drought stress identification in crops[J]. Scientific Reports, 2024, 14: 30062.

DOI

19
Eyring V , Bony S , Meehl G A , et al. Overview of the Coupled Model Intercomparison Project Phase 6(CMIP6) experimental design and organization[J]. Geoscientific Model Development, 2016, 9 (5): 1937- 1958.

DOI

20
Eyring V , Collins W D , Gentine P , et al. Pushing the frontiers in climate modelling and analysis with machine learning[J]. Nature Climate Change, 2024, 14: 916- 928.

DOI

21
Lorenzelli F . The essence of chaos[M]. London: CRC Press, 1993.

22
Chen L , Zhong X H , Zhang F , et al. FuXi: A cascade machine learning forecasting system for 15-day global weather forecast[J]. NPJ Climate and Atmospheric Science, 2023, 6: 190.

DOI

23
Price I , Sanchez-Gonzalez A , Alet F , et al. Probabilistic weather forecasting with machine learning[J]. Nature, 2025, 637: 84- 90.

DOI

24
Chen L , Zhong X H , Li H , et al. A machine learning model that outperforms conventional global subseasonal forecast models[J]. Nature Communications, 2024, 15: 6425.

DOI

25
Cavaiola M , Cassola F , Sacchetti D , et al. Hybrid AI-enhanced lightning flash prediction in the medium-range forecast horizon[J]. Nature Communications, 2024, 15: 1188.

DOI

26
Zhao S , Jin F F , Stuecker M F , et al. Explainable El Niño predictability from climate mode interactions[J]. Nature, 2024, 630: 891- 898.

DOI

27
Cheong T S , Kim S , Koo K M . Development of measured hydrodynamic information-based flood early warning system for small streams[J]. Water Research, 2024, 263: 122159.

DOI

28
Das P , Posch A , Barber N , et al. Hybrid physics-AI outperforms numerical weather prediction for extreme precipitation nowcasting[J]. NPJ Climate and Atmospheric Science, 2024, 7: 282.

DOI

29
Ravuri S , Lenc K , Willson M , et al. Skilful precipitation nowcasting using deep generative models of radar[J]. Nature, 2021, 597 (7878): 672- 677.

DOI

30
Yavas C E , Chen L , Kadlec C , et al. Improving earthquake prediction accuracy in Los Angeles with machine learning[J]. Scientific Reports, 2024, 14: 24440.

DOI

31
Pruthi D , Zhu Q Y , Wang W H , et al. Multiresolution analysis of HRRR meteorological parameters and GOES-R AOD for hourly PM2.5 prediction[J]. Environmental Science & Technology, 2024, 58 (45): 20040- 20048.

32
Oyounalsoud M S , Yilmaz A G , Abdallah M , et al. Drought prediction using artificial intelligence models based on climate data and soil moisture[J]. Scientific Reports, 2024, 14: 19700.

DOI

33
Xu J , Li X , Xi C W , et al. Development of a machine learning model to support low cost real-time Legionella monitoring in premise plumbing systems[J]. Water Research, 2024, 267: 122510.

DOI

34
Oh S , Byeon H , Wijaya J . Machine learning surveillance of foodborne infectious diseases using wastewater microbiome, crowdsourced, and environmental data[J]. Water Research, 2024, 265: 122282.

DOI

35
Clarke R , Bharucha T , Arman B Y , et al. Using matrix assisted laser desorption ionisation mass spectrometry combined with machine learning for vaccine authenticity screening[J]. NPJ Vaccines, 2024, 9: 155.

DOI

36
Liu H B , Su Y , Peng M , et al. Prediction of prognosis in patients with cerebral contusions based on machine learning[J]. Scientific Reports, 2024, 14: 31993.

DOI

37
Wendland P , Schenkel-Häger C , Wenningmann I , et al. An optimal antibiotic selection framework for Sepsis patients using Artificial Intelligence[J]. NPJ Digital Medicine, 2024, 7: 343.

DOI

38
Hamedi S Z , Emami H , Khayamzadeh M , et al. Application of machine learning in breast cancer survival prediction using a multimethod approach[J]. Scientific Reports, 2024, 14: 30147.

DOI

39
Liu R S , Zayed T , Xiao R . Advanced acoustic leak detection in water distribution networks using integrated generative model[J]. Water Research, 2024, 254: 121434.

DOI

40
Majumder S , Dong L , Doudi F , et al. Exploring the capabilities and limitations of large language models in the electric energy sector[J]. Joule, 2024, 8 (6): 1544- 1549.

DOI

41
TainGong. AI for sustainability[EB/OL]. [2025-01-02]. https://www.tiangong.earth/ai .

42
Guo T C, Chen X Y, Wang Y Q, et al. Large language model based multi-agents: A survey of progress and challenges[C]//Proceedings of the Thirty-Third International Joint Conference on Artificial Intelligence. International Joint Conferences on Artificial Intelligence Organization, 2024.

文章导航

/