超高清视频是中国视听产业重要发展方向之一,国家相关部门也出台了一系列政策,鼓励和支持超高清视频产业的发展。超高清视频的采集、传输、制作、播出过程,尤其是融合了ChatGPT、Sora等先进人工智能内容生成技术后,呈现出典型的大带宽、高算力、低时延特征,令算力和网络基础设施面临严峻考验。基于超高清视频典型需求和计算、网络技术最新发展趋势,提出了面向超高清视频的算力网络架构,综合运用异构算力资源组网与安全传输技术、超高清视频业务需求建模与资源编排技术、“数算模”联合调度与路由规划技术、超高清视频高速传输技术等算力网络关键技术,实现全国范围内异构算力的汇聚、组网,满足超高清视频采、编、播等各环节业务处理对多样化算力和网络传输的需求。
广域长距离高性能传输技术在中国“东数西算”工程构建全国一体化算力网背景下具备重要的战略价值。3个趋势对广域分布式算力协同范式提出新需求:对算力资源要求极高的人工智能(AI)大模型智能应用的兴起;高端高性能图形处理单元(GPU)芯片被禁运限制单中心算力资源;中国各地建设的算力集群形成算力分散分布态势。广域长距离高性能传输技术是上述新范式的关键技术。从支撑广域分布式算力协同新范式、技术路线、承载网络、研究难点、成本5个方面进行讨论,结合深圳到宁夏中卫2100 km实网实验结果,将现有远程直接内存访问(remote direct memory access,RDMA)技术基于广域全光网进行长距离优化的方案是短期内可行性高、成本低且利于开展研究的最佳方案之一,通过优化基于融合以太网的远程直接内存访问(RDMA over Converged Ethernet,RoCE)可以在广域全光网上实现“广域光数直达”逼近物理层通信性能指标。
随着ChatGPT引领的大模型与AI产业的爆发式发展,大规模分布式计算成为大模型训练常用模式,对应智算算力需求激增。旨在形成智算中心高性能网络技术体系,推动智算中心高性能网络技术持续发展。针对智算中心高性能网络内关键技术进行技术研究,首先,针对大规模智算业务承载场景,分析了智算中心提供高性能网络在传输协议层面、组网层面、管控运维层面的核心需求。随后依据所述需求,详细研究了智算中心高性能网络不同网络层的演进需求及智算中心高性能网络组网、面向智算中心网络的新型负载均衡协议与拥塞控制协议、新型网络管控及运维等领域的关键技术,对不同场景需求提供技术指导。其次,从网络协议发展与全光网络2个层面展开,分析了智算中心网络的未来导向与发展趋势。若要建立完善智算中心高性能网络技术体系,智算网络自身需提供足够的网络性能,如提供近似无丢包的网络环境、足够的互联能力并解决分布式存储场景下的存储性能瓶颈等;同时智算中心高性能网络的发展需要规范组网方案、高性能的新型负载均衡与拥塞控制协议、新型智慧化管控运维技术等方面关键技术的融合协同,提高运营效率;智算中心高性能网络需提供全局范围内设备与资源感知、分配、调度、运维的网络,并提供高性能无损传输能力。
算力路由在传统IP网络的基础上协同感知算力信息,提供高效灵活的网络能力,使能算力和网络的高效协同,随着技术的发展逐步走向行业实践。阐述并分析了算力路由的技术研究进展及关键使能技术,如独立语义算力服务标识、层次化算力路由,并依此提出了算力路由的技术拓展方向,如算网混合式业务功能链,以及部署算力路由的业务应用优势,建议借助标准化工作成果来推动算力路由技术在产品和业务应用上的进一步落地。
作为算网融合体系内的安全防护机制,算网安全的本质是一种新技术和新工程。算网安全涉及零信任、安全访问服务边缘、算网区块链等多种技术实现方式,能够以安全体系的方式为算网融合提供了设施、平台、应用、数据等多维一体的安全保障。梳理了算网安全的总体发展态势:基础设施面临严峻挑战,算网安全成为国家竞争新主题;ICT积极响应发展机遇,算网安全打造创新发展新蓝海;数字化因素推动算网安全演进发展。重点提炼了算网安全的技术参考架构,具体涵盖设施安全、平台安全、应用安全和数据安全4个方面。总结了算力网络安全、云网络安全、行业融合安全3种典型应用实践。结合当前算网安全领域面临的严峻挑战提出持续推进标准体系建设、加快应用实践规划落地、协同构建产业生态闭环等发展建议。