紫金山实验室:2025年智算网络技术与产业白皮书
紫金山实验室:2024年智算网络技术与产业白皮书
报告共计:85页
《智算网络技术与产业白皮书》由紫金山实验室等单位编写。当前,通用人工智能发展迅猛,智算网络作为其基础支撑,重要性日益凸显。在政策方面,我国通过加强政策引导、加快数字基础设施建设、强化规划管理和推动数字化产业升级等措施,大力支持智能计算领域发展。产业上,我国积极推进智算网络标准化,产业链涵盖上中下游,各地纷纷建设智算中心。技术层面,AI模型参数规模增大、序列变长,以太推动智算网络开放互联,融合成为技术演进主路径,新型大容量网络芯片不断发展。智算产业对网络的带宽、时延、抖动和丢包率都有着严格要求,需要网络具备高性能数据传输能力。为此,智算集群内发展了多种关键技术,如新型网络架构(包括Clos、Dragonfly等)提升组网性能,超宽可编程转发技术实现灵活定制转发,无损网络技术解决RDMA技术带来的拥塞问题,网络负载均衡技术应对复杂业务流量,端网协同的NetMind跨层通信架构提升系统整体性能。在智算集群间,光电融合组网与路由技术、广域拥塞控制技术、广域RDMA技术和新型低损光纤技术不断发展,以满足长距离、大容量数据传输需求。文中还列举了天翼云昇腾智算项目和紫金山新型无损数据中心项目两个典型案例,展示了智算网络技术的实际应用。最后,为推动智算网络技术与产业发展,建议深化硬件创新与技术优化、推进软件与算法的智能化集成应用、催化标准化与开放性的行业实践,并加大政府资金支持以促进产业生态合作 。