国家标准计划《全国一体化算力网 监测调度平台建设指南》由 TC609(全国数据标准化技术委员会)归口 ,主管部门为国家数据局。
主要起草单位 国家信息中心 、鹏城实验室 、中国科学院计算技术研究所 、中国移动通信集团有限公司 、天翼云科技有限公司 、中国联合网络通信集团有限公司 、中国信息通信研究院 、曙光信息产业股份有限公司 、华为技术有限公司 、中国电力工程顾问集团有限公司 、中国南方电网有限责任公司 、视联动力信息技术股份有限公司 、北京思特奇信息技术股份有限公司 、江苏未来网络集团有限公司 、太极计算机股份有限公司 、数据空间研究院 、深圳市数聚湾区大数据研究院 。
| 35 信息技术、办公机械 |
| 35.240 信息技术应用 |
近年来,算力作为数字经济时代的核心驱动力,大型算力中心已成为极具战略价值的新型基础设施,将加速推动智能技术与传统产业深度融合,打造具有竞争力的数字产业集群,对产业数字化、智能化转型意义重大。
随着业务扩展、业务系统规模越来越大,如何将广域分布的多样化异构算力中心联接成一体化、网络化、服务化的算力网络,构建全国一体化算力基础设施,通过多算力中心协同调度优化基础算力供给结构,扩展算力增长空间,是当前算力基础设施建设面临的新需求。
然而,算力网络的建设仍面临着一系列挑战: 1)由于资源差异和社会发展情况不同,国内各区域形成了具有本地特色的产业集群,各地自建的算力中心在算力、数据、网络资源上存在差异,且各算力中心在应用上也存在负载不均衡的现象,如何屏蔽各地算力中心的多层次异构性,提升整体算力调度水平成为亟待解决的技术和产业问题; 2)各地算力中心分布范围广,各算力中心之间组网面临管理分散性、连接异构性以及业务多样性等多方面挑战,如何实现统一、自治、灵活的算力中心网际管控,优化传输控制协议,算力网络内跨城际数据传输效率,是算力网络建设面临的关键问题; 3)算力网络内涵盖了人工智能算力中心、超算中心、商业云等多样化的算力资源以及各类数据资源,对上需要支撑处于不断演化中的各式各样的应用需求,尚缺乏统一标准和流通交易机制,数据访问安全和隐私存在顾虑。
因此,需构建标准化的算力和数据运营服务平台,以实现各类资源在大湾区内部的安全高效流通。
综上,随着全国一体化算力网络各国家枢纽节点、各地算力中心的筹备、建立和使用,建议加快推进《算力网一体化监测调度平台建设指南》标准的筹备及研制。
面向以上新趋势和需求,为全国一体化算力网络的开发、建设、测试提供规范化指引和依据。
(1)范围: 本标准为算力网一体化监测调度平台建设在参考架构、功能要求提出了参考性建议。 (2)主要技术内容: 算力网一体化监测调度平台是为解决算力东西部供需不均衡、体系架构研究不足、技术标准缺乏等问题规划的全国性的能力平台。平台以信息网络技术为载体,是促进全国范围内各类算力资源高比例、大规模一体化调度运营的数字基础设施,平台是一个层次化的全国一体化的算力调度平台体系,联通区域级、省级、市级算力资源和分布式的调度平台,促进算力资源跨地区、跨行业高效调度。同时,平台具有从算力资源到应用情况的全面的监测能力,监测采用统一的指标体系和采集方式,实现全平台多层次的可视化和分析能力。 算力网一体化监测调度平台以枢纽为核心的资源汇聚能力为依托,以分布式的调度系统为满足算力资源需求的核心能力,以全国统一的运营平台为核心服务支撑,通过门户作为服务层提供层次化的算力供给服务。即:算力网在资源层连接分散在各地的算力节点,汇聚和共享多类型的算力资源。算力中心通过加入算力网实现资源共享。算力网调度系统通过统一的分类接口对异构异属的算力资源进行统一的资源管理,并根据运营系统提供的需求对资源进行编排和调度,实现算力需求或任务的统一调度,实现网内算力的统一管理和调配,提高全网资源利用率,满足业务和应用的算力和网络需求。算力网运营系统以统一的门户服务所有的算力用户,提供统一是资源供给视图和需求的撮合服务,并协同调度系统完成订单的确认、结算以及其它用户服务。 同时,算力网一体化监测调度平台规划层次化的监测体系和指标体系。算力监测指标体系拟为算力网运行、运营、监管等提供核心数据参考及支撑辅助。通过算力监测相关数据信息的采集、汇总,支撑可视化监测管理能力的建立,形成直观的全国算力网监测评价能力,为定量和定性的分析和评估提供依据,实现各方面因素的综合考虑并进一步科学支撑在运营运行决策中实现对算力网络的全面监测和管理。