国家标准计划《智能计算 异构算力协同 第1部分:通用要求》由 SWG32(全国智能计算标准化工作组)归口 ,主管部门为国家标准委。
主要起草单位 之江实验室 、曙光信息产业股份有限公司 、中国信息通信研究院 、中国移动有限公司 、中国联通有限公司 、中国电信有限公司 、阿里云计算有限公司 。
35 信息技术、办公机械 |
35.020 信息技术(IT)综合 |
随着我国数字经济的快速发展,算力已成为一种新的生产力,是支撑我国数字化转型的重要底座。
目前,从算力需求方来看,人工智能、科学计算、大模型技术的发展对算力需求的爆发让我国算力产业进入新一轮的快速发展期,各领域算力需求呈指数型增长;从算力供给方来看,算力基础设施从同构向异构转变,异构的计算芯片、计算设备如CPU、GPU、FPGA、曙光X785-G30、浪潮NF5688M6等产品快速迭代,一体化数据中心、智算中心、超算中心的基础设施快速布局;然而从算力使用角度,我国算力资源利用率严重不均,西部地区不超过30%,而东部地区超60%,存在算力冗余与供给严重不足的相反使用情况。
在此背景下,算力服务产业以供给形态应运而生,连通跨域异构算力以协同计算支撑各行业领域的算力需求,为用户提供普惠、高效、弹性的一体化算力服务已成为发展新趋势。
我国接连发布的一系列政策均提出要实现算力的互联互通,提高算力资源综合利用率。
《“十四五”规划和2035年远景目标纲要》中明确提出要加快构建全国一体化大数据中心体系,强化算力统筹智能调度,建设若干国家枢纽节点和大数据中心集群。
《关于加快构建全国一体化大数据中心协同创新体系的指导意见》提出:“节点之间建立高速数据传输网络,支持开展全国性算力资源调度,形成全国算力枢纽体系”。
而异构算力协同正是:“一种将异构的计算资源进行整合、管理、供应与服务的智能计算模式”,实现跨域异构算力的互联互通,算力与任务的按需匹配,提高算力资源利用率,为用户提供一体化的算力服务。
目前,我国各地政府、算力提供方对异构算力协同计算均进行了一系列探索与实践,政府与产学研界对该发展方向已达成共识。
然而目前从顶层设计角度,仍未形成完整、统一的标准框架,缺乏产品服务组成架构、服务能力标准规范;从技术实现角度,缺乏标准化与体系化,导致跨域异构算力的统一接入纳管、互相兼容,协同计算存在困难。
为此我们认为需要研制智能计算异构算力协同的通用要求标准,从顶层设计与技术实现规范异构算力协同体系架构,以标准促进跨域异构算力的互联互通,引领算力一体化服务产业的发展。
定义异构算力协同内涵,提出异构算力协同系统架构,规范异构算力协同通用要求,适用于智能计算中异构算力协同平台与系统的设计、开发和使用。 主要章节包括: 1 范围 2 规范性引用文件 3 术语和定义 4 缩略语 5 异构算力协同总体架构 5.1 基础物理资源 5.2 异构算力协同平台 5.3 业务协同计算平台 6 异构算力协同平台通用要求 6.1 平台接口服务端 6.2 集群接口服务端 6.3 资源管理 6.4 调度管理 6.5 作业管理 6.6 运维监控