国家标准计划《分布式计算 算力度量方法》由 TC28(全国信息技术标准化技术委员会)归口,TC28SC28(全国信息技术标准化技术委员会办公机器、外围设备和耗材分会)执行 ,主管部门为国家标准委。
主要起草单位 北京信息科技大学 、中国电子技术标准化研究院 、清华大学 、南京大学 、中南大学 、南京百敖软件有限公司 、新云网科技集团股份有限公司等 。
35 信息技术、办公机械 |
35.240 信息技术应用 |
目的: 随着人工智能技术的发展,各类计算密集型智能应用不断涌现;面向不同场景的应用需求,出现了以CPU为代表的通用算力设备、以GPU和AI芯片为代表的智能算力设备等。
为快速、高效调度由分布式设备组成的智能计算系统算力资源,以支撑不同应用服务质量要求,设计通用标准规范算力度量方法成为必需。
由于设备算力相关资源存在多个维度,且各类资源对算力的影响存在耦合性;加之不同设备面向不同类型计算任务进行的优化各异,因此,分布式设备算力的统一度量存在困难。
该标准通过刻画面向智能计算的分布式设备多维度资源模型、建立设备在不同类型典型智能应用下计算性能评价参数与度量方法,进而对设备算力进行统一综合评价,为其定量分析提供方法;从而支持分布式设备间算力资源的高效分配、调度与协同。
意义: 随着数字时代到来,算力作为核心资源的作用日益凸显,对推动科技进步、促进行业数字化转型和支撑经济社会发展具有重要作用。
“东数西算”等工程提出的构建新型算力网络,有效推动了新基建向纵深发展。
然而,作为一种全新的基础架构,“算力”作为基本度量单位,业界对其概念和度量方法尚未达成共识,造成算力资源的分配和调度、算力设备的管理等难以形成统一有效的方法。
因此,针对分布式智能计算设备构建统一算力度量体系和方法成为亟需。
该标准对分布式计算设备的算力度量提出了参数与方法,解决了目前算力分析中算力统一度量难的问题;此外,本文件通过指导和规范分布式设备智能计算算力度量,为提高我国智能计算设备设计水平和管理能力具有重大意义。
该标准规定了分布式计算的算力度量参数,描述了对应的度量方法。 该标准适用于指导分布式算力协同场景中的算力资源统一度量。