9月27日,我国算力产业领域的顶级盛会——中国算力大会在郑州召开,会上浪潮信息联合信通院发布了《人工智能算力高质量发展评估体系报告》(以下简称报告)。报告首次完整地构建了人工智能时代高质量算力的理论体系,并探索性提出业界首个 "五位一体"的高质量算力评估体系。

发布现场
发布现场

在当前由大模型和AIGC驱动的AI时代,算力需求暴增,同时还面临供给不足、供需匹配难、能耗激增等挑战,亟需算力产业由"量"向"质"加速高质量发展。为了推动算力基础设施高质量发展,去年10月工业和信息化部等六部门联合印发了《算力基础设施高质量发展行动计划》。报告的发布,为该政策的进一步落实提供实践路径,加速高质量算力从概念到落地。

"三高三可"促进算力"提质增效"

报告对人工智能时代的"高质量算力"予以明确定义:高质量算力是基于最新人工智能理论,采用先进人工智能的计算架构,与算法、数据深度结合的高水平计算能力。高质量算力具备高算效、高智效、高碳效、可持续、可获得、可评估"三高三可"六大特征。

高算效是指在提高算力理论算效的同时考虑更高的实测性能和资源利用率。理论算效主要体现的是部件和系统能力,2023年年底,全国在用算力中心平均理论算效为11.8GFLOPS/W,仅达到GB/T 43331-2023《互联网数据中心(IDC)技术和分级要求》中通用算力算效第三等级,表明算效水平仍有很大提升空间。实测性能体现的是应用场景下的实测性能,如单位时间内处理的Token数量、运行时延、模型训练时间、数据处理质量等指标。当前算力集群实测性能和理论性能差距过大问题明显,部分算力实际性能不足理论性能的10%。资源利用率则关注的是算力资源利用水平。据公开数据显示,传统模式下的智算中心GPU利用率平均数值低于30%。高算效就是要破解上述算效水平不高、算力资源利用率较低等问题。

高智效体现的是算力面向人工智能业务的高效处理能力。在以大模型为代表的人工智能技术上,更高的模算效率是体现高智效的主要指标。模算效率正比于模型精度与模型的计算效率。模型本身精度越高、在对应软件上对硬件性能利用率越高、推理及训练所需算力越小,模算效率越高,整体反映被测模型在人工智能业务应用中的综合处理效率。当前大模型发展百花齐放,大模型的智能涌现能力大幅提升,但是现有大模型模算效率普遍不高,在算力供需矛盾凸显的当下,提升模算效率,以更低算力实现更高智能是智效水平提升的核心目标。

高碳效指的是算力在最低碳排放前提下实现最大化算力输出。高碳效不仅关注算力单纯的能源消耗、算力输出水平,更要注重算力的全生命周期碳足迹管理,通过绿色采购、绿色设计、清洁生产、绿色包装、回收处理等环节降低算力系统的碳排放。算力中心是公认的高耗能基础设施,据中国信通院数据显示,截至2023年我国算力中心耗电量,达到1500亿千瓦时,预计到2030年将超过4000亿千瓦时,二氧化碳排放或将超2亿吨。面对人工智能对算力的旺盛需求,算力产业在高速发展的同时亟需提高碳效,实现"双碳目标"。

此外,高质量算力还具备可持续、可获得和可评估三大特征。可获得是指算力普适普惠,能够适用各种应用场景,同时算力使用成本较低。可持续是指算力具备技术兼容、供应链完备、生态开放的特性,能够保证算力持续供给和升级迭代。可评估是指可通过完整、有效的评估体系反映算力系统实际应用情况。

聚焦高质量算力"三高三可"特征,报告提出了以系统设计提升算效、协同驱动提升智效、全生命周期管理提升碳效、基建先行推动算力普适普惠、繁荣生态推动算力可持续发展、多元评估加速算力规范化发展的高质量算力发展路径,有效推动算力发展"提质增效",让高质量算力助力经济社会实现数智化转型和高质量发展。

"五位一体"评估体系引导算力高质量发展

只有通过精准的性能评估与测试,发现算力系统的瓶颈,才能促进算力技术创新和改善产品设计,不断提升算力质量发展水平。然而,现有算力评估体系评估场景简单,无法全面、深入地反映算力应用的实际效果,如何准确评估算力的质量是当前算力建设者和使用者共同面临的问题。为此,报告结合人工智能时代算力发展面临的机遇与挑战,推出面向人工智能时代的"五位一体"高质量算力评估体系。

"五位一体"高质量算力评估体系遵循系统性、全面性等原则,针对算力系统从算效水平、智效水平、碳效水平、可获得水平、可持续水平5个维度搭建高质量算力评估体系,指标涉及理论算效、实测性能、模算效率等12个指标,进行多维、多元评估。

这套"五位一体"的高质量算力评估体系涵盖了算效、智效、碳效、可获得、可持续等算力系统建设运营关键因素,能够多维度客观评估我国算力质量情况,弥补了现有算力评估体系评估场景简单、评估维度单一、无法全面反映算力应用的实际效能与发展潜力等不足。

作为业界推出的首个高质量算力评估体系,对促进我国算力产业规范化、高质量发展具有重要意义,不但可以帮助企业用户识别和优化资源配置,提高算力资源使用效率,并激励企业进行技术研发和创新,进而推动整个行业的技术进步,而且能够在算力项目的规划期、建设期、运营期等不同阶段,引导算力实现全生命周期可持续发展。