【ZiDongHua 之品牌自定位收录关键词:联想  人工智能   AI计算机  边缘计算  智能制造   】
  
  联想携异构智算共赴HPC China 2024盛宴|高度自动化地完成AI全流程开发  
  
  9月24日,以“华章廿载,新质未来”为主题的CCF全国高性能计算学术年会2024(CCF HPC China 2024)在武汉正式拉开帷幕。作为高性能计算领域全球最具影响力的三大盛会之一,本届CCF全国高性能计算学术年会,是深研人工智能与新质生产力以及算力产业间紧密关系的重要契机。本次大会首次设置了“算力基础设施展区”,聚焦人工智能产业技术的发展与动态进行全景呈现。
 
  
  CCF全国高性能计算学术年会2024
  
  面对人工智能的浪潮,作为全球领先的科学计算解决方案提供商,联想以“一横五纵”战略框架,构建布局完整、稳定高效的AI基础设施,为企业智能化转型打造坚实可靠的智算底座。本次大会上,联想以“异构智算 稳定高效”为主题,携“一横五纵”算力基础设施战略联想万全异构智算平台、联想AI解决方案、联想科学计算整体解决方案参展。
 
 
  
  联想展台
  
  在主题报告环节,联想中国基础设施业务群战略管理总监黄山以“筑基新质算力,纵横数字未来”为主题作分享,探讨新质算力建设的关键挑战,展示联想在新质算力建设中所做的万全准备。此外,联想万全异构智算平台荣膺“产品创新奖”。
 
  
  联想万全异构智算平台荣膺“产品创新奖”
  
  01
  
  新型算力建设趋向规模化和多元异构
  
  算力要从“可用”到“好用”
  
  随着“人工智能+”政策的全面推进,我国正迎来智能化高质量发展的崭新时代。中国对智算算力的持续投入成就了AI大模型和应用迅猛发展,多个大模型的综合能力已经进入到全球第一梯队。与此同时,各行各业正积极跟进大模型行业落地。在医疗、教育、科研、传媒、政务、交通、制造等多个行业,基于或结合大模型的新型AI应用实践已经趋向成熟,即将进入广泛应用阶段。
  
  智算算力是当前新质算力建设中的重点。如大模型算法与多类型算法结合,多元异构算力的灵活匹配。这些因AI发展产生的众多新态势,对算力的可用性和效率提出了全新的挑战。黄山认为,算力需要满足从“算力可用”到“算力好用”的转变。
  
  具体而言,算力好用需要解决几大挑战。
  
  01
  
  多元异构处理器以及服务器、存储、网络等基础设施的硬件兼容性、互操作性设计是一项复杂的大工程。
  
  02
  
  AI训练集群故障频发是常态。一个千卡集群一个月至少有15次因故障停训,故障诊断与恢复是AI训练算力达成SLA的关键难题。
  
  03
  
  可用算力的效率还不够高,算力的投入产出不足以持续支持算力经济长期健康发展。
  
  04
  
  由于技术限制难以突破的散热瓶颈。智算算力发展需要液冷技术与方案设计的持续升级。
  
  联想中国基础设施业务群战略管理总监黄山
  
  黄山表示,
  
  “
  
  今天在智算市场同时存在算力荒和算力过剩两种矛盾观点。这是因为很多算力没有经过足够的重构或调优,以至于不好用甚至不可用;算力荒则是新型算法和应用开发所需的高质量新型算力仍然短缺。因此,各行各业既需要强劲、可靠、高能效的算力底座,也需要集群管理软件作为来完成多元异构算力的池化、调度、管理、调优等工作,将算力真正发挥出来,实现从‘可用’到‘好用’的升级。
  
  ”
  
  02
  
  全面布局,倾力创新
  
  以异构智算助力科学计算应用发展腾飞
  
  如今科学计算领域正在用大模型的能力来重构升级数字应用。比如大量的科研、气象、能源等科学计算的应用,存在从原有的HPC计算到AI计算的切换和算力调度需求。异构智算平台可以很好地调度HPC&AI平台,它能够支撑算法融合,实现多元异构算力协同,从而均衡多样化AI应用场景,带来高性能、高可靠算力支撑。
  
  今年4月重磅发布的联想万全异构智算平台,它是联想“一横五纵”的重要组成部分,是实现“算力好用”的破局关键。联想万全异构智算平台集成了算力匹配魔方、GPU内核态虚拟化、联想集合通信算法库、AI高效断点续训技术、AI与HPC异构集群超级调度器五大创新技术,能高度自动化地完成AI全流程开发,提供高可用算力,并持续突破计算效率瓶颈。
  
  联想万全异构智算平台
  
  以“一横五纵”战略框架为方向指引,联想通过联想万全异构智算平台实现通用、科学、AI算力的融合管理,提供高效、稳定的基础设施生产力;同时全面升级服务器、存储、数据网络、软件及超融合、边缘计算的产品能力,构建万全生态,以期问鼎AI基础设施。
  
  01
  
  算力方面
  
  联想服务器的性能和稳定性一直保持着世界领先地位,联想AI服务器提供覆盖大模型训练、推理、训推一体、边缘推理的服务器产品组合;
  
  02
  
  AI存储方面
  
  联想正构造支持AI全场景高性能的存力,对从AI数据准备到训练到推理的全过程进行存力配套;
  
  03
  
  AI网络方面
  
  联想正在打造多架构、低延迟的运力,针对各类型计算场景设计出最优化的网络架构。
  
  在升级硬件系统的同时,联想也持续发展和引领液冷技术为算提高算力能效,同时突破算力瓶颈。联想在冷板式液冷和浸没式液冷两大技术均有布局,能够提供能效领先的风液混合、冷板式液冷,整机柜液冷,液冷微模块等技术和产品。联想全覆盖式冷板技术,实现了100%服务器部件用水冷却,热移除效率最高可达98%。同时联想也在不断实践浸没式、相变液冷等前瞻技术。
  
  成功实践
  
  在联想的助力下,某985高校利用智算,超算混合算力承担国家级生命科学研究项目,实现了算力资源产业落地。通过联想方案,该高校成功实现统一管理HPC,AI算力集群,能够根据任务自动匹配国际和国产算力,大幅简化了运维,实现多集群的任务协同和异地云边训推协同,GPU内核态虚拟化技术提升推理效率15%。
  
  坚持“一横五纵”战略框架,联想将与千行万业一起,携手布局,倾力创新,以新质算力筑基,引领科学计算应用与技术发展,实现算力价值的跃迁,共同见证算力经济的繁荣。