4月18日,第十届联想立异科技大会Tech World在上海举办。联想集团副总裁、我国基础设施事务群总经理陈振宽表明,联想依据最全面的AI基础设施产品组合以及最丰厚的AI职业处理计划,加快了全球客户的智能化转型,一起在这场非赢不可的竞赛和比赛中将竭尽所能,为客户供给纵横智能化年代的万全之策。
陈振宽称,联想是扎根于我国的高科技企业,引领了一个又一个的我国IT技能开展浪潮。
在通用核算范畴,联想的X86服务器可靠性接连9年榜首,完成463项功能国际记载;在科学核算范畴,联想接连9年完成我国HPC TOP 100 NO.1,助力我国在科学核算、仿真、气候等前沿范畴的立异打破;在人工智能1.0年代,联想依据我国特征需求规划了完好AI基础设施组合,并完成165个职业验证落地的AI计划。
现如今,大模型的AI 2.0年代现已迈着大步走来。跟着AI模型参数的指数级添加、迈入千亿、万亿级大关,大模型具有了超强的泛化、生成才能,促进人工智能进入更广的使用场景和更深的事务流程傍边,发挥更大的价值。
为处理用户面临的应战,联想AI基础设施聚集三大范畴。一是为用户匹配通过验证优化的最佳算力,二是赋能用户充沛的使用算力,进步核算功率。三是以先进的液冷技能协助用户节能增效且打破芯片散热的瓶颈。
一起,陈振宽总结了联想曩昔一年为AI使用大潮立异的五大技能,包含智能匹配AI算力的智算魔方,针对GPU,AI集群提效规划的先进算法,以及跨AI和HPC集群充沛同享算力的超级调度器。
算力匹配魔方:依据海量的硬件评测和AI算子算法集成作业, 联想构建了AI场景与算法与集群硬件三者匹配联系的算力魔方知识库。立体魔方中的数千个穿插点中的每一个,代表一种场景和与之最匹配的算法和集群装备。使用算力匹配魔方,用户都能够越过挑选验证数十种算法和近百种AI集群装备的杂乱进程,只需输入场景和数据,算力魔方即可主动加载最优算法和调度最佳集群装备。
发掘GPU潜力的GPU内核态虚拟化技能:在AI推理和中小练习中,AI子使命多以虚拟GPU承载,而在容器和调度层做GPU虚拟化和容器间数据阻隔是现在业界较遍及的做法,这使得虚拟化和资源阻隔的开支形成约20%的GPU算力损耗。联想研究院与高校研究机构多年协作开发在GPU驱动层进行虚拟化和资源办理,新的算法能够将虚拟化形成的GPU损耗降至5%,极致情况降至1%,大幅度的进步GPU使用率。
联想调集通讯库:联想在多年集群网络规划中堆集了丰厚的对大规划集群网络的拓扑优化手法,一起联想研究院与高校研究机构协作建立了依据深层数学原理的调集通讯优化算法。在千卡规划练习集群,选用集成了联想调集通讯库的联想异构智算渠道做办理调度,可进步网络通讯功率超越10%,集群规划越大,作用越明显。
高效AI断点续训技能:AI练习毛病频发是常态,因此有必要在练习前设置毛病检查点和备份,以备练习因毛病中止时能提取备份做到从断点续训。联想异构智算渠道在惯例以外,深化了对软、硬件的全面监控,优化了多级存储备份架构和战略,更以多年堆集的AI练习毛病猜测的AI模型来猜测断点和提早优化备份,由此能将断点续训恢复时间缩减到分钟级。
联想AI与HPC异构集群超级调度技能:HPC集群部分会用到GPU节点,AI集群绝大部分用GPU节点。 一起具有HPC集群和AI集群的用户期望在不同集群间依据使命优先级和资源情况同享名贵的GPU节点资源。联想异构智算渠道在AI和HPC调度之上架构了超级调度器,大局主动化办理不同类使命和调度异构资源,完成了资源动态同享。
以上这些便是联想在AI基础设施堆集的三大才能和抢先的五大技能立异,是联想整合全球和本地研制才智,悉心研究AI技能和使用开展的新趋势,并深耕本地客户特征需求的基础上打造的。
大会上,陈振宽正式对外发布了“联想万全异构智算渠道”,它调集了联想在AI 2.0年代的IT基础设施技能建议。AI技能正在快速地开展,联想万全异构智算渠道也将布局未来,将应战分钟内的断点续训,继续优化超大规划集群的通讯算法,深入研究相变式液冷技能,并布局模块化液冷数据中心。这些技能将为我国用户更好的供给愈加强壮、安稳、高效、绿色的智能算力。
下一篇:华贵人寿:智慧渠道云服务平台