1200亿亿次每秒!阿里上线世界第一智算中心:1000卡并行

2022-10-20 12:40 来源:TechWeb   阅读量:7610   

日前,阿里云宣布正式推出全栈智能计算解决方案天妃智能计算平台同时推出两个超大规模智能计算中心,为科研,公共服务和企业提供强大的智能计算服务

天妃智能计算平台源于阿里巴巴内部实践,两个新的超大规模智能计算中心基于该平台,提供公有云和私有云两种模式。

其中,张北智能计算中心的AI计算能力规模为12EFLOPS,云端支持AI预训练大模型,AI地球,数字人等前沿AI应用,是全球最大的智能计算中心。

乌兰察布智能计算中心,计算能力3EFLOPS,位于东算西算内蒙古枢纽采用自然风冷,AI调温等绿色科技,实现绿色低碳

通过先进的技术架构,天妃智能计算平台将千卡并行计算的效率从传统的64%提升至90%,可将计算资源利用率提升3倍以上,AI训练效率提升11倍,推理效率提升6倍。

技术上采用高性能RDMA网络,端到端延迟至少2微秒。

在通信技术方面,自主研发的无阻塞通信技术在计算过程中提高了5倍以上的数据交换速度。

在存储技术方面,自主研发的IO加速器将数据访问性能提升高达10倍。

大数据AI开发层提供分布式训练框架,通过API自动组合优化分布式策略,训练效率提升11倍以上。

一站式AI计算开发服务,对算法模型进行量化,剪枝,细化,提炼,推理效率提升6倍以上。

同时,该平台可以运行在x86,GPU,ARM等多种芯片类型的服务器上,实现一云多核,支持多处理器混合部署和统一调度,优化应用,部分性能提升超过100%。

平台通过技术减排,能源结构优化,区域布局优化,供应链减碳,资源利用优化五个方面,降低单位计算能力的碳排放,并通过液冷,供电技术,智能运维等手段降低能耗PUE最低可达1.09

阿里云浸入式液体冷却集群

如今,天妃智能计算平台已在阿里广泛应用,支持达摩院前沿AI和电商智能技术开发,服务于Xpeng Motors,神石科技,SAIC,中国气象局,南方电网等机构和企业,以及支持自动驾驶,新药研发,天气预报,工业能源等行业,大幅提升AI训练效率。

Xpeng Motors:基于天妃智能计算,在乌兰察布建成智能计算中心,计算能力600PFLOPS它是中国最大的自动驾驶智能计算中心,将自动驾驶模型的训练速度提高了近170倍

毫米车:基于天妃智能计算,128卡并行效率超过96%,降低自动驾驶模型训练成本62%,提升训练速度110%,大幅缩短模型迭代周期。

深科技:使用天妃智能计算平台,集群性能优化提升100%以上,分子动力学模拟训练效率提升5倍以上。

智能汽车:采用高性能计算,工业仿真效率提升25%,智能驾驶培训效率提升70%。

山东德州电力:通过AI,准确率98%,耗时从一个小时缩短到几分钟。

四川成毅高速:通过数字结对,车路协同优化可降低60%的事故率。

重庆水务:通过遥感数据和模拟推演,水利调度预测准确率高达95%。

南方电网和中国气象局:利用智能提高天气预报的准确性和稳定性。

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。