中国最大的AI芯片发布,顺便获得了国内第一名的拥有Benchmark的四个量子比特
在上一本书中,他说:“这是邀请函对中国芯片的新猜测。”。
于是,我来到上海寻找,以验证这个猜测是否正确。
直接发表答案:猜对了!
中国最大的AI芯片“奥思2.0”正式发布。
中国首款支持单精度张量TF32数据精度的人工智能芯片。单精度FP32/张量TF32峰值计算力均为国内第一。中国首款支持世界最先进存储HBM2E和单片机64GB内存的产品。加上其他产品的升级,成为国内首个发布第二代AI培训的复合产品。嗯,看着好像有什么。
中国最大的AI芯片问世首先,让我们来谈谈最核心的这个芯片。
IELTS2.0是针对AI云的培训,基于第一代升级,但一个重点是流程没有变化。
也就是说,该芯片仍然由格芯的12nm FinFET工艺制成。
尺寸为57.5mm×57.5mm,达到芯片采用的日月光2.5D封装的极限。
据了解,单精度FP32的运算力为40TFLOPS单精度张量TF32的运算力为160TFLOPS整数精度INT8的运算力为320TOPS堆栈存储,搭载的是HBM2E,这是目前业界领先的存储方案。
具有大规模存储容量和接入带宽,最大可达64GB和1.8TB/s,可应对目前即将爆发的大规模型号培训。
在计算力扩展方面,远程2.0可以非常灵活,因为它具有300GB/s的独立片间互连通道。
一方面升级一个远程2.0、三个产品,另一方面随着远程2.0的到来,燧原科技其他产品也相应升级。
首先是云燧T20训练加速卡。
面向数据中心的第二代AI训练加速卡,官方介绍如下。
那么,性能能被夺走到什么程度呢。
在现场,燧原科技直接点灯的Benchmark!
图像识别/分类、NLP、目标检测、图像分割、推荐任务与友商相比明显提高。
(关于这个友商,你知道那个强大的家。)
你可能觉得数据还不够直观,直接给点效果啊。
下面是友商与云燧T20处理图像速度的比较:
多处理图像,速度更快,有没有!
此外,还有云燧T21训练OAM模块。
发现它是基于OCP(开放计算项目)OAM(开放加速器模块)标准设计的、符合OCP OAI标准(开放加速器结构)的AI培训加速器模块。
目标数据中心可用于互联网、金融、教育、医疗、工业和政务等场景。
云燧T21单精度FP32的计算力最高可达40TFLOPS,TF32的计算力最高为160TFLOPS。
友商的性能比较如下:
最后,燧原科技还升级了计算机TopsRider软件平台:
基于算子泛化技术及图优化策略,支持主流深度学习框架中的各种模型训练。结合Horovod分布式培训框架和GCU-LARE互连技术,为大型集群的高效运行提供解决方案。而且编程模型和可扩展运算符接口都是开放的。
原以为到此结束的“大集团”也成立了吗。
不,不。
燧原科技还创建了云智能计算集群(CloudBlazer Matrix2.0)这一“大组合”。
最高单精度计算力可达1.3E(13000T),是上代的46倍。
燧原科技COO张亚林
承诺了最后的承诺,还介绍了他们的下一个计划。
对于云培训计算产品,我们计划在2023年发布T30/T31。
与第二代产品相比,性能提高了14倍。
对于云推理计算产品,也将在2023年进行迭代,将性能提高16倍。
并给出了燧原产品定理:
到了2023年,让我们一起期待燧原科技是否能兑现承诺。