采用国产自主品牌加速卡,可广泛应用于通用计算、新算法研究等场景,具备自研通用 GPGPU 架构和指令集,具有完全自主知识产权,架构提供强大的多精度混合算力提供 150P@FP16/BF16 半精度算力、集群规模不少于 440 张卡的人工智能算力集群,同步建设具有高带宽、低延迟的无损智算网络及具备纳管、调度算力、存储及通用算力的云管平台。
GPU 卡技术性能要求:加速卡采用通用 GPU 架构,7 纳米制程及 2.5D CoWoS 封装技术,容纳 240 亿晶体管,芯片支持 FP32、FP16、BF16、INT8、INT16、 INT32 等多精度类型,支持高速片间互联,可达到 175 TFLOPS@FP16 的超强算力,集成 32GB HBM2E 内存芯片与主机之间由高速的 PCle Gen4 x16lane 完成,每条 lane 可达到 32Gb/s 的速度,芯片与主机间可提供 64GB/s 的数据吞吐率。
适配主流 CPU 芯片/服务器厂商,能够支持国内外主流软硬件生态和各种深度学习框架、算法模型和加速库,通过标准化的软硬件生态接口为行业解决产品使用难、开发平台迁移成本大等痛点,应用迁移成本低、耗时短、无需重新开发,可大幅缩短适配验证周期,使客户业务系统几乎无感知地使用。