更新时间:2021-09-14 17:08:18
今天NVIDIA A100 PCIe GPU发布后,Gigabyte完成了G481-HA0/G292-Z40的兼容性验证,将NVIDIA A100加入到这两款服务器的支持列表中。剩下的G系列服务器会分成两波,以便快速完成兼容性测试。与此同时,Gigabyte还发布了基于AMD EPYC 7002处理器家族的全新G492系列服务器,可支持多达10个NVIDIA A100 PCIe GPU的PCIe Gen4。
Gigabyte推出了一款新的4U服务器,搭载英伟达A100安培GPU和第二代AMD EPYC CPU。
G492是目前市场上AI模型训练计算能力最高的服务器。千兆字节将为G492提供两个SKU。G492-Z50的价格将更加平易近人,而G492-Z51的目标是更高的性能。
G492是千兆字节中的第二代4U G系列服务器。基于第一代G481(英特尔架构)/G482(AMD架构)服务器,用户友好的设计和可扩展性得到了进一步优化。除了支持两个280瓦的第二代AMD EPYC 7002处理器之外,这32个DDR4内存插槽还支持高达8TB的内存,并将数据传输保持在3200兆赫兹。G492内置PCIe第四代交换机,可以提供更多的PCIe第四代通道。PCIe 4的输入输出性能是PCIe第四代的两倍。它可以充分启用NVIDIA A100 Tensor Core GPU的计算能力,也可以应用于pcie存储,帮助提供G492固有的存储升级路径。
随着NVIDIA GPU加速成为数据中心的主流技术,科学家、研究人员和工程师致力于使用GPU加速的HPC和AI来应对当今世界的重要挑战。根据NVIDIA的说法,A100 Tensor Core GPU与前几代相比实现了最高的性能飞跃。A100 PCIe GPU也保持了与上一代V100 GPU相同的250W TDP轮廓和机械设计,但HBM2的内存容量增加到了40GB。在不改变代码的情况下,用TensorFloat-32(TF32)训练AI模型的速度是V100的6倍。英伟达A100可以处理越来越成熟、尺寸和复杂性迅速增加的AI模型处理。
升级到PCIe第4代,支持新的A100图形处理器。
G492设计支持NVIDIA A100 PCIe GPU。考虑到A100 GPU的使用,Gigabyte在系统中构建了PCIe Gen4交换机,以提供高速PCIe网状网络,支持GPU和RDMA技术之间的GPUDirect点对点(P2P)通信,用于并行甚至更大的计算集群。利用GPUDirect P2P,每个GPU都可以通过PCIe总线直接访问其他GPU的内存,从而避免了数据传输到服务器的系统内存,减少了数据交换的延迟。以深度学习为例,著名的开源深度学习框架(如TensorFlow、MXNet)为GPUDirect P2P提供支持,NVIDIA Collective Communication Library(NCCL)也针对GPUDirect P2P进行了优化。
通过PCIe Gen4交换机对PCIe Gen4通道的扩展,也使得G492的可扩展性远高于之前的G481/G482服务器。除了机箱中的10个双插槽A100 GPU之外,机箱的正面和背面还预留了三个PCIe x16插槽和一个OCP 3.0插槽,为用户提供了四个额外的SAS卡或SAS卡升级选项。NVIDIA Mellanox InfiniBand卡。
低成本、高性价比和灵活性是G492的主要产品吸引力。G492系列服务器为用户提供了高度的灵活性,可以根据用户需求配置和扩展计算能力。Gigabyte即将推出支持NVIDIA A100 GPU的NGC Ready系统。NGC-Ready系统专为AI应用打造,深度学习和机器学习工作负载的功能和性能均采用NVIDIA NGC注册中心的GPU优化软件进行测试。NGC支持的系统使管理员能够放心地部署运行人工智能应用程序所需的基础架构。
在存储配置方面,G492可以配备十二个3.5英寸或2.5英寸硬盘。背板支持SATA/SAS/NVMe协议;因此,除了大型集群之外,G492还适用于必须保证数据安全的企业或研究实验室的基础设施。G492和NVIDIA A100 PCIe GPU可以为各种规模的AI使用提供革命性的计算能力,加速各种规模的工作负载,并帮助客户缩短其服务的上市时间。