Traga desempenho acelerado para todas as cargas de trabalho corporativas com as GPUs NVIDIA A30 Tensor Core. Com a arquitetura NVIDIA Ampere Tensor Cores e a GPU Multi-Instância (MIG), ela oferece acelerações com segurança em diversas cargas de trabalho, incluindo inferência de AI em escala e aplicações de computação de alto desempenho (HPC).
INFERÊNCIA DE AI E COMPUTAÇÃO CONVENCIONAL PARA TODAS AS EMPRESAS Traga desempenho acelerado para todas as cargas de trabalho corporativas com as GPUs NVIDIA A30 Tensor Core. Com a arquitetura NVIDIA Ampere Tensor Cores e a GPU Multi-Instância (MIG), ela oferece acelerações com segurança em diversas cargas de trabalho, incluindo inferência de AI em escala e aplicações de computação de alto desempenho (HPC). Ao combinar largura de banda de memória rápida e baixo consumo de energia em um fator de forma PCIe - ideal para servidores convencionais - o A30 permite um data center elástico e oferece o máximo valor para as empresas. DEEP LEARNING O treino de modelos de AI para desafios de próximo nível, como AI de conversação, requer grande capacidade de computação e escalabilidade. Os núcleos Tensor NVIDIA A30 com Tensor Float (TF32) oferecem desempenho até 10 vezes maior em relação ao NVIDIA T4 com zero alterações de código e um aumento adicional de 2 vezes com precisão mista automática e FP16, proporcionando um aumento combinado de 20 vezes na taxa de transferência. Quando combinadas com NVIDIA® NVLink®, PCIe Gen4, rede NVIDIA e o SDK NVIDIA Magnum IO™, é possível escalar para milhares de GPUs. Os Tensor Cores e o MIG permitem que o A30 seja usado para cargas de trabalho dinamicamente ao longo do dia. Ele pode ser usado para inferência de produção no pico de demanda, e parte da GPU pode ser reaproveitada para treinar rapidamente esses mesmos modelos durante as horas de menor demanda. Especificações: Tipo de núcleo: Tensor Interface de host: PCI Express 4.0 x16 Arquitetura: Ampere Tamanho máximo da memória: 24 GB HBM2 Largura de banda máxima da memória: 933 GB/s Pico de FP64: 5.2 teraFLOPS Pico de FP64 Núcleo Tensor: 10.3 teraFLOPS Pico FP32: 10.3 teraFLOPS Pico do Núcleo Tensor TF32: 82 teraFLOPS | 165 teraFLOPS Pico do Núcleo Tensor BFLOAT16: 165 teraFLOPS | 330 teraFLOPS Pico do Núcleo Tensor FP16 165: teraFLOPS | 330 teraFLOPS Pico do Núcleo Tensor INT8: 330 TOPS | 661 TOPS Pico do núcleo do tensor INT4: 661 TOPS | 1321 TOPS Largura de banda da interconexão NVIDIA NVLink™: NVLINK de terceira geração: 200GB/s Potência máxima da placa gráfica: 165W