Estratégia de IA da Nvidia: Blackwell Gains e Vera Rubin Horizon

6

A Nvidia está melhorando agressivamente seu atual hardware de IA, Blackwell, enquanto se prepara para a próxima geração, Vera Rubin. Embora a tão esperada GPU Rubin não chegue antes do final de 2026, os sistemas Blackwell existentes estão vendo aumentos significativos de desempenho agora por meio de otimizações de software. Esta estratégia permite que as empresas maximizem os seus investimentos na infra-estrutura actual enquanto se preparam para o futuro.

A rápida evolução da Blackwell

A Nvidia não está esperando que um novo hardware agregue valor. A arquitetura Blackwell, lançada em 2024, já está sendo aprimorada com otimizações para cargas de trabalho de inferência e treinamento. Em apenas três meses, a Nvidia aumentou o desempenho de inferência da Blackwell em até 2,8x sem exigir nenhuma atualização de hardware. Isto é conseguido através de inovações no mecanismo de inferência TensorRT-LLM, incluindo:

  • Programmatic Dependent Launch (PDL): Reduz as latências de inicialização do kernel para uma taxa de transferência mais rápida.
  • Comunicação tudo para todos: Simplifica a transferência de dados, eliminando buffers desnecessários.
  • Predição de vários tokens (MTP): Gera vários tokens por passagem direta, melhorando a eficiência.
  • Formato NVFP4: Um formato de ponto flutuante de 4 bits que reduz a largura de banda da memória sem sacrificar a precisão.

Essas otimizações se traduzem em custos mais baixos por milhão de tokens e maior rendimento para provedores e empresas de nuvem.

Ganhos de treinamento com Blackwell

As melhorias da Blackwell não se limitam à inferência. O desempenho do treinamento também teve um aumento de 1,4x em apenas cinco meses, graças às receitas de treinamento otimizadas que aproveitam a precisão do NVFP4. Isto demonstra o compromisso da Nvidia com a inovação contínua, além das implantações iniciais de hardware.

Vera Rubin: o próximo salto

Apesar dos ganhos da Blackwell, a Nvidia já está de olho no Vera Rubin, com lançamento previsto para o segundo semestre de 2026. De acordo com testes internos da Nvidia, Rubin promete melhorias transformacionais:

  • Treinamento de modelos grandes em um quarto do número de GPUs.
  • 10x maior rendimento por watt para inferência.
  • Inferência de um décimo do custo por token.

Estas métricas sugerem que Vera Rubin reduzirá drasticamente a economia das operações de IA em escala, permitindo modelos mais capazes e eficientes.

O que isso significa para as empresas

Para as organizações que implantam infraestrutura de IA hoje, a Blackwell continua sendo um investimento sólido. As implantações existentes podem se beneficiar imediatamente das otimizações de software mais recentes, proporcionando economia de custos sem despesas de capital. No entanto, as empresas que planeiam construções de infra-estruturas em grande escala devem incluir Vera Rubin nos seus roteiros.

A principal conclusão é que a Nvidia está oferecendo uma abordagem em fases: maximizar o valor das implantações atuais da Blackwell enquanto se prepara para a próxima geração. Esta não é uma decisão ou/ou, mas sim uma estratégia para permanecer competitivo no cenário de IA em rápida evolução.

O modelo de otimização contínua da Nvidia garante que as empresas possam extrair o máximo valor de seus investimentos atuais enquanto se posicionam para o futuro com a próxima arquitetura Vera Rubin.