Próxima Geração de Aceleradores de IA: Nvidia B200 e Google Trillium

Próxima Geração de Aceleradores de IA: Nvidia B200 e Google Trillium

A indústria de tecnologia está em constante evolução, e a área da inteligência artificial (IA) não é exceção. Recentemente, algumas das principais empresas do setor, como Nvidia, Google, Dell e outras, divulgaram os resultados de seus testes de benchmark para as próximas gerações de aceleradores de IA. Esses resultados fornecem um vislumbre emocionante do que está por vir no campo da computação de alto desempenho.

Nvidia B200: A Próxima Geração de GPUs

A Nvidia, líder no mercado de GPUs, revelou os primeiros resultados de testes para sua próxima arquitetura de GPU, chamada Blackwell, incorporada na GPU Nvidia B200. Os resultados são impressionantes, mostrando um aumento significativo no desempenho em comparação com a atual geração de chips da Nvidia, o H100.

No treinamento do GPT-3 e no ajuste fino de modelos de linguagem natural (LLM), o B200 praticamente dobrou o desempenho do H100 em uma base por GPU. Os ganhos foram um pouco menos robustos, mas ainda substanciais, para sistemas de recomendação e geração de imagens, com aumentos de 64% e 62%, respectivamente.

Essa melhoria de desempenho é atribuída, em parte, à continuação da tendência da Nvidia de usar números cada vez menos precisos para acelerar a IA. Enquanto o H100 e o H200 usam números de ponto flutuante de 8 bits para certas partes de redes neurais transformadoras, como ChatGPT, Llama2 e Stable Diffusion, a B200 reduz isso para apenas 4 bits.

Google Trillium: A 6ª Geração de TPUs

O Google também apresentou os primeiros resultados para sua 6ª geração de TPU, chamada Trillium, que foi revelada apenas no mês passado. Em comparação com a última geração de TPU do Google, a v5p, a Trillium oferece um aumento de desempenho de até 3,8 vezes na tarefa de treinamento do GPT-3.

No entanto, em comparação com a Nvidia, os resultados do Google não foram tão impressionantes. Um sistema composto por 6.144 TPU v5ps atingiu o ponto de verificação de treinamento do GPT-3 em 11,77 minutos, ficando em um distante segundo lugar para um sistema Nvidia H100 de 11.616, que concluiu a tarefa em cerca de 3,44 minutos. Esse sistema TPU de ponta foi apenas cerca de 25 segundos mais rápido do que um computador H100 com metade do seu tamanho.

Quando comparado diretamente, o próximo Trillium cortou sólidos 2 minutos do tempo de treinamento do GPT-3, quase uma melhoria de 8% nos 29,6 minutos do v5p. Outra diferença entre as entradas Trillium e v5p é que o Trillium é pareado com CPUs AMD Epyc em vez dos Intel Xeons do v5p.

Outros Participantes e Resultados

Além da Nvidia e do Google, outras empresas como a Dell Technologies também participaram dos testes de benchmark MLPerf v4.1. A Dell relatou que um sistema de oito servidores contendo 64 GPUs Nvidia H100 e 16 CPUs Intel Xeon Platinum consumiu apenas 16,4 megajoules durante a execução de 5 minutos da tarefa de ajuste fino do LLM (Llama2 70B), o que equivale a cerca de 75 centavos de eletricidade ao custo médio nos Estados Unidos.

A Oracle também relatou um resultado de desempenho próximo ao da Dell, com 4 minutos e 45 segundos na mesma tarefa, usando o mesmo número e tipos de CPUs e GPUs.

Conclusão

Os resultados divulgados pelas principais empresas de tecnologia fornecem um vislumbre emocionante do que está por vir no campo da computação de alto desempenho e da inteligência artificial. A Nvidia B200 e o Google Trillium prometem levar a computação de IA a novos patamares, com aumentos significativos de desempenho em relação às gerações anteriores.

À medida que a indústria continua a evoluir, é emocionante acompanhar o desenvolvimento dessas tecnologias e imaginar o impacto que elas terão em áreas como aprendizado de máquina, processamento de linguagem natural e geração de conteúdo. À medida que os custos de energia do treinamento de IA diminuem, é provável que vejamos uma aceleração ainda maior na adoção e no impacto da IA em nossa sociedade.

Conteúdo Relacionado

PHP 8.4.1: Atualização da API DOM
O PHP, uma das linguagens de programação mais populares...
TypeScript 5.7: Melhorias no Sistema de Tipos e Novos Recursos
O TypeScript 5.7, a última versão planejada da variante...
Sessões de Interpretador de Código Python e JavaScript no Azure Container Apps
A Microsoft anunciou recentemente a disponibilidade geral do interpretador...
Por que as Unidades de Nuvem não funcionam para a maioria das empresas
Se aprendemos alguma coisa com a evolução constante da...
Observabilidade como Pilar essencial para Ambientes de Nuvem Modernos
Em seu relatório de 2024, a Splunk divide as...
Estratégias comprovadas para manter sua Equipe Remota Produtiva e Focada
O trabalho remoto não é mais uma tendência —...
7 Métodos de Análise de Riscos para Garantir a Segurança de Pessoas, Ativos e Operações
Quando falamos de segurança, o gerenciamento de riscos é...
Assistente de Inteligência Artificial: Redução de Custos e Eficiência Empresarial
A evolução tecnológica tem impactado significativamente a forma como...
O GLOBO Inova com IA: Tradução Automática de Notícias para Inglês
O comprometimento com o avanço tecnológico e a expansão...
Apple e o ChatGPT: Estratégia de assinatura e impacto no mercado
A Apple, conhecida por sua tradição em desenvolver internamente...
Microsoft Windows Co-piloto: APIs de IA Generativa chegam ao Windows
A Microsoft anunciou uma série de atualizações empolgantes para...
Futuro da Computação em Nuvem: Agentes de IA e a Revolução da Orquestração
De acordo com um relatório recente do SNS Insider,...
Acelerando o Desenvolvimento de IA Generativa Empresarial com a Gencore AI
Embora a criação de um protótipo básico do ChatGPT...
IA está revolucionando os testes em DevOps
A Inteligência Artificial encontrou seu lugar no desenvolvimento de...
Inteligência Artificial que transforma a Justiça Brasileira
A tecnologia está cada vez mais presente em nosso...
Cachaça criada por Inteligência Artificial custa R$ 697
Nos últimos anos, a Inteligência Artificial (IA) vem revolucionando...
Como a Inteligência Artificial está Revolucionando a Pesquisa Empresarial
A inteligência artificial (IA) está revolucionando o campo da...
Ascensão da IA Acionável: Transformando Vendas e Operações
A IA está avançando muito. Não estamos mais apenas...
ブログに戻る

コメントを残す

コメントは公開前に承認される必要があることにご注意ください。