A série de switches StrataXGS Tomahawk 5 da Broadcom fornece 51,2 Terabits/seg de capacidade de comutação Ethernet em um único dispositivo monolítico, o que é o dobro da largura de banda de outros silícios de switch disponíveis.
“Fornecer o primeiro switch de 51,2 Tbps do mundo, dois anos depois de lançarmos o Tomahawk 4, o primeiro switch de 25 Tbps do setor, é uma prova da excelente execução e inovação da equipe da Broadcom”, disse Ram Velaga, vice-presidente sênior e gerente geral do Core Switching Group. , Broadcom.
Embora os data centers continuem a experimentar um crescimento dramático nos requisitos de largura de banda de rede, também há uma forte motivação para unificar a infraestrutura de rede para computação e armazenamento de uso geral com a computação de IA/ML. Os clusters de treinamento de IA/ML estão impulsionando a necessidade de malhas com conectividade de alta largura de banda, alta base e menor tempo de conclusão de trabalho.
A Ethernet oferece a melhor solução para infraestrutura de rede unificada, fornecendo menor consumo de energia, maior largura de banda, maior base e velocidades SerDes mais rápidas, além de uma previsível duplicação da largura de banda a cada 18 a 24 meses. Esses benefícios, combinados com seu ecossistema grande e vibrante, a Ethernet fornece a interconexão de mais alto desempenho por Watt e por dólar para IA/ML e infraestrutura em escala de nuvem.
“Com a introdução hoje da família Tomahawk de quinta geração, temos orgulho de dizer que um único Tomahawk 5 substitui quarenta e oito switches Tomahawk 1 na rede, resultando em mais de 95% de redução nos requisitos de energia”, acrescentou Velaga. “Aplaudimos nossos clientes, parceiros e engenheiros por tornarem isso possível.”
Para permitir a próxima geração de redes unificadas, a Broadcom oferece agora a família Tomahawk 5. Fundamental para permitir o uso eficiente da infraestrutura amplamente compartilhada em grandes data centers, o Tomahawk 5 fornece virtualização de carga de trabalho de IA/ML com recursos como roteamento e ponte VxLAN de passagem única. Fundamental para minimizar o tempo de conclusão de trabalho (JCT) para cargas de trabalho de IA/ML, o Tomahawk 5 oferece recursos como Broadcom Cognitive Routing, buffer de pacotes compartilhados avançado, telemetria de banda programável e failover de link baseado em hardware.
O Roteamento Cognitivo do Tomahawk 5 melhora o uso do link da rede, selecionando automática e dinamicamente os links com menor carga no sistema para cada fluxo que atravessa o switch. Isso é importante para cargas de trabalho de IA/ML, que geralmente têm uma combinação de fluxos de mouse de curta duração e fluxos elefantes de longa duração e alta largura de banda com baixa entropia.
Além disso, o Tomahawk 5 inclui balanceamento de carga dinâmico em tempo real que rastreia o uso de todos os links, tanto no switch quanto no downstream da rede, para determinar o caminho ideal para cada fluxo. Ele também monitora a integridade dos links no hardware e desvia automaticamente o tráfego de links com falha. Esses recursos melhoram drasticamente a utilização da rede e reduzem o congestionamento, resultando em JCT mais curto.
Também importante para melhorar o JCT é minimizar o congestionamento da rede, controlando a taxa de tráfego injetado na rede por cada fonte. Como as operadoras de rede empregam uma variedade de diferentes algoritmos de controle de congestionamento em seus terminais (como NICs comerciais ou personalizadas), o Tomahawk 5 fornece extensa telemetria dentro da banda programável tanto no tráfego ao vivo quanto nas sondagens de rede.
Os metadados em tempo real podem ser inseridos no tráfego na taxa de linha à medida que ele atravessa a rede para coletar telemetria sobre tamanho da fila, latência de pacotes, utilização do switch e uma variedade de outras métricas selecionáveis pelo cliente. Esses metadados podem ser usados para controle preciso de congestionamento de rede de ponta a ponta.
Para permitir o menor consumo de energia e o menor custo para conectividade física, o Tomahawk 5 permite uma interface PAM4 100G direta para cobre de conexão direta (DAC), óptica conectável no painel frontal e óptica co-empacotada. O flexível e de longo alcance Tomahawk 5 SerDes fornece conectividade DAC para todos os dispositivos dentro de um rack, e até mesmo entre racks, sem a necessidade de retimers ou outros componentes ativos. Ele também pode interagir diretamente com um amplo ecossistema de módulos ópticos conectáveis padrão no painel frontal.
Ao aproveitar as tecnologias de fotônica e empacotamento de silício de ponta da Broadcom, o Tomahawk 5 será disponibilizado com óptica co-embalada usando a plataforma Silicon Photonics Chiplets in Package (SCIP) da Broadcom, proporcionando redução de mais de 50% na energia necessária para conectividade óptica. Como o mesmo switch de silício oferece todas essas opções, os clientes podem escolher a E/S ideal para cada parte de suas redes intra-cluster, inter-cluster e inter-DC sem necessidade de portabilidade de software.
Vantagens do StrataXGS Tomahawk 5:
- Permite a próxima geração de infraestrutura unificada de data center com 64 portas de comutação e roteamento de 800 GbE.
- Virtualização de cargas de trabalho gerais de computação e IA/ML com roteamento e ponte VxLAN de passagem única.
- Opções de E/S física incomparáveis usando 512 instâncias do SerDes 100G PAM4 de maior desempenho, mais flexível e de maior alcance do setor.
- Sincronização de tempo PTP e SyncE de alta precisão.
- Seis processadores ARM no chip para telemetria de streaming totalmente programável e de alta largura de banda e aplicativos integrados sofisticados, como resumo de estatísticas no chip.
- Eficiência energética incomparável, implementada como uma matriz monolítica de 5 nm.
“A latência final é a métrica crítica de desempenho da rede para treinamento distribuído de IA/ML”, disse Bob Wheeler, analista principal da Wheeler's Network. “A Broadcom reconheceu as limitações do balanceamento de carga tradicional baseado em hash para essas cargas de trabalho e adicionou o Roteamento Cognitivo com direcionamento de fluxo dinâmico ao Tomahawk 5. As operadoras de hiperescala agora podem unificar suas estruturas de rede, eliminando interconexões especializadas dedicadas apenas ao treinamento de clusters.”
Em comparação com a computação e o armazenamento gerais, os clusters de treinamento de IA/ML têm padrões de comunicação exclusivos. Para minimizar o tempo de conclusão do trabalho, o Tomahawk 5 adiciona recursos específicos para essas cargas de trabalho e topologias de rede.
Recursos do StrataXGS Tomahawk 5 para IA/ML:
- A maior base de portas 200GbE do mundo: 256 portas suportadas em um único chip, permitindo clusters de AI/ML simples e de baixa latência.
- A arquitetura de buffer compartilhado de 51,2 Tbps mais avançada do setor, proporcionando o mais alto desempenho e a menor latência final para RoCEv2 e outros novos protocolos RDMA.
- Roteamento Cognitivo Broadcom avançado, balanceamento de carga dinâmico e suporte para recursos de controle de congestionamento de ponta a ponta projetados especificamente para lidar com fluxos grandes e de baixa entropia típicos de cargas de trabalho de IA/ML.
- Suporte para topologias Clos e não Clos, como torus, Dragonfly, Dragonfly+ e Megafly.
- Failover de link baseado em hardware para melhorar a resiliência da rede e reduzir o JCT.
Juntamente com as famílias de switches Trident e Jericho, a série Tomahawk faz parte da estratégia tripla da Broadcom de fornecer arquiteturas de switches otimizadas para diferentes aplicações de rede. Todos esses dispositivos compartilham uma interface de programação comum, para que os clientes possam aproveitar facilmente seus esforços de desenvolvimento de software em diferentes plataformas.
Tendo um forte compromisso com redes abertas, a Broadcom forneceu interface de abstração de switch e APIs abertas Broadcom SDK para todas as cinco gerações da família Tomahawk. A Broadcom é uma das maiores contribuidoras do setor para o SAI e o sistema operacional de rede SONiC. Para acelerar o tempo de implantação, é fornecido suporte para SAI e Broadcom SDK no silício Tomahawk 5, bem como um conjunto abrangente de ferramentas de simulação de rede e dispositivos.