Recomendado por Jensen Huang Para levar inteligência artificial a todos os data centers, a The nvidia O co-fundador e CEO disse hoje durante a Computex em Taipei. Durante o primeiro discurso público de Huang em quase quatro anos, ele fez vários anúncios, incluindo datas de lançamento de chips, seu supercomputador DGX GH200 e parcerias com grandes empresas. Aqui estão todas as notícias da palestra de duas horas.
1. A GPU GForce RTX 4080 Ti da Nvidia para gamers está agora em plena produção e “produzida em massa” com parceiros em Taiwan.
2. Huang anunciou o Nvidia Avatar Cloud Engine (ACE) para jogos, um serviço AI Model Foundry personalizável com modelos pré-treinados para desenvolvedores de jogos. Isso dará aos NPCs um caráter extra por meio de interações de linguagem baseadas em IA.
3. O modelo de computação Nvidia Kuta agora atende a quatro milhões de desenvolvedores e mais de 3.000 aplicativos. Cuda teve mais de 40 milhões de downloads, incluindo 25 milhões de downloads apenas no ano passado.
4. A produção em grande escala do servidor GPU HGX H100 começou e “está sendo fabricado por empresas em todo Taiwan”, disse Huang. Ele também afirmou que foi o primeiro computador do mundo com um motor transformador.
5. Huang chamou a aquisição da fabricante de chips de supercomputadores Mellanox pela Nvidia em 2019 por US$ 6,9 bilhões como “uma das maiores decisões estratégicas”.
6. A produção da próxima geração de GPUs Hopper começará em agosto de 2024, exatamente dois anos após o início da produção da primeira geração.
7. O GH200 Grace Hopper da Nvidia está agora em plena produção. O SuperChip 4 PetaFIOPS TE utiliza 72 CPUs ARM, 96 GB HBM3 e 576 GPU de memória conectados via conectividade chip-to-chip. Huang o descreveu como o primeiro processador de computador acelerado do mundo, que também possui uma memória gigante: “É um computador, não um chip.” Ele é projetado para aplicações de centro de dados de alta resistência.
8. Se a memória de Grace Hopper não for suficiente, a Nvidia tem uma solução – o DGX GH200. Ele foi criado conectando primeiro oito Grays Hoppers a três switches NVLINK e, em seguida, conectando os pods em 900 GB. Finalmente, 32 são conectados junto com outra camada de interruptores para conectar um total de 256 chips cinzas. O ExaFLOPS Transformer Engine resultante atua como uma GPU gigante com 144 TB de memória GPU. O Grace Hopper é tão rápido que pode executar a camada 5G no software, disse Huang. Google Cloud, Meta e Microsoft serão as primeiras empresas a obter acesso ao DGX GH200 e explorar seus recursos.
9. A Nvidia e a SoftBank firmaram uma parceria para introduzir o Grace Hopper Superchip nos novos data centers distribuídos da SoftBank no Japão. Hospede aplicativos generativos de IA e sem fio em uma plataforma de servidor comum para vários locatários, reduzindo custos e energia.
10. A parceria SoftBank-Nvidia é baseada na arquitetura de referência Nvidia MGX, que está sendo usada atualmente por empresas em Taiwan. Ele fornece uma estrutura de referência modular que permite aos fabricantes de computadores criar mais de 100 variantes de servidor para IA, computação acelerada e aplicativos omniversos. Joint ventures incluem ASRock Rack, Asus, Gigabyte, Pegatron, QCT e Supermicro.
11. Huang anunciou a plataforma de rede acelerada Spectrum-X para acelerar nuvens baseadas em Ethernet. Ele tem um switch Spectrum 4 com 128 portas a 400 GB/s e 51,2 T/s. O switch foi projetado para executar um novo tipo de Ethernet e é projetado de ponta a ponta para roteamento adaptável, isolamento de desempenho e computação em malha, disse Huang. Ele tem um nick inteligente BlueField 3 que se conecta a um switch Spectrum 4 para controlar o congestionamento.
12. A WPP, a maior agência de publicidade do mundo, fez parceria com a Nvidia para construir um mecanismo de conteúdo baseado no Nvidia Omniverse. Ele será capaz de criar fotos e conteúdo de vídeo para serem usados em publicidade.
13. A plataforma de robôs Nvidia Isaac ARM está agora disponível para qualquer um que queira construir robôs e tem uma pilha completa de chips a sensores. Isaac ARM começa em um chip chamado Nova Orin e é a primeira pilha de referência completa de robótica, disse Huang.
Graças à sua proeminência na computação de IA, as ações da Nvidia dispararam no ano passado e atualmente têm uma avaliação de mercado de cerca de US$ 960 bilhões, tornando-a uma das empresas mais valiosas do mundo (apenas Apple, Microsoft, Saudi Aramco, Alphabet e a classificação da Amazon é mais alta).
Negócios chineses estão parados
Não há dúvida de que as empresas de IA da China estão de olho no silício de ponta que a Nvidia traz para a mesa. Enquanto isso, eles temem outra rodada de proibições de chips nos EUA que ameaçam minar seu progresso na IA generativa, que exigirá significativamente mais poder de computação e dados do que as gerações anteriores de IA.
No ano passado, o governo dos EUA proibiu a Nvidia de vender suas unidades de processamento gráfico A100 e H100 para a China. Ambos os chips são usados para treinar grandes modelos de linguagem, como o GPT-4 da OpenAI. O H100, seu chip de última geração baseado na arquitetura de computação Hopper GPU da Nvidia com seu mecanismo Transformer integrado, está tendo uma demanda particularmente forte. Em comparação com o A100O H100 pode fornecer treinamento de IA 9x mais rápido e inferência de IA 30x mais rápida em LLMs.
A China é obviamente um grande mercado que não pode ser desperdiçado. A proibição de exportação de chips custou à Nvidia US$ 400 milhões em vendas potenciais apenas no terceiro trimestre do ano passado. Isso deixou a Nvidia tentando vender um chip mais lento para a China que atendesse às regras de controle de exportação dos EUA. Mas, a longo prazo, a China procurará alternativas ainda mais fortes, e a proibição serve como um forte lembrete para que a China se torne autossuficiente em setores-chave de tecnologia.
Como Huang disse recentemente Entrevista Com o Financial Times: “Se [China] Não posso comprar dos EUA, eles mesmos fazem. Portanto, a América deve ter cuidado. A China é um mercado muito importante para o setor de tecnologia.
“Especialista em comida hardcore. Guru da web sutilmente encantador. Jogador. Pioneiro típico da cerveja. Viciado em álcool. Amante de café. Fã de viagens irritantemente humilde.”
More Stories
Os benefícios de custo desconhecidos de possuir um carregador de carro elétrico
Alfonso Cuaron trata sua série ‘Denial’ da Apple TV + como um filme
‘Se você me demitir, que assim seja’