Os chips TPU 8t e TPU 8i foram projetados para impulsionar a próxima geração de supercomputadores personalizados do Google.
O Google anunciou, nesta quarta-feira (22), a chegada da TPU 8t e da TPU 8i, dois novos processadores que visam aprimorar o treinamento e a inferência de IA, respectivamente, marcando a distinção entre essas funções. Os componentes estarão disponíveis ainda este ano.
Desenvolvidos para alimentar supercomputadores da empresa de Mountain View, os chips da oitava geração da Unidade de Processamento Tensorial (TPU) são capazes de lidar com treinamento de modelos avançados, desenvolvimento de agentes e tarefas de inferência em larga escala. Eles surgem como uma alternativa ao hardware da Nvidia.
Características dos novos chips de IA do Google
Com a separação de tarefas em chips distintos, a gigante da tecnologia acredita que os clientes poderão desfrutar de vantagens ao escolher um hardware especificamente adaptado às suas necessidades. A TPU 8t, por exemplo, reduz o ciclo de desenvolvimento de modelos de meses para semanas.
- Com quase três vezes o desempenho da TPU Ironwood da geração anterior, ela otimiza a taxa de transferência, a memória compartilhada e a largura de banda, garantindo maior agilidade no fluxo de trabalho;
- Um único processador da oitava geração é equivalente a 9.600 chips e 2 petabytes de memória compartilhada de alta largura de banda da versão anterior, segundo o Google;
- A arquitetura oferece 121 exaflops de capacidade computacional, permitindo alta escalabilidade para os modelos mais complexos;
- Outro destaque é o acesso ao armazenamento dez vezes mais rápido, possibilitando a utilização máxima do sistema de ponta a ponta.
A TPU 8i, por sua vez, é destinada ao trabalho complexo e colaborativo de agentes de IA especializados. Este chip combina 288 GB de memória de alta largura de banda com 384 MB de SRAM integrada, três vezes mais que a geração anterior, e dobra o número de CPUs físicas por servidor.
Para modelos específicos, a largura de banda da interconexão foi dobrada para 19,2 Tb/s, enquanto o novo mecanismo de aceleração coletiva integrado reduziu a latência no chip em até cinco vezes. Isso resultou em um desempenho 80% superior, conforme explicou a empresa.
Menor gasto energético
Com um desempenho por watt até duas vezes melhor que a série anterior, as novas TPUs do Google foram desenvolvidas para mitigar os problemas relacionados ao consumo de energia nos data centers. A empresa afirma que os componentes otimizam a eficiência em toda a cadeia.
Esse ajuste é realizado por meio do ajuste dinâmico do consumo de energia baseado na demanda em tempo real, evitando desperdícios. Ambas as TPUs também suportam a tecnologia de resfriamento líquido de quarta geração da empresa, que atua onde o resfriamento a ar não consegue alcançar.
A Citadel Securities e os laboratórios nacionais do Departamento de Energia dos Estados Unidos devem ser alguns dos primeiros clientes a experimentar as inovações da TPU 8t e da TPU 8i. A Anthropic também utilizará o poder computacional dessas novas soluções.
Você sabe qual é a diferença entre GPU e TPUs? Entenda neste comparativo elaborado pelo TecMania.