quarta-feira, março 12, 2025
No menu items!
HomeGadgetsM3 Ultra Desbrava o DeepSeek R1 com 671 Bilhões de Parâmetros Usando...

M3 Ultra Desbrava o DeepSeek R1 com 671 Bilhões de Parâmetros Usando 448GB de Memória Unificada e Desempenho de Alta Largura de Banda Abaixo de 200W, Sem Necessidade de Configuração Multi-GPU

Desempenho Impressionante do Chip M3 Ultra da Apple com o Modelo DeepSeek R1

Recentemente, a Apple apresentou o novo Mac Studio, equipado com seu chip mais potente até agora, o M3 Ultra. Este chip não apenas superou os próprios benchmarks de desempenho da empresa, mas também mostrou-se altamente eficiente ao rodar o modelo DeepSeek R1, que possui a impressionante marca de 671 bilhões de parâmetros.

O M3 Ultra e o Desempenho do Modelo DeepSeek R1

O modelo DeepSeek R1, que ocupa uma quantidade considerável de espaço com 404 GB e exige alta largura de banda de memória, foi comparado ao desempenho de chips anteriores da Apple. O M3 Ultra, com sua configuração de até 32 núcleos de CPU e 80 núcleos de GPU, oferece uma melhoria significativa em relação ao chip M2 Ultra. A arquitetura de memória unificada da Apple permite que o chip acesse recursos semelhantes aos da VRAM extremamente exigida por configurações de GPU poderosas.

Um vídeo do canal Dave2D no YouTube detalhou a comparação, mostrando que, ao contrário das configurações de PC que necessitam de múltiplas GPUs e consomem uma quantidade extrema de energia, o M3 Ultra conseguiu executar o modelo com eficiência impressionante. Essa arquitetura unificada proporciona uma pool compartilhada de memória de alta largura de banda, permitindo o uso de recursos de maneira otimizada para cargas de trabalho de IA.

Requisitos e Desempenho do M3 Ultra

Embora modelos de IA menores funcionem de maneira suave com recursos moderados, o modelo DeepSeek R1 exige a configuração mais robusta do M3 Ultra, que inclui impressionantes 512 GB de memória. No entanto, uma limitação no macOS quanto à alocação de VRAM necessitou de ajustes manuais no Terminal, elevando essa alocação para 448 GB.

Apesar de uma versão quantizada em 4 bits, que sacrifica parte da precisão, o modelo manteve seus 671 bilhões de parâmetros e apresentou um desempenho surpreendente. O que é mais notável é que, enquanto sistemas concorrentes requerem múltiplas GPUs para atingir resultados semelhantes, o chip M3 Ultra da Apple demonstrou superioridade no que tange à eficiência energética. Durante a execução do modelo DeepSeek R1, todo o sistema consumiu menos de 200W — um valor que é uma fração do requerido por configurações tradicionais de múltiplas GPUs, que poderiam necessitar de até dez vezes mais potência.

Eficiência e Futuro do M3 Ultra

Outro dado interessante é que, surpreendentemente, o modelo R1 de 671 bilhões de parâmetros superou em desempenho a versão menor de 70 bilhões de parâmetros, possivelmente devido a eficiências arquitetônicas. No geral, o chip M3 Ultra da Apple mostrou que pode lidar com cargas de trabalho significativamente superiores ao que seria esperado de seu design.

Com isso, a Apple solidifica sua posição como líder na integração de melhor desempenho e eficiência energética na computação moderna. Aguardamos mais informações sobre o desempenho e eficiência do M3 Ultra, e certamente ficaremos de olho nas inovações que estão por vir.

RELATED ARTICLES
- Publicidade -

Most Popular

Recent Comments