Google Lança o Gemma 3: Um Novo Modelo Open para Desenvolvedores
Em um movimento marcante, o Google apresentou recentemente o Gemma 3, a mais nova adição à sua coleção de modelos abertos, projetada especialmente para desenvolvedores. O lançamento ocorreu em maio de 2024 e, com isso, a empresa também lançou o modelo Gemma 2. O Gemma 3 é uma versão mais avançada e leve, fundamentada na mesma pesquisa e tecnologia que alimenta os modelos Gemini 2.0, e está disponível em diversas configurações, com tamanhos que variam de 1B a 27B.
Um gráfico divulgado pelo Google demonstra que o modelo Gemma 3 na configuração de 27B, que requer apenas um único GPU, supera notavelmente outros modelos, como Deepseek V3 e Llama 3 de 405B, mostrando seu desempenho superior no ranking de pontuação de Chatbot Arena.
Novas Capacidades do Gemma 3
Os desenvolvedores agora têm à disposição uma série de capacidades inovadoras com o Gemma 3:
-
Modelo de alto desempenho em única aceleração: O Gemma 3 se destaca ao oferecer desempenho de ponta para seu tamanho, superando até mesmo modelos mais robustos como o Llama-405B em avaliações iniciais sobre preferências humanas.
-
Suporte multilíngue: O Gemma 3 está pronto para atender a um público global, com suporte nativo para mais de 35 idiomas e treinamento para mais de 140 idiomas.
-
Raciocínio avançado em textos e imagens: A plataforma capacita o desenvolvimento de aplicações que podem analisar imagens, textos e vídeos curtos, expandindo as possibilidades de interações inteligentes.
-
Janela de contexto ampliada: Com uma capacidade de processamento de 128k tokens, o Gemma 3 permite que os aplicativos compreendam e processem grandes quantidades de informações.
-
Automatização com chamadas de funções: O novo modelo facilita a criação de experiências automatizadas e responsivas, suportando saídas estruturadas.
- Modelos quantizados para maior eficiência: Para acelerar o desempenho, o Gemma 3 apresenta versões quantizadas, reduzindo o tamanho do modelo e os requisitos computacionais, enquanto mantém a alta precisão.
Além dessas funcionalidades, o desenvolvimento do Gemma 3 focou em governança de dados extensiva, alinhamento com políticas de segurança e soluções de benchmark robustas. O Google também disponibiliza o ShieldGemma 2, um verificador de segurança de imagem de 4B, que pode ser personalizado ainda mais para atender às necessidades de segurança dos desenvolvedores.
Integração e Flexibilidade
O Gemma 3 foi projetado para se integrar com ferramentas já existentes:
-
Ferramentas preferidas: O modelo é compatível com Hugging Face Transformers, PyTorch, Keras, Google AI Edge, entre outros, oferecendo flexibilidade no desenvolvimento.
-
Acesso rápido ao desenvolvimento: Os usuários podem explorar o Gemma 3 instantaneamente, acessando-o no Google AI Studio, ou fazendo download através de plataformas como Kaggle ou Hugging Face.
- Personalização a partir de bases de código robustas: Com um código-base renovado, o Gemma 3 inclui receitas para ajustes e inferências eficientes, adaptando-se facilmente às necessidades individuais.
Além de proporcionar várias opções de implementação, o Gemma 3 é otimizado para GPUs NVIDIA, Google Cloud TPUs, e integra-se ao stack de código aberto ROCm™ para GPUs AMD.
Programa Acadêmico do Gemma 3
Para fomentar pesquisas acadêmicas, o Google estabeleceu o Programa Acadêmico Gemma 3, permitindo que pesquisadores solicitem créditos do Google Cloud (no valor de 10.000 dólares por prêmio) para impulsionar suas pesquisas baseadas no modelo Gemma 3.
Comece a Usar o Gemma 3
-
Exploração imediata: Teste o Gemma 3 diretamente no seu navegador por meio do Google AI Studio, sem necessidade de instalação.
-
Personalização e construção: Baixe os modelos do Gemma 3 e faça ajustes de acordo com suas necessidades através da biblioteca Transformers da Hugging Face.
- Implementação e escalabilidade: Leve suas criações do Gemma 3 ao mercado com o Vertex AI, ou execute inferências no Cloud Run com Ollama, aproveitando a facilidade de integração.
Com o lançamento do Gemma 3, o Google não apenas avança no campo da inteligência artificial, mas também oferece aos desenvolvedores as ferramentas necessárias para criar experiências únicas e impactantes, elevando o padrão do que é possível com modelos de linguagem.