quarta-feira, julho 30, 2025
HomeInternetZ.ai Lança modelos de IA Agentic de código aberto GLM-4.5 e GLM-4.5-Air.

Z.ai Lança modelos de IA Agentic de código aberto GLM-4.5 e GLM-4.5-Air.

O laboratório de inteligência artificial (IA) chinês Z.ai anunciou, na segunda-feira, o lançamento de dois novos modelos de linguagem de código aberto, denominados GLM-4.5 e GLM-4.5-Air. A empresa classifica esses modelos como seus mais recentes produtos de destaque. Ambos são modelos híbridos de raciocínio, oferecendo um modo de pensamento para raciocínios complexos e uso de ferramentas, e um modo não-pensante para respostas imediatas. Além disso, a empresa afirma que esses modelos suportam capacidades agentes. Em destaque, a Z.ai assegura que seus novos modelos superam todos os outros modelos de código aberto disponíveis no mundo.

Em um post no blog, a empresa chinesa explicou que a ideia por trás dos modelos GLM é criar um modelo de linguagem grande (LLM) que seja verdadeiramente generalista e capaz de desempenhar diferentes tipos de tarefas. De acordo com a Z.ai, apesar dos avanços em IA generativa, modelos de empresas como Google, OpenAI e Anthropic não são suficientemente gerais, apresentando desempenho forte em algumas áreas, enquanto ficam aquém em outras. “O GLM-4.5 busca unificar todas as diferentes capacidades”, afirmou a companhia.

O modelo GLM-4.5 possui um total de 355 bilhões de parâmetros, com 32 bilhões de parâmetros ativos. Em contrapartida, a variante Air conta com 106 bilhões de parâmetros totais, sendo 12 bilhões ativos. Ambos os modelos integram capacidades de raciocínio, codificação e agentes em uma única arquitetura, apresentando uma janela de contexto de 128.000 tokens e capacidade nativa de chamada de funções.

No que se refere à arquitetura do modelo, a Z.ai utilizou uma estrutura de mistura de especialistas (MoE) para melhorar a eficiência computacional tanto no treinamento quanto na inferência. Em vez de aumentar a largura (dimensões ocultas e número de especialistas) das camadas MoE, como feito pelo DeepSeek-V3, a série GLM-4.5 reduz a largura enquanto aumenta a altura (número de camadas), baseado na crença da empresa de que modelos mais profundos demonstram melhor capacidade de raciocínio.

A empresa também destacou, em seu post, as técnicas inovadoras utilizadas nos processos de pré-treinamento e pós-treinamento, com o objetivo de ajudar a comunidade de desenvolvedores a entender como os modelos foram construídos do zero.

A Z.ai relatou ter testado o desempenho do modelo GLM-4.5 em 12 benchmarks, abrangendo capacidades de agentes, raciocínio e codificação. A empresa compara os resultados gerais do modelo com vários LLMs de OpenAI, Anthropic, Google, xAI, Alibaba, entre outros. Com base nessa avaliação interna, a Z.ai afirmou que o GLM-4.5 obteve a terceira colocação, atrás do o3 da OpenAI e do Grok 4 da xAI.

Indivíduos interessados podem acessar os pesos abertos desses modelos nas listas do GitHub e Hugging Face da Z.ai. Alternativamente, os LLMs também podem ser acessados por meio do site e da interface de programação de aplicativos (API) da empresa.

RELATED ARTICLES
- Advertisment -

Most Popular

Recent Comments