segunda-feira, julho 28, 2025
HomeInternetA equipe Hunyuan da Tencent lança o modelo de mundo Hunyuan3D 1.0...

A equipe Hunyuan da Tencent lança o modelo de mundo Hunyuan3D 1.0 de código aberto, capaz de gerar mundos 3D exploráveis.

O time Hunyuan da Tencent lançou, no último domingo, um novo modelo de inteligência artificial (IA) capaz de gerar mundos tridimensionais (3D). Denominado Hunyuan 3D World Model 1.0, trata-se de um modelo de código aberto que aceita tanto texto quanto imagens como entrada. Ele permite a criação de visões de mundo em 360 graus, que são exploráveis e interativas. Após a geração, os usuários podem navegar por esses mundos como se fossem ativos jogáveis. O conglomerado tecnológico chinês afirma que o modelo pode auxiliar no desenvolvimento de jogos, realidade virtual e criação de conteúdo digital.

Os modelos de geração de mundos são uma das áreas específicas da IA generativa, focando na capacidade dos sistemas de criar consistência geométrica, eficiência na renderização e diversidade visual nos mundos gerados. Esses ambientes criados podem ser utilizados em diversas situações, desde a criação de jogos até o treinamento virtual de robôs.

O Hunyuan 3D World Model está disponível para download através das plataformas GitHub e Hugging Face da empresa. O modelo é disponibilizado com uma licença permissiva denominada “tencent-hunyuanworld-1.0-community”, permitindo tanto uso acadêmico quanto comercial. Aqueles que desejam apenas testar o modelo, sem executá-lo localmente, podem acessar a plataforma da Tencent e começar a gerar.

Em sua página do projeto, a empresa afirma que as abordagens existentes de geração de mundos se concentram em métodos baseados em vídeo ou em 3D. Enquanto os primeiros oferecem forte diversidade visual, os últimos garantem consistência 3D e eficiência na renderização. No entanto, nenhum desses métodos oferece ambos, disse a equipe. Para resolver esse problema, o time Hunyuan desenvolveu uma nova estrutura.

Essa estrutura utiliza uma representação de malha 3D em camadas semânticas que pode projetar imagens panorâmicas como proxies de mundos em 360 graus. Esses proxies são então decompostos e reconstruídos para criar os diversos mundos. Os pesquisadores usaram essa estrutura como base para treinar o modelo, de modo a gerar mundos 3D coerentes, exploráveis e interativos.

A equipe Hunyuan informou que a versão de código aberto do modelo de IA é baseada no gerador de imagens Flux; entretanto, ela pode ser adaptada para outros modelos, como Hunyuan Image, Kontext, Stable Diffusion, entre outros. A empresa não especificou se o modelo estará disponível por meio de interfaces de programação de aplicativos (APIs).

RELATED ARTICLES
- Advertisment -

Most Popular

Recent Comments