Raw Record Source

{
  "$type": "site.standard.document",
  "bskyPostRef": {
    "cid": "bafyreic6p6reavsnrftlds5cpfrog7eiyzoqdaf2qt5etcoxp54rwqgrzq",
    "uri": "at://did:plc:3pjw65epwlo3rzajhx6xg4br/app.bsky.feed.post/3mfyq3yfqr3x2"
  },
  "coverImage": {
    "$type": "blob",
    "ref": {
      "$link": "bafkreianquip2obmqifkbyocicm5r2c7wetpjltvsk7u53ze6qacnhccoy"
    },
    "mimeType": "image/jpeg",
    "size": 11333
  },
  "path": "/2026/03/01/lingbot-world-geracao-de-mundo-jogavel-opensource/",
  "publishedAt": "2026-03-01T05:26:51.000Z",
  "site": "https://assuntonerd.com.br",
  "tags": [
    "https://github.com/Robbyant/lingbot-world"
  ],
  "textContent": "Imagine assistir a um vídeo gerado por IA. Agora, imagine que você pode colocar as mãos no teclado e **controlar** para onde a câmera vai, em tempo real, enquanto o mundo é criado à sua frente. Isso não é mais ficção científica distante: conheça o **LingBot-World**.\n\nRecém-lançado, o framework apresenta o primeiro modelo de mundo de alta capacidade totalmente open source, estabelecendo um contraste direto com soluções proprietárias como o Genie 3.\n\nEmbora ambos ofereçam interatividade em tempo real, o LingBot-World se destaca no chamado grau dinâmico, ou seja, demonstra maior fidelidade ao lidar com física complexa e transições de cena. O sistema atinge 16 quadros por segundo e conta com memória espacial emergente, mantendo a consistência dos objetos mesmo após ficarem até 60 segundos fora do campo de visão.\n\nNa prática, esse lançamento rompe o monopólio na simulação de mundos interativos, ao disponibilizar para a comunidade não apenas o código-fonte, mas também os pesos completos do modelo.\n\n> O “Teste que executei” demonstra isso perfeitamente. no video deste post.\n\nEle chega a simular dinâmicas que não estão visíveis na cena. Se um veículo sai do enquadramento, o modelo continua calculando sua trajetória fora da tela. Quando a câmera retorna, o carro reaparece na posição matematicamente coerente, em vez de simplesmente sumir ou ficar congelado. Isso indica uma mudança profunda: deixamos de ter modelos que apenas “imaginam” imagens e passamos a ter sistemas que efetivamente simulam leis físicas.\n\nPublicado em 28 de janeiro de 2026, o artigo “Advancing Open Source World Models” introduziu este novo simulador que promete abalar as estruturas da IA generativa e do desenvolvimento de jogos. Diferente de tudo o que vimos até agora, o LingBot-World não apenas cria vídeos; ele simula ambientes interativos com física consistente e latência abaixo de um segundo\n\n## O Que Faz o LingBot-World Ser Diferente?\n\nA maioria dos modelos de vídeo atuais (como o Gen3 ou Matrix GAN 2.0) funciona de forma passiva: você digita um texto e espera o vídeo ficar pronto. O LingBot-World muda esse paradigma ao permitir que o usuário **dirija a câmera** através das cenas usando as teclas **W, A, S e D**.\n\nSeja explorando castelos góticos com dragões, interiores realistas ou mundos com estética de anime e pintura a óleo, o modelo responde aos seus comandos instantaneamente.\n\n## Por Baixo do Capô: Como a Mágica Acontece\n\nPara os entusiastas técnicos e desenvolvedores, a arquitetura do LingBot-World é fascinante. O modelo de 14 bilhões de parâmetros (cujos pesos estão disponíveis no Hugging Face) utiliza um pipeline de treinamento em três estágios,\n\n  1. **Pré-treinamento:** Estabelece uma base sólida de vídeo para entender texturas.\n  2. **Treinamento Intermediário (Física):** Aqui o modelo aprende “conhecimento de mundo”. A equipe usou a Unreal Engine para gerar dados sintéticos onde as ações do usuário e os estados da câmera foram gravados em sincronia com o vídeo\n  3. .**Pós-treinamento (Baixa Latência):** O segredo da interatividade. Usando técnicas como “destilação latente”, eles reduziram os passos computacionais para garantir que a simulação rode suavemente em tempo real.\n\n\n\nO sistema usa um componente chamado **codificador “Plucker”** , que transforma seus comandos de teclado (WASD) em embeddings geométricos. Esses dados ajustam as características do vídeo através de uma camada de ação, direcionando a geração quadro a quadro\n\n## Open Source vs. O Resto\n\nEnquanto concorrentes de peso como o **Mirage 2** e o **Genie 3** mantêm seus códigos fechados, o LingBot-World é totalmente **Open Source**\n\nE ele não sacrifica qualidade por ser aberto. Nos benchmarks (Versus Bench), ele alcançou uma pontuação de quase **0,89 em grau dinâmico** (movimento complexo), superando significativamente concorrentes como o Ume 1.5 e o HY World 1.5, que ficam em torno de 0,76. Ele consegue manter essa física complexa de forma consistente por longas durações (mais de um minuto)\n\n## Conclusão\n\nO LingBot-World representa um passo gigante na transformação da geração de vídeo passiva em **simulação interativa**\n\nCom o código disponível no GitHub, ele abre portas para acelerar o progresso no desenvolvimento de jogos e na IA corporificada, colocando o poder de criar mundos infinitos e controláveis nas mãos de qualquer desenvolvedor.\n\nSe você quer testar, o código e os exemplos de inferência já estão disponíveis para quem quiser mergulhar na próxima geração de simuladores de mundo.\n\nCódigo Fonte:\nhttps://github.com/Robbyant/lingbot-world",
  "title": "LingBot-World: Geração de mundo “jogável” opensource."
}