External Publication

General Compute promete inferência de IA até 15x mais rápida que GPUs tradicionais

Pequenas Empresas & Grandes Negócios [Unofficial] May 18, 2026

A corrida global da inteligência artificial entrou em um novo momento. Depois do avanço acelerado dos grandes modelos de linguagem, o mercado começou a voltar sua atenção para um desafio considerado ainda mais complexo: entregar inferência de IA em tempo real com velocidade, estabilidade e baixo custo energético. Por isso, a General Compute tenta se posicionar como uma das empresas mais ousadas do setor. A startup afirma estar construindo uma infraestrutura capaz de oferecer inferência de inteligência artificial até 15 vezes mais rápida do que soluções tradicionais baseadas em GPUs. A proposta chamou atenção do mercado após reportagens e apresentações da empresa destacarem uma mudança radical na forma como workloads de IA podem ser executados. O que é inferência de IA? Inferência de IA é o processo responsável por transformar modelos treinados em aplicações reais utilizadas por usuários. Na prática, sempre que alguém conversa com um chatbot, usa um copiloto de programação ou interage com agentes autônomos, existe um sistema processando perguntas e gerando respostas em tempo real. Ao apostar em ASICs e em uma arquitetura voltada exclusivamente para inference AI, a empresa tenta criar uma alternativa ao domínio das GPUs tradicionais. Se a promessa de inferência até 15 vezes mais rápida realmente se confirmar em larga escala, a General Compute pode ajudar a acelerar uma nova transformação na infraestrutura global da inteligência artificial. Essa etapa se tornou uma das áreas mais importantes da inteligência artificial moderna porque representa o momento em que os modelos realmente entram em operação. Com o crescimento da IA generativa, o volume de inferência explodiu. Empresas passaram a precisar de data centers extremamente rápidos para lidar com bilhões de tokens diariamente. Segundo a General Compute, a infraestrutura atual baseada em GPUs começa a apresentar gargalos importantes nesse cenário. A crítica da General Compute às GPUs Grande parte do mercado de inteligência artificial depende atualmente de GPUs fabricadas pela NVIDIA. Esses chips dominaram a primeira fase da IA generativa principalmente por serem extremamente eficientes no treinamento de modelos de linguagem. No entanto, a General Compute afirma que GPUs nunca foram projetadas originalmente para inference AI. Segundo o posicionamento da empresa, GPUs carregam décadas de arquitetura voltada para gráficos, renderização e processamento paralelo genérico. Isso cria limitações estruturais quando utilizadas para inferência em tempo real. A startup resume essa ideia com uma frase presente em seu posicionamento institucional: "GPUs were built for graphics. We're built for inference." A aposta em ASICs Para tentar superar essas limitações, a General Compute aposta em ASICs (Application-Specific Integrated Circuits), chips desenvolvidos especificamente para inferência de inteligência artificial. Diferentemente das GPUs tradicionais, os ASICs da empresa foram projetados exclusivamente para workloads de IA em tempo real. Segundo a companhia, isso permite reduzir gargalos relacionados a: movimentação de memória; consumo energético; latência; refrigeração; throughput de tokens. A empresa afirma que sua infraestrutura pode atingir velocidades entre 500 e 1.900 tokens por segundo, enquanto muitas infraestruturas tradicionais operam próximas de 100 a 120 tokens por segundo. Inferência mais rápida para agentes autônomos A General Compute acredita que o futuro da IA será dominado por agentes autônomos. Esses sistemas vão precisar tomar decisões continuamente, conversar em tempo real e executar tarefas sem interrupções. Segundo Finn Puklowski, Chief Executive Officer da General Compute, velocidade deixa de ser apenas uma questão de performance e passa a influenciar diretamente a inteligência percebida pelos usuários. Na visão da empresa, quanto mais rápido um sistema processa tokens, mais eficiente e contextualizado ele consegue se tornar. Dessa forma, impacta diretamente aplicações como: copilotos de programação; agentes de voz; automação corporativa; atendimento inteligente; IA multimodal; plataformas autônomas. A companhia estima que mais de 1 bilhão de agentes de IA poderão estar ativos até 2029, criando uma demanda gigantesca por infraestrutura especializada em inferência. Menor consumo de energia Outro ponto utilizado pela General Compute para defender sua arquitetura é a eficiência energética. O crescimento da inteligência artificial aumentou o consumo de energia em data centers ao redor do mundo. Além do alto gasto elétrico, sistemas baseados em GPUs frequentemente exigem refrigeração líquida para controlar o superaquecimento. A General Compute afirma que seus ASICs funcionam com refrigeração a ar, eliminando a necessidade de resfriamento líquido. Segundo os dados divulgados pela empresa: racks da General Compute consomem cerca de 17 kW; infraestruturas equivalentes baseadas em GPUs chegam a aproximadamente 120 kW. A startup também afirma operar com energia estimada em US$ 0,035 por kWh, valor muito abaixo da média comercial americana. Paraguai como estratégia de infraestrutura Parte da operação inicial da empresa foi instalada no Paraguai. Segundo a companhia, o país oferece acesso a energia hidrelétrica barata, fator considerado estratégico para data centers de IA. Além disso, a General Compute afirma conseguir reutilizar estruturas antigas de mineração de criptomoedas para criar novos ambientes voltados para inferência de inteligência artificial. Como seus chips operam com refrigeração a ar, a adaptação dessas estruturas se torna mais simples e econômica. Compatibilidade com OpenAI Outro diferencial apresentado pela empresa é a compatibilidade com APIs da OpenAI. Na prática, desenvolvedores podem migrar aplicações alterando apenas a base URL e a API key. A empresa também oferece: APIs compatíveis com OpenAI; deploy customizado; infraestrutura dedicada; suporte para BYOM (Bring Your Own Model); integração com o OpenClaw. Uma nova disputa no mercado de IA A General Compute surge em um momento em que o mercado começa a perceber que o futuro da inteligência artificial não depende apenas de modelos mais avançados, mas também da infraestrutura responsável por entregar essas respostas em tempo real.

Discussion in the ATmosphere