{
"$type": "site.standard.document",
"bskyPostRef": {
"cid": "bafyreibo6nysnqdv7xngitsinlkgwwrbsmtqmkhd3qqumvmblkjsk5tqbq",
"uri": "at://did:plc:ulfbtqn2ybcgbzf27z75qrvu/app.bsky.feed.post/3mgqcic4z6yo2"
},
"coverImage": {
"$type": "blob",
"ref": {
"$link": "bafkreihmrdxbvty6kpw4yoaonuh3idxpgc7difyy5xchnemo6uyd2je65u"
},
"mimeType": "image/jpeg",
"size": 486021
},
"path": "/mercado/411486-gpt54-quando-o-avanco-deixa-de-ser-teoria-e-vira-trabalho-de-verdade.htm",
"publishedAt": "2026-03-10T20:45:00.000Z",
"site": "https://www.tecmundo.com.br",
"tags": [
"The BRIEF"
],
"textContent": "Quem me conhece sabe: sou obcecada por lançamentos de modelos. Também sei que eles não permanecem “estado da arte” por muito tempo. Na minha viagem recente para São Francisco, aprendi que a janela de relevância de um modelo está mais próxima de quatro semanas — ou até que um dos outros três grandes players lance uma atualização.\n\nEspecialistas em tecnologia também reforçaram nessa viagem que a capacidade do modelo, por si só, caminha rapidamente para se tornar uma commodity. O verdadeiro diferencial estará nas aplicações verticais construídas sobre ela.\n\nAinda assim, acompanhar — e sentir — esse ritmo de progresso de perto continua sendo fascinante. A velocidade com que esses modelos evoluem é, sinceramente, impressionante. No dia 5 de março, a OpenAI lançou o GPT‑5.4 e, sim, eu fiquei bastante animada e comecei a ler tudo sobre o tema – e, obviamente, testei o modelo.\n\nO GPT‑5.4 chegou com mais expectativa do que alguns lançamentos recentes porque foi apresentado como um avanço mais estrutural. A OpenAI o descreve como um modelo que reúne seus progressos mais recentes em raciocínio, programação e fluxos de trabalho com agentes em um único “modelo de fronteira”, pensado para uso profissional. Ele também traz uma janela de contexto de 1 milhão de tokens.\n\nPara quem não vive imerso em especificações técnicas, vale a tradução simples: a janela de contexto é a quantidade de informação que o modelo consegue manter “em mente” ao mesmo tempo. Quanto maior ela é, mais documentos longos, abas abertas, instruções e tarefas em múltiplas etapas o modelo consegue executar sem perder o fio da meada.\n\nDesta vez, a OpenAI foi especialmente explícita em duas prioridades: trabalho intelectual e uso do computador. As chamadas “capacidades de uso de computador” significam, na prática, que o modelo consegue operar um computador como um humano — interpretando o que está na tela e usando mouse e teclado para concluir tarefas em diferentes aplicações.\n\nEm seus próprios benchmarks, o GPT‑5.4 atingiu uma taxa de sucesso de 75,0% no OSWorld‑Verified, um teste que mede se o modelo consegue navegar por fluxos reais de trabalho em desktops a partir de capturas de tela, cliques e comandos de teclado.\n\nEsse número chama atenção não apenas por estar bem acima dos 47,3% do GPT‑5.2, mas também por superar a performance média humana no mesmo teste. Em termos simples: os modelos estão ficando significativamente melhores em usar softwares de verdade — não apenas em falar sobre eles.\n\nIsso importa porque a próxima grande mudança de interface provavelmente não será feita por humanos clicando em sites e sistemas, mas por agentes fazendo isso por nós. Se esse cenário se confirmar, empresas precisarão cada vez mais de produtos, sites e fluxos de trabalho que não sejam apenas intuitivos para pessoas, mas também fáceis de entender e executar para agentes.\n\nA OpenAI também deu destaque ao desempenho no GDPval, seu benchmark voltado ao trabalho profissional do conhecimento, que cobre 44 ocupações em nove dos principais setores que compõem o PIB dos Estados Unidos.\n\nEm termos simples, o GDPval mede quão bem o modelo executa tarefas reais do dia a dia corporativo: planilhas, apresentações, agendas, análises e outros entregáveis que as pessoas efetivamente produzem no trabalho.\n\nNesse indicador, o GPT‑5.4 igualou ou superou profissionais da indústria em 83,0% das comparações — contra 70,9% do GPT‑5.2. Houve também um salto expressivo em tarefas de modelagem em planilhas, de 68,4% para 87,3%, algo particularmente relevante para fluxos intensivos em finanças.\n\nE, sim, o recado para o mercado financeiro foi bastante claro. Junto com o lançamento do modelo, a OpenAI apresentou o ChatGPT para Excel, um add‑in em beta que leva o GPT‑5.4 diretamente para dentro das planilhas.\n\nIsso importa porque um dos casos de uso corporativos mais evidentes desses modelos está justamente em modelagem financeira, análises de cenário e trabalhos pesados em dados — atividades que ainda consomem uma parcela desproporcional do tempo de analistas.\n\nMais do que um novo modelo, o GPT‑5.4 sinaliza uma transição: da IA que responde bem para a IA que executa, navega, constrói e entrega. E esse, ao que tudo indica, é o verdadeiro próximo capítulo.",
"title": "GPT‑5.4: quando o avanço deixa de ser teoria e vira trabalho de verdade"
}