Raw Record Source

{
  "$type": "site.standard.document",
  "bskyPostRef": {
    "cid": "bafyreibo6nysnqdv7xngitsinlkgwwrbsmtqmkhd3qqumvmblkjsk5tqbq",
    "uri": "at://did:plc:ulfbtqn2ybcgbzf27z75qrvu/app.bsky.feed.post/3mgqcic4z6yo2"
  },
  "coverImage": {
    "$type": "blob",
    "ref": {
      "$link": "bafkreihmrdxbvty6kpw4yoaonuh3idxpgc7difyy5xchnemo6uyd2je65u"
    },
    "mimeType": "image/jpeg",
    "size": 486021
  },
  "path": "/mercado/411486-gpt54-quando-o-avanco-deixa-de-ser-teoria-e-vira-trabalho-de-verdade.htm",
  "publishedAt": "2026-03-10T20:45:00.000Z",
  "site": "https://www.tecmundo.com.br",
  "tags": [
    "The BRIEF"
  ],
  "textContent": "Quem me conhece sabe: sou obcecada por lançamentos de modelos. Também sei que eles não permanecem “estado da arte” por muito tempo. Na minha viagem recente para São Francisco, aprendi que a janela de relevância de um modelo está mais próxima de quatro semanas — ou até que um dos outros três grandes players lance uma atualização.\n\nEspecialistas em tecnologia também reforçaram nessa viagem que a capacidade do modelo, por si só, caminha rapidamente para se tornar uma commodity. O verdadeiro diferencial estará nas aplicações verticais construídas sobre ela.\n\nAinda assim, acompanhar — e sentir — esse ritmo de progresso de perto continua sendo fascinante. A velocidade com que esses modelos evoluem é, sinceramente, impressionante. No dia 5 de março, a OpenAI lançou o GPT‑5.4 e, sim, eu fiquei bastante animada e comecei a ler tudo sobre o tema – e, obviamente, testei o modelo.\n\nO GPT‑5.4 chegou com mais expectativa do que alguns lançamentos recentes porque foi apresentado como um avanço mais estrutural. A OpenAI o descreve como um modelo que reúne seus progressos mais recentes em raciocínio, programação e fluxos de trabalho com agentes em um único “modelo de fronteira”, pensado para uso profissional. Ele também traz uma janela de contexto de 1 milhão de tokens.\n\nPara quem não vive imerso em especificações técnicas, vale a tradução simples: a janela de contexto é a quantidade de informação que o modelo consegue manter “em mente” ao mesmo tempo. Quanto maior ela é, mais documentos longos, abas abertas, instruções e tarefas em múltiplas etapas o modelo consegue executar sem perder o fio da meada.\n\nDesta vez, a OpenAI foi especialmente explícita em duas prioridades: trabalho intelectual e uso do computador. As chamadas “capacidades de uso de computador” significam, na prática, que o modelo consegue operar um computador como um humano — interpretando o que está na tela e usando mouse e teclado para concluir tarefas em diferentes aplicações.\n\nEm seus próprios benchmarks, o GPT‑5.4 atingiu uma taxa de sucesso de 75,0% no OSWorld‑Verified, um teste que mede se o modelo consegue navegar por fluxos reais de trabalho em desktops a partir de capturas de tela, cliques e comandos de teclado.\n\nEsse número chama atenção não apenas por estar bem acima dos 47,3% do GPT‑5.2, mas também por superar a performance média humana no mesmo teste. Em termos simples: os modelos estão ficando significativamente melhores em usar softwares de verdade — não apenas em falar sobre eles.\n\nIsso importa porque a próxima grande mudança de interface provavelmente não será feita por humanos clicando em sites e sistemas, mas por agentes fazendo isso por nós. Se esse cenário se confirmar, empresas precisarão cada vez mais de produtos, sites e fluxos de trabalho que não sejam apenas intuitivos para pessoas, mas também fáceis de entender e executar para agentes.\n\nA OpenAI também deu destaque ao desempenho no GDPval, seu benchmark voltado ao trabalho profissional do conhecimento, que cobre 44 ocupações em nove dos principais setores que compõem o PIB dos Estados Unidos.\n\nEm termos simples, o GDPval mede quão bem o modelo executa tarefas reais do dia a dia corporativo: planilhas, apresentações, agendas, análises e outros entregáveis que as pessoas efetivamente produzem no trabalho.\n\nNesse indicador, o GPT‑5.4 igualou ou superou profissionais da indústria em 83,0% das comparações — contra 70,9% do GPT‑5.2. Houve também um salto expressivo em tarefas de modelagem em planilhas, de 68,4% para 87,3%, algo particularmente relevante para fluxos intensivos em finanças.\n\nE, sim, o recado para o mercado financeiro foi bastante claro. Junto com o lançamento do modelo, a OpenAI apresentou o ChatGPT para Excel, um add‑in em beta que leva o GPT‑5.4 diretamente para dentro das planilhas.\n\nIsso importa porque um dos casos de uso corporativos mais evidentes desses modelos está justamente em modelagem financeira, análises de cenário e trabalhos pesados em dados — atividades que ainda consomem uma parcela desproporcional do tempo de analistas.\n\nMais do que um novo modelo, o GPT‑5.4 sinaliza uma transição: da IA que responde bem para a IA que executa, navega, constrói e entrega. E esse, ao que tudo indica, é o verdadeiro próximo capítulo.",
  "title": "GPT‑5.4: quando o avanço deixa de ser teoria e vira trabalho de verdade"
}