{
  "$type": "site.standard.document",
  "bskyPostRef": {
    "cid": "bafyreigjy4gkfveczoqg3kub2dvp5d5rb45vxyxpccczobwtsq27ggkh24",
    "uri": "at://did:plc:5ovpevcql62fs43duhethzix/app.bsky.feed.post/3mhlnxx6bux62"
  },
  "coverImage": {
    "$type": "blob",
    "ref": {
      "$link": "bafkreia5w6jraouvk2pazytc4uwvoi4iqjbg2pkn7ojinnwwgqdbbcbrt4"
    },
    "mimeType": "image/jpeg",
    "size": 77322
  },
  "path": "/once-matematicos-de-elite-han-creado-una-prueba-que-expone-el-mayor-punto-debil-de-la-inteligencia-artificial-diferencia-entre-responder-bien-y-razonar-de-verdad-2000223035",
  "publishedAt": "2026-03-21T16:33:05.000Z",
  "site": "https://es.gizmodo.com",
  "tags": [
    "Tecnología"
  ],
  "textContent": "\n\nEl proyecto First Proof enfrenta a los modelos de lenguaje a problemas matemáticos inéditos, fuera de su entrenamiento. El objetivo no es que acierten, sino ver cómo piensan. El resultado apunta a una diferencia incómoda: responder bien no es lo mismo que razonar de verdad.",
  "title": "La inteligencia artificial es capaz de responder casi cualquier cosa con precisión. Pero once matemáticos han creado una prueba diseñada para algo distinto: comprobar si realmente entiende lo que hace o solo imita patrones sin razonar"
}