{
"$type": "site.standard.document",
"bskyPostRef": {
"cid": "bafyreigjy4gkfveczoqg3kub2dvp5d5rb45vxyxpccczobwtsq27ggkh24",
"uri": "at://did:plc:5ovpevcql62fs43duhethzix/app.bsky.feed.post/3mhlnxx6bux62"
},
"coverImage": {
"$type": "blob",
"ref": {
"$link": "bafkreia5w6jraouvk2pazytc4uwvoi4iqjbg2pkn7ojinnwwgqdbbcbrt4"
},
"mimeType": "image/jpeg",
"size": 77322
},
"path": "/once-matematicos-de-elite-han-creado-una-prueba-que-expone-el-mayor-punto-debil-de-la-inteligencia-artificial-diferencia-entre-responder-bien-y-razonar-de-verdad-2000223035",
"publishedAt": "2026-03-21T16:33:05.000Z",
"site": "https://es.gizmodo.com",
"tags": [
"Tecnología"
],
"textContent": "\n\nEl proyecto First Proof enfrenta a los modelos de lenguaje a problemas matemáticos inéditos, fuera de su entrenamiento. El objetivo no es que acierten, sino ver cómo piensan. El resultado apunta a una diferencia incómoda: responder bien no es lo mismo que razonar de verdad.",
"title": "La inteligencia artificial es capaz de responder casi cualquier cosa con precisión. Pero once matemáticos han creado una prueba diseñada para algo distinto: comprobar si realmente entiende lo que hace o solo imita patrones sin razonar"
}