{
  "$type": "site.standard.document",
  "bskyPostRef": {
    "cid": "bafyreieuyl65t2o5vhjcwh3hnckqjlbqxcmqkjybhzod5gijau2smixzr4",
    "uri": "at://did:plc:zfkx2dhqf3sjdalzku4ajvqy/app.bsky.feed.post/3mnfoyzxsron2"
  },
  "coverImage": {
    "$type": "blob",
    "ref": {
      "$link": "bafkreihpgbtjvroszggrsvff7tlmhtdoegrrwc6ssrjjklx3gpseslvocm"
    },
    "mimeType": "image/jpeg",
    "size": 136734
  },
  "path": "/noticias/ia/google-gemma-4-12b/",
  "publishedAt": "2026-06-03T17:27:15.000Z",
  "site": "https://www.adslzone.net",
  "tags": [
    "@Google"
  ],
  "textContent": "\n\n\nEl mundo de la IA no se detiene y cada día hay una novedad. En esta ocasión, es el turno de **Google y Gemma 4**. Más que nada porque hoy anuncia la llegada de una nueva variante de Inteligencia Artificial creada por DeepMind, aunque es completamente de código abierto y cuenta con licencia Apache 2.0. Pero, ¿cuáles son las novedades de este nuevo lanzamiento?\n\nLa finalidad de **Gemma 4 12B** es conseguir que tu ordenador portátil también pueda disfrutar de la inteligencia multimodal de alto rendimiento. Y lo más importante de todo es que esta nueva variante se sitúa entre E4B y 26B. Además de que, como explica la propia compañía, se trata de su primer modelo de tamaño medio en el que se incluyen entradas de audio de forma nativa. Pero no es el único detalle que se puede resaltar de este lanzamiento.\n\n## Los puntos clave del nuevo modelo\n\nEsta variante tiene un objetivo claro: llevar la inteligencia multimodal y agéntica de manera directa a los **PC portátiles**. Ahora bien, hay una serie de aspectos clave que no se pueden pasar por alto de este modelo que hace posible que, de manera local, un ordenador portátil pueda usar este modelo que es capaz de razonar, ejecutar herramientas y procesar diferentes tipos de datos. Y todo sin depender de la nube.\n\nDe entre las claves se pueden destacar los siguientes puntos:\n\n  * No usa codificadores para visión y audio, por lo que **se reduce la latencia y el uso de memoria**. Asimismo, las imágenes y el audio van de manera directa al núcleo del modelo de lenguaje (LLM).\n  * Tiene un rendimiento bastante que se aproxima al modelo más grande de 26B, lo que hace posible que permita un flujo de trabajo de razonamiento que cuente con multitud de pasos y agentes.\n  * Es más pequeño, así que es posible ejecutarlo de manera local **en portátiles que tengan 16 GB de VRAM**.\n  * Es multimodal tanto en texto, como en visión y audio.\n\n\n\n> Google\n>\n> @Google\n>\n> Our new unified architecture allows Gemma 4 12B to process multimodal inputs natively. Here’s how ⬇️\n>\n> Traditional models rely on separate encoders for images and audio. This adds latency and increases memory usage. So we streamlined this:\n>\n> 👁️ Vision: We took a novel approach to https://t.co/iQRIKsrzmS\n>\n> 03 de junio, 2026 • 18:03\n>\n>\n>  68\n>\n>\n>  3\n\n## Otras novedades de esta nueva variante\n\nComo también mencionábamos antes, dentro de la familia Gemma, las entradas de audio solo estaban disponibles en arquitecturas pequeñas y ligeras, como es el caso de E4B, pero la nueva variante 12B se convierte en el primer modelo de tamaño medio que ya puede **procesar audio de manera nativa**.\n\nA todo esto, se ofrece también **una nueva experiencia de escritorio para macOS**. Así lo explica Google en su lanzamiento: « _Por primera vez, lanzamos aplicaciones de escritorio de macOS descargables, lo que permite a los desarrolladores experimentar una interacción visual y de voz totalmente local directamente en dispositivos de consumo_ «. Por ejemplo, los usuarios de macOS ya pueden probar la codificación local con Gemma 4 12B a través de Google AI Edge Gallery desde hoy mismo.",
  "title": "Google tiene un nuevo modelo para Gemma 4 y esto es todo lo que puede hacer"
}