Google tiene una nueva IA que escribe texto mucho más rápido: así funciona DiffusionGemma

Google ha presentado DiffusionGemma, un modelo experimental de código abierto para la generación de texto. Basado en la familia Gemma 4 y publicado bajo la licencia Apache 2.0, está dirigido principalmente a desarrolladores e investigadores que trabajan con aplicaciones de IA en tiempo real y entornos locales, asimismo, ha sido diseñado para generar texto hasta cuatro veces más rápido que los modelos tradicionales.La compañía de Mountain View explica en su blog oficial que, a diferencia de los modelos de lenguaje convencionales que generan texto palabra por palabra, DiffusionGemma apuesta por una arquitectura basada en difusión para producir bloques completos de texto de forma simultánea, reduciendo considerablemente los tiempos de respuesta.Así lo señala Google en la publicación: "Basada en la inteligencia por parámetro líder en la industria de nuestra familia Gemma 4 y en la vanguardista investigación de Gemini Diffusion, DiffusionGemma integra un novedoso cabezal de difusión diseñado para maximizar la velocidad de generación".
Asimismo, agrega que "genera bloques de texto completos simultáneamente, logrando una generación de texto hasta cuatro veces más rápida en GPU".¿Cómo funciona DiffusionGemma?El modelo empieza generando una especie de borrador compuesto por tokens aleatorios y, a través de varias iteraciones, va refinando el resultado hasta obtener un texto coherente. Este proceso es similar al de los modelos de difusión utilizados para crear imágenes mediante inteligencia artificial, que parten de ruido visual y lo transforman progresivamente en una imagen definida.Según Google, DiffusionGemma puede procesar hasta 256 tokens en paralelo y utiliza atención bidireccional, lo que le permite analizar el contexto completo de un bloque de texto al mismo tiempo.
Asimismo, esto mismo facilita tareas como la edición de textos, la corrección de errores, el relleno de código o la generación de estructuras complejas que resultan más difíciles para los modelos tradicionales.La compañía asegura que el modelo puede superar los 1.000 tokens por segundo en determinadas GPU empresariales y alcanzar más de 700 tokens por segundo en tarjetas gráficas de consumo avanzadas. No obstante, reconoce que la calidad de las respuestas todavía puede ser inferior a la de los modelos Gemma 4 convencionales, por lo que su principal atractivo reside en la velocidad y no en sustituir a los modelos más precisos.Cuándo estará disponibleDiffusionGemma ya está disponible como modelo experimental de acceso abierto.
Los desarrolladores pueden descargar sus pesos desde plataformas como Hugging Face e integrarlo en herramientas populares de desarrollo y despliegue de IA.Asimismo, Google también ha confirmado compatibilidad con distintos entornos de ejecución locales y en la nube, con soporte optimizado para hardware de NVIDIA.
Información de 20 Minutos. Edición y redacción: Noticias Today.
Ver publicación original ↗
💬 Comentarios (0)
Iniciá sesión o creá tu cuenta para comentar.