Lanzamiento de Gemini 3.5 Flash Omni: Actualización de IA Multimodal de Google para Creadores

James Morton • Publicado el 22/05/2026 - 14:59 • Actualizado 09/06/2026 - 15:57 • 4 min de lectura • 288,300 • 11,064

Vivid 3D render of glowing abstract neural forms merging in cosmic space.

Tabla de contenidos

Qué reveló Google en I/O 2026
Iteración más rápida y control más preciso para flujos de trabajo diarios
Ventajas prácticas para creadores de imágenes, video y contenido multimodal

Qué reveló Google en I/O 2026

A partir del 20 de mayo de 2026, el polvo apenas se ha asentado en Google I/O 2026, y los anuncios ya se sienten como un paso significativo adelante para las herramientas multimodales. Gemini 3.5 Flash es ahora el modelo predeterminado en toda la app de Gemini y el modo de IA en Búsqueda. Ofrece aproximadamente cuatro veces la velocidad de su predecesor mientras mejora la asistencia de codificación y los comportamientos agénticos, todo a costos de inferencia más bajos. En el mismo evento, Google presentó Gemini Omni, un modelo mundial multimodal capaz de convertir cualquier combinación de texto, imágenes fijas, clips de video y audio en una salida de video coherente. Las demos iniciales mostraron al modelo uniendo un breve prompt de texto con una fotografía de referencia y unos segundos de sonido ambiente en un movimiento sorprendentemente estable. El lanzamiento inmediato de Gemini Omni Flash está dirigido a los suscriptores de Google AI Plus, Pro y Ultra a través de la app principal, Google Flow y YouTube Shorts, con un acceso más amplio a la API esperado en las próximas semanas.

Iteración más rápida y control más preciso para flujos de trabajo diarios

La velocidad y la consistencia importan más a los creadores que las especificaciones destacadas. El aumento de rendimiento de Gemini 3.5 Flash debería reducir el tiempo entre el prompt y una salida usable, lo cual es clave cuando estás refinando una secuencia en múltiples tomas. Las mejoras agénticas también permiten que el modelo planifique tareas simples de varios pasos, como generar un storyboard y luego extender fotogramas seleccionados en clips cortos. El enfoque de entrada mixta de Gemini Omni resulta especialmente útil para flujos de imagen a video. Un creador puede alimentar una imagen fija existente, un video de referencia de estilo y una breve nota de voz que describa el movimiento de cámara, y recibir una salida que respete las tres señales al mismo tiempo. Ese nivel de control era difícil de lograr antes sin una postproducción intensiva.

Ventajas prácticas para creadores de imágenes, video y contenido multimodal

La mejor adherencia a los prompts y la consistencia de personajes son las dos mejoras que los creadores mencionan con más frecuencia en las pruebas iniciales. Cuando el movimiento se mantiene anclado al mismo sujeto en diferentes tomas, el tiempo de edición disminuye notablemente. Los prompts de medios mixtos también abren experimentos creativos más pequeños: insertar un render de producto en una escena de estilo de vida o superponer diálogo sobre metraje generado, sin tener que reconstruir toda la toma desde cero. Honestamente, después de realizar varias pruebas de entrada mixta, encontré los resultados más utilizables de lo que esperaba, aunque todavía lejos de ser perfectos en movimientos de cámara complejos. Avances multimodales como estos ya están moldeando las herramientas de video de próxima generación, incluida la conversación en curso sobre cómo Gemini Omni maneja el material explícito, que exploré con más detalle aquí: Gemini omni nsfw: Por qué el modelo de video de IA de Google bloquea el contenido explícito.

Preguntas que los creadores se están haciendo ahora mismo

¿Cómo accedo a Gemini 3.5 Flash y Gemini Omni hoy?

Gemini 3.5 Flash ya está activo como modelo predeterminado en la app de Gemini y en el modo de IA de Búsqueda. Gemini Omni Flash está disponible de inmediato para los suscriptores de Google AI Plus, Pro y Ultra dentro de la app, Google Flow y YouTube Shorts.

¿Qué técnicas de prompt funcionan mejor con las nuevas funciones multimodales?

Combina una descripción clara del sujeto con una imagen de referencia o un clip corto y, cuando sea posible, una breve señal de audio para el timing o el tono. El modelo responde bien a instrucciones explícitas sobre movimiento de cámara y continuidad de iluminación.

¿En qué se diferencia Gemini 3.5 Flash de las versiones anteriores de Gemini?

La versión 3.5 Flash se centra en velocidad, una planificación agéntica más sólida y menor costo. La asistencia de codificación y el manejo de tareas de varios pasos han mejorado notablemente en comparación con la generación anterior.

¿Cuándo llegarán el acceso a la API y para empresas?

Se espera un acceso más amplio a la API en las próximas semanas, aunque Google aún no ha publicado una fecha exacta para el despliegue empresarial.

Crea tu propio video porno con IA

Convierte cualquier fantasía en un video Full HD realista. Más de 1.000 escenarios, posturas y fetiches — 100% privado.

Empieza a Crear Ahora

🔒 100% Privado 🎬 Full HD hasta 60s 🔥 +1.000 Acciones

Compartir: X Reddit Telegram WhatsApp

Sobre el autor

James Morton

Analista Tecnológico Independiente

Analista tecnológico con base en Londres. Cubre tendencias de la industria AI y AI creativa con una honestidad inusual — incluyendo admitir que realmente disfruta los productos que reseña.