Lancio di Gemini 3.5 Flash Omni: L’aggiornamento AI multimodale di Google per i creator

James Morton • Pubblicato il 22/05/2026 - 14:59 • Aggiornato 08/06/2026 - 05:43 • 3 min di lettura • 285,990 • 10,976

Vivid 3D render of glowing abstract neural forms merging in cosmic space.

Indice

Cosa ha svelato Google all'I/O 2026
Iterazione più rapida e controllo più stretto per i flussi di lavoro quotidiani
Vantaggi pratici per creator di immagini, video e contenuti multimodali

Cosa ha svelato Google all'I/O 2026

Al 20 maggio 2026, la polvere si è appena posata su Google I/O 2026 e gli annunci sembrano già un passo avanti significativo per gli strumenti multimodali. Gemini 3.5 Flash è ora il modello predefinito nell'app Gemini e nella modalità AI di Search. Offre circa quattro volte la velocità del predecessore, migliorando l'assistenza alla codifica e i comportamenti agentici, il tutto a costi di inferenza inferiori. Durante l'evento Google ha presentato Gemini Omni, un modello del mondo multimodale in grado di trasformare qualsiasi combinazione di testo, immagini fisse, clip video e audio in output video coerenti. Le prime demo hanno mostrato il modello che unisce un breve prompt testuale con una foto di riferimento e qualche secondo di suono ambientale in un movimento sorprendentemente stabile. Il rollout immediato di Gemini Omni Flash è rivolto agli abbonati Google AI Plus, Pro e Ultra tramite l'app principale, Google Flow e YouTube Shorts, con un accesso API più ampio previsto nelle prossime settimane.

Iterazione più rapida e controllo più stretto per i flussi di lavoro quotidiani

Velocità e coerenza contano più delle specifiche da titolo per i creator. Il miglioramento delle prestazioni di Gemini 3.5 Flash dovrebbe ridurre il tempo tra prompt e output utilizzabile, un aspetto cruciale quando si rifinisce una sequenza attraverso più take. Gli aggiornamenti agentici permettono inoltre al modello di pianificare semplici attività multi-step, come generare uno storyboard e poi estendere i fotogrammi selezionati in brevi clip. L'approccio a input misti di Gemini Omni risulta particolarmente utile per le pipeline image-to-video. Un creator può inserire un'immagine fissa esistente, un video di riferimento di stile e una breve nota vocale che descriva il movimento della camera, ottenendo un output che rispetta tutti e tre i segnali contemporaneamente. Questo livello di controllabilità era precedentemente difficile da raggiungere senza una pesante post-produzione.

Vantaggi pratici per creator di immagini, video e contenuti multimodali

Una migliore aderenza ai prompt e la coerenza dei personaggi sono i due miglioramenti che i creator citano più spesso nei primi test. Quando il movimento rimane ancorato allo stesso soggetto attraverso le inquadrature, il tempo di editing si riduce notevolmente. I prompt misti aprono anche a esperimenti creativi più piccoli: inserire un render di prodotto in una scena lifestyle o sovrapporre dialoghi su footage generato, senza ricostruire l'intera inquadratura da zero. Onestamente, dopo aver eseguito alcuni test con input misti ho trovato i risultati più utilizzabili di quanto mi aspettassi, anche se ancora lontani dalla perfezione con movimenti di camera complessi. Progressi multimodali come questi stanno già plasmando gli strumenti video di nuova generazione, inclusa la conversazione in corso sul trattamento di contenuti espliciti da parte di Gemini Omni, che ho esplorato in modo più dettagliato qui: Gemini omni nsfw: Perché il modello video AI di Google blocca i contenuti espliciti.

Domande che i creator si pongono proprio adesso

Come accedo a Gemini 3.5 Flash e Gemini Omni oggi?

Gemini 3.5 Flash è già attivo come modello predefinito nell'app Gemini e nella modalità AI di Search. Gemini Omni Flash è immediatamente disponibile per gli abbonati Google AI Plus, Pro e Ultra all'interno dell'app, di Google Flow e di YouTube Shorts.

Quali tecniche di prompt funzionano meglio con le nuove funzionalità multimodali?

Combina una descrizione chiara del soggetto con un'immagine di riferimento o una clip breve e, ove possibile, un breve segnale audio per timing o tono. Il modello risponde bene a istruzioni esplicite sui movimenti della camera e sulla continuità dell'illuminazione.

In cosa si differenzia Gemini 3.5 Flash dalle versioni precedenti di Gemini?

Il rilascio di 3.5 Flash si concentra su velocità, pianificazione agentica più forte e costi ridotti. L'assistenza alla codifica e la gestione di attività multi-step sono migliorate in modo evidente rispetto alla generazione precedente.

Quando arriveranno l'accesso API e quello enterprise?

Un accesso API più ampio è previsto nelle prossime settimane, anche se Google non ha ancora pubblicato una data esatta per il rollout enterprise.

Crea il tuo video porno AI

Trasforma qualsiasi fantasia in un video Full HD realistico. 1.000+ scenari, posizioni e kink — 100% privato.

Inizia a Creare

🔒 100% Privato 🎬 Full HD fino a 60s 🔥 1.000+ Azioni

Condividi: X Reddit Telegram WhatsApp

L'autore

James Morton

Analista Tech Indipendente

Analista tech con base a Londra. Copre trend dell'industria AI e AI creativa con una onestà insolita — inclusa l'ammissione che in realtà gode dei prodotti che recensisce.