📰 Notizie IA

Lancio di Gemini 3.5 Flash Omni: L’aggiornamento AI multimodale di Google per i creator

James Morton James Morton 3 min di lettura 285,990 10,976
Vivid 3D render of glowing abstract neural forms merging in cosmic space.

Indice

  1. Cosa ha svelato Google all'I/O 2026
  2. Iterazione più rapida e controllo più stretto per i flussi di lavoro quotidiani
  3. Vantaggi pratici per creator di immagini, video e contenuti multimodali

Cosa ha svelato Google all'I/O 2026

Al 20 maggio 2026, la polvere si è appena posata su Google I/O 2026 e gli annunci sembrano già un passo avanti significativo per gli strumenti multimodali. Gemini 3.5 Flash è ora il modello predefinito nell'app Gemini e nella modalità AI di Search. Offre circa quattro volte la velocità del predecessore, migliorando l'assistenza alla codifica e i comportamenti agentici, il tutto a costi di inferenza inferiori. Durante l'evento Google ha presentato Gemini Omni, un modello del mondo multimodale in grado di trasformare qualsiasi combinazione di testo, immagini fisse, clip video e audio in output video coerenti. Le prime demo hanno mostrato il modello che unisce un breve prompt testuale con una foto di riferimento e qualche secondo di suono ambientale in un movimento sorprendentemente stabile. Il rollout immediato di Gemini Omni Flash è rivolto agli abbonati Google AI Plus, Pro e Ultra tramite l'app principale, Google Flow e YouTube Shorts, con un accesso API più ampio previsto nelle prossime settimane.

Iterazione più rapida e controllo più stretto per i flussi di lavoro quotidiani

Velocità e coerenza contano più delle specifiche da titolo per i creator. Il miglioramento delle prestazioni di Gemini 3.5 Flash dovrebbe ridurre il tempo tra prompt e output utilizzabile, un aspetto cruciale quando si rifinisce una sequenza attraverso più take. Gli aggiornamenti agentici permettono inoltre al modello di pianificare semplici attività multi-step, come generare uno storyboard e poi estendere i fotogrammi selezionati in brevi clip. L'approccio a input misti di Gemini Omni risulta particolarmente utile per le pipeline image-to-video. Un creator può inserire un'immagine fissa esistente, un video di riferimento di stile e una breve nota vocale che descriva il movimento della camera, ottenendo un output che rispetta tutti e tre i segnali contemporaneamente. Questo livello di controllabilità era precedentemente difficile da raggiungere senza una pesante post-produzione.

Vantaggi pratici per creator di immagini, video e contenuti multimodali

Una migliore aderenza ai prompt e la coerenza dei personaggi sono i due miglioramenti che i creator citano più spesso nei primi test. Quando il movimento rimane ancorato allo stesso soggetto attraverso le inquadrature, il tempo di editing si riduce notevolmente. I prompt misti aprono anche a esperimenti creativi più piccoli: inserire un render di prodotto in una scena lifestyle o sovrapporre dialoghi su footage generato, senza ricostruire l'intera inquadratura da zero. Onestamente, dopo aver eseguito alcuni test con input misti ho trovato i risultati più utilizzabili di quanto mi aspettassi, anche se ancora lontani dalla perfezione con movimenti di camera complessi. Progressi multimodali come questi stanno già plasmando gli strumenti video di nuova generazione, inclusa la conversazione in corso sul trattamento di contenuti espliciti da parte di Gemini Omni, che ho esplorato in modo più dettagliato qui: Gemini omni nsfw: Perché il modello video AI di Google blocca i contenuti espliciti.

Domande che i creator si pongono proprio adesso

Come accedo a Gemini 3.5 Flash e Gemini Omni oggi?

Gemini 3.5 Flash è già attivo come modello predefinito nell'app Gemini e nella modalità AI di Search. Gemini Omni Flash è immediatamente disponibile per gli abbonati Google AI Plus, Pro e Ultra all'interno dell'app, di Google Flow e di YouTube Shorts.

Quali tecniche di prompt funzionano meglio con le nuove funzionalità multimodali?

Combina una descrizione chiara del soggetto con un'immagine di riferimento o una clip breve e, ove possibile, un breve segnale audio per timing o tono. Il modello risponde bene a istruzioni esplicite sui movimenti della camera e sulla continuità dell'illuminazione.

In cosa si differenzia Gemini 3.5 Flash dalle versioni precedenti di Gemini?

Il rilascio di 3.5 Flash si concentra su velocità, pianificazione agentica più forte e costi ridotti. L'assistenza alla codifica e la gestione di attività multi-step sono migliorate in modo evidente rispetto alla generazione precedente.

Quando arriveranno l'accesso API e quello enterprise?

Un accesso API più ampio è previsto nelle prossime settimane, anche se Google non ha ancora pubblicato una data esatta per il rollout enterprise.

Crea il tuo video porno AI

Trasforma qualsiasi fantasia in un video Full HD realistico. 1.000+ scenari, posizioni e kink — 100% privato.

Inizia a Creare
🔒 100% Privato 🎬 Full HD fino a 60s 🔥 1.000+ Azioni
Condividi:

L'autore

James Morton
James Morton

Analista Tech Indipendente

Analista tech con base a Londra. Copre trend dell'industria AI e AI creativa con una onestà insolita — inclusa l'ammissione che in realtà gode dei prodotti che recensisce.

Piano
2
Accedi
Crea

Il tuo video IA è pronto per essere creato

Video lunghi Gemiti e voci Creazioni illimitate Da Immagine a Video

Crea il tuo primo video porno IA

Senza censura · HD 60s · ogni fantasia

Da $8/mese · Non soddisfatto? Rimborso completo, senza domande.

Generazione privata · Fatturazione discreta

o

Continuando, accetti i nostri Termini di Utilizzo e la nostra Politica sulla Privacy.

Da 8 $/mese Fatturazione discreta Annulla in qualsiasi momento
o esplora ogni feticcio