Google ha presentato ufficialmente Gemini Omni, una nuova famiglia di modelli generativi AI progettati per “creare qualsiasi cosa” partendo da input multimodali. La piattaforma, annunciata al Google I/O 2026, permette di generare video estremamente realistici.
Le Caratteristiche del Modello
Durante l’evento, Google ha illustrato le capacità avanzate del nuovo sistema AI. Negli anni precedenti, l’azienda aveva sviluppato un “world model”, un modello capace di mantenere un mondo coerente e realistico durante la generazione dei contenuti. In precedenza, Google aveva introdotto modelli come Veo e Nano Banana, focalizzati sulla creazione e modifica di immagini e video tramite testo e input visivi. Gemini Omni unisce queste tecnologie in un sistema multimodale avanzato per la comprensione della realtà.
Funzionalità di Gemini Omni
Attualmente, Omni è progettato principalmente per la generazione video ma viene descritto come un modello in grado di “creare qualsiasi cosa da qualsiasi input”. Combinando testo, immagini, video e audio, Omni genera un video finale coerente. Gli utenti possono poi perfezionare ulteriormente il contenuto attraverso richieste successive.
Accessibilità e Disponibilità
Google ha mostrato video generati con un realistico livello di dettaglio, dalle biglie rotanti a sculture di bolle. A differenza di Genie, disponibile solo per gli abbonati AI Ultra, Google intende rendere Gemini Omni più accessibile. Il modello Gemini Omni Flash è già disponibile agli abbonati ai piani AI Plus e superiori. Inoltre, entro la fine della settimana, sarà accessibile gratuitamente su YouTube tramite YouTube Shorts e YouTube Create.
Sicurezza e Utilizzi Impropri
Data l’estrema realisticità dei contenuti, Google ha introdotto misure di sicurezza per limitare usi impropri. Gli utenti potranno creare un “Avatar” personalizzato per essere utilizzato nei video AI. Al momento, Omni non modifica audio e voce finché Google non riterrà sicura questa funzione. I video generati saranno contrassegnati con SynthID, un sistema di watermark per identificare chiaramente i contenuti creati dall’intelligenza artificiale.












