Google ha recentemente annunciato l’introduzione della
Agentic Vision nel modello
Gemini 3 Flash. Questa nuova funzionalità promette di migliorare l’accuratezza delle risposte fornite dall’intelligenza artificiale, basandosi su prove visive concrete. La tecnica mira a superare le limitazioni dei modelli AI generalisti, che tendono a perdersi dettagli essenziali a causa di un’analisi statica delle immagini. Con Agentic Vision, il processo diventa dinamico e permette a
Gemini 3 Flash di esplorare le immagini in modo dettagliato e approfondito.
Il ciclo operativo di Agentic Vision
Il funzionamento di Agentic Vision si basa su un ciclo definito come “Think, Act, Observe” (lett. “Pensa, Agisci, Osserva”). In questa sequenza, il modello analizza la richiesta e l’immagine per sviluppare un piano d’azione. Successivamente, esegue
codice Python per manipolare o analizzare l’immagine, infine, riassicura l’immagine modificata nella sua analisi per produrre una risposta finale più accurata.
Esempi di applicazione innovativa
Google ha fornito diversi esempi concreti per mostrare l’applicazione pratica di Agentic Vision. Tra questi, Gemini 3 Flash può automaticamente
zoomare su immagini per ispezionare dettagli vitali o aggiungere
annotazioni. Inoltre, è in grado di analizzare dati complessi in tabelle, utilizzando il
codice Python per generare rappresentazioni grafiche accurate, eliminando le congetture probabilistiche tipiche dei modelli standard.
Disponibilità e prospettive future
La Agentic Vision è ora disponibile nel modello Gemini 3 Flash tramite l’API di Gemini in
Google AI Studio e
Vertex AI. È prevista la sua integrazione anche nell’app di Gemini per mobile e web. Nel futuro, Google ha pianificato di espandere questa funzionalità ad altri strumenti e modelli di Gemini, con l’intento di automatizzare ulteriormente il comportamento dell’AI per compiti specifici.
Per scoprire tutte le ultime offerte, novità ed errori di prezzo, entra subito nel canale Telegram di Offerte Dal Web