Google Gemini ora supporta il caricamento di file audio e altri nuovi tipi di file.
Per mesi, l'app Gemini di Google è stata in grado di elaborare immagini, PDF e persino video caricati, ma l'audio era notevolmente assente. Oggi le cose stanno cambiando. Google ha implementato silenziosamente una delle funzionalità più richieste di Gemini: il caricamento di file audio.

Supporto più ampio, più usi
Funzionalità tanto attesa

Il vicepresidente di Google Labs e Gemini Josh Woodward ha confermato, Lancio delle funzionalità su XDescritto come "Richiesta n. 1", l'aggiornamento è ora disponibile su Android, iOS e sul Web e consente di aggiungere MP3, WAV e la maggior parte degli altri formati più diffusi toccando la familiare opzione "Carica file".
Come puoi immaginare, ci sono alcune limitazioni. Per gli utenti Gemini con abbonamento gratuito Carica fino a 10 file alla volta, ma la durata audio totale di questi caricamenti non deve superare i 10 minuti. Se ti abboni ai piani a pagamento di Google (Gemini Advanced tramite AI Pro o AI Ultra), questo limite aumenta significativamente, fino a tre ore.
✅ Papercut risolto: ora puoi caricare qualsiasi file su @GeminiAppInclusa la richiesta n. 1: ora sono supportati i file audio! pic.twitter.com/4Te3xwLC6W
— Josh Woodward (@joshwoodward) 8 settembre 2025
Sebbene non sia illimitato, è relativamente generoso. In confronto, è ancora Caricamento video su Gemini Gli utenti gratuiti hanno un limite di cinque minuti, mentre gli utenti a pagamento hanno un'ora. L'audio raddoppia questo limite gratuito, offrendo al contempo tre volte lo spazio per gli abbonati a pagamento, il che è utile per casi d'uso come la trascrizione, l'analisi degli appunti delle riunioni o l'analisi di podcast.
La mancanza di supporto audio è stata una strana omissione dall'arrivo del caricamento di file all'inizio di quest'anno. Gemini era già in grado di riassumere i video di YouTube e gestire brevi clip che gli venivano inviati, ma registrare un breve memo vocale e chiedere all'IA di elaborarlo non era possibile fino ad ora.
Con questo, Gemini si avvicina sempre di più alle funzionalità offerte da concorrenti come ChatGPT di OpenAI, che supporta il caricamento di audio e testo da mesi. La domanda rimane: 10 minuti saranno sufficienti per l'utente medio? Questa disparità suggerisce che Google voglia che l'elaborazione audio sia un ulteriore incentivo per gli abbonamenti. In ogni caso, se aspettavate di poter inserire una clip di podcast, un segmento di lezione o persino le vostre note vocali casuali in Gemini, ora è la vostra occasione per provarlo.
I commenti sono chiusi.