Grok contro Gemini in 7 test di generazione di immagini tramite intelligenza artificiale: qual è il migliore?
Ogni generatore di immagini ha i suoi punti di forza.
I generatori di immagini basati sull'intelligenza artificiale si stanno evolvendo rapidamente, diventando più intelligenti, veloci e creativi. Dopo aver testato le capacità di generazione di immagini di ChatGPT-5 e Gemini, ho voluto confrontare le prestazioni di Gemini di Google con Grok, il chatbot "gratuito" di Elon Musk.

In una battaglia di sette round, che includeva richieste fotorealistiche e in stile Pixar, ho testato l'aderenza di ciascun modello alle istruzioni e la capacità di fornire immagini convincenti. Ecco i punti di forza principali di ciascuno e quale IA ha prevalso. Questo confronto ti aiuterà a capire quale modello, Gemini o Grok, è più adatto alle tue esigenze di generazione di immagini IA.
1. Concetto di prodotto iperrealistico

Richiedente: “Crea un'immagine fotorealistica di uno smartphone pieghevole e trasparente esposto su un tavolo di legno da bar, con le luci della città riflesse sulla sua superficie.”
Ha funzionato Grok Per soddisfare questa richiesta, ha creato due fotografie realistiche che includevano tutti i dettagli da me richiesti. Entrambe le versioni apparivano curate e riflettevano fedelmente il concetto.
Il risultato è stato Gemini Buono, ma non perfetto. Lo smartphone trasparente appariva un po' sproporzionato e i riflessi delle luci della città, un elemento chiave dell'affermazione, non erano resi in modo convincente come nel tentativo di Grok.
vincitore: Vince Grok Per generare un'immagine di alta qualità e interpretare al meglio il prompt. In questo test di generazione di immagini tramite intelligenza artificiale, Grok ha ottenuto risultati nettamente superiori.
2. Disegnare personaggi con emozioni

Richiedente: “Disegna un'illustrazione in stile fumetto di un giovane astronauta che si rende conto di aver dimenticato il casco su Marte, con un'espressione esagerata, colori vivaci e umorismo da cartone animato.”
Produrre Grok Due immagini di quelli che sembrano essere astronauti sorpresi, entrambi con il casco. Poiché le immagini sono così vicine tra loro, è difficile interpretarle in modo specifico e la "dimenticanza" non appare molto chiara.
Produrre Gemini Questa immagine raffigura un astronauta smemorato. Il fumetto illustra meglio il motivo del disagio dell'astronauta, anche se l'immagine sarebbe stata migliore se l'astronauta non avesse indossato il casco. Lo sfondo e il design generale sono chiari.
Vincitore: Gemelli Vince chi segue più attentamente le istruzioni e realizza un'immagine più comica.
3. Reinventare la storia

Richiedente: “Disegna un dipinto in stile rinascimentale di Cleopatra che tiene in mano uno smartphone moderno, nello stile di Leonardo da Vinci.”
Produrre Grok Questa immagine sembra essere la fotografia di una donna moderna che indossa abiti in stile rinascimentale e tiene in mano uno smartphone. Il dipinto sembra più un selfie ed è molto moderno.
focalizzare Gemini Dal punto di vista artistico, il dipinto assomigliava più a un dipinto rinascimentale e alla stessa Cleopatra, piuttosto che a una semplice donna moderna nel suo costume.
Vincitore: Gemelli Vince per la migliore interpretazione della richiesta e per la migliore accuratezza storica.
4. Scena di folla complessa

Richiedente: “Crea una foto aerea di Times Square alla vigilia di Capodanno, piena di gente, cartelloni pubblicitari luminosi e coriandoli che cadono nel cielo notturno.”
Grok Sono davvero deluso da questa foto. Entrambe le foto erano brutte, un po' sfocate e non catturavano molto bene la notte di Capodanno a Times Square. Le persone erano troppo distanti tra loro e mancavano altri dettagli che avrebbero potuto suggerire la notte di Capodanno.
Gemini Cattura l'energia e la folla sterminata della notte di Capodanno a Times Square. La foto è chiaramente di New York City e i cartelli contribuiscono a sottolineare l'evento. La folla è gremita, a differenza della foto di Grok.
Vincitore: Gemelli Vince la foto più nitida e precisa della notte di Capodanno a Times Square.
5. Mix surreale

Richiedente: “Immaginate un polpo gigante che gioca a scacchi con Albert Einstein in una camera di vetro sul fondo dell'oceano.”
Viso Grok Difficoltà con questo test. Richiedeva di "pensare" molto più a lungo di qualsiasi altro prompt del test finora. L'immagine era buona, ma non teneva conto del prompt "stanza di vetro".
Piede Gemini Ho scattato subito una foto di quello che sembrava un selfie. La casa di vetro era interessante e realistica. Il polpo era molto più grande di quello di Grok e completava meglio la strana immagine.
Vincitore: Gemelli Vince grazie alla qualità superiore delle immagini e alle indicazioni precise.
6. Chiarezza dell'infografica

Richiesta: “Progetta un'infografica chiara che illustri il ciclo vitale di una farfalla, etichettando le fasi, utilizzando frecce e icone piatte con il minor numero di colori possibile.”
È stato un tentativo Grok Creare un grafico che fosse sia di successo che di insuccesso. La prima versione era troppo elaborata, con una farfalla in più che distraeva dall'importanza del ciclo di vita. La seconda versione era più vicina all'affermazione, ma mancava di precisione nei dettagli del ciclo.
Gemini Fornire un'immagine chiara che raffiguri accuratamente il ciclo vitale di una farfalla, con etichette chiare, pochi colori e facili da leggere.
Vincitore: Gemelli Vince perché ha completato la richiesta al primo tentativo. L'immagine è accurata e pronta per essere visualizzata.
7. Mantieni la coerenza nelle immagini del profilo stilizzate.

Richiedente: “Crea un modello 3D in stile Pixar di un giornalista quarantenne con i capelli biondi che tiene in mano un taccuino, quindi crea 40 varianti con abiti diversi.”
Grok Ha completamente tralasciato la richiesta di "stile Pixar" in questo prompt, così come la parte sugli "abiti diversi". Ha creato tre acconciature diverse, il che è un suo merito.
Gemini Distruggi il giornalista in stile Pixar ma tralascia le tre differenze.
Vincitore: un pareggio Entrambi i robot non hanno seguito le istruzioni. Se dovessi sceglierne uno, direi Gemini per aver azzeccato lo stile e catturato meglio l'atmosfera del giornalista.
Vincitore assoluto: Gemelli
Dopo sette comandi, Gemini si è dimostrato il generatore di immagini più affidabile in assoluto. Ha eseguito le istruzioni in modo più coerente e accurato, ha prodotto composizioni più pulite e ha padroneggiato dettagli che Grok spesso trascurava. In altre parole, Gemini eccelleva nella comprensione ed esecuzione di comandi testuali per generare le immagini richieste.
Grok ha sicuramente mostrato sprazzi di creatività e ha ottenuto un netto successo in termini di fotorealismo, ma spesso ha inciampato in precisione e si è discostato dalla norma. Se si desiderano risultati sperimentali e non convenzionali, Grok ha i suoi momenti. Ma per l'uso quotidiano, dove chiarezza, precisione e raffinatezza sono fondamentali, Gemini è il generatore di immagini AI di cui mi fido per portare a termine il lavoro. In breve, Gemini è la scelta migliore per gli utenti che cercano risultati coerenti e di alta qualità in una varietà di scenari.
Hai provato Grok? E Gemini? Qual è il tuo preferito? Fammelo sapere nei commenti.
I commenti sono chiusi.