Immagini realistiche e testo leggibile con gli ultimi modelli di intelligenza artificiale di OpenAI. Provalo gratuitamente.

OpenAI ha introdotto il suo modello 4o in ChatGPT per abilitare la generazione di immagini all'interno dell'ambiente chatbot. Questo aggiornamento elimina la necessità di utilizzare il modello di generazione di immagini Dall-E di OpenAI come entità separata, sebbene Dall-E sia ancora disponibile per chi lo preferisce. L'azienda di intelligenza artificiale ha anche abilitato il suo generatore video Sora AI all'interno di ChatGPT.

Le nuove funzionalità sono attualmente disponibili per gli utenti della versione gratuita di ChatGPT, nonché per gli utenti di ChatGPT Plus, Team e Pro. Saranno disponibili per gli utenti business e education la prossima settimana.

In precedenza, Dall-E 3 era il plugin di generazione di immagini riservato agli abbonati a pagamento di ChatGPT. Chi desidera provare il generatore gratuitamente può farlo tramite la versione base di Microsoft Copilot.

Il modello è stato elogiato come uno dei migliori generatori di immagini disponibili, soprattutto nella sua versione a pagamento. Sebbene sia vantaggioso per tutti gli utenti di ChatGPT poter utilizzare la generazione di immagini integrata nel modello 4o, coloro che utilizzano la versione gratuita di ChatGPT devono essere preparati ad affrontare alcune limitazioni, come ad esempio i limiti di caricamento dei file e di analisi dei dati, come già accennato. CNET.

Tuttavia, ChatGPT trarrà vantaggio dall'avere immagini più realistiche con testo più chiaro dopo che OpenAI ha trascorso un anno ad addestrare GPT-4o dopo il lancio attraverso uno sforzo di formazione chiamato "Apprendimento per rinforzo dal feedback umano" (RLHF), secondo Wall Street Journal.

Dopo aver annunciato GPT-4o nel maggio 2024, OpenAI ha incaricato un team di oltre 100 "addestratori umani" di analizzare il modello alla ricerca di errori di battitura e di errori comuni nelle mani e nei volti, ha dichiarato al giornale il ricercatore principale del progetto, Gabriel Goh.

Il modello GPT-4o aggiungerà anche la possibilità di creare sfondi trasparenti a ChatGPT. Questa funzionalità sarà molto utile per utenti aziendali e creativi, consentendo loro di creare loghi o altre icone, come ha dichiarato al WSJ Jackie Shannon, responsabile dei prodotti multimediali di ChatGPT.

Nonostante i miglioramenti apportati da OpenAI, il modello GPT-4o aggiornato nel suo complesso presenta ancora alcune carenze. Presenta ancora una tendenza alle allucinazioni, un tratto comune nell'intelligenza artificiale che deve ancora essere risolto. Mantenere la coerenza nell'editing rimane una sfida all'interno dell'ambiente ChatGPT; tuttavia, Ho promesso OpenAI con aggiornamenti rapidi, già dalla prossima settimana.

Un altro problema attuale che OpenAI si trova ad affrontare è la questione dell'etica e della legittimità. L'azienda insiste sul fatto che il suo modello è stato addestrato su "dati pubblicamente disponibili", nonché su dati privati di sua proprietà attraverso partnership con marchi come Shutterstock, come ha osservato il WSJ.

Le immagini generate da ChatGPT in base al modello 4o non conterranno filigrane AI. Tuttavia, l'azienda ha sottolineato che le immagini includeranno metadati C2PA che indicano che sono state generate dall'IA. Questo rimane lo standard del settore.

ChatGPT