Le 5 principali notizie sull'intelligenza artificiale che ti sei perso questa settimana: aggiornamenti di ChatGPT e ultime mosse di Google

Questa settimana ci sono state diverse sorprese da parte di aziende di intelligenza artificiale che non erano sotto i riflettori. Sembra che Gemelli di Google Sulla buona strada per diventare il beniamino dei fan, mentre Grok È in cima alla lista dei chatbot più performanti. Un nuovo modello di intelligenza artificiale in ambito medico aiuta i medici a diagnosticare oltre 1000 malattie, tra cui il cancro.

Nel frattempo, ChatGPT sta adottando misure drastiche per aumentare la sicurezza tra i suoi utenti più giovani, introducendo misure di sicurezza per gli utenti di età inferiore ai 18 anni. Ecco le principali novità sull'intelligenza artificiale che devi conoscere questa settimana.

Gemini è il preferito dal pubblico tra 27 diversi modelli di intelligenza artificiale.

In uno dei più grandi sondaggi pubblici del suo genere, più di 21000 partecipanti negli Stati Uniti e nel Regno Unito hanno valutato 27 diversi modelli di intelligenza artificiale e Gemelli 2.5 Pro In cima alla lista. Lo studio, condotto utilizzando il sistema Humaine di Prolific, ha valutato i modelli in base a criteri quali stile comunicativo, capacità di inferenza, livello di fiducia ed esperienza complessiva dell'utente.

Gemini ha superato i suoi concorrenti, tra cui ChatGPT e Claude, nella maggior parte delle sottocategorie, consolidando la sua posizione come modello di inferenza più avanzato di Google fino ad oggi. ChatGPT si è classificato all'ottavo posto nella classifica generale.

Punti chiave:

Gemini 2.5 Pro si aggiudica il primo posto In un sondaggio d'opinione condotto su 27 modelli negli Stati Uniti e nel Regno Unito.
21,352 persone hanno condiviso Da diversi gruppi demografici in questi risultati.
Criteri di valutazione: Comunicazione, flessibilità, ragionamento, fiducia ed esperienza utente complessiva.
ChatGPT si è classificato ottavo Nel complesso, le uscite di Claude si sono classificate all'11° e al 12° posto.

ChatGPT crea funzionalità specifiche per gli adolescenti

Finalmente, OpenAI lancia Nuove regole di sicurezza per gli adolescentiGli aggiornamenti includono un sistema di previsione dell'età per rilevare gli utenti di età inferiore ai 18 anni, applicando con cautela controlli preventivi se l'età non è nota. Le promesse includono filtri più severi per argomenti sensibili (contenuti sessuali, autolesionismo, ecc.), nonché controlli parentali come orari di blocco e la possibilità di collegare gli account.

Questi cambiamenti sono solo un inizio, ma sollevano domande difficili su come verrà definita l'età, con quale frequenza gli errori influiranno sulla fiducia e se gli adolescenti si sentano al sicuro ad aprirsi se temono di essere osservati o giudicati.

Cosa sapere

Nuova regola per la rilevazione dell'etàOpenAI indirizzerà gli utenti che riterrà abbiano meno di 18 anni a una versione di ChatGPT con regole di sicurezza più severe.
Predefinito per minorenniSe non è possibile confermare l'età, il sistema prende comunque delle precauzioni applicando delle piccole restrizioni.
Fornire strumenti di controllo parentaleI genitori possono connettersi all'account dei propri figli adolescenti, disattivare o limitare funzionalità (come la memoria o la cronologia), impostare orari sicuri (bloccare gli orari) e ricevere avvisi se l'intelligenza artificiale rileva segnali di disagio.
Restrizioni della chat per gli adolescentiSono vietati contenuti sessuali espliciti, chat provocatorie e discussioni su autolesionismo. In casi estremi di rischio imminente, le forze dell'ordine potrebbero essere contattate se i genitori non sono reperibili.

Ora puoi condividere le tue creazioni personalizzate Gemini.

Google sta ampliando la portata di Gemini, offrendo ora agli utenti la possibilità di condividere i propri assistenti personalizzati, le Gemme. Per chi ha più familiarità con ChatGPT, si tratta essenzialmente di Modelli GPT personalizzatiPrima d'ora era Gemelli Gemelli Limitato all'uso personale privato, ora può essere condiviso con la stessa facilità di Google Docs, consentendo a colleghi, studenti e chiunque altro di collaborare con un'intelligenza artificiale progettata su misura, senza doverla costruire da zero.

Questa mossa sottolinea l'impegno di Google nel rendere Gemini una piattaforma più flessibile e intuitiva.

Cosa devi sapere:

Gemme personalizzabili Si tratta di assistenti basati sull'intelligenza artificiale che puoi progettare per compiti specifici, come la programmazione, l'editing o il brainstorming.
Le gemme sono condivise Proprio come quando condividi qualsiasi altra cosa su Google Drive, quando collabori, altri possono visualizzare o modificare la tua Gem.
Ora disponibile per gli abbonati Gemini Advanced, Business ed Enterprise in oltre 150 paesi.

Grok in cima alla lista ARC-AGI

Elon Musk e Grok 4 sembrano essere in testa alla corsa all'intelligenza artificiale, in cima alla lista ARC-AGI, un benchmark che misura il numero di problemi che un'intelligenza artificiale può risolvere e l'efficienza di un modello. Nei test recenti, Grok 4 ha superato concorrenti come ChatGPT e Gemini in questa metrica impegnativa, evidenziando la sua superiore capacità di risolvere problemi del mondo reale e la sua velocità.

Nonostante la sua velocità, l'uso della ricerca web in tempo reale e la straordinaria capacità di gestire complesse richieste di ingegneria, gli utenti nutrono ancora dubbi sull'accuratezza, la moderazione dei contenuti e la parzialità di Grok.

Cosa devi sapere:

ARC-AGI List TopperGrok 4 si posiziona al primo posto, il che significa che risolve più sfide standard di intelligenza artificiale per unità di risorsa rispetto ai concorrenti.
punto di forza: Ricerca web praticamente istantanea, gestione migliorata di attività geometriche e logiche complesse e miglioramenti delle prestazioni rispetto alle versioni precedenti di Grok.
Debolezze e paure
: Problemi di accuratezza dei contenuti (alcune affermazioni errate), problemi di parzialità e la sfida di mantenere moderazione e affidabilità in caso di utilizzo intenso.
Conclusione:Dimostra che efficienza e qualità vengono sempre più premiate nei benchmark dell'IA.

Un nuovo modello di intelligenza artificiale prevede il rischio di contrarre oltre 1000 malattie, tra cui il cancro.

Un nuovo modello di intelligenza artificiale chiamato Delphi-2M rappresenta un salto di qualità nell'intelligenza artificiale in ambito medico. Addestrato su dati sanitari anonimizzati di quasi 2.3 milioni di persone nel Regno Unito e in Danimarca, è in grado di prevedere il rischio di sviluppare oltre 1000 malattie e stimare quando potrebbero verificarsi.

A differenza di altri modelli di intelligenza artificiale, Delphi-2M fornisce un punteggio di rischio per 1000 casi, utilizzando anamnesi patologiche, fattori legati allo stile di vita, età e sesso per simulare traiettorie di salute nel corso di decenni. Il modello può prevedere non solo quale malattia potrebbe manifestarsi, ma anche quando.

Negli esperimenti, il sistema ha raggiunto un'area sotto la curva (AUC) media di 0.76 su centinaia di patologie nei dataset del Regno Unito, sebbene l'accuratezza sia diminuita nelle popolazioni danesi. È importante sottolineare che questo modello non è uno strumento diagnostico e non sostituisce il medico.

Ma lo strumento è promettente come strumento predittivo, utile per monitorare le tendenze generali del rischio, pianificare la prevenzione e mettere in luce il potenziale dell'intelligenza artificiale nella salute personale.

Punti chiave:

enorme set di dati:Formato su circa 2.3 milioni di persone provenienti dalla Biobanca del Regno Unito e dai registri danesi.
Modellazione completa e temporaleUtilizza dati dettagliati (età, sesso, stile di vita, diagnosi precedenti) e prevede sia la malattia successiva che le seguenti: E sì Succederà.
Previsione, non diagnosi:Il suo scopo è quello di guidare la prevenzione, non di sostituire il parere medico.

Conclusione

In una sola settimana, questi aggiornamenti evidenziano un netto cambiamento nel panorama dell'intelligenza artificiale verso l'integrazione nel mondo reale e maggiori progressi.