I Large Business Model (LAM) stanno rivoluzionando il mondo dell'intelligenza artificiale rispetto ai modelli tradizionali.

L'avvento dei chatbot generativi basati sull'intelligenza artificiale ha dato origine al concetto di "large language model" (LLM), una tecnologia di intelligenza artificiale avanzata che analizza e comprende il linguaggio naturale per generare risposte significative basate sulle query degli utenti. Gli LLM sono caratterizzati dalla capacità di generare contenuti coerenti e simili a quelli umani, dando l'impressione che l'intelligenza artificiale possieda una sorta di "pensiero" autonomo.

Tuttavia, i modelli linguistici non sono l'unica tecnologia che contribuisce al progresso dell'IA. I Large Business Model (LAM) potrebbero rappresentare il passo successivo. Questi modelli si concentrano sul miglioramento delle capacità analitiche e decisionali in contesti pratici, trasformando potenzialmente ambiti come l'automazione e la gestione aziendale. In questo articolo, esploreremo il funzionamento sia dei LLM che dei LAM e il loro crescente impatto sul miglioramento delle applicazioni di IA e sull'ampliamento del suo ambito di applicazione.

I grandi modelli di business (LAM) stanno rivoluzionando il mondo dell'intelligenza artificiale.

Che cos’è un modello di grande business (LAM)?

Un Large Action Model (LAM) è un modello di intelligenza artificiale in grado di comprendere l'input umano ed eseguire l'azione corrispondente, rendendolo in grado di interagire con il mondo in modo simile a quello umano. Si tratta di un approccio leggermente diverso rispetto ai modelli di intelligenza artificiale che si concentrano esclusivamente sulla generazione di risposte. Il termine “grande modello di business” è stato introdotto per la prima volta da Rabbit Inc, sviluppatore di Rabbit R1. Nel video di lancio di Rabbit R1 dell'azienda, si afferma che LAM è un nuovo modello fondamentale che aiuta a spostare l'intelligenza artificiale dalle parole all'azione.

Che cos’è un modello di grande business (LAM)?

I LAM vengono addestrati su ampi set di dati sulle azioni dell'utente; Quindi imparano imitando le azioni umane o attraverso la dimostrazione. Attraverso la demo, il modello LAM può comprendere e navigare nelle interfacce utente di diversi siti Web o applicazioni mobili ed eseguire azioni specifiche in base alle tue istruzioni. Secondo ConiglioLAM può raggiungere questo obiettivo anche se l'interfaccia viene leggermente modificata.

I LAM possono essere considerati un'estensione delle capacità esistenti dei LLM. Mentre gli output generativi di testo o contenuti multimediali nei LLM si basano sull'input dell'utente prevedendo la parola o il token successivo (si pone una domanda e il modello LLM fornisce output di testo o contenuti multimediali), i LAM vanno oltre aggiungendo la possibilità di eseguire azioni complesse per conto dell'utente.

Cosa possono fare i LAM?

I LAM riguardano l'esecuzione di azioni complesse per tuo conto. Tuttavia, il punto cruciale da notare è la capacità di eseguire procedure complesse. Ciò rende i LAM più utili per attività avanzate, ma ciò non significa che non possano eseguire procedure più semplici.

In teoria, ciò significa che potresti, ad esempio, chiedere al modello LAM di fare qualcosa per tuo conto, come ordinare un caffè al tuo bar locale, o una corsa Uber, e persino effettuare una prenotazione di un hotel. Quindi è diverso dall'eseguire semplici attività come chiedere all'Assistente Google, Siri o Alexa di accendere la TV o le luci del soggiorno.

In sostanza, secondo la visione condivisa da Rabbit Inc., il modello LAM è in grado di accedere a un sito web o a un'app pertinente come Uber e di navigare attraverso la sua interfaccia per eseguire un'azione, come richiedere una corsa o annullarne una se si cambia idea.

I LAM supereranno gli LLM, ma non sono (ancora) pronti

Il concetto di LAM è entusiasmante, forse più di quello di LLM. I Large Action Models (LAM) saranno il futuro dopo l’intelligenza artificiale generativa, consentendoci di essere in grado di compensare compiti banali e concentrarci su altre attività appaganti. Tuttavia, per quanto entusiasmante possa sembrare, i LAM non sono ancora pronti.

Il primo prodotto commerciale che prometteva di sfruttare la LAM (Rabbit r1) non ha mantenuto pienamente la promessa di marketing di eseguire azioni per conto dei suoi utenti. Il dispositivo ha fallito così gravemente nel suo punto di forza principale che molte recensioni di prima mano lo hanno descritto come abbastanza inutile.

Peggio ancora, un'indagine condotta dallo YouTuber Coffeezilla, in collaborazione con un gruppo selezionato di ingegneri del software con accesso a parte della base Rabbit r1, ha scoperto che Rabbit utilizzava script Playwright per eseguire azioni invece di LAM. Quindi, invece di una macchina che esegue un modello AI unico, in realtà esegue solo una serie di istruzioni If > then; Ben lontano dal modello LAM promesso.

Se c'è una cosa che puoi imparare dal Rabbit r1, è che sì, la visione c'è. Tuttavia, prima dell'implementazione c'è ancora del lavoro da fare, quindi non entusiasmarti ancora.