Alibaba supera Meta con i nuovi modelli di intelligenza artificiale Qwen 3

Riepilogo:

  • Il colosso tecnologico cinese Alibaba ha lanciato una famiglia di modelli di intelligenza artificiale Qwen 3 open source. La collezione comprende 8 nuovi modelli.
  • Il modello leader, Qwen3-235B-A22B MoE, è stato addestrato su 235 miliardi di parametri, con 22 miliardi di parametri attivati.
  • Il modello più piccolo, Qwen3-30B-A3B MoE, che ha solo 3 miliardi di parametri attivati, supera di gran lunga le prestazioni del GPT-4o.

Il colosso tecnologico cinese Alibaba ha lanciato otto nuovi modelli di intelligenza artificiale (IA) open source della sua serie Qwen 3. I nuovi modelli Qwen 3 includono due modelli MoE (Mixture of Experts), Qwen3-235B-A22B e Qwen3-30B-A3B. Il modello Qwen3-235B-A22B è il più grande e all'avanguardia, con un totale di 235 miliardi di parametri e 22 miliardi di parametri attivati.

Qwen 3 modelli AI lanciati da Alibaba

Il Qwen3-30B-A3B è un modello MoE più piccolo con un totale di 30 miliardi di parametri e 3 miliardi di parametri attivati. Inoltre, la serie Qwen 3 comprende sei modelli densi: Qwen3-32B, Qwen3-14B, Qwen3-8B, Qwen3-4B, Qwen3-1.7B e Qwen3-0.6B. Questi nuovi modelli Alibaba Qwen 3 AI rafforzano ulteriormente la posizione dell'azienda nel campo dell'intelligenza artificiale.

Tutti i modelli Qwen 3 supportano le modalità di pensiero ibrido, ovvero sono allo stesso tempo modelli di intelligenza artificiale inferenziale e modelli linguistici tradizionali (LLM). In "modalità di pensiero", il modello può dedurre passo dopo passo, mentre in "modalità di non pensiero", il modello fornisce una risposta rapida. Questa caratteristica aumenta la flessibilità di utilizzo del modello in varie applicazioni.

inoltre, supporto I modelli Qwen 3 supportano oltre 119 lingue e dialetti da tutto il mondo. È uno dei modelli multilingue più versatili. Inoltre, Alibaba ha migliorato il supporto del Model Context Protocol (MCP) per i modelli Qwen 3, sbloccando ulteriori funzionalità agentiche. Questo miglioramento consente ai modelli di comprendere meglio il contesto e prendere decisioni più intelligenti.

In termini di prestazioni, il modello Qwen3-235B-A22B più grande offre risultati competitivi in ​​linea con DeepSeek R1 e Grok 3 Beta e Gemelli 2.5 Pro e OpenAI o1. Ciò che trovo interessante è che il modello più piccolo Qwen3-30B-A3B, che ha solo 3 miliardi di parametri attivi, supera le prestazioni di DeepSeek V3 e del modello GPT-4o di OpenAI. Ciò indica un'elevata efficienza delle risorse e la capacità di ottenere prestazioni eccezionali con un modello di dimensioni più ridotte.

Alibaba afferma che i modelli Qwen 3 hanno buoni risultati in programmazione, matematica, scienze e competenze generali. Nel complesso, Qwen 3 rappresenta una famiglia di modelli di intelligenza artificiale avanzati e altamente capaci provenienti dalla Cina. Ora, con l'imminente DeepSeek R2, la Cina è ben posizionata per competere con i laboratori di intelligenza artificiale occidentali. Questo sviluppo riflette i rapidi progressi della Cina nel campo dell'intelligenza artificiale.

I commenti sono chiusi.