Di recente, xAI, l'azienda di intelligenza artificiale fondata da Elon Musk, ha presentato il suo ultimo modello di IA, Grok 3. Musk ha affermato che Grok 3 ha migliorato le prestazioni del suo predecessore, Grok 2, di "un ordine di grandezza" e descrive questo modello come un'IA che cerca la "realtà estrema", anche se talvolta questa realtà potrebbe entrare in conflitto con la "correttezza politica".
In ambiti come il ragionamento matematico, la logica scientifica e la generazione di codice, Grok 3 ha superato altri modelli come DeepSeek-v3, GPT-4o e Gemini-2 Pro in diversi test di benchmark. Musk non ha esitato a definire Grok 3 "l'intelligenza artificiale più intelligente della Terra", evidenziando le sue eccezionali capacità in queste aree cruciali.
Secondo xAI, Grok 3 ha superato GPT-4o in vari test importanti, tra cui AIME (valutazione delle prestazioni su problemi matematici) e GPQA (test delle capacità su problemi di fisica, biologia e chimica a livello di dottorato). Inoltre, la versione preliminare di Grok 3 ha ottenuto ottimi risultati anche su Chatbot Arena, una piattaforma collaborativa dove diversi modelli di IA competono e gli utenti votano per le risposte più precise.
Le prestazioni di Grok 3 sono alimentate dal supercomputer Colossus. Colossus, che utilizza 100.000 GPU NVIDIA H100 e ha accumulato 200 milioni di ore GPU di addestramento, ha permesso di accelerare notevolmente il processo di sviluppo e migliorare la precisione del modello. Colossus supera di gran lunga le capacità di Grok 2, consentendo a Grok 3 di elaborare enormi set di dati più velocemente e con maggiore precisione.
Oltre ai miglioramenti hardware, xAI ha anche ottimizzato il software. Con miglioramenti nel processo di addestramento, l'uso di set di dati sintetici, auto-correzione e apprendimento rinforzato, Grok 3 offre prestazioni notevolmente superiori, specialmente quando si affrontano compiti complessi.
Il ciclo di sviluppo di Grok 3 è stato notevolmente ridotto grazie alla potenza del supercomputer Colossus. Colossus è stato costruito in soli otto mesi, utilizzando 100.000 GPU NVIDIA H100 e accumulando 200 milioni di ore GPU di addestramento, consentendo a Grok 3 di elaborare enormi set di dati più rapidamente e migliorando significativamente la precisione del modello.
Oltre agli aggiornamenti hardware, xAI ha anche ottimizzato il software. Grazie al miglioramento del processo di addestramento e all'integrazione di set di dati sintetici, auto-correzione e apprendimento rinforzato, Grok 3 ha ottenuto prestazioni straordinarie nell'affrontare compiti complessi.
Grok 3 presenta due versioni specializzate: Grok 3 Reasoning (Ragionamento) e Grok 3 Mini Reasoning, che operano in modo simile ai modelli di ragionamento come l'o3-mini di OpenAI o il R1 di DeepSeek. Questi modelli eseguono una verifica completa dei fatti prima di fornire una risposta, evitando errori comuni che affliggono i modelli tradizionali.
xAI afferma che Grok 3 Reasoning ha superato la migliore versione di o3-mini (o3-mini high) in numerosi test di benchmark popolari, tra cui un nuovo test matematico chiamato AIME 2025. Gli utenti potranno accedere ai modelli di ragionamento tramite l'app Grok e, quando si trovano di fronte a problemi più complessi, potranno attivare la modalità "Big Brain" per un ragionamento più approfondito e cauto. xAI sottolinea che queste modalità sono particolarmente adatte per problemi di matematica, scienze e programmazione.
Gli utenti abbonati al piano Premium+ sulla piattaforma X saranno i primi a provare Grok 3. Altre funzionalità saranno disponibili tramite un nuovo servizio di abbonamento chiamato SuperGrok. SuperGrok ha un costo di 30 dollari al mese o 300 dollari all'anno e offre l'accesso aggiuntivo ai modelli di ragionamento, alle ricerche DeepSearch e alla generazione illimitata di immagini.
Musk ha anche rivelato che la "Modalità vocale" di Grok sarà disponibile entro la prossima settimana, e nelle prossime settimane Grok 3 e le funzionalità di DeepSearch saranno integrate nell'API aziendale di xAI.
Il mondo dell'intelligenza artificiale sta evolvendo incredibilmente velocemente! Dal lancio del modello R1 di DeepSeek all'inizio dell'anno, fino all'arrivo di Grok 3 e l'annuncio di OpenAI riguardo la prossima uscita di GPT 4.5 e GPT 5, stiamo assistendo a un progresso accelerato. Mentre DeepSeek si concentra su una strategia a basso costo e alto rendimento, Grok 3 adotta un approccio di "grandi investimenti per grandi ritorni", dimostrando che la Legge della Scalabilità è ancora valida, grazie ai suoi 200.000 GPU.
Indipendentemente da ciò, questa è una buona notizia per gli utenti. Siamo entusiasti di vedere le innovazioni e le sorprese che i nuovi modelli di IA porteranno. Dopotutto, chi non vorrebbe essere testimone di come si sta sviluppando questo mondo? Io sono pronto e ansioso di abbracciare il futuro che l'intelligenza artificiale ci porterà!