OpenAI lancia o1-preview: un nuovo livello di modelli di ragionamento per risolvere problemi complessi

xx
2024-11-08
Share :

OpenAI è lieta di annunciare il lancio della serie di modelli di intelligenza artificiale o1-preview, progettati per affrontare problemi complessi prendendosi più tempo per riflettere prima di rispondere. Questi modelli possono ragionare su compiti difficili e risolvere problemi più complessi in scienza, programmazione e matematica rispetto ai modelli precedenti. image.png

Caratteristiche e applicazioni del nuovo modello

I modelli o1-preview sono progettati per spendere più tempo a riflettere sui problemi prima di rispondere, proprio come farebbe un essere umano. Possono affinare i loro processi di pensiero, provare diverse strategie e riconoscere errori grazie a una formazione estesa. Oggi segna il lancio del primo modello di questa serie, con aggiornamenti e miglioramenti regolari previsti per il futuro.

Come funziona il modello

Il team di OpenAI ha addestrato questi modelli per migliorare le loro competenze di problem-solving prendendosi più tempo per affinare le risposte. Durante i test, l'aggiornamento del modello ha mostrato prestazioni paragonabili a quelle degli studenti di dottorato in compiti di riferimento impegnativi in fisica, chimica e biologia. Sorprendentemente, il modello ha eccelso in matematica e programmazione, risolvendo l'83% dei problemi dell'Olimpiade Internazionale di Matematica (IMO) e raggiungendo l'89º percentile nelle competizioni di programmazione di Codeforces. [ Video Game Coding with OpenAI o1]

Limitazioni delle funzionalità

Attualmente, il modello iniziale manca di numerose funzionalità che rendono ChatGPT utile, come la navigazione sul web per ottenere informazioni e il caricamento di file o immagini. Tuttavia, per i compiti di ragionamento complessi, la serie OpenAI o1 rappresenta un avanzamento significativo nelle capacità dell'IA.

Sicurezza

Per garantire la sicurezza e l'allineamento di questi modelli di ragionamento avanzati, OpenAI ha implementato un nuovo approccio alla formazione sulla sicurezza. Questo approccio permette ai modelli di ragionare e aderire alle linee guida di sicurezza in maniera più efficace. In un test difficile di "jailbreaking" (evasione), il modello o1-preview ha ottenuto un punteggio di 84 (su una scala da 0 a 100), rispetto al punteggio di 22 del GPT-4o. Maggiori dettagli sono disponibili nella scheda del sistema e nel post di ricerca di OpenAI.

Per allinearsi alle nuove capacità di questi modelli, OpenAI ha rafforzato la sua governance interna e la collaborazione con le entità federali. Ciò include test rigorosi e valutazioni utilizzando il Framework di Preparazione, i migliori team di test di penetrazione e i processi di revisione a livello di consiglio di amministrazione supervisionati dal Comitato di Sicurezza e Protezione.

OpenAI ha anche formalizzato accordi con gli Istituti di Sicurezza dell'IA di Stati Uniti e Regno Unito, offrendo loro un accesso anticipato a una versione di ricerca di questo modello. Queste partnership stabiliscono un processo di ricerca, valutazione e test dei futuri modelli prima e dopo il loro lancio pubblico.

Pubblico target

Le capacità di ragionamento migliorate dei modelli OpenAI o1 sono particolarmente utili per coloro che affrontano problemi complessi in campi come scienza, programmazione e matematica. Ad esempio, i ricercatori nel settore sanitario possono utilizzare questi modelli per annotare dati di sequenziamento cellulare, i fisici possono generare formule matematiche complesse necessarie per l'ottica quantistica e gli sviluppatori possono costruire ed eseguire flussi di lavoro a più step.

OpenAI o1-mini

OpenAI presenta anche OpenAI o1-mini, un modello di ragionamento più veloce ed economico, progettato specificamente per la programmazione. Il modello o1-mini è l'80% più economico del modello o1-preview, offrendo una soluzione potente ed economica per i compiti che richiedono un forte ragionamento ma non una vasta conoscenza del mondo. image.pngimage.png

Vantaggi di XXAI

XXAI integra perfettamente i modelli GPT-4 e Claude3.5 per soddisfare le diverse esigenze degli utenti. Per soli 9,9 USD al mese, gli utenti possono sfruttare le capacità di questi due modelli di punta, rendendo la tecnologia AI all'avanguardia più accessibile ed economica. Se desideri saperne di più sullo sconto, clicca qui! image.png

Come utilizzare OpenAI o1

A partire da oggi, gli utenti di ChatGPT Plus e Team possono accedere ai modelli o1 in ChatGPT. I modelli o1-preview e o1-mini possono essere selezionati manualmente nel selettore di modelli, con limiti iniziali fissati a 30 messaggi a settimana per o1-preview e 50 per o1-mini. OpenAI sta lavorando per aumentare questi limiti e permettere a ChatGPT di scegliere automaticamente il modello appropriato per ogni richiesta. image.png

Gli utenti di ChatGPT Enterprise ed Edu avranno accesso a entrambi i modelli a partire dalla prossima settimana.

Gli sviluppatori qualificati per il livello di utilizzo dell'API di livello 5 possono iniziare a creare prototipi con entrambi i modelli già da oggi con un limite di 20 RPM. OpenAI sta attivamente lavorando per aumentare questi limiti dopo ulteriori test. L'API di questi modelli attualmente non include chiamate di funzione, streaming, supporto per messaggi di sistema e altre funzionalità. Gli sviluppatori possono consultare la documentazione API per iniziare.

OpenAI prevede anche di offrire l'accesso al modello o1-mini a tutti gli utenti gratuiti di ChatGPT in un prossimo futuro.

Quali sono i prossimi passi?

Il lancio di o1-preview offre un'anteprima anticipata di questi modelli di ragionamento in ChatGPT e nell'API. OpenAI prevede di aggiornare continuamente i modelli e di aggiungere funzionalità come la navigazione sul web, il caricamento di file e immagini per migliorarne l'utilità. Inoltre, lo sviluppo e il lancio di modelli sia nella serie GPT che nella nuova serie OpenAI o1 continueranno.

XXAI seguirà anche da vicino gli aggiornamenti del settore per offrire agli utenti l'esperienza più innovativa. Non perdere l'occasione!