OpenAI, l'azienda dietro ChatGpt, ha concluso il suo "calendario dell'avvento" tecnologico con un annuncio a sorpresa: il lancio di o3, il nuovo modello di intelligenza artificiale specializzato in matematica e programmazione. Stando ai primi risultati, l'IA supera test specifici usati in campo professionale, come l'Aime, o American Invitational Mathematics Examination, in cui ha ottenuto il 96,7% di risposte corrette, commettendo un solo errore. Come spiega una nota dell'azienda, o3 eccelle anche nella programmazione: con un punteggio di 2727 su Codeforces, dimostrando una padronanza elevata dei principi di sviluppo e codificazione informatica.
Prima di o3, nessun altro modello di intelligenza artificiale era riuscito ad andare oltre il 2% nel test Frontier Math di EpochAI, un vero e proprio esame per le IA. In quest'ultimo, o3 ha risolto il 25,2% dei problemi. Consapevole del potenziale impatto di queste nuove tecnologie, OpenAI ha deciso di adottare un approccio cauto.
L'accesso ai modelli o3 sarà inizialmente limitato ai ricercatori specializzati in sicurezza e protezione informatica. I risultati ottenuti da o3, in particolare nel test Arc-Agi, dove ha triplicato il punteggio del modello precedente raggiungendo l'85% di accuratezza, alimentano le voci secondo cui OpenAI sarebbe vicina allo sviluppo dell'intelligenza artificiale generale, Agi appunto, considerata l'ultimo step verso la realizzazione di modelli in grado di ragionare come l'uomo, anche in termini di creatività.
"Vediamo questo come l'inizio della prossima fase dell'IA, dove i modelli potranno essere utilizzati per svolgere compiti sempre più complessi che richiedono un notevole ragionamento" le parole di OpenAI.
Riproduzione riservata © Copyright ANSA