OpenAI vuole addestrare ChatGPT con un'altra Intelligenza Artificiale

Posted by on Saturday, 29 June 2024 in IntraWorld, AI

OpenAI ha recentemente presentato CriticGPT, un nuovo modello progettato per affiancare gli essere umani nell'addestramento dell'intelligenza artificiale. L'obiettivo è creare sistemi più potenti e sicuri migliorando ulteriormente le prestazioni di ChatGPT e altre IA sviluppate dall'azienda.

L'apprendimento per rinforzo con un feedback umano

OpenAI è stata pioniera nell'uso dell'apprendimento per rinforzo con feedback umano (RLHF). Questa tecnica ha giocato un ruolo cruciale nello sviluppo di ChatGPT, utilizzando i feedback degli addestratori umani per migliorare la coerenza, l'affidabilità e la precisione del modello. Tuttavia, il processo presenta alcuni limiti, come la possibilità di feedback incoerenti o difficoltà nel valutare i risultati complessi.

CriticGPT: un'AI per addestrare l'AI

Per superare questi limiti, OpenAI ha sviluppato CriticGPT, un modello basato su GPT-4. CriticGPT è in grado di supportare gli addestratori umani, individuando bug e migliorando la qualità del codice prodotto dall'AI. I test hanno dimostrato che CriticGPT fornisce valutazioni migliori nel 63% dei casi rispetto agli umani. L'azienda spera di estender questo approccio anche ad altri settori in futuro.

Potenziamento dell'AI e sicurezza

La nuova tecnica fa parte degli sforzi di OpenAI per migliorare i modelli linguistici di grandi dimensioni e garantire che si comportino in modo accettabile. L'RLHF combinato con CriticGPT potrebbe rendere i modelli di OpenAI più precisi e affidabili, riducendo gli errori legati all'addestramento umano e consentendo agli esseri umani di contribuire a creare IA più avanzate.

Competizione e innovazione

Nel panorama dell'intelligenza artificiale, OpenAI non è l'unica a cercare innovazioni. Anthropic, fondata da ex dipendenti di OpenAI, ha recentemente annunciato miglioramenti al proprio chatbot, Claude, grazie a nuove tecniche di addestramento. Entrambe le aziende stanno anche sviluppando metodi per ispezionare i modelli di IA e prevenire comportamenti indesiderati.

Verso un futuro più sicuro

OpenAI è determinata a dimostrare che i suoi modelli posso essere potenti e sicuri. Nonostante lo scioglimento di un team dedicato alla valutazione dei rischi a lungo termine, l'azienda continua a lavorare per garantire che i suoi algoritmi si comportino in modo appropriato. CriticGPT rappresenta un passo importante in questa direzione.

Conclusione

I recenti sviluppi mostrano il potenziale di CriticGPT nell'addestramento delle IA, promettendo modelli più intelligenti e sicuri. Cosa ne pensate di questa nuova tecnica? Pensate che l'uso di un'IA per addestrarne un'altra possa davvero migliorare la qualità e la sicurezza dei modelli?
Lasciate un commento con le vostre opinioni!