Questo articolo è stato pubblicato da questo sito
La tecnologia alla base di ChatGpt ha un potenziale che va ben al di là delle semplici conversazioni. Linxi “Jim” Fan, un ricercatore di intelligenza artificiale (Ai) che lavora per Nvidia, ha escogitato con alcuni colleghi un modo per sfruttare il potente modello linguistico Gpt-4 – ovvero il “cervello” alla base del chabot di OpenAi e di un numero crescente di altre applicazioni e servizi – all’interno di Minecraft.
Il team di Nvidia – che comprendeva anche Anima Anandkumar, direttrice dell’apprendimento automatico dell’azienda e professoressa del California Institute of Technology – ha creato un bot chiamato Voyager, che utilizza Gpt-4 per risolvere problemi all’interno del popolare videogioco. Il modello linguistico genera obiettivi che aiutano l’agente a esplorare il gioco, oltre a del codice che migliora l’abilità del bot nel corso del tempo.
Voyager non è in grado di giocare come una persona, ma può leggere direttamente lo stato del gioco tramite un’Api. Il bot potrebbe per esempio vedere una canna da pesca nell’inventario e un fiume nelle vicinanze, quindi usare Gpt-4 per suggerire al giocatore l’obiettivo di pescare per accumulare esperienza. L’obiettivo verrà poi utilizzato per far sì che Gpt-4 generi il codice necessario a far sì che il personaggio lo superi.
La parte più innovativa del progetto è il codice generato da Gpt-4 per aggiungere comportamenti a Voyager. Se il codice suggerito inizialmente non funziona perfettamente, il bot cercherà di perfezionarlo utilizzando i messaggi di errore, i feedback del gioco e la descrizione del codice generato da Gpt-4.
Nel corso del tempo, Voyager costruisce una libreria di comandi che gli consentono di imparare a creare oggetti sempre più complessi ed esplorare nuove parti del gioco. Un grafico creato dai ricercatori mostra le sue capacità rispetto agli altri agenti di Minecraft. Il bot ottiene più del triplo degli oggetti, esplora una distanza pari a oltre il doppio e costruisce strumenti 15 volte più rapidamente di altri agenti Ai. Fan sostiene che l’approccio potrebbe essere migliorato in futuro con l’aggiunta di una modalità che permetta al sistema di incorporare informazioni visive dal gioco.