Questo articolo è stato pubblicato da questo sito
Si chiamerà Velvet e sarà un modello tutto italiano di intelligenza artificiale open source, multilingua e multimodale. A svilupparlo saranno Almawave, società tricolore quotata sul mercato Euronext Growth Milan parte del gruppo Almaviva e attiva nel campo dei dati e della tecnologia del momento, e Cineca, il consorzio interuniversitario che ospita per il ministero della Ricerca il supercomputer Leonardo nella rete EuroHpc Le due realtà, che hanno annunciato la propria partnership in una nota, coopereranno per realizzare un modello di linguaggio di grandi dimensioni (Llm) di tipo fondazionale, capace cioè di rappresentare la base per altri modelli di sviluppo successivo.
Velvet opererà innanzitutto con un focus sulla lingua e sui contenuti italiani, ma sarà sviluppato in chiave multilingua, prevedendo i principali idiomi europei. Considerando la presenza e gli obiettivi di crescita di Almawave nei mercati latino americani e in quello africano, il progetto implementerà inoltre il portoghese brasiliano e lo swahili, puntando a un’adozione estesa anche a livello internazionale.
L’infrastruttura di calcolo del Cineca permetterà al modello di essere addestrato anche per gestire la multimodalità e generare quindi non solo testi, ma anche, per esempio, audio e video. In tal modo, esso sarà applicabile per compiti e in contesti diversi e in più settori. Inoltre, nella sua prima versione, Velvet sarà rilasciato nell’ultimo trimestre del 2024 e messo a disposizione del pubblico sulle piattaforme di condivisione del software Open Source, abilitandone anche l’utilizzo su infrastrutture dedicate.
A partire dal prodotto di Almawave e Cineca, sarà poi possibile creare altri modelli verticali, ciascuno finalizzato a soddisfare esigenze diverse. Una trasversalità resa possibile dalle esperienze accumulate negli ultimi dieci anni nel comparto dell’intelligenza artificiale da Almawave in settori come pubblica amministrazione, sicurezza, trasporti, turismo, sanità, educazione, beni culturali, transizione ecologica e finanza.
Dal canto suo, Cineca è forte di 118 enti pubblici tra cui due ministeri e 70 università italiane e gestisce Leonardo, uno dei più avanzati sistemi di calcolo scientifico ad alte prestazioni. Basti pensare che attualmente il supercomputer è sesto nella classifica dei 500 supercalcolatori più potenti del mondo, secondo in Europa.
L’intenzione di Almawave è quella di mantenere Velvet rilevante nel tempo e di renderlo uno strumento dinamico. Anche in questo senso saranno fondamentali i temi di attenzione nella selezione, gestione, qualità e pulizia dei dati per il loro addestramento, costruzione e fruizione, la conformità e la correttezza nelle informazioni trattate, la gestione dei dati trattati dai modelli, la privacy e il presidio dei temi etici di sviluppo. Ma centrali saranno anche quelli culturale, sociale e linguistico.