Vai al contenuto

Italia: l’AI generativa italiana open source per chatbot aziendali

Scopri come ‘Italia’, il primo modello di linguaggio AI generativo in italiano, può rivoluzionare i chatbot aziendali.

Nel panorama dell’intelligenza artificiale, l’Italia fa un passo avanti con ‘Italia’, il primo modello di linguaggio di grandi dimensioni (LLM) addestrato interamente in italiano. Questo progetto, realizzato da iGenius in collaborazione con Cineca, rappresenta una svolta significativa per le aziende e le Pubbliche Amministrazioni italiane che desiderano implementare chatbot avanzati e personalizzati.

Il valore di ‘Italia’ per i chatbot aziendali

La creazione di ‘Italia’ è stata una sfida complessa, ma iGenius e Cineca sono riusciti a sviluppare un modello che comprende tutte le sfumature linguistiche e culturali italiane. Addestrato esclusivamente in italiano, ‘Italia’ è in grado di fornire risposte precise e contestualmente appropriate, rendendolo ideale per applicazioni aziendali e governative. Il modello, denominato Italia 9B, utilizza un’architettura Transformer con 9 miliardi di parametri, una finestra di contesto di 4.096 token e un vocabolario di 50.000 token.

Implementazione per PA e imprese

Le Pubbliche Amministrazioni e le aziende di vari settori, come quello bancario, assicurativo e della moda, possono ora utilizzare ‘Italia’ per creare chatbot su misura. Questo modello open source e gratuito permette di integrare dataset specifici per rispondere alle esigenze particolari di ogni organizzazione. iGenius, pur non guadagnando direttamente da ‘Italia’, ottiene un significativo riconoscimento come pioniera nel campo dell’AI generativa in Italia.

‘Italia’ è stato addestrato su oltre mille miliardi di parole, utilizzando fonti pubbliche, dati sintetici e contenuti di settore forniti da partner commerciali. Questo approccio garantisce che il modello sia conforme alle normative europee sull’Intelligenza Artificiale, rendendolo adatto per settori regolamentati come i servizi finanziari e la Pubblica Amministrazione.

Collaborazioni e futuro sviluppo

Il modello è stato sviluppato in soli cinque mesi grazie alla potenza del supercomputer Leonardo, gestito da Cineca. Inoltre, iGenius ha collaborato con Editoriale Nazionale per utilizzare il loro archivio storico di articoli di stampa, migliorando ulteriormente il modello. Questa collaborazione continuerà per le future versioni di ‘Italia’, che saranno ancora più potenti e versatili.

Per garantire l’integrità etica dei contenuti generati, sono stati sviluppati filtri di sicurezza specifici per la lingua italiana, volti a rimuovere contenuti sensibili e limitare l’esposizione a contenuti coperti da copyright.

Prestazioni e disponibilità

Grazie a un Tokenizer proprietario, ‘Italia’ è in grado di elaborare e generare token in italiano con prestazioni equivalenti a un aumento del 60% della sua finestra di contesto. Questo si traduce in una notevole efficienza in termini di costi e risorse, rendendolo una soluzione ideale per il mondo aziendale. ‘Italia’ è scaricabile dal sito web di iGenius e sarà presto disponibile su piattaforme come Hugging Face.

Un nuovo Rinascimento Digitale

Uljan Sharka, Fondatore e CEO di iGenius, ha dichiarato che ‘Italia’ rappresenta il primo passo verso un nuovo Rinascimento Digitale, in cui le soluzioni di AI sono progettate mettendo al centro le persone. iGenius sta già lavorando a nuove versioni del modello, inclusa una versione multilingua, per estendere ulteriormente le sue capacità.

Alessandra Poggiani, Direttrice Generale di Cineca, ha sottolineato come questo progetto dimostri il ruolo di Cineca come abilitatore dell’innovazione digitale in Italia, confermando la potenza e la versatilità del supercomputer Leonardo.