A dicembre Meta ha rilasciato Llama 3.3, lโultima versione della sua famiglia di modelli linguistici. Disponibile solamente nella versione da 70 miliardi di parametri, il modello supporta una finestra di contesto estesa a 128k token e 8 lingue, tra cui lโitaliano. Llama 3.3 rappresenta un significativo passo avanti nella generazione di linguaggio naturale. Come tutti i modelli della famiglia Llama, Llama3.3 รจ ๐๐๐๐ ๐๐๐๐๐๐, disponibile sotto community licence e offre versioni quantizzate.
๐ย Miglioramenti e utilizzi
Il modello integra miglioramenti architetturali come il GQA (๐บ๐๐๐ข๐๐๐-๐๐ข๐๐๐ฆ ๐ด๐ก๐ก๐๐๐ก๐๐๐). ร un modello text-to-text, in grado quindi di gestire solamente dati testuali ed รจ quindi ottimizzato per applicazioni nel ๐๐๐๐๐๐๐ ๐๐๐๐๐๐๐๐ ๐๐๐๐๐๐๐๐๐๐: dallโutilizzo in sistemi RAG, alla generazione di dati sintetici di alta qualitร , allโutilizzo come chatbot.
๐ง Prestazioni del modello
Llama 3.3 รจ stato addestrato su 15 trilioni di token, utilizzando una combinazione di dati pubblici e sintetici. Grazie all’apprendimento supervisionato e al RLHF (๐๐๐๐๐๐๐๐๐๐๐๐๐ ๐๐๐๐๐๐๐๐ ๐๐๐๐ ๐๐๐๐๐ ๐๐๐๐
๐๐๐๐), il modello eccelle in benchmark per il ragionamento logico, la generazione di codice e il ragionamento multilingue.
๐ Sicurezza
Meta, come tutti i grandi player del settore, ha integrato solide strategie di sicurezza per prevenire abusi e mitigare rischi legati a prompt dannosi.
Llama 3.3 รจ stato sottoposto anche a esercizi di red teaming per identificare vulnerabilitร e migliorare la sicurezza dei contenuti generati.
hashtag#Llama3 hashtag#AIInnovation hashtag#NaturalLanguageProcessing
hashtag#MachineLearning
Fonti:
https://lnkd.in/gTBcD6_v
https://lnkd.in/d8GfvX7p
https://lnkd.in/dYJBh7tA
Comments are closed