In arrivo il motore di riconoscimento vocale di Facebook?

Si sapeva da tempo che gli sviluppatori di Facebook fossero al lavoro per creare uno specifico motore di riconoscimento vocale da utilizzare sulla piattaforma.

Dall’inizio di questo anno, poi, dal loro dipartimento di ricerca erano state fatto offerte in denaro per raccogliere a livello mondiale registrazioni vocali in diverse lingue.

Adesso la notizia è ufficiale: hanno sviluppato quello che sostengono sia il più grande modello di riconoscimento vocale automatico (ASR) nel suo genere, un modello che ha imparato a comprendere le parole in 51 lingue dopo essersi allenato su oltre 16.000 ore di registrazioni vocali.

In un articolo pubblicato sul server di prestampa Arxiv.org, i coautori affermano che il sistema, che contiene circa un miliardo di parametri, migliora le prestazioni di riconoscimento vocale fino al 28,8% rispetto ai valori di riferimento medi attuali.

Progettare un singolo modello per riconoscere il parlato in più lingue potrebbe essere rivoluzionario. Semplifica, per prima cosa, la linea di produzione del backend nelle tecnologie vocali e gli studi hanno inoltre dimostrato che la formazione di modelli multilingue su lingue dello stesso gruppo può ridurre il tasso di errore globale delle parole (WER – Worl Error Rate).

#MulticanalitàVocale #Voicebot #chatbot