Barriere linguistiche e Intelligenza Artificiale

Le interazioni vocali svolgono un ruolo chiave nei progressi tecnologici che riguardano la cosiddetta Intelligenza artificiale, in particolare nel caso della comprensione del linguaggio parlato (NLU – natural language understanding), oppure in un campo estremamente attiguo come quello della traduzione linguistica.
La traduzione in lingua online è iniziata negli anni ’90 con due prodotti principali: Babelfish di AltaVista e Systran di Xerox: questi primi strumenti di traduzione web potevano gestire solo brevi parti di testo utilizzando regole statistiche.
Ma più si è andati avanti, più è stato necessario gestire enormi volumi di dati a un ritmo veloce, il che ha portato a un approccio diverso da parte degli strumenti di traduzione linguistica che si sono affermati negli ultimi anni, come Google Translate, probabilmente il più noto, oppure Translator di Microsoft, suo concorrente più significativo.
Gli attuali strumenti di traduzione linguistica AI sfruttano una tecnica chiamata traduzione automatica neurale (NMT – neural machine translation), che sembra usare reti neurali costruite artificialmente, nelle quali in sostanza viene analizzata l’intera frase (l’insieme delle parole presenti) anziché solo le singole parole, rendendo comunque la traduzione più veloce e accurata.
Ma l’apprendimento profondo (deep learning), nonostante tutto il suo fascino percepito, ha ancora molti limiti.
I ricercatori di Google hanno parlato apertamente di alcune di queste limitazioni in un’intervista a Wired Magazine. In particolare, hanno sottolineato che il semplice aumento di scala della rete neurale e l’aggiunta di più dati non significa necessariamente che sia possibile replicare le capacità umane.
Nello stesso articolo, il professore della NYU (Università di New York) Gary Marcus ha descritto l’apprendimento profondo come “avido, fragile, opaco e superficiale”. Per “avidità” Marcus intende che le reti neurali richiedono enormi set di dati per l’addestramento.
Il fattore addestramento è ancora più evidente quando si ha a che fare con esigenze specifiche di un settore, di una professione, oppure con la specifica base di conoscenza di una azienda, grazie alle terminologie usate, tecniche o legate ai prodotti.