L'intelligenza Artificiale Ha Imparato A Riconoscere Correttamente Il Parlato Nel Rumore - Visualizzazione Alternativa

L'intelligenza Artificiale Ha Imparato A Riconoscere Correttamente Il Parlato Nel Rumore - Visualizzazione Alternativa
L'intelligenza Artificiale Ha Imparato A Riconoscere Correttamente Il Parlato Nel Rumore - Visualizzazione Alternativa

Video: L'intelligenza Artificiale Ha Imparato A Riconoscere Correttamente Il Parlato Nel Rumore - Visualizzazione Alternativa

Video: L'intelligenza Artificiale Ha Imparato A Riconoscere Correttamente Il Parlato Nel Rumore - Visualizzazione Alternativa
Video: Human learning in the Machine learning era (BROADCAST IN ITALIANO) 2024, Potrebbe
Anonim

Assistenti virtuali e sistemi di riconoscimento vocale hanno imparato a "riconoscere" ciò che una persona dice loro ea seguire i suoi comandi. Ma per il corretto funzionamento degli stessi Siri e Cortana, il rumore estraneo può essere un grosso problema. Gli esperti di Mitsubishi Electric possono aiutare a far fronte a questo difetto tecnico, che ha presentato una nuova tecnologia per separare il discorso di una persona dal rumore generale.

La tecnologia dell'azienda giapponese si chiama Deep Clustering, il cui funzionamento si basa sui principi del machine learning. Per cominciare, l'intelligenza artificiale ha imparato a separare in modo indipendente il discorso di una persona dal flusso generale di vari suoni e rumori. La rete neurale separa i dati audio in ingresso in vari elementi e li analizza separatamente, dopodiché può già elaborare la voce umana. Un lavoro simile si osserva quando due o più interlocutori sono “connessi”.

Durante una dimostrazione della tecnologia di un'azienda giapponese, il sistema è stato in grado di separare con successo il discorso di due persone che pronunciavano la stessa frase in lingue diverse in un microfono. Tutta l'elaborazione è stata eseguita in tempo reale e il ritardo non ha superato i tre secondi. La precisione del riconoscimento era del 90% e quando tre persone hanno iniziato a parlare nel microfono, la percentuale di "hit" è scesa a 80, che è anche un buon risultato. Secondo gli autori del progetto Anthony Vetro e Yohei Okato,

“Al contrario di separare il discorso dai rumori di fondo, separare il discorso di una persona dal rumore della“voce”di persone che parlano contemporaneamente è un compito molto difficile, poiché i suoni delle voci di persone diverse hanno molte peculiarità. Nella maggior parte dei sistemi, il problema della separazione vocale viene risolto installando due o più microfoni, ma nel caso di utilizzo di un solo microfono, solo l'intelligenza artificiale può far fronte al compito della separazione vocale. Questa tecnologia può essere utilizzata ovunque sia richiesta un'elevata precisione del riconoscimento dei messaggi vocali. Ad esempio, nei sistemi di controllo vocale per automobili, ascensori, elettrodomestici e altri dispositivi elettronici.

VLADIMIR KUZNETSOV

Raccomandato: