Intrepido, il sistema di riconoscimento vocale per la giustizia italiana

L’intelligenza artificiale nei tribunali: sistema sviluppato dal CRIL dell’Unisalento permette di identificare con precisione le voci

LECCE – Un nuovo strumento di intelligenza artificiale entra in scena per supportare la giustizia italiana: si chiama Intrepido. Si tratta di un sistema innovativo di riconoscimento vocale sviluppato dal Centro di Ricerca Interdisciplinare sul Linguaggio (CRIL) dell’Università del Salento, guidato dal professor Mirko Grimaldi. Intrepido mira a risolvere una problematica cruciale per l’ambito forense, garantendo maggiore precisione nell’identificazione della voce e supportando magistrati, avvocati e periti nel rispetto dei principi del giusto processo. L’innovazione, frutto del lavoro del professor Grimaldi e del ricercatore Francesco Sigona, è stata pubblicata sulla rivista internazionale Speech Communication, confermando l’importanza della tecnologia nell’analisi delle prove vocali (https://doi.org/10.1016/j.specom.2024.103045).

Una risposta scientifica alle lacune della giustizia

Intrepido risponde a una lacuna normativa significativa: l’assenza del perito fonico riconosciuto dalla legge, figura non prevista dalla recente Riforma Cartabia, che lascia l’identificazione vocale spesso a periti privi di formazione specifica. «Nel sistema attuale», commenta il professor Grimaldi, «la figura del Perito Fonico non è prevista dal legislatore e la Riforma Cartabia non ha colmato la lacuna. L’identificazione del parlante in ambito forense è spesso lasciata al fai da te, assegnata cioè a figure che non hanno nessuna formazione specifica. Per questo, ogni perito si sente libero di usare il metodo che preferisce (raramente basato su presupposti scientifici), e la sorte dell’indagato può finire nelle mani del caso». Intrepido si propone come soluzione a queste carenze, garantendo l’impiego di un metodo scientifico per l’identificazione vocale forense, paragonabile al rigore biometrico delle analisi del DNA.

Professor Mirko Grimaldi Centro di Ricerca Interdisciplinare sul Linguaggio Unisalento

Un metodo biometrico avanzato per identificare la voce

Il principio di funzionamento di Intrepido è simile alla comparazione biometrica, sfruttando una rete neurale avanzata per identificare le caratteristiche fonetiche specifiche della voce dell’indagato e confrontarle con quelle delle registrazioni acquisite durante le indagini. Come nelle analisi genetiche, ogni voce ha caratteristiche uniche, e il sistema riesce a identificare e comparare le tracce vocali in modo scientifico e accurato, offrendo ai tribunali una nuova certezza nell’interpretazione delle prove.

Variabilità vocale e intelligenza artificiale

Un aspetto cruciale che rende unica la voce è la sua variabilità: essa cambia a seconda del tono, della velocità e dell’intensità. Questa variabilità intra-parlante, insieme alle diversità anatomiche, dialettali e socio-demografiche, costituisce una grande sfida. Intrepido è stato quindi progettato per gestire non solo la variabilità naturale della voce, ma anche le variazioni di contesto e ambiente, come i rumori di fondo nelle intercettazioni telefoniche. Questo sistema è in grado di riconoscere le voci anche in presenza di disturbi e interferenze, che rappresentano una delle maggiori sfide nel contesto forense.

Allenamento e prestazioni del sistema: il ruolo della rete SpeechBrain

Intrepido è stato addestrato utilizzando la rete neurale SpeechBrain, uno strumento di riconoscimento vocale sviluppato a livello internazionale e testato su ampie banche dati di voci. Per migliorare le performance, i ricercatori hanno utilizzato registrazioni di oltre 7.000 parlanti, raccolte principalmente da piattaforme come YouTube, con frasi pronunciate in inglese, tedesco, francese e indiano, per un totale di circa 2.000 ore di registrazioni. Il sistema è stato allenato per adattarsi ai rumori del mondo reale: dai suoni di sottofondo alle voci sovrapposte e ai rumori tipici dei canali di trasmissione, rendendo il riconoscimento della voce più accurato in contesti difficili.

Oltre ai dati in altre lingue, Intrepido include una banca dati di voci rappresentative dell’italiano, oltre che di alcune varietà dell’arabo, per aumentare la precisione nel riconoscimento vocale anche nelle realtà multiculturali. La rete SpeechBrain si è rivelata un potente strumento per garantire l’adattabilità del sistema alle sfide dei tribunali italiani, dove la variabilità vocale e la qualità delle intercettazioni possono variare considerevolmente.

Francesco Sigona, ricercatore Cril

Validazione internazionale del sistema: il modello di Morrison e Enzinger

Intrepido è stato sottoposto a un rigoroso processo di validazione per garantire la qualità dei risultati, basato su un modello sviluppato dagli esperti Geoffrey Morrison (Aston University) ed Ewald Enzinger (Stanford Research Institute). Tale modello, riconosciuto a livello internazionale e applicato da Speech Communication in un numero speciale del 2016 (https://www.sciencedirect.com/journal/speech-communication/special-issue/10KTJHC7HNM), ha confermato l’affidabilità di Intrepido rispetto agli altri sistemi in uso, posizionandolo come uno degli strumenti più avanzati per la comparazione forense della voce.

Una nuova era per la giustizia: un sistema affidabile e scientifico

Intrepido apre un nuovo capitolo per la giustizia, offrendo un supporto scientifico in grado di migliorare il processo decisionale nelle aule dei tribunali. «I risultati ottenuti dal sistema che abbiamo sviluppato sono migliori di tutti gli altri attualmente in uso», sottolinea Grimaldi, aggiungendo che con Intrepido «magistrati, avvocati e periti hanno ora uno strumento in più per applicare i principi del giusto processo». Il sistema riduce il margine di errore nell’identificazione vocale, offrendo alla giustizia italiana un metodo sicuro e affidabile per garantire processi equi, dove ogni prova vocale è valutata con la massima accuratezza scientifica.