Upload
others
View
108
Download
0
Embed Size (px)
Citation preview
INTELLIGENZA
ARTIFICIALE E
TECNOLOGIE VOCALI
ENRICO REBOSCIO
1 OTTOBRE 2019
SOCIETÀ COSTITUITA NEL MARZO 2004
FINO A SETTEMBRE 2006 OSPITATA INCUBATORE DI ALTA TECNOLOGIA DEL BIC
DAL 2006 ABBIAMO SEDE IN UN PALAZZO DEI ROLLI DEL CENTRO STORICO
CHI SIAMO
UN PO’ DI STORIA
NATURAL LANGUAGE
SPEECH INDEPENDENT
NATURAL LANGUAGE
SPEECH DEPENDENT
SET BY GRAMMAR
SPEECH INDEPENDENT
SET BY GRAMMAR
SPEECH DEPENDENT
IN PRINCIPIO
FU IL NUMERO
LABORATORI DELLA BELL (1952)
IL SISTEMA RICONOSCE I NUMERI
PRONUNCIATI DA UNA SOLA PERSONA
1.000 PAROLE
HARPY SYSTEM - CARNEGIE MELLON
(1976)
IL SISTEMA RICONOSCE PIÙ DI MILLE
PAROLE PRONUNCIATE DA 5 PERSONE
DIVERSE
SET BY GRAMMAR
SPEECH DEPENDENT
SPEECH
DEPENDENT
DRAGON NATURALLY SPEAKING (1997)
IL PRIMO SISTEMA DI RICONOSCIMENTO DEL PARLATO CONTINUO
PUÒ USARLO UN SOLO UTENTE DOPO CHE IL SISTEMA È STATO ADDESTRATO
NATURAL LANGUAGE
SPEECH DEPENDENT
SET BY GRAMMAR
SPEECH DEPENDENT
MOTORI
SPEECH
INDEPENDENT
VOCON (2001)
È IN GRADO DI RICONOSCERE UN SET
ANCHE MOLTO AMPIO DI PAROLE E
SEMPLICI FRASI PRONUNCIATE DA
CHIUNQUE
NATURAL LANGUAGE
SPEECH DEPENDENT
SET BY GRAMMAR
SPEECH INDEPENDENT
SET BY GRAMMAR
SPEECH DEPENDENT
L’EMPASSE
E
LA SVOLTA
NUMERI
1952
1.000
PAROLE
1976
24 ANNI 21 ANNIPARLATO
CONTINUO
1997
COMANDI
20014 ANNI
PARLATO
CONTINUO AL 98%
2018
49 ANNI
SPEECH API
DI GOOGLE
2016
2 ANNI5 ANNISIRI
20112 ANNI
PRIMI
ESPERIMENTI
2009
9 ANNI
L’INTELLIGENZA
ARTIFICIALE
IL RICONOSCIMENTO VIENE EFFETTUATO DAI PIÙ AVANZATI
ALGORITMI DI RETE NEURALE DI DEEP LEARNING CON
UN'ACCURATEZZA SENZA PRECEDENTI.
IL SISTEMA IMPARA COSTANTEMENTE GRAZIE
ALL’ESPERIENZA DI MILIONI DI UTENTI CHE LO UTILIZZANO
NATURAL LANGUAGE
SPEECH INDEPENDENT
NATURAL LANGUAGE
SPEECH DEPENDENT
SET BY GRAMMAR
SPEECH INDEPENDENT
SET BY GRAMMAR
SPEECH DEPENDENT
SIAMO ARRIVATI?
GRAZIE ALL’INTELLIGENZA ARTIFICIALE POSSIAMO
AFFERMARE CHE LA TECNOLOGIA DI RICONOSCIMENTO
VOCALE HA TERMINATO IL SUO PERCORSO.
RIMANE PERÒ APERTO IL PIÙ GRANDE PROBLEMA:
L’ESTRAZIONE SEMANTICA
FACCIAMO UN
PASSO INDIETRO
GRAMMATICA
Significato1
Significato2
Significato3
Significato4
.
.
.
SignificatoN
OUTPUT
SignificatoX
COSA SUCCEDE
OGGI?
TRASCRIZIONE DEL
PARLATO CONTINUO
Questa è una qualsiasi frase tra
le possibili che esprimono il
SIGNIFICATOX
MA QUAL È IL
SIGNIFICATO?
APPLICAZIONE PER LA
SEGNALAZIONE DI PUNTI DI
INTERESSE
In che stato sei?
IN TEXAS
OGGI SONO ALLEGRO
ESTRAZIONE DEL
SIGNIFICATO
IN UN DOMINIO
TRASCRIZIONE DEL
PARLATO CONTINUO
Questa è una qualsiasi frase tra
le possibili che esprimono il
SIGNIFICATOX
ESTRAZIONE DEL
SIGNIFICATO
SIGNIFICATOX
è l’INTENTO che l’Utente ha
voluto esprimere
PERSONAL
ASSISTANT
GOOGLE ASSISTANT
ALEXA
SIRI
CORTANA
LA VERA SFIDA?
HTTPS://WWW.LINKEDIN.COM/FEED/UPDATE
/URN:LI:UGCPOST:6496682049712201728
RICONOSCIMENTO
DEI RUMORI
AMBIENTALI
ABBIAMO UN DATASET DI DIVERSE MIGLIAIA
DI SUONI AMBIENTALI GIÀ CATEGORIZZATI.
L’OBIETTIVO DI STUDIO È ADDESTRARE UNA
RETE ALLA CLASSIFICAZIONE DI RUMORI
AMBIENTALI A MICROFONO APERTO
CREAZIONE DELL’APPLICAZIONE:
1. NORMALIZZAZIONE DEL DATO
2. ESTRAZIONE DELL’IMPRONTA SONORA
3. CREAZIONE DEL DATABASE DI IMPRONTE SONORE
FUNZIONAMENTO LIVE:
1. RILEVAZIONE DELL’EVENTO SONORO
2. NORMALIZZAZIONE DEL DATO LIVE
3. ESTRAZIONE DELL’IMPRONTA SONORA LIVE
4. CONFRONTO CON IL DATABASE DI IMPRONTE SONORE GENERATO SULLA BASE DEL DATASET
5. I PRINCIPALI PROBLEMI RISCONTRATI SONO RELATIVI ALLA LUNGHEZZA DELL’EVENTO SONORO E ALL’ESTRAZIONE DELL’IMPRONTA SONORA