Applicazioni del riconoscimento vocale per la sottotitolazione di
telefonate e videoconferenze
Introduzione al riconoscimento vocale
Relazione dalla tesi di laurea di Davide Ferrazzi
Davide Ferrazzi, tesista presso il CCR, introduce i concetti di comunicazione fra normo-udenti e audiolesi esplorando le tecnologie a disposizione. Si sofferma particolarmente sul riconoscimento vocale (speech to text) effettuato tramite personal computer: concetti base per lo sviluppo del sistema di sottotitolazione.
Nella relazione sono messi in particolare evidenza il riconoscimento vocale in parlato discreto e in parlato continuo. Nel primo caso (parlato discreto) la tecnologia, ancora oggi in uso per risolvere i problemi legati alla disabilità motoria, permette la dettatura di una singola parola per volta; richiede, cioè, una pausa fra due parole. Nel secondo caso (parlato continuo) permette la dettatura di una frase; la pausa identifica la fine della frase.
Tesi di laurea di Davide Ferrazzi , cap. 4
Filmato: dettatura in parlato discreto, sistema Dragon Dictate ™ 1994