Ho lavorato alla trascrizione di una serie di conferenze da file audio a file di testo. Ci sono poco più di 20 lezioni e ognuna dura circa un'ora. Usando VLC Player, sono in grado di rallentare le parole dell'altoparlante ad un ritmo che posso tenere il passo con.
Tuttavia, è estremamente lento e richiede così tanta concentrazione che riesco a malapena a superare un terzo di una lezione prima di dover fare una pausa prolungata.
Il pensiero mi era venuto in mente che sarei stato meglio servito usando un qualche tipo di software di riconoscimento vocale, e poi rileggere il risultato generato dal computer.
Probabilmente è una cosa da fare una sola volta, quindi mentre non mi interessa usare software commerciali per fare il lavoro, sarebbe preferibile se non fosse troppo costoso (o gratuito, il free è sempre buono) .
Anche le soluzioni da riga di comando vanno bene (:
Qualche suggerimento?