Utilità della riga di comando commerciale per trascrivere i memo vocali in testo?

5

Sto cercando un'utilità commerciale da riga di comando per trascrivere i miei memo vocali MP3 in file di testo. Il mio flusso di lavoro consiste nel registrare memo vocali durante tutto il giorno e caricare questi memo come file MP3 su Dropbox. Mi piacerebbe convertire questi file MP3 in file TXT equivalenti su base batch. I miei memo vocali vanno da < 1 minuto a un massimo di ~ 10 minuti.

Ho provato a utilizzare Dragon Dictate 4 per Mac e ho trovato questa applicazione un incubo da usare e molto inaffidabile. Sarei felice di acquistare una versione ridotta di questa applicazione che ha solo trascritto file audio ma non riesco a trovare un prodotto del genere sul sito Web Nuance. Sfortunatamente non sono riuscito a far funzionare questa applicazione in modo abbastanza affidabile per cercare un'interfaccia API o di scripting ... e sono un po 'nervoso su questo venditore dopo aver letto di esperienze simili da altri utenti.

Ho anche esaminato i servizi cloud, ma quelli che ho trovato sembrano piuttosto costosi - $ 0.20 / minuto e con limitazioni sulla dimensione massima del file audio che può essere caricato.

    
posta Brett Bond 31.03.2015 - 19:12
fonte

1 risposta

4

Dubito che tu possa trovare un'applicazione commerciale a riga di comando.

Puoi utilizzare meglio alcune librerie open source come link

Per trascrivere un file puoi usare l'ultima versione 5prealpha:

   ffmpeg -i file.mp3 -ar 16000 -ac 1 file.wav
   pocketsphinx_continuous -infile file.wav -logfn /dev/null

che dovrebbe darti una trascrizione automatica. Per aumentare la precisione puoi adattarti alla tua voce.

    
risposta data 02.04.2015 - 10:57
fonte