Vorrei richiamare un'utilità della riga di comando in Mac OS X 10.8 che mi consente di convertire un file di testo salvato nella codifica occidentale standard di Mac OS per Mac con il più generico UTF-8.
Chiamerò l'utilità da un AppleScript che ho creato. AppleScript è estremamente lento quando si lavora con blocchi di testo molto grandi. In quanto tale, voglio eseguire l'analisi e la conversione del testo utilizzando la riga di comando di OS X. Ho trovato uno strumento chiamato "sed", che mi permette di fare l'analisi del testo. Tuttavia, ci sono ancora molti elementi del file che devono essere ripuliti, caratteri che appaiono come garbage se il file è aperto come utf-8 (ad esempio virgolette ed ellissi).
Penso che forzare una conversione della codifica del testo possa aiutare a eliminare tutti i caratteri non utf8 nel file. Tuttavia, non riesco a vedere come "sed" possa facilmente convertire la codifica del testo.
Avrò già salvato il file temp txt, come MacRoman, su disco usando le routine AppleScript incorporate.
Qualcuno di voi ha qualche idea su uno strumento da riga di comando incorporato in grado di convertire la codifica del testo? Riga di comando per le prestazioni e built-in, poiché altri utenti del mio script non avranno necessariamente il set di strumenti appropriato se non è integrato.
Grazie per il tuo aiuto!