TextEdit rimuove Byte-Order-Mark (BOM) dai file Unicode / UTF. Come risolvere?

2

Sto lavorando con i file UTF-8, ma TextEdit sembra non supportare completamente il BOM. Quando una distinta base è presente, rende correttamente i caratteri unicode. Tuttavia, dopo aver salvato il file, il BOM viene rimosso, quindi l'apertura del file in TextEdit causa la visualizzazione dei caratteri "errati".

C'è un modo per rimediare a questo? Tieni presente che sto condividendo file con diversi utenti non tecnici, quindi qualsiasi cosa relativa alla riga di comando è fuori questione. Se la soluzione è 'usare un altro editor di testo', questo potrebbe essere accettabile, se è gratuito, e non completamente diverso da TextEdit - cioè, più semplice, meglio è. Ma, idealmente, c'è un modo per correggere TextEdit ...

    
posta Bobby Jack 29.03.2012 - 12:25
fonte

3 risposte

4

TextEdit → Preferenze → Apri e Salva

Imposta"Codifica file di testo normale" su "Unicode (UTF-8)" sia per aprire e salvare i file.

Se non lo risolve già, apri Terminal.app e inserisci quanto segue:

echo "0x08000100:0" > ~/.CFUserTextEncoding

Quindi esci e accedi di nuovo.

Questo risolve l'antica UTF- 8 bug in OS X che si manifestano anche in QuickLook.

Per risolverlo solo per un singolo file piuttosto che per tutti i file (non vedo perché lo faresti, però), basta scrivere l'attributo esteso che TextEdit usa:

xattr -w com.apple.TextEncoding 'UTF-8;134217984' filename.txt

Spero che questo aiuti!

    
risposta data 29.03.2012 - 15:23
fonte
5

Questa non è la soluzione principale che stai cercando, ma TextWrangler è gratuita, gestisce UTF-8 (e molte altre codifiche) molto bene, e non ha troppo ripido una curva di apprendimento, in particolare se stai usando solo funzionalità simili a TextEdit. So che vorresti correggere TextEdit e spero che tu riceva una risposta spiegando come farlo, ma in assenza di una soluzione primaria, questo dovrebbe essere un buon piano di backup.

    
risposta data 29.03.2012 - 12:45
fonte
1

Penso che usare TextWrangler per salvare sempre come "UTF-8 con BOM" sia il modo migliore per assicurarsi che tutti gli altri sistemi vedano i tuoi file come UTF-8. Un'altra opzione sarebbe quella di usare UTF-16, ma ciò è insolito e potrebbe confondere alcuni utenti.

    
risposta data 29.03.2012 - 15:47
fonte

Leggi altre domande sui tag