Qual è la differenza e l'uso delle codifiche UTF-8 e UTF-8-MAC in iconv?

0

Quali sono le differenze e l'uso delle codifiche UTF-8 e UTF-8-MAC in iconv?
All'inizio pensavo che fosse la differenza tra \ n e \ r (MAC OS 9).
Ma ho provato iconv -f UTF-8 -t UTF-8-MAC filename > filename2
Il contenuto del file non cambia in visualizzazione esadecimale.

    
posta maP1E bluE 22.12.2018 - 20:55
fonte

1 risposta

2

Come spiegato qui , utf-8-mac è la versione utf 8 di un testo dopo l'applicazione della normalizzazione Unicode NFD (ad es. I caratteri accentati sono rappresentati dal carattere base più un carattere accento combinato), con alcuni intervalli di punti di codice esclusi dall'operazione di scomposizione.

Ad esempio, il carattere é può essere rappresentato in due modi ugualmente validi in Unicode:

  • "\ x {00E9}" - singolo punto di codice, LATIN SMALL LETTER E WITH ACUTE, utf-8 C3 A9, "composed".
  • "\ x {0065} \ x {0301}" - due codepoint, LATIN SMALL LETTER E e COMBINING ACUTE ACCENT, utf-8 65 CC 81, "decomposto"

UTF-8-MAC assicurerà che il secondo modulo, decomposto, venga sempre utilizzato.

    
risposta data 22.12.2018 - 21:57
fonte

Leggi altre domande sui tag