Come spiegato qui , utf-8-mac è la versione utf 8 di un testo dopo l'applicazione della normalizzazione Unicode NFD (ad es. I caratteri accentati sono rappresentati dal carattere base più un carattere accento combinato), con alcuni intervalli di punti di codice esclusi dall'operazione di scomposizione.
Ad esempio, il carattere é può essere rappresentato in due modi ugualmente validi in Unicode:
- "\ x {00E9}" - singolo punto di codice, LATIN SMALL LETTER E WITH ACUTE, utf-8 C3 A9, "composed".
- "\ x {0065} \ x {0301}" - due codepoint, LATIN SMALL LETTER E e COMBINING ACUTE ACCENT, utf-8 65 CC 81, "decomposto"
UTF-8-MAC assicurerà che il secondo modulo, decomposto, venga sempre utilizzato.