Quale formato di trasformazione Unicode viene rappresentato quando viene scritto solo Unicode?

Question

Quale formato di trasformazione Unicode viene rappresentato quando viene scritto solo Unicode?

#1 da (4 voti)

2

Molti programmi forniranno uno o più dei seguenti formati di codifica dei file: UTF-8 , UTF-16 , UTF-32 e semplicemente Unicode . Come faccio a sapere a che cosa si riferisce il formato di trasformazione Unicode Unicode ? Suppongo che sia correlato a uno dei formati 8/16/32 ma non sono stato in grado di trovarlo sul sito Web Unicode.

unicode character-encoding

posta Govind Rai 02.08.2016 - 19:10

fonte

1 risposta

Leggi altre domande sui tag unicode character-encoding

Il livello di accesso ai dati dovrebbe rispecchiare la configurazione del mio database? Processi asincroni in competizione per l'area di uscita

score 4 · Accepted Answer

Unicode è uno standard che definisce un elenco di caratteri astratti, regole di rendering, punti di codice, regole di composizione e sistemi di codifica. Ad esempio:

il piccolo epsilon greco è il carattere U + 03B5
il piccolo c con una cediglia è il carattere U + 00E7, ma anche il piccolo C U + 0063 combinato con la cediglia U + 0327

UTF-8, UTF-16 e UTF32 sono formati di codifica per caratteri unicode su interi 8,16 o 32 bit. Va aggiunto che quando si guardano i flussi di byte (ad esempio i file), UTF-16 e UTF-32 hanno una variante big endian (BE) e little endian (LE).

Quindi parlare di codifica unicode è fuorviante: non ce n'è uno singolo. Ma c'è un uso comune di questo termine:

su Windows , quando dici UNICODE , si presume che sia la codifica UTF-16. Nell'API di Windows, la codifica unicode predefinita utilizza un wchar_t che viene mappato su un numero intero a 16 bit.
su Linux , la codifica preferita per unicode è UTF-8. Esiste comunque un UTF-8 in tutto il mondo che spiega la motivazione alla base e cerca di promuovere questa pratica.