Quali sono le codifiche comunemente confuse che possono risultare in dati di test identici?

2

Sto correggendo il codice che sta usando ASCIIEncoding in alcuni punti e la codifica UTF-8 in altre funzioni.

Poiché non utilizziamo le funzionalità UTF-8, tutti i nostri test unitari sono passati, ma voglio creare una maggiore consapevolezza delle codifiche che producono risultati simili e potrebbero non essere completamente testati.

Non voglio limitare questo a solo UTF-8 vs ASCII, poiché penso che il problema con il codice che gestisce i campi ASN.1 e altri codici funzionino con Base64.

Quindi, quali sono le codifiche comunemente confuse che possono risultare in dati di test identici?

    
posta random65537 30.06.2012 - 20:42
fonte

2 risposte

3

Le codepage di Windows e il supporto ASCII esteso sono virtualmente garantiti per lanciare una curva.

    
risposta data 01.07.2012 - 12:52
fonte
0

Per MIME le seguenti intestazioni possono produrre risultati simili:

  • Tipo di contenuto: testo / plain; charset = us-ascii (testo normale)
  • Tipo di contenuto: testo / plain; charset = UTF-8 (un superset di ASCII)
  • Tipo di contenuto: testo / plain; charset="ISO-8859-2" (un altro superset di ASCII)
  • Tipo di contenuto: testo / arricchito; charset="windows-1252" (se non ci sono codici arricchiti)
risposta data 03.07.2012 - 00:23
fonte

Leggi altre domande sui tag