Sottoinsieme visivamente e chiaramente non ambiguo dell'alfabeto latino?

13

Immagina di dare a qualcuno una cartolina con il codice "5SBDO0".

In alcuni tipi di carattere, la lettera "S" è difficile da distinguere visivamente dal numero cinque, (come con il numero zero e la lettera "O").

Leggendo il codice ad alta voce, potrebbe essere difficile distinguere "B" da "D", che richiede di dire "B come nel ragazzo", "D come in un cane" o utilizzare un " alfabeto fonetico " invece.

Qual è il più grande sottoinsieme di lettere e numeri che, nella maggior parte dei casi, appariranno ambigui e visivamente ambigui quando vengono letti ad alta voce?

Sfondo:

Vogliamo generare una stringa breve in grado di codificare quanti più valori possibili pur rimanendo facile da comunicare.

Immagina di avere una stringa di 6 caratteri, "123456". Nella base 10 questo può codificare 10 ^ 6 valori.

In hex "1B23DF" puoi codificare 16 ^ 6 valori nello stesso numero di caratteri, ma questo può sembrare ambiguo quando viene letto ad alta voce. ("B" vs. "D")

Allo stesso modo per qualsiasi stringa di N caratteri, ottieni (dimensione dell'alfabeto) ^ N valori.

La stringa è limitata a una lunghezza di circa sei caratteri, a causa del desiderio di adattarsi facilmente alla capacità di capacità di memoria di lavoro umana .

Quindi per trovare il massimo numero di valori che possiamo codificare, dobbiamo trovare il più grande insieme di lettere / numeri senza ambiguità. Non c'è motivo per cui non possiamo considerare le lettere GZ, e qualche punteggiatura comune, ma non voglio dover confrontare manualmente a coppie "G suona come A?", "G suona come B?", "Fa Mi sento come C "me stesso. Come sappiamo questo sarebbe O (n ^ 2) lavoro linguistico da fare =) ...

    
posta elliot42 25.03.2012 - 22:44
fonte

4 risposte

15

Dovresti suddividere l'insieme di caratteri alfanumerici in gruppi per somiglianza visiva e scegliere un rappresentante "più iconico" da ciascun gruppo. Questo è in qualche modo soggettivo, sebbene tu possa eseguire test utente su di esso. Le scelte che fai dipendono anche dal fatto che le figure vengano stampate o scritte a mano. Ad esempio:

  • { O , 0 , Q , D }

  • { I , L , 1 }

  • { B , 8 }

  • { Z , 2 }

  • { S , 5 }

  • { 7 , T }

  • { U , V , Y }

Allo stesso modo, suddividere i caratteri secondo la similarità fonetica delle loro pronunce di nomi:

  • { A [ʔeɪ], 8 [ʔeɪ (ʔ / t)]}
    = inizia con [ʔeɪ]

  • { P [pi:], B [bi:], V [vi:], D [di:], T [ti:], E [ʔi:]}
    = stop / fricativo + [i:]

  • { G [ʤi:], C [si:], Z [zi:], 3 [θɹi:]}
    = fricativo / affricato (cluster) + [i:]

  • { M [ɛm], N [ɛn]}
    = [ɛ] + nasale

  • { S [ɛs], F [ɛf], X [ɛks]}
    = [ɛ] + fricativo / affricato

  • { I [ʔaɪ], Y [waɪ], 5 [faɪv], 9 [naɪn]}
    = consonante + [aɪ] + (consonante)

  • { Q [kjʉ:], U [jʉ:], 2 [t (j) ʉ:]}
    = consonante + [(j) ʉ:]

Queste sono, ovviamente, non le uniche partizioni possibili, solo quello che viene in mente al momento. Indipendentemente da ciò, dovrebbero essere sufficienti per iniziare per ulteriori test. Inoltre, questi non sono supportati da alcuna fonte professionale - cito solo i miei sfondi hobbisti in tipografia e fonetica.

    
risposta data 25.03.2012 - 23:14
fonte
3

Potresti usare Mechanical Turk per far sì che le persone reali valutino tutte le 26 ^ 2 coppie di lettere per somiglianza fonetica e visiva. Il vantaggio è che potresti persino ottenere dati per varie lingue native in questo modo.

    
risposta data 26.03.2012 - 09:52
fonte
1

Per l'inglese, soundex e Metaphone algoritmi codificano quali suoni sono ambigui. Soundex è probabilmente troppo semplice, ma Metaphone incorpora alcuni buoni punti. Vuoi la sequenza "OU"? Ciò potrebbe essere pronunciato in molti modi, poiché questa frase si contrae;)

    
risposta data 27.03.2012 - 00:09
fonte
0

La risposta di Jon Purdy sopra sembra più corretta. Per scopi pratici, sto provando z-base-32 , una codifica base32 non standard progettata pensando alla comunicabilità. Sembra funzionale, anche se non ideale - ad es. esplicitamente non si sono concentrati sulla disambiguazione orale.

link

link

    
risposta data 27.03.2012 - 07:50
fonte

Leggi altre domande sui tag