Domande con tag 'unicode'

4
risposte

Perché esattamente PHP non può supportare completamente unicode?

Tutti sanno che PHP ha problemi con Unicode. La versione 6 viene effettivamente abbandonata, a causa delle difficoltà di implementazione Unicode. Ma mi chiedo se qualcuno sa quali sono le ragioni esatte ? Problemi di architettura / design, prob...
posta 26.12.2010 - 14:15
1
risposta

Perché ci sono così tanti spazi e interruzioni di riga in Unicode?

Unicode ha forse 50 spazi \u0009\u000A-\u000D\u0020\u0085\u00A0\u1680\u180E\u2000-\u200A\u2028\u2029\u202F\u205F\u3000][\u0009\u000A-\u000D\u0020\u0085\u00A0\u1680\u180E\u2000-\u200A\u2028\u2029\u202F\u205F\u3000 e 6 interruzioni di riga...
posta 30.01.2011 - 02:12
3
risposte

È possibile scrivere una funzione di inversione della stringa generalizzata che funzioni per tutte le localizzazioni e i tipi di stringa?

Stavo solo guardando la presentazione di Jon Skeet (con Tony the Pony) da Dev-Days. Anche se "scrivere una funzione di inversione delle stringhe" è un'intervista di codifica 101 - Non sono sicuro che sia effettivamente possibile scrivere un...
posta 26.07.2011 - 19:28
2
risposte

È UTF-16 a larghezza fissa o variabile? Perché UTF-8 non ha un problema di ordine dei byte?

È UTF-16 a larghezza fissa o variabile? Ho avuto risultati diversi da diverse fonti: Da link : UTF-16 stores Unicode characters in sixteen-bit chunks. Da link : UTF-16 (16-bit Unicode Transformation Format) is a character e...
posta 23.07.2011 - 01:45
3
risposte

Un valore sentinella Unicode che posso usare?

Sto progettando un formato di file e voglio farlo nel modo giusto. Poiché è un formato binario, il primo byte (o byte) del file dovrebbe non formare caratteri testuali validi (proprio come nell'intestazione del file PNG 1 ). Ciò consente agli...
posta 13.03.2013 - 16:15
8
risposte

A cosa serve aggiungere il supporto dell'identificatore Unicode alle varie implementazioni linguistiche?

Personalmente trovo il codice di lettura pieno di identificativi Unicode che confondono. A mio parere, impedisce anche che il codice venga facilmente mantenuto. Per non parlare di tutti gli sforzi richiesti agli autori di vari traduttori per imp...
posta 13.11.2011 - 18:02
2
risposte

Implementazione efficiente di Trie per stringhe Unicode

Ho cercato un'efficiente implementazione di trie String. Per lo più ho trovato un codice come questo: Implementazione referenziale in Java (per wikipedia) Non mi piacciono queste implementazioni principalmente per due motivi: Support...
posta 05.07.2012 - 13:25
5
risposte

Perché "charset" significa veramente "codifica" nell'uso comune?

Qualcosa che da tempo mi ha confuso è che così tanto software usa i termini "charset" e "encoding" come sinonimi. Quando le persone si riferiscono a una "codifica" unicode, intendono sempre una serie di regole per rappresentare i caratteri un...
posta 07.09.2014 - 15:13
1
risposta

Come si mescolano gli script da sinistra a destra e da destra a sinistra senza che i file sembrino pazzi?

La tua lingua nativa è l'ebraico e stai lavorando in un linguaggio di programmazione come Python 3, che ti consente di inserire l'ebraico nel codice sorgente. Buon per te! Hai un dict : d = {'a': 1} e vuoi sostituire quel a con un...
posta 09.04.2016 - 05:07
1
risposta

Le categorie di iteratore di C ++ impediscono di scrivere un adattatore iteratore UTF-8?

Ho lavorato su un adattatore iteratore UTF-8. Con ciò intendo un adattatore che trasforma un iteratore in una sequenza char o unsigned char in un iteratore in una sequenza char32_t . Il mio lavoro qui è stato ispirato da questo it...
posta 01.04.2017 - 20:43