Esiste una notazione Unicode decimale accettata per un pubblico tecnico?

1

Quando scrivi per un pubblico tecnico, ci sono vari modi per digitare le rappresentazioni Unicode, ma sembrano tutti esadecimali:

  • \uFFFF - Da C # / stringhe Java
  • \U0000FFFF - Da C # / stringhe Java

Tuttavia, Unicode può anche essere specificato in decimale e può essere inserito in entrambi i modi nelle entità XML:

  • Esadecimale: 
  • Decimale: 

Anche se potrei (tipo) usare \u65535 , questo rende qualcosa che è già definito come esadecimamente specifico e lo abusa, e potrebbe anche causare problemi - è \u1111 decimale o esadecimale?

Quindi - ci sono linguaggi di programmazione che consentono metodi simili per denotare i characatec Unicode in base al decimale, o convenzioni di stenografia comuni per specificare Unicode in notazione decimale per i segmenti di pubblico tecnico?

    
posta Ehryk 14.03.2015 - 06:15
fonte

2 risposte

4

Non esiste una notazione decimale comunemente accettata per i codepoint Unicode.

I codepoint Unicode sono quasi universalmente rappresentati in esadecimale. L'unica eccezione di cui sono a conoscenza è l'uso dei riferimenti numerici dei caratteri (NCR) nelle lingue derivate da SGML ( eg , HTML e XML), che può assumere una delle due forme: &#nnn; in decimale o &#xnnn; in esadecimale.

In altri contesti, alcune lingue hanno tentato di mescolare diverse basi numeriche - l'esempio più noto è l'uso di C di nnn per decimale, 0nnn per ottale e 0xnnn per esadecimale. Anche con questo ben noto utilizzo, si innesca all'inizio dei programmatori C per tutto il tempo in cui 012 e 12 sono numeri diversi.

    
risposta data 16.03.2015 - 02:28
fonte
0

Fin qui ci sono alcuni modi in cui Unicode decimale può essere specificato abbastanza da trasmettere il significato a chiunque lo cerchi:

  • Notazione entità XML: &#nnn;
  • Carattere largo C / C ++: wchar_t(nnn)
  • Carattere nazionale SQL: NCHAR(nnn) (disponibile in MSSQL, MySQL, Oracle)
  • Notazione ALT di Windows: ALT+nnn (sebbene possa essere facilmente confuso con la versione esadecimale con il tasto più, ALT++01bd )

Sono interessato a qualsiasi altro da aggiungere a questa lista.

    
risposta data 16.03.2015 - 19:11
fonte

Leggi altre domande sui tag