Perché ci sono così tanti spazi e interruzioni di riga in Unicode?

18

Unicode ha forse 50 spazi

\u0009\u000A-\u000D\u0020\u0085\u00A0\u1680\u180E\u2000-\u200A\u2028\u2029\u202F\u205F\u3000][\u0009\u000A-\u000D\u0020\u0085\u00A0\u1680\u180E\u2000-\u200A\u2028\u2029\u202F\u205F\u3000

e 6 interruzioni di riga

not only CRLF, LF, CR, but also NEL (U+0085), PS (U+2029) and LS (U+2028).

Forse potrei capire la maggior parte degli spazi e PS ("Separatore di paragrafi"), ma a cosa servono "Next Line" e "Line separator"?

Sembra tutto inventato da un comitato molto grande in cui tutti volevano il proprio spazio e ai leader veniva concessa un'interruzione di riga ciascuno. Ma seriamente, come ci si comporta quando il tuo linguaggio di programmazione non lo supporta (o non funziona come ad esempio Java)?

    
posta maaartinus 30.01.2011 - 02:12
fonte

1 risposta

15

Maybe I could understand most of the spaces and PS ("Paragraph separator"), but what are "Next Line" and "Line separator" good for

NEXT LINE (U + 0085) viene spesso usato come carattere di nuova riga sui sistemi EBCDIC (come 0x15). È come CR + LF, ma come un personaggio.

SEPARATORE DI LINEA (U + 2028) e PARAGRAFO SEPARATORE (U + 2029) sono spiegati nella sezione 5.8 di lo standard Unicode , che li descrive come una versione in puro testo di HTML <br> e <p> , per disambiguare queste funzioni di "newline". Ma in pratica, questi personaggi non vengono usati molto.

    
risposta data 30.01.2011 - 06:21
fonte

Leggi altre domande sui tag