Creazione di hyperlink in documenti e messaggi

0

In Svezia l'abbreviazione "t.ex." significa "per esempio" ("fino all'esenzione") ed è estremamente comune. Ogni volta che scrivo che t.ex. in una e-mail o in un messaggio di testo viene contrassegnato come un collegamento ipertestuale cliccabile che danneggia il mio messaggio.

Quanto è difficile abbinare i collegamenti ipertestuali senza ottenere falsi positivi?

Ricordo di aver visto una regex di circa 150 righe per farlo, incluso il protocollo gopher:// . Come mai creare collegamenti ipertestuali è ancora così poco sviluppato? Uso il filtro di django urlize ed è piuttosto restrittivo, probabilmente non si aspetterebbe che T.EX sia un link.

Perché non è molto standardizzato anche se il formato è così vecchio?

    
posta Niklas Rosencrantz 05.05.2016 - 06:57
fonte

1 risposta

2

urlize è restrittivo perché funziona con contenuti che, in sostanza, sono molto diversi rispetto a SMS. L'obiettivo di urlize è di essere restrittivo, perché:

  • Gli sviluppatori di solito includono lo schema da soli,

  • Non saranno molto infastiditi se non lo fanno e urlize considererà che example.com non è un URI valido, mentre http://example.com è.

  • Saranno estremamente delusi dai falsi positivi. Ad esempio, sarebbero probabilmente arrabbiati se Node.js fosse considerato un URI.

Nel mondo degli SMS, le cose sono diverse:

  • Gli utenti finali non scriveranno http:// , perché non ha senso (hai mai scritto http:// su un display da 4,7 pollici su un bus?).

  • Se hanno effettivamente digitato un URI come goo.gl e il destinatario non può fare clic su di esso, copiare l'indirizzo su un display da 4,7 pollici su un bus sarebbe noioso.

  • Ai destinatari non interessa che un testo che non sia un URI venga sottolineato e colorato in blu. Abbandonano la formattazione solo se sanno che questo non è un URI. Questa è una delle differenze tra uomo e macchina. A:

    I'll be late, and b.t.w we'll have pizza tonight.

    molte macchine considererebbero b.t.w un link perché ha un colore diverso o ha un markup <a> attorno ad esso, mentre la maggior parte degli umani rifiuterà la formattazione incoerente, semplicemente perché semanticamente non ha senso.

Quando devi gestire l'input dell'utente, specialmente in condizioni restrittive (schermo tattile da 4,7 pollici su un bus), devi essere più permissivo. Non puoi pretendere che tutti usino il formato (541) 754-3010 per inserire i numeri di telefono, quindi 75 13010 deve essere considerato valido.

BTW, se i collegamenti ipertestuali su "t.ex" ti infastidiscono così tanto, puoi provare a "t". ex. "invece. Sfortunatamente, spreca due caratteri aggiuntivi. La forma "t-ex" può anche essere una soluzione, a seconda della sintassi Sweden.

    
risposta data 05.05.2016 - 13:06
fonte

Leggi altre domande sui tag