In che modo i commenti vengono generalmente trattati nei linguaggi di programmazione e nel markup? Sto scrivendo un parser per un linguaggio di markup personalizzato e voglio seguire il principio di sorpresa minima , quindi sto provando a determinare la convenzione generale.
Ad esempio, un commento incorporato in un token 'interferisce' con il token o no? In generale, è qualcosa del tipo:
Sys/* comment */tem.out.println()
valida?
Inoltre, se la lingua è sensibile alle nuove righe e il commento si estende sulla nuova riga, la nuova riga dovrebbe essere considerata o no?
stuff stuff /* this is comment
this is still comment */more stuff
essere trattati come
stuff stuff more stuff
o
stuff stuff
more stuff
So cosa fanno alcuni linguaggi specifici, né sono in cerca di opinioni, ma cerco o meno: c'è un consenso generale che cosa ci si aspetta da un mark up per quanto riguarda token e nuove linee?
Il mio particolare contesto è un markup simile a un wiki.