Qual è il modo giusto per analizzare HTML? [chiuso]

-1

Ho sentito che l'analisi dell'HT utilizzando la via Cthulhu non è molto buona . Ma quali sono i modi giusti per analizzare l'HTML? O è possibile analizzarlo affatto?

    
posta JadedTuna 15.04.2014 - 11:00
fonte

1 risposta

4

Or is it possible to parse it at all?

Alcuni dicono che è possibile, e che persino i browser usano questa funzione per visualizzare pagine web.

what are the right ways to parse HTML?

Fondamentalmente è necessario un parser in grado di esprimere l'idea che un elemento html possa essere composto da altri elementi html.

<div>
  some text 
  <div>
    nested element!!
  </div> <!--a regular expression cannot tell if this closes the first or second div-->
</div>

Questo non può essere fatto con espressioni regolari. Ma puoi farlo con tipi più generici di parser.

vedi link

    
risposta data 15.04.2014 - 11:07
fonte

Leggi altre domande sui tag