Come ottenere il testo da una pagina Web dalla riga di comando?

3

Sto cercando una riga di comando equivalente all'opzione Get text from webpage in /Applications/Automator.app . L'opzione Get text from webpage è piuttosto auto-esplicativa, ottiene solo il testo, senza tag HTML, CSS, JavaScript, ecc. Da una pagina web. So che posso usare wget o curl ma che mi darà tutti i tag HTML, CSS, JavaScript, ecc. Non l'unica versione di testo della pagina web.

    
posta JBis 12.04.2018 - 01:25
fonte

1 risposta

0

La tua opzione migliore è il comando textutil . Leggi la pagina man, ma qualcosa del tipo:

textutil -convert txt webpage.html

dovrebbe funzionare.

    
risposta data 16.12.2018 - 16:00
fonte

Leggi altre domande sui tag