Come convertire un file HTML con immagini di riferimento sulla riga di comando in un webarchive?

2

Sotto macOS voglio convertire i file HTML con le immagini di riferimento sulla riga di comando / programmaticamente su webarchives .

Dato un file di esempio sample.html contenente:

<html><body>
<h1>File with resource</h1>
<p>This file shows text and references an image.</p>
<img src="sample.jpg" />
</body></html>

e un'immagine sample.jpg nella stessa directory, posso visualizzare il file html in qualsiasi browser ed è renderizzato con l'immagine. Per convertire in un webarchive ho provato:

textutil -convert webarchive sample.html

ma il risultante sample.webarchive non, se aperto in Safari, esegue il rendering dell'immagine, anche se contiene (vedi commenti).

Come posso eseguire correttamente la conversione dalla riga di comando, in modo che il risultato contenga e esegua il rendering dell'immagine? Dopo tutto questo è ciò che i Webarchives sono per!

    
posta halloleo 03.08.2017 - 09:20
fonte

2 risposte

1

Utilizza lo strumento webarchiver (che puoi installare tramite brew install webarchiver ):

webarchiver -url sample.html -output sample.webarchive

Il webarchive prodotto contiene l'immagine e Safari mostra l'immagine quando visualizza il webarchive.

    
risposta data 23.09.2017 - 03:57
fonte
-2

Penso che la linea di comando non sia a conoscenza di alcuna immagine inclusa.

Ho testato una semplice pagina Web con immagini + testo e l'ho aperta con Safari.

Se scegli File - > Salva come ... 'webarchive' puoi vedere nell'archivio Web creato che l'immagine viene aggiunta alla fine del file.

È abbastanza ovvio che Safari utilizza alcune funzioni di Swift / Objective-C per implementare l'immagine.

Se decidi di ottenere l'html e di avere l'immagine come riferimento, sembra ignorare l'immagine e produrre solo il testo (tramite textutil).

Non mi affiderei ai webarchives quando scaricano pagine web - invece uso wget o curl o scrapers come scrapy / beautifulSoup e li scarico.

So che è comodo avere 1 file, ma non è il modo migliore per salvare immagini e così via, il che rende piuttosto difficile estrarli in seguito.

    
risposta data 03.08.2017 - 11:19
fonte

Leggi altre domande sui tag