Pagine trascinate più grandi del documento di origine

2

Ho un documento accademico di 35 pagine in foo.pdf creato usando LaTeX. Il documento completo è 950 KB.

Voglio estrarre le figure e le tabelle alla fine del documento in un file separato, quindi apro il documento in Anteprima e trascino le pagine che mi servono sul desktop. Questo crea un nuovo file, foo (dragged).pdf che è 2,2 MB.

Come possono le ultime 10 pagine di un documento di 35 pagine essere 2,4 volte più grandi del documento originale? OSX aggiunge molti metadati a queste pagine? Considero questa una curiosità più che un problema, ma ancora ...

    
posta gregmacfarlane 13.06.2013 - 21:30
fonte

2 risposte

2

Mac OS non ottimizza i file PDF come di solito fanno Acrobat o altre applicazioni di generazione di PDF. Può anche essere che quando si trascina la pagina sul desktop si stia creando un PDF che è in realtà solo un wrapper per un'immagine bitmap.

Potresti provare a utilizzare "Esporta come ..." facendo clic con il pulsante destro del mouse su una miniatura di una pagina per vedere se questo risulta in file più piccoli. Un'altra scelta potrebbe essere quella di eliminare tutte le pagine che non si desidera conservare e quindi salvare il file.

Ecco una discussione decente sull'ottimizzazione delle dimensioni dei file PDF in Mac OS. link

    
risposta data 13.06.2013 - 23:22
fonte
2

I file PDF sono file di testo con alcuni campi binari al loro interno, quindi dovresti essere in grado di aprire i due file in un editor di testo (o usare più / vi / grep) per ispezionarli. Uno strumento di comparazione dei file potrebbe anche aiutarti a discernere se Anteprima ricodifica le risorse in modo non ottimale.

Automator ha anche alcuni strumenti di elaborazione PDF tra cui compressione, compressione delle immagini e rendering delle pagine come immagini. Vorrei provare ad esportare il PDF risultante da Anteprima e selezionare il filtro Quartz di "ridurre la dimensione del file" per vedere se forse questo ridurrebbe le dimensioni.

Puoi vedere diverse domande correlate in cui altri hanno notato questo effetto in cui le impostazioni standard aumentano le dimensioni di alcuni tipi di contenuti.

Come post-script, un documento di 35 pagine in formato ASCII con un peso di 950K è abbastanza efficiente ma anche di un ordine di grandezza maggiore di alcuni testi di base inclusi nell'intervallo di 60 pagine, anche con illustrazioni su ogni pagina.

Prendi ad esempio questo libro da Project Gutenberg - The Cat and the Mouse di Hartwell James e John R. Neill

  • Le versioni di testo semplice (UTF-8) e HTML sono comprese nell'intervallo di 70 kB
  • La versione ePub è un elegante 45 kB senza immagini, ma si gonfia a 2,8 MB con le immagini.

Se prendo la versione HTML e la ispeziono in Safari, è chiaro che il 75 kB è solo il testo principale / file HTML e non tutte le immagini incluse. Stampare quella pagina in PDF usando Safari (che usa lo stesso motore di rendering di Anteprima) - Ottengo un file da 3,7 MB che può essere compresso con Quartz riduce il filtro delle dimensioni del file a 2,2 MB.

Speriamo che questi esempi ti aiutino a decidere se generare tutte le versioni dei tuoi file in LaTeX o vivere con le librerie per la generazione di PDF su OS X.

    
risposta data 14.06.2013 - 01:49
fonte

Leggi altre domande sui tag