Che cosa fa aumentare le dimensioni del file PDF durante il salvataggio in Anteprima?

17

Sembra che apportare modifiche, annotazioni o anche solo aprire e salvare un file PDF in Anteprima causerà un aumento significativo delle dimensioni del file. Ho notato che per alcuni libri che ho scansionato ciò accade anche per migliorare il tempo di rendering della pagina.

Qualcuno può far luce su cosa sta succedendo per causare questi cambiamenti? Sono interessato a sincronizzare le annotazioni degli ebook PDF tra Anteprima e iPad (forse GoodReader), ma ciò potrebbe essere troppo poco pratico con file PDF di grandi dimensioni.

    
posta Alex B 01.01.2013 - 18:48
fonte

4 risposte

12

Nel suo romanzo poco conosciuto, PDF Karenina , ha scritto Leo Tolstoy,

Optimally encoded PDF files are all alike; every sub-optimally encoded PDF file is sub-optimally encoded in its own way.

È difficile per chiunque rispondere perché i tuoi file PDF sono più grandi dopo che Anteprima li ha modificati. Un file PDF è costituito da molti diversi tipi di dati: immagini, flussi di contenuti, caratteri, overhead del documento, spazi colore, stati grafici estesi e una tabella di riferimenti incrociati. Proprio come una frase potrebbe essere concisa e un altro verboso, ma entrambi sono validi in inglese e dicono la stessa cosa, così un solo file PDF potrebbe avere un modo più dettagliato di rappresentare lo stesso contenuto di un file PDF più conciso. Dovremmo esaminare i tuoi file PDF esatti. È probabile che siano stati creati da una varietà di diversi software, alcuni consisi, altri meno.

Importa anche la versione di Mac OS X e di Anteprima che stai usando, perché questo determina il software che scrive il nuovo file PDF quando fai un Salva con nome in Anteprima.

Posso, tuttavia, dirti cosa diventa più grande su alcuni dei miei file PDF. Questa storia si applica al mio computer, con Mac OS X 10.5.8 e Apple Preview 4.2 (469.5).

Un file, Giulio.pdf , è un documento di 22 pagine con testo come testo, non immagini scansionate. È largo 461.092 byte. L'ho aperto in Anteprima, ho File ... Salva come ... e l'ho salvato con un nuovo nome di file. Il nuovo file è 724.421 byte, ovvero il 57% più grande.

Ho aperto ciascun file con Adobe Acrobat Professional, versione 8.3.1 per Mac OS. Ho fatto Avanzate ... Ottimizzatore PDF ... Utilizzo dello spazio di controllo ... . Una piccola finestra di dialogo ha fornito una descrizione dettagliata di quanti byte erano dovuti a ciascuna categoria di utilizzo, oltre alla percentuale della dimensione totale del file per la categoria.

L'originale Giulio.pdf ha 390.754 byte (84.75%) dedicati ai flussi di contenuto e zero byte dedicati alle immagini. È nel formato PDF 1.4. Il file salvato da Preview ha 675.846 byte (93,29%) dedicati ai flussi di contenuto, anche zero byte di immagini, ed è nel formato PDF 1.3. L'anteprima ha reso i flussi di contenuti più grandi di 285.092 byte e ciò rappresenta il 73% della differenza di dimensioni tra i due file.

Mi chiedevo se il formato di file PDF 1.3 fosse intrinsecamente meno efficiente per la memorizzazione di questo tipo di file. Ho aperto l'originale Giulio.pdf in Adobe Acrobat Professional 8 e ho fatto Avanzate ... Ottimizzatore PDF ... Compatibile con: Acrobat 3.0 e versioni successive e premuto OK. Ho salvato il file risultante con un nuovo nome. Il file risultante è nel formato PDF 1.3 ed era 452.356 byte o più piccolo dell'originale. I suoi flussi di contenuti sono 375.171 byte (82,94%), una proporzione simile, ma inferiore ai flussi di contenuti del file originale.

Quindi sembra che possiamo concludere che l'app Anteprima su Mac OS X 10.5.8 non è efficiente come alcuni altri creatori di PDF nel creare flussi di contenuti concisi nei file PDF, e la differenza è sufficiente per rappresentare i tre quarti di la differenza di dimensioni in un file PDF senza immagini.

Ho fatto un esperimento simile su form k.pdf , un documento di 1 pagina scansionato su carta. Il file originale è 303.730 byte, di cui 298.197 byte (98,18%) sono immagini. Una copia di questo file creato da Anteprima usando Salva con nome ... è 300.601 byte, o 1% più piccola. Questa differenza di dimensione del file è più che compensata da una categoria di byte "overhead di documento" più piccola nel file creato da Preview.

Quindi sembra che possiamo anche concludere che Anteprima non sempre fa aumentare le dimensioni di un file PDF. Dipende dalla natura del file PDF originale e dalla sua concisione iniziale.

    
risposta data 19.01.2013 - 23:12
fonte
3

So che è abbastanza tardi, ma ho trovato qualcosa che sembra funzionare, almeno se usato inizialmente: ho provato ad usare il filtro Quartz per "Ridurre le dimensioni del file". Sembra funzionare ma non è attivo per impostazione predefinita. Posso selezionarlo in modo specifico tramite il menu Salva con nome (tieni premuto Opzione), ma sono preoccupato del fatto che il suo metodo di default sia il solito nelle immagini automatiche.

Ecco cosa sta succedendo per me e come sono arrivato a questa pagina in primo luogo: Il PDF inizia come un libro di 91MB 900. Aggiungo una singola annotazione e la salvi e il file salta fino a 2,29 GB. Per finire, ci vuole un salvataggio per sempre, soprattutto dal momento che sto salvando su un'unità esterna. Grazie a Dio l'unità è USB 3!

Esiste comunque un modo per estrarre queste annotazioni? Posso annotare ed evidenziare su Goodreader e PDF Expert sul mio iPad. Se Anteprima non può permettermi di farlo sul mio computer, ci sono altre app che lo faranno? Perché non è sufficiente salvare le annotazioni / evidenziamenti, ma non provare a ricomprimere tutte le immagini come sto salvando un JPEG ogni volta. Grazie per l'aiuto!

    
risposta data 27.05.2015 - 23:34
fonte
1

Il problema rimane grave. In Anteprima 7.0 (Mac OS 10.9.5.) Ho generato un pdf usando Acrobat 9.5.5. che ha provocato un file di 5 MB. In Anteprima ho aggiunto esattamente 12 caratteri (usando gli strumenti di modifica). Dopo aver salvato questo file, è baloonato a 14 MB.

Puoi correggerlo aprendo e salvando di nuovo in Acrobat (potrebbe essere necessario utilizzare l'opzione "riduci dimensioni del file").

    
risposta data 08.02.2015 - 18:03
fonte
0

Impossibile aggiungere indizi alla soluzione. Posso aggiungere uno scenario simile (OS X 10.11.3): un PDF scansionato del peso di ~ 800kb è aperto in anteprima, un paio di pagine vuote scansionate sono cancellate, il pdf breve di due pagine risultante è ~ 2,2Mb. "Opzione-Salva con nome" e selezionando il filtro "Riduci dimensioni file" del quarzo comprime il file fino a ... 1,9 Mb.

Il file originale è stato generato da una fotocopiatrice Xerox WC 7830, che nella mia esperienza (rispetto alle precedenti stampanti multifunzione / fotocopiatrici che avevamo) produce PDF scansionati abbastanza ben ottimizzati.

Non vedo alcuna differenza nel file, visivamente; Vorrei indovinare che le immagini della pagina vengano ricompresse in 24 bpp, mentre il file originale è chiaro usando meno profondità del colore, probabilmente 6 bit (è un documento stampato e firmato, solo testo, lo scanner fa un buon lavoro di mantenere lo sfondo bianco bianco puro). Purtroppo, Anteprima non è abbastanza intelligente da rilevare e mantenere questo, e sembra dover ricomprimere l'intero file anche se non sono state apportate modifiche nelle pagine rimanenti (di nuovo, sono state eliminate solo un paio di pagine.

    
risposta data 26.02.2016 - 12:45
fonte

Leggi altre domande sui tag