L'azione "Combina pagine PDF" di Automator non conserva il raccolto?

0

Sto provando a ritagliare separatamente le pagine pari e dispari del PDF, costruendo in cima alla risposta accettata da Come ritagliare le pagine pari e dispari in modo diverso in un PDF?

Il mio flusso di lavoro di Automator, all'incirca:

  1. automaticamente Extract Odd & Even Pages ; ogni nome file PDF di output è suffisso con "(Even Pages)" o "(Odd Pages)"
  2. interrompi il flusso di lavoro Automator con Ask for Confirmation e ritaglia manualmente ciascuno dei due file PDF di output (utilizzando Rectangular Selection e Crop in Anteprima)
  3. seleziona i due PDF ritagliati usando Get Folder Contents
  4. Combine PDF Pages con Shuffling pages opzione

Il problema è il passaggio 4. che sembra inevitabilmente eliminare qualsiasi Crop dal passaggio 2. Il PDF combinato non ha applicato alcun ritaglio, anche se i due & i PDF di input dispari sono definitivamente tagliati.

Questo comportamento atteso da Combine PDF Pages ? I metadati PDF e le annotazioni sembrano essere abbandonati, anche Crop ?

    
posta Blaz 22.05.2017 - 09:31
fonte

2 risposte

1

C'è un pacchetto chiamato pdfjoin che usa pdflatex per combinare i file pdf. Potresti provare ad unire i tuoi pdf nel modo seguente:

pdfjoin 01.pdf 02.pdf

che combina i file in un unico pdf chiamato 02-combined.pdf , nella directory di lavoro corrente.

Se non hai installato LaTeX, puoi seguire questa guida per farlo.

Queste colture conservate per me quando ho provato. Se riesci a farlo funzionare sul tuo sistema, potresti forse cercare di metterlo insieme in uno script bash.

    
risposta data 22.05.2017 - 15:27
fonte
0

L'anteprima non ritaglia le immagini in modo "distruttivo". (Ti dice tutto quando ritagli un PDF.)

Ci sono quattro diverse 'caselle' usate per descrivere la dimensione della pagina di un PDF. Quando si ritaglia un PDF in Anteprima, si modifica il 'cropBox', ma i dati della pagina intera sono ancora presenti nel 'mediaBox', ed è questo il valore che Automator utilizza per ottenere le pagine PDF.

L'azione Combina pagine utilizza (al centro) uno script python per combinare le pagine. Questo carica ogni pagina in un nuovo oggetto CoreGraphics, che è anche il motivo per cui i metadati e le annotazioni vengono eliminati. Dovrebbe essere possibile creare uno script che utilizza il cropBox al posto di mediaBox e che conserva le annotazioni.

    
risposta data 16.02.2018 - 11:14
fonte

Leggi altre domande sui tag