Disabilita la gestione "legatura" automatica in PDF / Anteprima su El Capitan

4

Potrei aver trovato un bug grave in EC ...

Come studente universitario ho spesso bisogno di copiare e incollare brevi passaggi da documenti PDF in altri documenti (ad esempio per citazioni). In precedenza, su Yosemite, ho semplicemente usato Anteprima per farlo. L'anteprima è eccezionale perché i suoi algoritmi di IA determinano quasi sempre dove sono le interruzioni di paragrafo. Quasi tutti gli altri visualizzatori di file PDF che ho utilizzato si limitano a restituire risultati concreti a ogni interruzione di riga visiva nel PDF.

Su EC, tuttavia, alcuni comuni caratteri "legatura" (cioè due o più caratteri resi insieme, come "Th", "ffi", "ff", "fi", "ft" - questi sono quelli che io " ve trovato finora) finiscono per copiare come spazi vuoti. In altre parole, se ho un PDF contenente testo che legge:

"This is different from those who can afford to pay for college first; such students may find it less difficult by at least fifty percent."

Otterrò questo risultato quando copio e incollo questo testo:

" is is di erent from those who can a ord to pay for college  rst; such students may  nd it less di cult by at least   y percent."

Questo non è chiaramente l'output desiderato!

Quando seleziono lentamente il testo carattere per carattere, posso vedere chiaramente che la selezione si sta spostando contemporaneamente su tutte le lettere della legatura - in altre parole, sta trattando la legatura come se fosse un carattere.

Ho testato il PDF su una macchina da laboratorio a scuola che è ancora in esecuzione Yosemite e non mostrava questo comportamento, quindi questo è sicuramente un bug introdotto in EC.

Esiste un'impostazione forse tramite defaults che posso utilizzare per disabilitare completamente questo comportamento?

(Come nota a margine, ho scoperto questo bug dopo aver trasformato un foglio e avere un professore che mi chiedeva perché le mie citazioni fossero così divertenti ... Non ho corretto le correzioni come avrei dovuto, ma ancora.)

    
posta fdmillion 29.11.2015 - 09:42
fonte

1 risposta

1

Sei sicuro che non si tratti di un semplice errore di sostituzione dei caratteri? In che tipo di carattere è visualizzato il PDF? Hai installato quel font? La macchina da laboratorio è stata installata? Il documento che stai incollando utilizza lo stesso font del PDF sorgente?

Ho eseguito un semplice test utilizzando il tuo testo di esempio, inserito in un documento Word (con legature abilitate), quindi salvato come PDF utilizzando il PDF integrato di Apple o Acrobat Pro.

Il testo originale, tagliato e incollato da Word:
"Questo è diverso da quelli che possono permettersi di pagare prima il college; questi studenti potrebbero trovarlo meno difficile almeno del cinquanta percento. "

Apple PDF, tagliati e incollati da Anteprima:
"Questo è diverso da quelli che possono permettersi di pagare prima il college; tali studenti potrebbero trovarlo meno difficile almeno del 5% ".

Adobe PDF, tagliato e incollato da Anteprima: "Questo è diverso da quelli che possono permettersi di pagare prima il college; questi studenti potrebbero trovarlo meno difficile almeno del 5% ".

Adobe PDF, tagliato e incollato da Acrobat Pro:
"Questo è diverso da quelli che possono permettersi di pagare prima il college; tali studenti potrebbero trovarlo meno di difficile almeno del cinquanta percento. "

Tutti i tentativi sopra riportati sono stati incollati correttamente, ad eccezione della legatura "fty", che differiva nel rendering in base ai metodi di creazione e rendering PDF utilizzati. Probabilmente questo carattere non si è tradotto correttamente in testo semplice perché ho abilitato più di semplici legature di base in Word (facoltativo e discrezionale, ma non storico).

Tutto sommato, non mi sembra altro che una codifica o un errore di sostituzione dei font. Ricordare che un documento PDF avrà tutti i caratteri necessari inclusi nel file stesso, ma quando si incolla, il carattere di destinazione non corrisponderà necessariamente all'origine, specialmente se si sta utilizzando un sistema con un'installazione pulita (ovvero meno font).

    
risposta data 30.11.2015 - 18:58
fonte

Leggi altre domande sui tag