Umlauts e copia e incolla

4

Ho un problema con copia e incolla di caratteri come "ü". Quando copio e incollo il nome "Gereon Müller" da questo libro link (scegli la scheda download) ricevo il ü scomposto in due caratteri su un Mac. Questo non succede sotto Windows e Linux (xpdf, acroread, sumatra), ma succede su un mac con acroread e con skim. Qualche idea?

Modifica: Questi sono i due caratteri: ü Nel testo puoi vedere un ü, ma in realtà è un u con due punti che sono spostati sulla u. Guarda questo: ẗ (come puoi vedere, ho composto una t con questi due punti). Questo non è un problema per leggere il ü, ma se voglio continuare a lavorare con questo ü ho problemi, dal momento che LaTeX non ama affatto questi personaggi. In emacs posso modificare questi due caratteri separatamente.

Modifica II:

Ho giocato con diverse applicazioni e si comportano in modo diverso: Word ha una copia e incolla a destra, mentre emacs sbaglia entrambe.

Word:

Emacs:

Modifica III

E questo è text edit:

    
posta Stefan Müller 14.03.2014 - 11:51
fonte

4 risposte

1

Se avere questi caratteri in una forma scomposta (rappresentata da due codepoint, carattere base e combinazione di accento) è un problema per l'ulteriore elaborazione che devi fare, allora puoi usare un'app come Unicode Checker per convertire il testo in Normalizzazione Unicode Forma C. Questo li trasformerà nella forma composta, a codice unico.

link

    
risposta data 14.03.2014 - 19:12
fonte
0

Ho riprodotto i tuoi passi:

Il libro è in inglese e in formato Adobe pdf.

Ho scaricato l'anteprima e ho trovato alcuni esempi con "Umlauts".

Copialo e incollalo nei miei appunti.

Güldemann Joël König

Come puoi vedere funziona perfettamente.

Suggerisci di controllare e aggiornare il tuo Adobe Reader alla versione XI.

    
risposta data 14.03.2014 - 12:41
fonte
0

"ü" è quasi sempre rappresentato come un singolo carattere negli schemi di codifica del testo, ma sono stato informato che può anche essere rappresentato come due caratteri. Ad esempio, in Unicode "ü" è rappresentato come un singolo carattere "precomposto" come 00FC. Tuttavia, esiste come un gruppo di due caratteri meno comunemente usato come 0075 0308.

Stai riscontrando uno strano bug o incompatibilità. Suggerisco che potrebbe essere che il programma di elaborazione testi in cui si sta incollando il testo sia stato impostato, per quel documento, per utilizzare un tipo di codifica di caratteri (vecchia e obsoleta) che non riconosce correttamente il carattere "ü". O questo, o c'è qualche strano problema nel modo in cui questo particolare PDF con cui stai lavorando è stato codificato con caratteri.

Ispezionando il PDF a cui ti sei collegato, vedo quanto segue:

Application: LaTeX with hyperref package
PDF Producer: xdvipdfmx (0.7.9)
PDF Version: 1.5 (Acrobat 6.x)

Non capisco le implicazioni di questo, non avendo esperienza con LaTeX, ma forse questo potrebbe fornire un indizio.

Il prossimo passo per risolvere il problema è trovare diversi PDF da diverse fonti e diversi siti Web che contengono anche il tedesco, e vedere se hai lo stesso risultato quando copi il testo da loro e incollalo in qualsiasi parola processore che stai utilizzando. Se non riesci a riprodurre il problema, allora è un problema con quel particolare PDF.

Quindi dovresti provare ad incollare il testo tedesco con dieresi dei vari PDF in nuovi documenti vuoti in diversi programmi di elaborazione testi (Apple TextEdit, Bean, Apple Pages, Microsoft Word, OpenOffice, qualunque cosa tu abbia a disposizione) e vedere quali risultati da quello. Il problema potrebbe essere una stranezza in un particolare programma di elaborazione testi e le sue impostazioni di preferenza.

Ti assicuro che è altamente improbabile che tu stia riscontrando alcun tipo di problema con il sistema operativo Mac OS X stesso. Lavoro abitualmente con la scrittura di testi e la realizzazione di PDF in diverse lingue con diacritici, tra cui tedesco, spagnolo, italiano e francese, e non ho mai riscontrato un problema come quello che stai segnalando.

    
risposta data 14.03.2014 - 17:57
fonte
-2

"Digitare caratteri tedeschi - tastiera tedesca online", digitare la lettera e al termine copiarla sul documento di cui si ha bisogno (nel mio caso, la copio sulla mia e-mail, nessun problema). Quella tastiera online è disponibile in molte lingue. Controlla, è buono, è sotto German.typeit.org

    
risposta data 15.02.2018 - 22:15
fonte

Leggi altre domande sui tag