PDF-Inhalt kopieren geht nicht

Hallo,

ich habe eine PDF-Datei aus der ich Text markieren und über die Zwischenablage in Word kopieren kann. Das funktioniert normalerweise gut. Jetzt habe ich aber eines, da kommen im Zieldokument nur „kryptische“ Zeichen an.
Ich vermute mal, dass es am Zeichensatz liegt (das pdf hat „stone sans“) - an den Sicherheitseinstellungen scheint es mir nicht zu liegen(?).

any other idea?

LG
Christof

Hallo.

Kopier den ganzen Sums doch einfach mal in den Editor (Notepad). Dabei gehen zwar sämtliche Formatierungen verloren, aber der Text bleibt Text.

Was natürlich sein könnte: In der Schriftart selbst ist die Zuordnung der Zeichencodes (absichtlich) durcheinandergewürfelt, um das Kopieren zumindest zu erschweren. Wenn Du in der Schrift dann þ drückst, erscheint ein A, bei © kommt ein F usw. D.h. die Darstellung ist zwar korrekt, aber die Codierung komplett anders, wovon Word natürlich nix weiß, wenn’s nicht die gleiche Schriftart kennt.

Noch eine Möglichkeit: Kopier das Zeuch als Grafik raus und laß ne Texterkennung drüberlaufen.
Oder tipp’s einfach ab, geht vielleicht schneller :smile:

Gruß

Michael

Hi Christof,

das liegt wahrscheinlich daran, dass der Autor dieser pdf-Datei nicht will, dass du was kopierst.

Beim Erstellen von pdf-Dateien, ist es möglich Sicherheitseinstellungen vorzunehmen. Dazu gehört u.a. das Verbieten des Ausdruckens, des Kopierens, usw.

Gruß
Dirk

Hallo Dirk,

das liegt wahrscheinlich daran, dass der Autor dieser
pdf-Datei nicht will, dass du was kopierst.

Beim Erstellen von pdf-Dateien, ist es möglich
Sicherheitseinstellungen vorzunehmen. Dazu gehört u.a. das
Verbieten des Ausdruckens, des Kopierens, usw.

Drucken, Kopieren und Entnehmen von Inhalten ist definitiv erlaubt.
Deshalb bin ich ja auch so erstaunt…

LG
Christof

Hi Michael,

Kopier den ganzen Sums doch einfach mal in den Editor
(Notepad). Dabei gehen zwar sämtliche Formatierungen verloren,
aber der Text bleibt Text.

leider nein, ist das selbe „Chinesisch“:
Das hier: t~ë=áëí=dÉÖÉåëí~åÇ=ÇÉê=sÉêëáÅÜÉêìåÖ\
soll heissen „Was ist Gegenstand der Versicherung?“

Was natürlich sein könnte: In der Schriftart selbst ist die
Zuordnung der Zeichencodes (absichtlich)
durcheinandergewürfelt, um das Kopieren zumindest zu
erschweren. Wenn Du in der Schrift dann þ drückst, erscheint
ein A, bei © kommt ein F usw. D.h. die Darstellung ist zwar
korrekt, aber die Codierung komplett anders, wovon Word
natürlich nix weiß, wenn’s nicht die gleiche Schriftart kennt.

interessante Theorie, aber das könnten die viel einfacher per Sicherheitseinstellungen erreichen…

Noch eine Möglichkeit: Kopier das Zeuch als Grafik raus und
laß ne Texterkennung drüberlaufen.

das wird es wohl oder übel werden… :frowning:

Oder tipp’s einfach ab, geht vielleicht schneller :smile:

bei mir nicht, aber es gibt sehr flinke KollegInnen…

LG
Christof

Hallo.

interessante Theorie, aber das könnten die viel einfacher per
Sicherheitseinstellungen erreichen…

Ist tatsächlich so. Es gibt einen Versatz von 29 Zeichen, im ASCII-Code mit DOS-Erweiterung. Wenn ihr jemanden habt, der einigermaßen was von VBA-Programmierung versteht (z.B. in Word oder Excel), dann macht der dir aus dem „chinesisch“ in einer halben Stunde lesbaren Text.

Gruß

Michael

Hallo.

interessante Theorie, aber das könnten die viel einfacher per
Sicherheitseinstellungen erreichen…

Ist tatsächlich so. Es gibt einen Versatz von 29 Zeichen, im
ASCII-Code mit DOS-Erweiterung. Wenn ihr jemanden habt, der
einigermaßen was von VBA-Programmierung versteht (z.B. in Word
oder Excel), dann macht der dir aus dem „chinesisch“ in einer
halben Stunde lesbaren Text.

=:-o Danke! Wer kommt nur auf solche Schnapsideen?*) Ich habe es inzwischen mit einer OCR-SW gemacht, das geht (für das eine Dokument) schneller.

LG
Christof

*) die UNIQA-Versicherung offenbar…