Postscript Textextraktion?

Hallo

Ich suche eine möglichkeit um Texte samt Koordinaten aus einer Postscript-datei zu extrahieren. Gibt es da bereits eine Lib?

Grüße Sven

Wie wäre es mit einer Public

CPostScript

finde und staune
http://cvs.ktug.or.kr/viewcvs/miktex-ktug/src/yap/Po…
http://cvs.ktug.or.kr/viewcvs/miktex-ktug/src/yap/

Yap hat sowas :smile:

[Bei dieser Antwort wurde das Vollzitat nachträglich automatisiert entfernt]

Hallo RakonDark

Danke für deine Antwort. Leider kann ich mit dem Code keine Texte sammt Koordinaten extrahieren. Falls doch habe ich es überlesen :frowning:.

Kennst du sonst noch eine Seite wo ich eine entsprechende Lib bekomme?

Wenn ich nämlich denn Sourcecode fürs Postscript von Yap benutzen will. Muss ich erstmal die anderen Sourcecodes kompilieren um die benötigten Libs zu habe. Gibt die es bereits kompiliert?

Gruß Sven

[Bei dieser Antwort wurde das Vollzitat nachträglich automatisiert entfernt]

Hallo Sven,

Ich suche eine möglichkeit um Texte samt Koordinaten aus einer
Postscript-datei zu extrahieren. Gibt es da bereits eine Lib?

Dir ist aber schon klar was PS ist, bzw. wie es funktioniert??

PS ist eigentlich schon eine ausgewachsene Programmiersprache.
Zudem kann man Fenster anlegen und die Koordinaten sind dann relativ zu diesem Fenster. Natürlich kann man die Koordinaten zuerst auch in einem, oder mehreren, Unterprogramm(en) berechnen…

Du benötigs also eine PS-Interpreter um die Koordinaten überhaupt zu bestimmen. Allerdings besteht die Ausgabe des Interpreters dann aus einer Graphik.

Achja, die Codetabellen sind natürlich auch per PS modifizierbar.

MfG Peter(TOO)

Hallo Peter

Danke für deine Antwort.

Klar ist mir Klar das PS eine ausgewachsene Programmiersprache ist. Es kommt aber immerhin darauf an was ich machen Will. Ich brauche die Textteile samt Koordinaten. Ich muß diese in einer Matrix speichern, für eine weitere Aufbereitung der Datei. die PS-Dateien die ich verwende sind nur Seitenbeschreibungen. (D.H. Es sind keine funktionen und keine Algorthymen vorhanden). Ich wandel PDFs in PS. PDF scheitet aus, da die Objektstruktur nicht dazu geeignet ist, die Textinformation wieder auszulesen. Außer mit einer OCR-Software. Ich hatte mehrere Testfiles die jedesmal eine andere Objectstruktur hatten. Habe später mit der TET-Lib von PDFLib gearbeitet. Das hat dann funktioniert aber die Drucker können nicht alles was ich brauche :frowning: .

Das mit den Interpreter ist schade. Werde wieder einen anderen Schritt gehen.

Gruß Sven

Dir ist aber schon klar was PS ist, bzw. wie es funktioniert??

PS ist eigentlich schon eine ausgewachsene Programmiersprache.
Zudem kann man Fenster anlegen und die Koordinaten sind dann
relativ zu diesem Fenster. Natürlich kann man die Koordinaten
zuerst auch in einem, oder mehreren, Unterprogramm(en)
berechnen…

Du benötigs also eine PS-Interpreter um die Koordinaten
überhaupt zu bestimmen. Allerdings besteht die Ausgabe des
Interpreters dann aus einer Graphik.

Achja, die Codetabellen sind natürlich auch per PS
modifizierbar.

MfG Peter(TOO)