Per DOS/Batch Teil einer Textdatei extrahieren

Hallo allerseits,

Auf der einen Seite hab ich eine Win32-Anwendung, die eine Website auf neuen Text hin überwacht. Wird neuer Text gefunden, erzeugt die Anwendung ein lokales Abbild der Website als html-Datei, in der der neue Text zum einen sichtbar mittels und unsichtbar im Quelltext mittels <!-- markeranfang --> und <!-- markerende --> markiert wird. Außerdem kann die Anwendung bei einem Treffer eine Batch starten.

Auf der anderen Seite hab ich ein Dos-Programm, dem ich mittels Parameter einen Text übergeben kann, der mir dann aufs Handy geschickt wird.

Jetzt mein Problem, an dem ich scheitere: Wie kann ich per Batch in der html-Datei den Text zwischen dem <!-- markeranfang --> und dem <!–markerende --> finden und als Parameter dem SMS-Sendeprogramm übergeben?

Ich hab mit „find“ schonmal die Zeile isolieren können, da steht jetzt aber noch jede Menge html-„Müll“ mit drin. Allerdings ist der Müll immer derselbe, vielleicht kann man die Zeile um x Zeichen am Anfang und y Zeichen am Ende oder genau um den „Müll-Text“ kürzen!?

Vielen Dank für jeden konstruktiven Beitrag!

Hi,

ich würde es mal mit „Unix für Windows“ versuchen, hier dann den Befehl „grep.exe“ verwenden.

Grüsse

Hi,
ich kann jetzt erstmal nur Ideen anbieten, keine konkrete Lösung. Ich kenne das Problem bei Datumsabfragen, wo es nicht auf das Datum, sondern auf den Wochentag ankommt, der abgefragt wird. Da die Monate unterschiedlich lang sind, ist es besser, eine Routine z.B. jeden Freitag nach Dienstschluß für das Wochenbackup laufen zu lassen. Ich würde versuchen, den html-Müll als %1 zu definieren und den folgenden Text als %2 und ihn auszudrucken / auszugeben. Die Html Zeichen könnten als Umleitung mißverstanden werden, echt nicht einfach.
Anderseits könnte man versuchen über den ASCII Code „Returnbefehle“ nach und vor dem HTML Code in die Zeile einzufügen, so daß man drei Zeilen statt einer hätte.
Und noch eine ganz andere Idee: Ich benutzte vor Jahren von Neosoft das Quickmenü unter DOS, eine grafische Benutzeroberfläche. Um mit dem Webbrowser Arachne unter DOS im Internet zu surfen, hatte ich im RAM eine virtuelle Festplatte, auf die Arachne kopiert wurde. Dieses kopieren lief über eine Makroaufnahme von Quickmenü. Wenn nun Dein Text als Webseite dargestellt wird, mit Strg+A Strg+C komplett markiert und kopiert ins Notepad eingesetzt wird, ist der ganze HTML Müll automatisch weg.
Wie gesagt nur Ideen, keine konkrete Lösung.
LG Arne

Hallo simonavenia,

du ersetzt einfach alle Zeichen die du nicht haben möchtest durch nichts, dabei musst du nur das [und] durch den HTML-Müll ersetzen :wink:

SET STRING=[ABCDEFG]
SET STRING=%STRING:[=%
SET STRING=%STRING:]=%
ECHO String: %STRING%

Ich hoffe das konnte ein wenig weiterhelfen,
Grüße