Fremde Webseite durchsuchen?

Hallo Wissende,

in der Brettbeschreibung vom Word-Brett gibt es einen super Link:
http://web.archive.org/web/20070503124443/mypage.blu…
Leider ist deie Seite jetzt nicht mehr auf der früheren HP des Erstellers der Seite sondern jetzt irgendwie bei web.archive.

Dadurch klappt die Suchmöglichkeit innerhalb der Seite leider nicht mehr :frowning:

sehr garantiert ist es euch im Gegensatz zu mir (Html-DAU) sehr leicht dort zu schauen wie da gesucht wird.

Sieht dann da jmd. eine auch für DAUs umsetzbare Lösung daß man da wieder in Richtung Volltext suchen könnte?

Vielleicht *rumrat*, den Quellcode in eine Datei auf der eigenen FP zu kopieren und dann von da aus im Web.archive zu suchen?

Ich kann Vba. Da es ja um Word geht, in Word kann man ein großes Fenster aufziehen und dadrin den Internet Explorer starten.
Dann kann man ihn mit Vba (an-) steuern.
D,h, mit z.b. Navigate die genannte Webseite ansteuern.

Es geht auch, falls da in der Webseite die Suche mit Submit erfolgt dies durch Vba auch an den „eigenen“ Wordbrowser zu „schicken“.

Zumindest konnte ich so schon erfolgreich als Test über Vba in google.de einen Suchbegriff eingeben und quasi auf „Suchen“ klicken.
Aber das geht nicht bei allen ähnlich aussehenden Webseiten, irgendwie muß da das Suchbegriffeingabefeld einen namen haben, dann geht das, wenn nicht, nicht.
Naja, ihr wißt da besser was ich meinen könnte :smile:

Auch alles was da es da so an php, css oder sonstigen römischen Dörfern für mich gibt geht nicht.
Ist dadurch, also den „eigenen“ Browser etwas zu „machen“?

Der Lohn für eure Mühe ist das hier übliche fürstliche Salär :smile:))

Danke für das Interesse
Gruß
Reinhard

Hallo Reinhard,

wird durch das frameset etwas „verschleiert“ :smile:

die Datei mit den Stich/Suchworten findest Du hier:

http://web.archive.org/web/20070405061338/
mypage.bluewin.ch/reprobst/WordFAQ/Index.htm

wenn diese durch den Browser aufgerufen wird, dann checkt ein javasript nach dem frameset und läd es, wenn nicht vorhanden, neu.

ein Zeile daraus sieht z.B. so aus:
Abbildungsverzeichnis I

der direkte Link zu LangDok.htm sieht so aus:

http://web.archive.org/web/20070320220659/mypage.blu…

was Du jetzt damit meinst

Dadurch klappt die Suchmöglichkeit innerhalb der Seite leider nicht mehr :frowning:

weiß ich nicht?
Willst Du mit VBA die Index.htm durchsuchen?
Dann müsste es Dir jetzt mit der URL möglich sein.

Gruß
Klaus

der direkte Link zu LangDok.htm sieht so aus:

http://web.archive.org/web/20070320220659/mypage.blu…
probst/WordFAQ/LangDok.htm

der direkte Link ist zwar richtig, aber Du weiß nicht, welche Ziffern hinter /web/… je Datei stehen. Die unterscheiden sich.

Setzt Du das


http://web.archive.org/web/20070405061338/http://myp…

vor LangDok.htm , dann wird immer „richtig“ weitergeleitet.

Hallo KKo,

schon mal großen Dank daß du dich meiner annimmst :smile:

wird durch das frameset etwas „verschleiert“ :smile:

sagt mir nix, ist aber wohl egal. *denk*

die Datei mit den Stich/Suchworten findest Du hier:
http://web.archive.org/web/20070405061338/
mypage.bluewin.ch/reprobst/WordFAQ/Index.htm

wenn diese durch den Browser aufgerufen wird, dann checkt ein
javasript nach dem frameset und läd es, wenn nicht vorhanden,
neu.

Aha, kann mir zwar nur vage vorstellen was da passiert, aber okay.

ein Zeile daraus sieht z.B. so aus:
Abbildungsverzeichnis I

Das weiß ich. Ich habe mir den Sourcecode angeschaut. Und ich habe schon in Vba gebastelt, also aus diesen ganzen Zeilen nur die rausgefiltert, die vorne „bbildungsverzeichnis I“

Das geht schon. ABER, jetzt mal weglassend wieviel Zeit mich das kostet, derart mit Vba eine Suche zu gestalten, gibt ja da auch noch wenige Zeilen die nicht „LangDok.htm“ haben sondern irgendwie sowas „LangDok.htm?xyz“. also noch quasi Unterverzeichnisse oder wie das heißt aufrufen.

D.h., bei einer entsprechenden Suche per Vba muß ich ja jedesmal in einer Schleife den Link neu basteln/zusammenstezen, dort suchen usw.
Und da befürchte ich sehr daß das lange dauert :frowning:(

Machbar schon, traue ich mir auch zu, aber die Suchzeit sehe ich als Problem.

Noch dazu, wenn schon denn schon würde ich da gerne auch einbauen, Volltextsuche, Suche nur in Überschriften.
Mit Überschriften meine ich jetzt daß was du wenn du z.B. auf der Seite auf Absatzmarken klickst dort dann unterhalb von „Diese Seite“ siehst.

Und so kam ich halt auf die Idee hier mal nachzufragen bevor ich da eine reine Vba Lösung bastle.
Von mir aus stellt sich das so dar.
Da gibt es eine Suche, die hat früher funktioniert *weiß*

Jetzt klappt sie nicht mehr weil die Pfade nicht mehr stimmen, okay.
Meine Hoffnung ist, mit einem Trick den nur ihr wenn überhaupt wissen könnt, durch Pfadumbiegung wieder die Suchfunktion, oder eine andere nutzen zu können.
Von mir aus gesehen sehr bedeutent einfacher als wenn ich da mühsam htmlseiten parsen, zerlegen muß um danach wieder Weblinks zu basteln.

Und so ganz blöde bin ich ja dann doch nicht :smile:, mit Frameset meinste wohl daß ich wenn ich den Quelltext lesen will erstmal This frame (mein Browser redet englisch mit mir) o.ä. auswählen muß und dort dann den Framesource zu lesen, dann hab ich das doch verstanden.

Danke ^ Gruß
Reinhard

Das geht schon. ABER, jetzt mal weglassend wieviel Zeit mich
das kostet, derart mit Vba eine Suche zu gestalten, gibt ja da

kenne VBA nicht … gibt es da kein Matching mit regulären Ausdrücken und keine Replace-Function für Strings?

auch noch wenige Zeilen die nicht „LangDok.htm“ haben sondern
irgendwie sowas „LangDok.htm?xyz“. also noch quasi
Unterverzeichnisse oder wie das heißt aufrufen.

ne … diese Links haben keinen QueryString

eigentlich braucht man nur den relativen Pfad im href:
LangDok.htm

in diesen absoluten zu ändern:

http://web.archive.org/web/20070405061338/http://myp…

und wie im Nachtrag geschrieben, ist bei allen Links das, was vor LangDok.htm, steht gleich.

Machbar schon, traue ich mir auch zu, aber die Suchzeit sehe :ich als Problem.

naja … nicht nur die Suchzeit … auch die Ladezeit :smile:
die Seite hat 214kb
wenn man alles unnütze rausschmeißt (class, onmouse…, font) wird man wohl 40kb nicht überschreiten.
Wäre zu erwägen, sich so eine reduzierte „Suchseite“ selbst abzuspeichern.

Hallo Klaus,

Das geht schon. ABER, jetzt mal weglassend wieviel Zeit mich
das kostet, derart mit Vba eine Suche zu gestalten, gibt ja da

kenne VBA nicht … gibt es da kein Matching mit regulären
Ausdrücken und keine Replace-Function für Strings?

? Genau verstanden habe ich nicht was du meinst,
Ich kann schon Match machen, also Vergleichen ob Strings gleich sind
Oder auch vergleichen ob dffdhks like „dff*“ ist.
Replace gibt es auch, also in einem String xyz durch x zu ersetzen o.ä.

auch noch wenige Zeilen die nicht „LangDok.htm“ haben sondern
irgendwie sowas „LangDok.htm?xyz“. also noch quasi
Unterverzeichnisse oder wie das heißt aufrufen.

ne … diese Links haben keinen QueryString

? Ich kenne schon Queries, was issen nun ein QueryString?

eigentlich braucht man nur den relativen Pfad im href:

LangDok.htm

Übrigens, ich poste sehr oft Code, prehtml klappt da nie, ich nehm immer pre

prehtml soll hier auch klappen aber nur bei xml oder so, habe die Auskunft vom Team nie so ganz kapiert, jedenfalls bei mir klappt kein prehtml.

in diesen absoluten zu ändern:

http://web.archive.org/web/20070405061338/http://myp…
n.ch/reprobst/WordFAQ/LangDok.htm

Ja, das kriege ich ja auch hin mit Vba. Mein Ansinnen ist aber etwas anderes.

und wie im Nachtrag geschrieben, ist bei allen Links das, was
vor LangDok.htm, steht gleich.

Ja, habe ich ja beim Filtern gelöst.

Mir geht es hier einzig um eine Möglichkeit in Html da elegant zu suchen ohne daß ich da zig Hundert Links zusammenbasteln muß um dann darin zu suchen.

Der Weg in Vba (sorry, mehr kann ich nicht) ist mir sehr klar.
Und da die Seite nicht durch irgendwas mir unbekanntes verschleiert oder sonstwas ist sondern klar lesbar, krieg ich das auch bestimmt hin *annehm*

Nur, könnte ich Html so gut wie Excel-Vba, würde ich gleich sehen, aha, dies irgendwie über Html zu lösen geht geht nicht, dauert x Zeit.
Über Excel-Vba zu lösen geht zum Glück in dem Fall, da kann ich abschätzen, genau natürlich auch nicht, ich treff ja auf sowas abcd.html?xyz, was ich erstmal einsortieren muß, aber ich weiß ich komm zum Ziel.

Und, nach abcd.html?xyz kann ja noch mehr kommen. Und jetzt von Vba aus gesehen kann ich ja leider nicht sagen, da ist eine Liste mit htm-Dateinen such da mal, nein ich muß ja auch in den wie auch die heißen Unterkapiteln von abcd.html?xyz suchen.

D.h. ich muß alles „einzeln“ überprüfen, also in den 200 Zeilen die 4 Zeilen mit abcd.html?xyz beachten, daß im Code berücksichtigen und wenn dann noch mehr Abweichungen kommen muß ich dies auch im Code berücksichtigen.

Übrigens, ich bin ne Klette, jetzt haste mich am Hals *lächel*
Komm mit ner Frage ins Excelbrett, egal was, ich zahle dir die Hilfe sehr gerne zurück:smile:

Btw, was bedeutet dieses Mouseover sTT(‚3‘) mit unterschiedlichen Nummern? Ist das gar die Sprungadresse wenn ich darauf klicke o.ä.?

Die Farbe? Eher nicht, ist mir irgendwie unklar, aber anders gefragt, brauch ich das bei meinem Vorhaben?

Danke
Reinhard

Hallo Klaus,

wegen deinen Nachfragen, ich kann scon aus dem was ich auf der Webseite sehe, dieses herausfiltern:

VBAHetro.htm
VBAHetro.htm
Booklet.htm
LangDok.htm
Beschr.htm

…/FrmSet.htm?FFInhalt
…/FrmSet.htm?FFIndex
Konvert.htm
TMPopup.htm

Und „hinten“ das mit „„capss“>Abbildungsverzeichnis I“
kann ich auch filtern, also die Html Codes beseitigen, das Dauerleerzeichen rauswerfen usw.

Bei „…/FrmSet.htm?FFInhalt“ muß ich halt erst prüfen was es sich da mit den zwei Punkten und dem „/“ auf sich hat, das geht schon, ich will ja nur daraus einen Link generieren.

Das mit dem „?“ glaube ich verstanden zu haben, naja, nicht wirklich, zumindest kommt da ein Untermenu oder so.

Wie du siehst, muß ich mich da mühsam von unklarem Punkt zum anderen hangeln allein um zu herauszufinden wie ich das dann in Code umsetze.

Umsomehr ist mein Wunsch verständlich, dies einfacher durch irgendwas in Html zu „erledigen“.

Gruß
Reinhard

Hallo Klaus,

Machbar schon, traue ich mir auch zu, aber die Suchzeit sehe :ich als Problem.

naja … nicht nur die Suchzeit … auch die Ladezeit :smile:
die Seite hat 214kb

das will ich ja vermeiden, daß sich da jmd. das komplett auf die FP laden muß.
214 KB irritieren mich, sind garantiert eher 100 200 MB oder so.

Dann gehts sicher schon schneller mit der Suche.

wenn man alles unnütze rausschmeißt (class, onmouse…, font)
wird man wohl 40kb nicht überschreiten.

? Irgendwie haben wir uns mißverstanden :frowning:

Gruß
Reinhard

Hallo Reinhard,

? Ich kenne schon Queries, was issen nun ein QueryString?

na das, wenn eine URL ?den_QueryString dran hat.

Übrigens, ich poste sehr oft Code, prehtml klappt da nie, ich
nehm immer pre

prehtml nehme ich, damit der Text maskiert wird und nicht vom Browser als Quelltext interpretiert wird.
(so wie in der FAQ von diesem Brett :smile:))

Mir geht es hier einzig um eine Möglichkeit in Html da
elegant zu suchen ohne daß ich da zig Hundert Links
zusammenbasteln muß um dann darin zu suchen.

Ah … Du willst z.B. in LangDok.htm suchen?
Hatte es so verstanden, dass bei Stichwort „Abbildungsverzeichnis“ die LangDok.htm zum Lesen angeboten wird.
Es gibt ja schon 722 Stichworte bei class=„index“ mit Links auf 175 Dateien.

Was für eine Monstersucherei soll das werden? :smile:))

Bei der class=„blue“ wird bei der absoluten URL das Verzeichnis /WordFAQ/ weggelassen … also auch machbar.

Gruß
Klaus

Hallo Reinhard,

naja … nicht nur die Suchzeit … auch die Ladezeit :smile:
die Seite hat 214kb

das will ich ja vermeiden, daß sich da jmd. das komplett auf
die FP laden muß.

214 KB irritieren mich, sind garantiert eher 100 200 MB oder
so.

diese Menge mag ja sein, wenn Du alle 175 Dateien (class index) und die anderen dazu laden willst.

Dir stehen die 733 Stichworte aus der Index zu Verfügung - willst Du noch mehr generieren? Wenn Nein, dann wäre es doch Blödsinn, die Dateien nach den Stichworten zu durchsuchen :wink:

Gruß
Klaus

Hallo Reinhard,

wegen deinen Nachfragen, ich kann scon aus dem was ich auf
der Webseite sehe, dieses herausfiltern:
VBAHetro.htm

und wenn Du dann auch noch das Stichwort „Kompilierung“ dazu herausfilterst, dann weißt Du doch, wohin der neue „absolute“ Link führen muss … wenn über Deine Suchengine danach gesucht wird … oder?

Gruß
Klaus

wegen deinen Nachfragen, ich kann scon aus dem was ich auf
der Webseite sehe, dieses herausfiltern:
VBAHetro.htm

und wenn Du dann auch noch das Stichwort „Kompilierung“ dazu
herausfilterst, dann weißt Du doch, wohin der neue „absolute“
Link führen muss … wenn über Deine Suchengine danach gesucht
wird … oder?

Hallo Klaus

irgendwie reden wir aneinander vorbei :frowning:
Was hat es mit Kompilierung auf sich? Hab jetzt nicht geschaut ob das irgendwo im Quelltext steht.

Ich möchte, lassen wir mal die beschränkte Suche nur in Kapitelüberschriften weg, in einer Volltextsuche nach dem Begriff „Huhu“ in der „gesamten“ Seite suchen.
Natürlich nicht alles im web.archive, aber in allem was da unterhalb von reprobst steht.

Und genau dafür erwünsche ich mir eine einfache Html-Lösung. Wenn die nicht geht, gut, mach ichs anders mit dem was ich kann.
Gibt es eine die ich auch umsetzen kann würde ich mich freuen.

Gruß
Reinhard

Hallo Reinhard,

auf der IndexSeite kommst Du über K ompilierung zur …/VBAHetro.thm

wenn Du VBAHetro.htm herausfiltern kannst, dann doch bestimmt auch „Kompilierung“ … zwar in diesen font-tags … aber in der gleichen Zeile.
Ich verstehe nicht ganz, warum alle Dateien erstmal durchsucht werden sollen, wenn doch auf der IndexSeite 733 Stichworte und die dazugehörigen Dateien vorhanden sind.

Es reicht doch, wenn man sich nur die 214kb große IndexSeite holt!!
Habe ich gemacht und daraus die Stichworte mit den dazugehörigen Dateien in eine csv-datei extrahiert.
Ausschnitt daraus:


Kompilierung;VBAHetro.htm
Komprimieren von VBA-Code;CodeClnr.htm
Konkatinieren von Dokumenten;Konkat.htm
Kontakte;ABuch.htm

Jetzt braucht man doch nur den Dateinamen zur absoluten URL ergänzen … und fertig.

Warum willst Du in allen Dateien nach Huhu suchen? :smile:)

Gruß
Klaus

Warum willst Du in allen Dateien nach Huhu suchen? :smile:)

hallo Klaus,

weil ich mal z.B. auf der Seite war, sehr Hilfreiches entdeckt habe.
Jetzt bräuchte ich genau das wieder, weiß aber weder Kapitel noch sonstwas, nur noch daß da im Text Huhu vorkam…

Gruß
Reinhard

Hallo Reinhard,

nun … dann musst Du wirklich alle Dateien durchsuchen.

Aber soviel, wie Du denkst, ist das dann doch nicht.
Die 175 Dateien der class index haben ca. 7,5 MB.

Das Herausfiltern der Dateinamen und Ergänzung zur absoluten URL ist doch jetzt klar … oder?

Gruß
Klaus

nun … dann musst Du wirklich alle Dateien durchsuchen.
Aber soviel, wie Du denkst, ist das dann doch nicht.
Die 175 Dateien der class index haben ca. 7,5 MB.
Das Herausfiltern der Dateinamen und Ergänzung zur absoluten
URL ist doch jetzt klar … oder?

Hallo Klaus,

eine reine Vba-Lösung, die alle Dateien durchsucht, egal ob auf meiner FP oder im Internet (ist nur ein Unterschied in der Geschwindigkeit) traue ich mir ja zu.

Weshalb ich überhaupt hier anfragte ist die Hoffnung auf eine Html-Lösung.

Ich kenne nicht alle Möglichkeiten von Html, geschweige denn die einfachsten genau :smile:

Jetzt KÖNNTE es ja so gehen.
Auf der angegebenen Seite ist ja ein Textfeld in das man einen Suchbegriff schreibt, dann klickt man auf eine Schaltfläche (oder Enter *glaub*) da durch wird eine Funktion o.ä. aufgerufen der der Textfeldinhalt als parameter übergeben wurde.

Danach durchsucht die Funktion dann alle Dateien.
Auch die Funktion braucht den genauen Link zu den Dateien.
Entweder wird er fest innerhalb der Funktion der Funktion bekannt,

Angenommen, durchsucht werden sollen 10 dateien
C:\meinedaten\Datei1
C:\meinedaten\datei2
C:\meinedaten\datei3

dann wird das wohl so aussehen:

Funktion xyz( Suchtext)
Suchpfad=„C:\meinedaten“
for N = 1 to 10
xyz=xyz & „,“ & Durchsuche(Suchpfad & Datei & N)
next N

oder aber es geht relativ zur datei in der die Suchfunktion selbst steht, wenn das C:\meinedaten ist, dann so:

Funktion xyz( Suchtext)
for N = 1 to 10
xyz=xyz & „,“ & Durchsuche(„Pfad zu xyz“ & „“ & Datei & N)
next N

Wenn das so sein sollte, müßte man doch nur, die Codes der Suchfunktion in eine neue Html auf einer FP reinschreiben und dort die Pfade umbiegen zu den Tatsächlichkeiten auf der web-archive-Seite.

Den enstandenen Quellcode könnte man dann mit in eine FAQ schreiben.
Leider bietet w-w-w ja keine Möglichkeiten sich Dateien herunterzuladen:frowning:
Aber immerhin könnte sich dann jeder Innteressierte sich da diesen Quellcode herunterkopieren und mit Notepad so eine html oder htm erstellen.

Dadurch könnte er dann wieder wie früher auch in der Seite richtig suchen.

Ich denke meinen Pseudocode könnt ihr sehr leicht deuten. Die Machbarkeit kann ich nicht beurteilen derzeit.

Gruß
Reinhard

Hallo Reinhard,

jetzt mal nur was für offline :smile:)

Du hast z.B. das hier auf Deiner FP:

http://www.file-upload.net/download-1583604/WordFAQ…

Dann könnte man mit ein paar Änderungen, Ergänzungen und Javascript anstatt der Google-Suche, die eh nicht mehr funktioniert, so Art offline „Suchmaschine“ einbauen.

Im Prinzip stelle ich mir das so vor:
Javascript läd die Dateien in den Frame Data, sucht dort nach dem Begriff und gibt die Treffer im Frame Navigation aus.

Gruß
Klaus

Hallo Unwissender,

weder der Titel, noch die 1.,2. und weitere Frage/Problemstellungen entsprechen den gegebenen Möglichkeiten.
Jedoch war es mir eine Freude mich damit zu beschäftigen … darum ein *

Gruß
Klaus

Hallo Klaus,

Hallo Unwissender,

das sagt man nicht, ab ins Bad, spül dir den Mund aus mit Seifenlauge *hihi*
Im Ernst, was heißt schon Unwissender? Zeig mir einen der alles weiß. Wir sind doch alles nur Wissende, wenn überhaupt, in winzigen nicht der Rede wert großen Bereichen gesamt gesehen.

Komm mal in „mein“ Brett, ins Excelbrett, und wenn du Unwissender das wieder nicht findest wie das Wordbrett, es nennt sich hier Tabellenkalkulation.
Jetzt müßte das aber klappen :smile:

Jetzt schau mal da nach meinem Namen. Dann erklär mir bitte nochmal daß ich ein Unwissender bin wenn es z.B. um Excel geht oder Excel-Vba.

Ich habe in den 10 Jahren da wo ich anderen bei Problemen in Excel helfe noch nie auch nur einen als Unwissend bezeichnet.
Bis auf die Selbstüberschätzer wissen die Leute schon daß sie von Excel keine Ahnung haben aber ein Problem haben daß sie lösen müssen oder wollen.

Das erkenne ich auch, manchmal direkt aus der Fragestellung, manchmal aus danach kommenden Beitragswechseln.

Oder, so wie ich es auch tat, es steht schon in der Anfrage daß da jmd. keine Ahnung von z.B. Html wie hier hat.

Na und, so fing ich auch mal an, wie viele, alle anderen, kein Gruind für mich da großspurig aufzutreten, he du Unwissender :frowning:

Jedoch war es mir eine Freude mich damit zu beschäftigen …
darum ein *

Danke, mein erstes Sternchen was ich für eine eigene Anfrage bekomme :smile:

Und wenn du dich mit Aufgaben beschäftigen willst, gerne ich hab da einige ungelöste Probleme.

Eine, wo ich schon jahrelang nach einer Lösung suche, ist,

In Vba (sorry, einzige was ich kann) kann ich alle 65536 Unicodezeichen in z.B. der Schrifart Arial in Word oder Excel auflisten lassen.
Alle nicht druckbaren Zeichen werden da als Quadrat dargestellt.

Geht das mit Html auch? Ich gehe davon aus. Kann man dann in Html irgendwie auswerten welche Zeichen ausdruckbar sind und welche nicht?
Daß man als Ergebnis eine Liste hat jetzt für Arial, welche Unicode-Zeichen druckbar sind?

Gruß
Reinhard