HTML Parsen

Hallo,
ich möchte gerne mit einem Programm verschiedene Informationen von Websiten auslesen können. Ich habe den Code einer Zielseite analysiert und mir ein paar Stellen ausgesucht, die ich mittels Regex auswerten kann. Gibt es dazu aber evtl. einen Parser wie für XML? Beid en Lösungen für XML ist das Problem das die Datei dann immer Wohlgeformt sein muss usw. Was aber leider auf vielen seiten so nicht vorliegt.

Gruß
Boris