Well format xml file

Hallo

ich lese eine Webseite ein. Nutze dazu
import java.util.Iterator;

import org.jdom.Document;
import org.jdom.Element;
import org.jdom.input.SAXBuilder;

Nun ist es so dass die webseite die …
wenn ich nun mit replace die

Hallo,

wäre evtl. TagSoup, NekoHTML oder JTidy eine Alternative? Die sollten auch mit HTML zurechtkommen das nicht XML konform ist.

Gruß
Heavy