Mit der Methode IndexOf() und Remove() filtere ich den Body
aus dem Quelltext.
Bei einfachen Textemails funktioniert es aber bei HTML emails
müsste ich sehr aufwendig mit Regex() die Tags entfernen.
Habt ihr eine Idee/Link wie sowas einfacher gemacht werden
könnte.
Man könnte einen sog. „Mailclient“ einsetzen. Das ist eine Software, die sämtliche Algorithmik zur Verarbeitung und Anzeige von Emails mitbringt - und glaub mir, die ist schon erheblich. Hast du z.B. schon über unterschiedliche Textkodierungen nachgedacht oder über MIME-Parts?
Wenn du den Quelltext eines quelloffenen Mailprogramms anschaust bzw. dir passende Module daraus kopierst (unter Beachtung ihrer Lizenz), kommst du vielleicht am ehesten voran. Das wird dann vermutlich C oder C++ sein, aber es gibt ja P/Invoke. Alternativ kann man gegen Geld Mail-Parsing-Module für Dotnet kaufen… etwas quelloffenes ist mir da nicht bekannt.
Grüße,
Sebastian
PS: Was ist denn aufwändig an der Regex für die Tags? Ist s/]>//g irgendwie zu einfach gedacht? Abgesehen von den Tags wären natürlich noch die Entities zu bereinigen (ü etc).