HTML Tags aus einem Quelltext entfernen Verfasst am: 30.06.2008, 13:31
Ihr kennt das sicher, ihr lest den Quelltext einer Internetseite aus und denn ist da alles verlinkt und bold, italic, oder in einer Tabelle.. Da gibt das sicherlich die Möglichkeit das ganze in einem Webbrowser darzustellen, aber den hasse ich debst, ^^ Also hab ich mich mal drangesetzt und eine kleine Funktion gebastelt die alle HTML Tags entfernen sollte.
Es wird nur der sichtbare Text einer Internetseite zurück gegeben. Bilder, Tabellen, Links und andere Tags werten entfernt.
Visual Basic: [code] Private Function RemoveHTML(ByVal Quelltext As String) As String On Error Resume Next Dim x() As String = Quelltext.Split("<") For i As Integer = 0 To x.GetUpperBound(0) - 2 Dim strTag As String = Quelltext.Split("<")(1) strTag = strTag.Split(">")(0) Quelltext = Quelltext.Replace("<" & strTag & ">", "") Next Return Quelltext End Function[/code]