Le espressioni regolari sono uno strumento estremamente potente per estrarre del testo da una pagina HTML registrata su disco.
Una delle cose più interessanti è il fatto che possiamo raggiungere questo obiettivo con una sola riga di codice!
Ecco qui la nostra funzione:
Public Function EstraiTestoDaHTML(ByVal HTML As String) As String
‘ rimuove i tag HTML
Return System.Text.RegularExpressions.Regex.Replace( _
HTML, “<[^>]*>”, “”)
End Function
… ed ecco il codice, inserito nel gestore dell’evento Click di un pulsante:
Dim testoHTML As String
testoHTML = My.Computer.FileSystem.ReadAllText(“C:\paginaX.html”)
Me.TextBox1.Text = EstraiTestoDaHTML(testoHTML)
A questo punto basta inserire una casella di testo di nome TextBox1, impostare la sua proprietà Multiline a True e definire la scrollbar verticale e il gioco è fatto!