mario.deghetto

Visual Basic & .NET
posts - 319, comments - 204, trackbacks - 0

#40: Estrarre il testo da una pagina HTML con VB.NET

Le espressioni regolari sono uno strumento estremamente potente per estrarre del testo da una pagina HTML registrata su disco.

Una delle cose più interessanti è il fatto che possiamo raggiungere questo obiettivo con una sola riga di codice!

Ecco qui la nostra funzione:

Public Function EstraiTestoDaHTML(ByVal HTML As String) As String
   ‘ rimuove i tag HTML
   Return System.Text.RegularExpressions.Regex.Replace( _
      HTML, “<[^>]*>”, “”)
End Function

… ed ecco il codice, inserito nel gestore dell’evento Click di un pulsante:

Dim testoHTML As String
testoHTML = My.Computer.FileSystem.ReadAllText(“C:\paginaX.html”)
Me.TextBox1.Text = EstraiTestoDaHTML(testoHTML)

A questo punto basta inserire una casella di testo di nome TextBox1, impostare la sua proprietà Multiline a True e definire la scrollbar verticale e il gioco è fatto!

Print | posted on venerdì 15 gennaio 2010 5.50 |

Feedback

No comments posted yet.

Post Comment

Title  
Name  
Email
Url
Comment   
Please add 5 and 8 and type the answer here:

Powered by: