Witam piszę program który ma pobrać interesujące mnie informacje z strony www ale mam problem z skonstruowaniem odpowiedniego wyrażenia.
Nie idź tą drogą. Ręczne parsowanie HTML-a prawie zawsze jest koszmarnie złym pomysłem. Chyba każdy w miarę popularny język programowania ma specjalnie skrojone pod tą okoliczność biblioteki. Regexp to absolutna ostateczność.
Jest mi to potrzebne jednorazowo a tylko taki przykład pobierania danych znalazłem
Obadaj to: http://htmlagilitypack.codeplex.com/
Przykład do kompletu: http://htmlagilitypack.codeplex.com/wikipage?title=Examples
Mam z tym problem podam kod:
Private Sub Button1_Click(sender As Object, e As EventArgs) Handles Button1.Click
Dim content As String = ""
Dim webClient As New System.Net.WebClient
Dim dane As HtmlAgilityPack.HtmlNode
Dim WebSource As String = webClient.DownloadString("http://strona.pl/")
Dim htmlDoc As New HtmlAgilityPack.HtmlDocument()
htmlDoc.LoadHtml(WebSource)
For Each link As HtmlNode In htmlDoc.DocumentNode.SelectNodes("//a")
dane = link.SelectSingleNode("//td[@onclick]")
content = Trim(dane.InnerText) vbNewLine
Next
RichTextBox1.Text = WebSource
RichTextBox2.Text = content
End Sub
A problem jest taki że nie wiem jak połączyć dwa argumenty tak aby było width=“140px” i onclick.