[VB] Problem z wyrażeniem regularnym


(Seba65439) #1

Witam piszę program który ma pobrać interesujące mnie informacje z strony www ale mam problem z skonstruowaniem odpowiedniego wyrażenia. 


(Frankfurterium) #2

Nie idź tą drogą. Ręczne parsowanie HTML-a prawie zawsze jest koszmarnie złym pomysłem. Chyba każdy w miarę popularny język programowania ma specjalnie skrojone pod tą okoliczność biblioteki. Regexp to absolutna ostateczność.


(Seba65439) #3

Jest mi to potrzebne jednorazowo a tylko taki przykład pobierania danych znalazłem


(Jim1961) #4

Obadaj to: http://htmlagilitypack.codeplex.com/

Przykład do kompletu: http://htmlagilitypack.codeplex.com/wikipage?title=Examples


(Seba65439) #5

Mam z tym problem podam kod:

Private Sub Button1_Click(sender As Object, e As EventArgs) Handles Button1.Click
    Dim content As String = ""
    Dim webClient As New System.Net.WebClient
    Dim dane As HtmlAgilityPack.HtmlNode
    Dim WebSource As String = webClient.DownloadString("http://strona.pl/")
    Dim htmlDoc As New HtmlAgilityPack.HtmlDocument()
    htmlDoc.LoadHtml(WebSource)

    For Each link As HtmlNode In htmlDoc.DocumentNode.SelectNodes("//a")
      dane = link.SelectSingleNode("//td[@onclick]")
      content = Trim(dane.InnerText) vbNewLine


    Next
    RichTextBox1.Text = WebSource
    RichTextBox2.Text = content
  End Sub 

 A problem jest taki że nie wiem jak połączyć dwa argumenty tak aby było width=“140px” i onclick.