[VB] Problem z wyrażeniem regularnym


(Seba65439) #1

Witam piszę program który ma pobrać interesujące mnie informacje z strony www ale mam problem z skonstruowaniem odpowiedniego wyrażenia. 


(Frankfurterium) #2

Nie idź tą drogą. Ręczne parsowanie HTML-a prawie zawsze jest koszmarnie złym pomysłem. Chyba każdy w miarę popularny język programowania ma specjalnie skrojone pod tą okoliczność biblioteki. Regexp to absolutna ostateczność.


(Seba65439) #3

Jest mi to potrzebne jednorazowo a tylko taki przykład pobierania danych znalazłem


(Jim1961) #4

Obadaj to: http://htmlagilitypack.codeplex.com/

Przykład do kompletu: http://htmlagilitypack.codeplex.com/wikipage?title=Examples


(Seba65439) #5

Mam z tym problem podam kod:

Private Sub Button1_Click(sender As Object, e As EventArgs) Handles Button1.Click
        Dim content As String = ""
        Dim webClient As New System.Net.WebClient
        Dim dane As HtmlAgilityPack.HtmlNode
        Dim WebSource As String = webClient.DownloadString("http://strona.pl/")




        Dim htmlDoc As New HtmlAgilityPack.HtmlDocument()
        htmlDoc.LoadHtml(WebSource)

        For Each link As HtmlNode In htmlDoc.DocumentNode.SelectNodes("//a")
            dane = link.SelectSingleNode("//td[@onclick]")
            content = Trim(dane.InnerText) vbNewLine


        Next
        RichTextBox1.Text = WebSource
        RichTextBox2.Text = content
    End Sub

 A problem jest taki że nie wiem jak połączyć dwa argumenty tak aby było width="140px" i onclick.