[C#]Regex i zmiana wyrażenia w MatchCollections


(Sumek) #1

Witam,

Parsuję kod HTML za pomocą wyrażeń regularnych. Następnie dane wrzucam w MatchCollections, a potem w HashSet.

Mój problem polega na tym, że niektóre linki są ścieżkami względnymi, zaczynającymi się od pewnego momentu i chciałbym dopisać przed nimi http://www.strona.com/ ale nie wiem jak zrobić to tylko w tych linkach, które są niepełne.


(Fiołek) #2

(Tomek Matz) #3

Zmień to. Tutaj masz trochę info o tym jakie rozwiązania możesz zastosować http://stackoverflow.com/questions/56107/what-is-the-best-way-to-parse-html-in-c. Wspomniany w podanym przeze mnie linku Html Agility Pack sprawdza się świetnie (ale dodam tutaj, że ja nigdy nie używałem tej biblioteki z wersją HTML 5, więc nie wiem jak sobie z nią poradzi - musisz sam sprawdzić). Jeśli ten HTML, który parsujesz to XHTML to użyj wówczas wbudowanego rozwiązania jakim jest Linq to XML.