Java pobieranie danych ze stron internetowych


(pain3hp) #1

jak pobrać dane w javie z stron internetowych np cały div id="kontakt"


(Razi) #2

Najpierw ściągasz przez Http całą stronę do stringa. Potem możesz:

  1. Ręcznie szukać danego Diva (patrz metody Stringa)

  2. Wyciągnąć dane poprzez REGEX

  3. Założyć że strona jest w zgodzie z xml (np. xhtml) i przeparsować jako DOM


(pain3hp) #3

połączenie już mam i moge zbierać kod do stringa ale jak wyciagnac z DOM'u coś z takiej struktury

tekst do wyciagniecia

ale tu jest pełno znaczników innych jeszcze a trzeba tylko h1

tekst do wyciagniecia

ale tu jest pełno znaczników innych jeszcze a trzeba tylko h1
[/code]

czyli wszystko co jest w h1 a to h1 musi być w ul klasie "opis"