Java pobieranie danych ze stron internetowych

jak pobrać dane w javie z stron internetowych np cały div id=“kontakt”

Najpierw ściągasz przez Http całą stronę do stringa. Potem możesz:

  1. Ręcznie szukać danego Diva (patrz metody Stringa)

  2. Wyciągnąć dane poprzez REGEX

  3. Założyć że strona jest w zgodzie z xml (np. xhtml) i przeparsować jako DOM

połączenie już mam i moge zbierać kod do stringa ale jak wyciagnac z DOM’u coś z takiej struktury

tekst do wyciagniecia

ale tu jest pełno znaczników innych jeszcze a trzeba tylko h1

tekst do wyciagniecia

ale tu jest pełno znaczników innych jeszcze a trzeba tylko h1
[/code]

czyli wszystko co jest w h1 a to h1 musi być w ul klasie “opis”