[C++ Builder] Parsowanie źródła strony

Witam!

Pobrałem do pola Memo1 źródło strony i teraz chciałbym wyciągnąć z niego pewne informacje.

TREŚĆ2012-02-28 15:41

Troszkę czytałem o parsowaniu źródła w internecie i ponoć do tego używa się wyrażeń regularnych, byłbym wdzięczny jakby ktoś podpowiedział jak to uczynić w C++ Builder

To jest tak: C++ w bibliotekach standardowych nie ma wsparcia dla wyrażeń regularnych. Są w dodatkowych bibliotekach boost, polecam poczytać.

ALE

Ważnym pytaniem jest na ile się znasz na programowaniu. Wyrażenia regularne są znane z dość skomplikowanej składni i nie są polecane początkującym programistom.

Proponuję inne podejście, poprawny html to tak naprawdę xml, więc może powinieneś te źródło sparsować przez TXMLDocument (z tego co pamiętam z delphi jest do tego nawet kontrolka), a z tego już naprawdę bardzo prosto można powyciągać potrzebne informacje. Jeśli nie obracasz się na codzień w tych tematach to ten sposób polecam najbardziej :).

Chyba TXMLDocument to zły pomysł, cały czas generuje błędy co do poprawności składni pliku…

Na samym początku pliku dodaj <?xml version=“1.0” encoding=“UTF-8”?>

Popraw ostatniego diva bo zamiast < div> musi być

Problem polega na tym, że przytoczyłem tylko fragment źródła, a do parsowania jest cała skomplikowana strona, która sobie instnieje w sieci.