Regularne wyrażenia - kwestia/zagadnienia


(Djzon) #1

Jakie będzie regularne wyrażenie dla przykładowej strony ???

als.site.com/als/showthread.php?102-%CC%E0%FF-%F2%E5%EC%E0/page2

Najwięcej problemów mam z tym (tu się zmienia)

102-%CC%E0%FF-%F2%E5%EC%E0

dobry regex ?

als\.site\.com/als/showtread\.php\?

(lucas80) #2

Ten ciąg 102-%CC%E0%FF-%F2%E5%EC%E0

 

dopasujesz tym wyrażeniem

 

[0-9]±%[A-Z0-9]{2}%[A-Z0-9]{2}%[A-Z0-9]{2}-%[A-Z0-9]{2}%[A-Z0-9]{2}%[A-Z0-9]{2}%[A-Z0-9]{2}

 

 

als.site.com/als/showt h read.php?

 

tutaj (jeśli nie działa, bo to zależy w czym to wyrażenie jest używane) dodałbym \ przy / tak jak niweluje się właściwość kropki.


(Djzon) #3

ale

102-%CC%E0%FF-%F2%E5%EC%E0

 

jesli występuje tu dowolny ciąg to chyba nie zastąpię tego regex  --> (.*) lub [A-Z0-9_-]

 

Ciągle nie działa przeszukiwanie strony page2 , page3 page4 … bo parsowanie strony jednej dział doskonale więc co zrobić aby parsowąło wszystkie strony …należałoby dokładnie napisać regex …

 

samo wstawienie

 

page(\d+) nie rozwiązuje problemu i brakuje mi pomysłów

 

 

Potrzebny mi ten regex do 

 

BULK IMAGE DOWNLOADER (MULTIPAGE)


(lucas80) #4

Czyli teraz jak rozumuję, to 102-%CC%E0%FF-%F2%E5%EC%E0 nie ma żadnego znaczenia, bo może tu być np. &hhg-098+09908234 ?

A takie coś:

als.site.com/als/showthread.php?\d+.*/page[0-9]+


(Djzon) #5

BULK IMAGE DOWNLOADER używa Regex typu ASCII


(lucas80) #6

No to nie używaj \d+ tylko [0-9]+


(Djzon) #7

DZIAŁA