djzon
(Djzon)
26 Czerwiec 2014 09:32
#1
Jakie będzie regularne wyrażenie dla przykładowej strony ???
als.site.com/als/showthread.php?102-%CC%E0%FF-%F2%E5%EC%E0/page2
Najwięcej problemów mam z tym (tu się zmienia)
102-%CC%E0%FF-%F2%E5%EC%E0
dobry regex ?
als\.site\.com/als/showtread\.php\?
lucas80
(lucas80)
26 Czerwiec 2014 10:49
#2
Ten ciąg 102-%CC%E0%FF-%F2%E5%EC%E0
dopasujesz tym wyrażeniem
[0-9]±%[A-Z0-9]{2}%[A-Z0-9]{2}%[A-Z0-9]{2}-%[A-Z0-9]{2}%[A-Z0-9]{2}%[A-Z0-9]{2}%[A-Z0-9]{2}
als.site.com/als/showt h read.php?
tutaj (jeśli nie działa, bo to zależy w czym to wyrażenie jest używane) dodałbym \ przy / tak jak niweluje się właściwość kropki.
djzon
(Djzon)
26 Czerwiec 2014 11:11
#3
ale
102-%CC%E0%FF-%F2%E5%EC%E0
jesli występuje tu dowolny ciąg to chyba nie zastąpię tego regex --> (.*) lub [A-Z0-9_-]
Ciągle nie działa przeszukiwanie strony page2 , page3 page4 … bo parsowanie strony jednej dział doskonale więc co zrobić aby parsowąło wszystkie strony …należałoby dokładnie napisać regex …
samo wstawienie
page(\d+) nie rozwiązuje problemu i brakuje mi pomysłów
Potrzebny mi ten regex do
BULK IMAGE DOWNLOADER (MULTIPAGE)
lucas80
(lucas80)
26 Czerwiec 2014 11:25
#4
Czyli teraz jak rozumuję, to 102-%CC%E0%FF-%F2%E5%EC%E0 nie ma żadnego znaczenia, bo może tu być np. &hhg-098+09908234 ?
A takie coś:
als.site.com/als/showthread.php?\d+.*/page[0-9]+
djzon
(Djzon)
26 Czerwiec 2014 12:01
#5
BULK IMAGE DOWNLOADER używa Regex typu ASCII
lucas80
(lucas80)
26 Czerwiec 2014 12:07
#6
No to nie używaj \d+ tylko [0-9]+