Pobranie CAŁEGO bloga Wordpress na dysk twardy offline

WunderWungiel · 6 Październik 2021 13:36

Witam
Mam problem. Potrzebuję pilnie pobrać pewnego bloga Wordpress na dysk twardy do przeglądania w przyszłości offline. Blog ma około 250 stron (na każdej po ~10 postów).
Próbowałem już dwóch programów - HTTrack Website Copier:
https://www.httrack.com/
Oraz Offline Explorer:
https://metaproducts.com/products/offline-explorer
Żaden nie potrafi ściągnąć CAŁEGO bloga. Kilka pierwszych stron wraz z postami jest ściągnięte, ale późniejsze - NIE! Próbowałem też wget na Arch Linux - ten sam problem. W programach zaznaczam wszystkie pliki, wszystkie możliwe odnośniki itp. - bez efektu.
Tak więc moje pytanie, jakiś sprawdzony program, który by potrafił ŚCIĄGNĄĆ CAŁEGO BLOGA WORDPRESS NA DYSK TWARDY? CAŁEGO?
Pozdrawiam, sorry za Caps Locka, ale… nie wiem w zasadzie jakie ale

Pozdrawiam serdecznie, błagam o pomoc

krystian3w · 6 Październik 2021 13:52

Spróbuj dodać opóźnienia lub zmianę używanego IP/karty sieciowej z innym operatorem internetowym.

Może strona ma jakiś skrypt do analizy przeciążeń i banuje Cię automatycznie lub webmaster ma powiadomienie z mechanizmem szybkich banów.

aesereht · 6 Październik 2021 13:54

Jaki adres bloga?

WunderWungiel · 6 Październik 2021 14:11

Hm. Chodzi Ci o pobieranie automatycznie co jakiś czas? Lub jest może jakiś program do jakby zmiany IP co jakiś czas? Może jakiś VPN?

krystian3w · 6 Październik 2021 20:18

Tak.

deton24 · 6 Październik 2021 21:20

Ciekawe, czy archive org nie dałoby się jakoś zmusić, żeby zindeksował wszystkie wpisy. Problem tylko, bo twórca zawsze może zawnioskować o usunięcie tych kopii.

Można by to ugryźć inaczej i użyć jakiegoś scrappera.
Polega to na tym, że ściągasz Octoparse 8, trenujesz skrypt pod względem tego, jakie operacje ma wykonywać.
Normalnie na otwartej stronie tam w programie klikasz poszczególne elementy, żeby dostać się do całego wpisu, a potem jakie teksty mają być kopiowane - nagłówek i tekst, a potem, że ma wrócić do poprzedniej strony, otworzyć następny wpis, skopiować, i tak kilka razy, żeby skrypt był dobrze wytrenowany i wiedział co ma robić.
Tutorial na przykładzie FB:

jajecpl · 7 Październik 2021 11:44

Kiedys posiłkowałem się czymś takim, ale trzeba uważać co się zaznacza, bo można trafić na film w 4K, i 20 GB leci.

krystian3w · 7 Październik 2021 11:52

Już widzę jak w pętli pobiera 2499 artykułów i 249 podstron „2+”.

jajecpl · 7 Październik 2021 21:13

Można,ze tylko tekst i spokojnie =–da się

WunderWungiel · 8 Październik 2021 17:34

Nie o to chodzi, ten sam problem - ja muszę ściągnąć CAŁY BLOG, wszystkie zdjęcia, pliki, posty, podstrony itp

aesereht · 8 Październik 2021 17:57

Podaj bloga to zobaczy czy jest tam problem

jajecpl · 8 Październik 2021 18:01

A może to blog o jakiś kobietach z penisami i się wstydzi.

aesereht · 8 Październik 2021 18:04

Po innych tematach strzelam, że coś związanego z minecraftem Ale przy takich stronach może są jakieś zabezpieczenia przed kopiowaniem

aesereht · 8 Październik 2021 19:02

Możesz spróbować ustawić user-agenta w httracku może pomoże, może jest ograniczna liczba zapytań na minute itp.

Masz 15 programów do tego
https://prowebscraper.com/blog/top-website-ripper-or-website-downloader-compared/

Bradlee · 8 Październik 2021 19:26

Dosyć dawno temu z największym powodzeniem używałem Teleport Pro -- Offline Browsing Webspider
Wget jest zbyt prosty do takich operacji, a httrack można zmusić do wielu rzeczy ale wymaga to wiele wysiłku, prób i błędów.

jajecpl · 8 Październik 2021 19:59

Nie kciuk w dół, tylko najpierw zapoznaj się z menu i ustawieniami

WunderWungiel · 9 Październik 2021 13:09

O, ok, spróbuję

krystian3w · 9 Październik 2021 23:00

Jakoś nie ufam, że „listed URL-s” wykrywa te co są na stronie.

Nie daj Boże są linki zewnętrzne, to nagle „pół Internetu” zapisze i się dysk zapcha a blog dalej będzie w powijakach.

Bradlee · 10 Październik 2021 11:56

Tylko Chuck Norris potrafi zgrać internet na dyskietkę.

pvalue · 10 Październik 2021 12:00

Musisz mieć dostęp do hostingu i normalnie przegrywasz pliki wszystkie , do tego exportujesz bazę SQL ręcznie lub dedykowanym programem.