Jak pobrać plik ze spisem wszystkich miejscowości w Polsce

sexy69bis · 9 Wrzesień 2017 09:02

Chciałbym te miejscowości zapisać do pliku tekstowego.

W poniższym linku nie mogę znaleźć gdzie to jest zapisane

urzedowy_wykaz_nazw_miejscowosci_2012.pdf
nie nadaje się do wyłuskania tych miejscowości, chyba, że przeglądająć ponad 10.000 linii.

Może istnieje gdzieś plik z takim spisem.

tomcio_pl · 9 Wrzesień 2017 10:53

Tu masz wykaz miejscowości w Excelu
http://ksng.gugik.gov.pl/pliki/urzedowy_wykaz_nazw_miejscowosci_2015.xlsx

Bogdan_G · 9 Wrzesień 2017 11:09

A tu masz w pdf

A tu do pliku tekstowego ode mnie:
https://mega.nz/#!RK4AlahL!qtkRy4fAk8SiI1Z38fHrZr5TNa8Y5c6Ujwaph5aJxFw

sexy69bis · 9 Wrzesień 2017 12:17

Dzięki Bogdan.
Plik tekstowy mnie uratował.
PDF jest zabezpieczony przed kopiowaniem.

Z Excela ciężko wydłubać nazwy miejscowości, np.
Abisynia, część wsi Turzyn lub część kolonii Dąbrowa
lub osada lub część miasta Starachowice.

Trochę nie bardzo to pasuje do wsi czy miasta, a taka wieś jednak istnieje w pomorskim.

Wyszło mi, że w Polsce jest: 25055 miejscowości

Bogdan_G · 9 Wrzesień 2017 12:36

Akelpad obsługuje tysiące stron tekstowych i lekko mu. Systemowy notatnik zawiesza się przy takiej ilości tekstu.
Akelpad jest czysty, ale Nasi uparci, nie dają tego programu raz, że ustawia się polski, a dwa, że portable i instalacyjny jednakowo dobre.
Ten plik tekstowy ma grubo ponad 7MB. Dlatego nie można było normalnie dodać do postu. Konwerty darmowe online też zawieszało na pdf to txt. Ale przypadkiem znalazłem jakiś tam na 5 str wyników google - stąd plik. Dodam, że pdfunlock.com nie wykrywał zabezpieczeń na pdf. Siakieś teraz mają takie uciążliwe zabezpieczenia.
Mnie też przyda się ta lista, dlatego zaciąłem się na problemie.
Uparci mają więcej

sexy69bis · 9 Wrzesień 2017 13:33

Jakby ktoś chciał to tu jest spis miejscowości w Polsce
SpisMiejscowosci.txt (242,1 KB)

A jak taki duży plik tu załadowałeś?
Mnie nie chce

Bogdan_G · 9 Wrzesień 2017 15:19

To jest tak, że firefox otwiera sukcesywnie w miarę przewijania, bo to duży plik. Ale da się pobrać na dysk. Mam sumatrę pdf, czy pdf xchange wiewer - oba portable i przydatnie.
Ten plik pdf załadowałem na mega:
https://mega.nz/#!oSI02ADB!j1LYc9mbs-vdmm0yMMruydLW8_4YRxuB-Uqva_A-NMc
Przeglądarki pdf też otwierają sukcesywnie bardzo długie pdf. Ale można poczytać.
Z pdf można skopiować tekst tylko ze stron, które się załadują - nawet w tych przeglądarkach - stąd trudność, żeby z całego pliku zrobić tekstowy. To ponad 1700 stron.
Gdyby programem do rozpoznawania tekstu z modułem OCR chcieć skopiować tekst z tego pliku pdf, to trzeba by było kompa siódmej generacji, a obawiam się, że i tak by zawiesiło superkomputer.

sexy69bis · 9 Wrzesień 2017 15:28

Ten pdf odkodowałem i teraz przerabiam go na ,txt i porównam z wcześniejszym plikiem tekstowym

fb45 · 9 Wrzesień 2017 16:12

Tutaj spróbuj http://eteryt.stat.gov.pl/eTeryt/rejestr_teryt/udostepnianie_danych/baza_teryt/uzytkownicy_indywidualni/pobieranie/pobieranie.aspx?contrast=default