Jak pobrać plik ze spisem wszystkich miejscowości w Polsce


(sexy69bis) #1

Chciałbym te miejscowości zapisać do pliku tekstowego.

W poniższym linku nie mogę znaleźć gdzie to jest zapisane

urzedowy_wykaz_nazw_miejscowosci_2012.pdf
nie nadaje się do wyłuskania tych miejscowości, chyba, że przeglądająć ponad 10.000 linii.

Może istnieje gdzieś plik z takim spisem.


(tomcio_pl) #2

Tu masz wykaz miejscowości w Excelu
http://ksng.gugik.gov.pl/pliki/urzedowy_wykaz_nazw_miejscowosci_2015.xlsx


(Bogdan_G) #3

A tu masz w pdf


A tu do pliku tekstowego ode mnie:
https://mega.nz/#!RK4AlahL!qtkRy4fAk8SiI1Z38fHrZr5TNa8Y5c6Ujwaph5aJxFw


(sexy69bis) #4

Dzięki Bogdan.
Plik tekstowy mnie uratował.
PDF jest zabezpieczony przed kopiowaniem.

Z Excela ciężko wydłubać nazwy miejscowości, np.
Abisynia, część wsi Turzyn lub część kolonii Dąbrowa
lub osada lub część miasta Starachowice.

Trochę nie bardzo to pasuje do wsi czy miasta, a taka wieś jednak istnieje w pomorskim.

Wyszło mi, że w Polsce jest: 25055 miejscowości


(Bogdan_G) #5

Akelpad obsługuje tysiące stron tekstowych i lekko mu. Systemowy notatnik zawiesza się przy takiej ilości tekstu.
Akelpad jest czysty, ale Nasi uparci, nie dają tego programu raz, że ustawia się polski, a dwa, że portable i instalacyjny jednakowo dobre.
Ten plik tekstowy ma grubo ponad 7MB. Dlatego nie można było normalnie dodać do postu. Konwerty darmowe online też zawieszało na pdf to txt. Ale przypadkiem znalazłem jakiś tam na 5 str wyników google - stąd plik. Dodam, że pdfunlock.com nie wykrywał zabezpieczeń na pdf. Siakieś teraz mają takie uciążliwe zabezpieczenia.
Mnie też przyda się ta lista, dlatego zaciąłem się na problemie.
Uparci mają więcej :wink:


(sexy69bis) #6

Jakby ktoś chciał to tu jest spis miejscowości w Polsce
SpisMiejscowosci.txt (242,1 KB)

A jak taki duży plik tu załadowałeś?
Mnie nie chce :joy:


(Bogdan_G) #7

To jest tak, że firefox otwiera sukcesywnie w miarę przewijania, bo to duży plik. Ale da się pobrać na dysk. Mam sumatrę pdf, czy pdf xchange wiewer - oba portable i przydatnie.
Ten plik pdf załadowałem na mega:
https://mega.nz/#!oSI02ADB!j1LYc9mbs-vdmm0yMMruydLW8_4YRxuB-Uqva_A-NMc
Przeglądarki pdf też otwierają sukcesywnie bardzo długie pdf. Ale można poczytać.
Z pdf można skopiować tekst tylko ze stron, które się załadują - nawet w tych przeglądarkach - stąd trudność, żeby z całego pliku zrobić tekstowy. To ponad 1700 stron.
Gdyby programem do rozpoznawania tekstu z modułem OCR chcieć skopiować tekst z tego pliku pdf, to trzeba by było kompa siódmej generacji, a obawiam się, że i tak by zawiesiło superkomputer.


(sexy69bis) #8

Ten pdf odkodowałem i teraz przerabiam go na ,txt i porównam z wcześniejszym plikiem tekstowym


(fb45) #9

Tutaj spróbuj http://eteryt.stat.gov.pl/eTeryt/rejestr_teryt/udostepnianie_danych/baza_teryt/uzytkownicy_indywidualni/pobieranie/pobieranie.aspx?contrast=default