Usuwanie duplikatów z pliku

manitou · 1 Sierpień 2020 11:36

Bardzo Dziękuję za odpowiedź the_scx the_scx

Na pierwszy rzut oka wygląda to fajnie ale

Plik zawiera prawie 100 000 lini więc jak do takiego dużego pliku stworzyć polecenie ?

Mógłbyś też jakoś wytłumaczyć jak to zrobić na Windows 7. Jak to zainstalować i uruchomić bo z tego co widzę to nie jest takie proste jak by się wydawało

manitou · 1 Sierpień 2020 13:41

udało mi się odpalić takie coś:

ale jak utworzyć polecenie by np. w pliku lista.txt usunął wszystkie zduplikowane linie, pominął spacje i zapisał to w pliku lista_2.txt ?

Czy ja to w ogóle dobrze zrobiłem ?

manitou · 1 Sierpień 2020 14:55

Korzystając z propozycji the_scx the_scx zrobiłem to tak:

ściągłem plik SimpleAWKforWindows - jest w nim 6 plików:

in.txt - (tutaj edytowałem i umieściłem swoje dane)
out.txt - ten plik generuje program
awk95.exe
AWK
prog.awk - ten plik edytowałem wpisując polecenie the_scx

!a[$0]++ { print $0; next } /^[[:space:]]*$/ { print $0 }

run.bat - na koniec uruchamiam plik i program generuje oczyszczoną ze zduplikowanych linii bazę danych