Usuwanie duplikatów z pliku

Bardzo Dziękuję za odpowiedź the_scx the_scx

Na pierwszy rzut oka wygląda to fajnie ale :frowning:

Plik zawiera prawie 100 000 lini więc jak do takiego dużego pliku stworzyć polecenie ? :frowning:

Mógłbyś też jakoś wytłumaczyć jak to zrobić na Windows 7. Jak to zainstalować i uruchomić bo z tego co widzę to nie jest takie proste jak by się wydawało :frowning:

udało mi się odpalić takie coś:


ale jak utworzyć polecenie by np. w pliku lista.txt usunął wszystkie zduplikowane linie, pominął spacje i zapisał to w pliku lista_2.txt ?

Czy ja to w ogóle dobrze zrobiłem ?

Korzystając z propozycji the_scx the_scx zrobiłem to tak:

  • ściągłem plik SimpleAWKforWindows - jest w nim 6 plików:

in.txt - (tutaj edytowałem i umieściłem swoje dane)
out.txt - ten plik generuje program
awk95.exe
AWK
prog.awk - ten plik edytowałem wpisując polecenie the_scx

!a[$0]++ { print $0; next } /^[[:space:]]*$/ { print $0 }

run.bat - na koniec uruchamiam plik i program generuje oczyszczoną ze zduplikowanych linii bazę danych :slight_smile: