Sparawdzanie częstotliwośći występowania wyrazu, Czy któryś

Elo

mam plik z tysiącami wyrazami.

Chce wiedzieć jakie wyrazy się powtarzają??

Jak to sprawdzić?

Czy te wyrazy są w nowych liniach ?? jeśli tak to skopiuj i wrzuć do excela (albo arkusza kalkulacyjnego w open office) i posortuj. Będziesz widział jakie wyrazy się powtarzają. Można też napisać jakiś prosty program do tego.

ale jak mam tysiąc słów to mogę któres przypadkiem pominąc (niezauważyc ze się 2x powtarza)

nie ma programu do tego?

Może być taki wysmażony na szybko skrypcik Ruby? Jako argument należy podać ścieżkę do pliku

#!/usr/bin/ruby -KU


hash = {};


IO.foreach(ARGV[0]) do |line|

	line.gsub(/[^ \w]/, '').downcase.tr('ĄĆĘŁŃÓŚŹŻ', 'ąćęłńóśźż').split.each do |w|

		hash[w] ? hash[w] += 1 : hash[w] = 1

	end

end


hash.each_pair do |key, val|

	printf " - '%s' występuje %d razy\n", key, val if val > 2

end