Sparawdzanie częstotliwośći występowania wyrazu, Czy któryś


(Xerox91) #1

Elo

mam plik z tysiącami wyrazami.

Chce wiedzieć jakie wyrazy się powtarzają??

Jak to sprawdzić?


(Marcin Obala) #2

Czy te wyrazy są w nowych liniach ?? jeśli tak to skopiuj i wrzuć do excela (albo arkusza kalkulacyjnego w open office) i posortuj. Będziesz widział jakie wyrazy się powtarzają. Można też napisać jakiś prosty program do tego.


(Xerox91) #3

ale jak mam tysiąc słów to mogę któres przypadkiem pominąc (niezauważyc ze się 2x powtarza)

nie ma programu do tego?


(Sawyer47) #4

Może być taki wysmażony na szybko skrypcik Ruby? Jako argument należy podać ścieżkę do pliku

#!/usr/bin/ruby -KU


hash = {};


IO.foreach(ARGV[0]) do |line|

	line.gsub(/[^ \w]/, '').downcase.tr('ĄĆĘŁŃÓŚŹŻ', 'ąćęłńóśźż').split.each do |w|

		hash[w] ? hash[w] += 1 : hash[w] = 1

	end

end


hash.each_pair do |key, val|

	printf " - '%s' występuje %d razy\n", key, val if val > 2

end