Jak ułożyć polecenie w DOS, aby wyciągnąć zawartość Hunspell do pliku tekstowego?

Uważasz, że już nic nie potrafię.
Dość mam nauki w swojej pracy i nie chcę się zajmować wszystkimi
sprawami na świecie. I tak zmarnowałem kilka dni
z hunspellem i do niczego właściwie nie doszedłem.
Wiem, jak on działa i jak by było trzeba programować,
aby to odkręcić (wyciągnąć słowa wraz z odmianami), to utopia.
Denerwuje mnie to, że są porady dla Linuxa, a nijak tego nie mogę przerobić na Widows.
Jest kilkanaście stron jak przekonwertować słownik
aspela pl.rws na hunspell pl_PL.dic, ale nic mnie nie pomogły.
Znalalazłem sposób, aby przekonwertować słownik.txt na pl_PL.dic, ale coś tam nie gra.
Część jest w ISO a część w UTF-8.
Być może jest tam rozwiązanie, ale trzeba się na tym znać.

Jeśli masz rozwiązania dla Linuksa i nie potrafisz tych, które masz przełożyć na Windows to rozwiąż problem w maszynie wirtualnej z Linuksem, albo zbootuj sobie komputer z jakiegoś live systemu na USB. Mamy XXI wiek, są możliwości. Aspell, hunspell i inne słowniki jak ispell itp. to są typowe programy wywodzące się z uniksowej ścieżki i nic dziwngo, że ich użytkownicy pracują na tego typu sytemach a więc i porady dotyczą głównie tych systemów. Może świat Microsoftu ma jakieś swoje rozwiązania tych problemów, nie wiem, bo nie nigdy nie używałem jednorazowo Windows dłużej niż kilka godzin, praca na tym systemie jest zbyt uciążliwa.

A ja nigdy nie używałem linuksa.
Mam problem z polecaniami w DOS’ie.
np.
hunspell.exe -d pl_PL < b:\slownik-ISO.txt > B:\pl_PL.dic
przekonwertowane na .dic angielskie.

plik pl_PL.aff pozostaje ten sam.

Rozpoznaje jako dobre… tylko wyrazy angielskie

Wtedy to powinno być łatwe do znalezienia w Google :grinning:

Ta komenda robi coś zupełnie innego niż myślisz, że robi, a to dlatego, że nadal nie zapoznałeś się z materiałami i wiedzą, którą dostałeś w innym temacie.
Poza tym już 2 razy w tym temacie napisałem, że hunspell sam w sobie NIE POZWALA na uzyskanie tego, o co pytasz.

TU np. na samym dole jest o tym

To dotyczy aspella, a pytałeś o hunspella…
Skoro znalazłeś gotowe rozwiązanie to pozostaje Ci albo odpalić je w Linuksie, albo przepisać na CMD. Z tego co widzę to bez problemu można to też przepisać na Powershelll ale oczywiście nikt za Ciebie tego nie zrobi.

No właśnie, jak w tym wszystkim się rozpoznać?
Dwa pierwsze obrazki pokazują zawartość plików .dic i .aff,
które należą do hunspella.

Może aspell je konwertuje?

Jak zwykle nie zadałeś sobie trudu, żeby zrozumieć co tamte osoby napisały. Autor wątku pytał o pliki hunspella, ale odpowiedź dostał dla aspella.

Jakbyś jednak zdecydował się zrobić to na linuksie to masz jeszcze jedną podpowiedź, program unmunch. Prościej niż nim to się już nie da.

Ale wygląda tam na to, że Aspell może przekonwertować słownik do Hunspella.

Na podstawie artykułu, który podesłałeś takiego wniosku wyciągnąć nie można. Natomiast operacja jest jak najbardziej możliwa i samego aspella nawet do tego nie potrzeba.

Problem mam taki.
Co zrobić, aby stworzyć słownik w Hunspelu
z pliku tekstowego zawierającego kilka milionów słów.

Przy samej tylko obróbce tego pliku tekstowego mam pracy na kilka miesięcy. :grinning:

Ciągle zmieniasz zdanie. Nikt już chyba nie wie co tak naprawdę chcesz zrobić. A tworzenia słownika Ci nie polecam, to nie jest zadanie na jeden wieczór.

Może inaczej.
Są polskie wyrazy np Zofią, zawał, ceł, które po stracie ogonków wyglądają tak: Zofia, zawal, cel.
chcę aba HunSpell je wykrywał i zaznaczał jako błąd.
Przeprowadzam, różne kombinacje i chwytam się różnych sposobów.
Najprostszym sposobem, tak mnie się wydaje to usunąć te wyrazy ze słownika.

Jesteś pewny, że to ma sens? Zofia i cel to są poprawne słowa.

A jeśli było napisane w oryginale Zofią i ceł to tekst zawiera błędy.

hunspell.exe --lang=pl -d < b:\slownik-ISO.txt > B:\pl_PL.dic
hunspell.exe -d pl_PL < b:\slownik-ISO.txt > B:\pl_PL.dic

te polecenia robią mnie z pliku tekstowego plik .dic (tak sądzę).

A Hunspell jest potrzebny tylko dlatego,
że błędy są zaznaczane poprzez pokrycie wyrazu paskiem,
a nie podkreśleniem jak to robi Aspell, przez co zaznaczenie jest bardziej widoczne

Gdyby udało się takie zaznaczenie wprowadzić do Aspella. to Hunspell stałby się zbyteczny.

Po lewej są wyrazy, które skonwertowałem do pliku .dic i podmieniłem w Hunsell w Notepad++.
Po prawej jest wynik sprawdzania tym Hunshell’em.

Powinny być wszystkie dobre, a są dobre tylko te, co składają się z dwóch członów.
Plik .dic przeze mnie stworzony, Hunspell go zaakceptował, a mimo to…

te polecenia robią mnie z pliku tekstowego plik .dic (tak sądzę).

Robią plik B:\pl_PL.dic, ale czy jest to plik słownika hunspella? Dlaczego miałby nim być lub nie być Twoim zdaniem?

A Hunspell jest potrzebny tylko dlatego,
że błędy są zaznaczane poprzez pokrycie wyrazu paskiem,
a nie podkreśleniem jak to robi Aspell, przez co zaznaczenie jest bardziej widoczne

To w ogóle nie ma związku z aspellem czy hunspellem tylko jest to sprawa Notepad++.

Massz rację.

Wygląda podobnie, ale nie działa.
A w ogóle co to za plik powstaje po tym poleceniu?
hunspell.exe --lang=pl -d < b:\slownik-ISO.txt > B:\pl_PL.dic

Czuję, że jest to tylko błąd w poleceniu.

Czyli… pozostał mi tylko Notepad++.
Tylko jak wprowadzić zmodyfikowany słownik (plik tekstowy)
do Hunspell’a w Notepad’zie?, lub przekonwertować z Aspella do Hunspella.

Jako autor tego polecenia powinieneś wiedzieć co ono robi.

Tylko jak wprowadzić zmodyfikowany słownik (plik tekstowy)
do Hunspell’a w Notepad’zie?

Nie wiem, nie mam Windows.

przekonwertować z Aspella do Hunspella

http://app.aspell.net/create

Robiłem eksperymenty i to… zadziałało.
Podobne do .dic.
Notepad++ to akceptuje, ale to nie działa.
Czuję, że jestem na tropie tylko coś mam w poleceniu nie tak. :sleepy:

Już się ucieszyłem, że wreszcie koniec udręki. ale niestety…

Use this tool to create and download custimized Word Lists or Hunspell dictionaries from SCOWL.

tam w „SCOWL” nie ma plika wykonywalnego exe, ani instalatora.