W wyniku różnych operacji w niektórych wyrazach,
ostatnia litera mogła ulec zmianie z „ą” na „a”
np. było wcześniej „abonencką a teraz jest „abonencka”
Tych wyrazów mam bardzo dużo. Znajomi powiedzieli,
że prędzej skończy się „epidemia” niż ja to zakończę.
Zastanawiam się od czego jest rozum?
Myślę, że można to jakoś szybko posegregować.
Od czego są komputery i programiści?
A może łatwiej obliczyć trajektorię lotu rakiety na księżyc?
Oczywiście że można. Rozumiem że chcesz napisać prosty skrypt?
Zmieniasz wszyskim słowom ostanie ‘a’ na ‘ą’ i sprawdzasz czy takie slowo istnieje w slowniku, np tu: https://sjp.pl/slownik/odmiany/
roboty na 3 minuty
Dobry jesteś. A myślałem, że ta ja wszystkie rozumy pozjadałem.
Też na to wpadłem… ale na jeszcze lepszy sposób,
aby nie kopiować nazwy, następnie wklejać
i sprawdzać co zajmie około 10 sekund na wyraz.
700.000 wyrazów razy 10 sekund to zajmie… 81 dni i nocy.
Linux > instalujesz słownik aspell i język PL, czyli aspell-pl
Jeżeli masz bazę wyrazów po jednym wyrazie na linię tekstu: cat baza_z_wyrazami.txt | aspell list -a --dont-suggest >> złe_wyrazy.txt
W pliku złe_wyrazy.txt masz odsiane niepoprawne wyrazy.
cat wyświetla zawartość pliku, prawie to samo, co type w plikach wsadowych.
Można było zrobić poprzez opcję -c w aspell, ale wtedy program wchodzi w interakcję i pyta dla każdego z osobna słowa, czy poprawić lub zamienić na inne słowo.
cat baza_z_wyrazami.txt przekazuje zawartość pliku poprzez “|” na program aspell, list formatuje wyrazy w formie listy, -a powoduje kompatybilność z przekazywaniem danych za pomocą “|”, --dont-suggest wyłącza podpowiedzi alternatywnych/poprawnych słów na wyjściu, a >> przekazuje wyjście do pliku.
Nie, raczej nie przejdzie, bo tam nie ma “rurek”, “|” do przekazywania danych.
W grę wchodzi PowerShell, musiałbyś go doinstalować i niech ktoś, kto lepiej ogrania składnię w PowerShell Ci podpowie.
Pod Linux żywcem przeklej polecenie, zmień nazwę pliku z bazą słów na swój i zadziała bez problemu. (pod warunkiem, że aspell i aspell-pl będzie zainstalowane)
Mam dostęp do bazy… to jest plik tekstowy i nazywa się baza.txt
Aspell mam zainstalowany w Notepad++ i czyta z pliku binarnego:
pl.rws , który tworzę z pliku baza.txt
Tak tylko tam każdy program używa własnych binarek, a pod Linux masz jedną binarkę na cały system - każda “chętna” aplikacja po prostu sobie go używa, co więcej w trybie CLI można w pełni w interakcję z tym słownikiem wejść.
Rozwiązanie w każdym razie Ci podałem.
W Windows 10 problem byś miał z głowy, bo tam jest Windows Subsystem for Linux (WSL).