Jak poprawnie zainstalować polskie biblioteki we FreeOCR?

Witam.

Posiadam programik FreeOCR.net do konwersji plików graficznych na tekst. Niestety domyślnie program odczytuje tylko angielskojęzyczne znaki. Wiem jednak, że można doinstalować mu także biblioteki języka polskiego, dzięki czemu to odczytywanie stanie się łatwiejsze i lepsze. Znalazłem stronę skąd właśnie można je pobrać: tutaj

Jednak nie bardzo wiem, które dokładnie to są pliki wydaje mi się, że: stąd jak również proszę o wskazówki jak i do jakiej lokalizacji skopiować pliki by wszystko działało jak należy ? :slight_smile:

Na tym programie, użytkownicy wieszają psy. Właściwie, można po dodaniu do ulubionych korzystać z darmowego http://www.ocrzilla.pl/ na razie za darmo do odwołania.

Pamiętam, że OCR od Google’a całkiem nieźle sobie radzi z polskimi znakami. Zwyczajnie wczytaj obrazek do Google Docs.

Skoro tak uważasz, to przyjmuję to do wiadomości. Gdybyś jednak napisał co legło u postaw tak krytycznych opinii o tym programie.

Natomiast nie wiem o jakie dodanie do ulubionych Ci chodzi i jakie ma znaczenie, rozumiem że o dodanie do zakładek tak ?

Ja muszę powiedzieć, że program nawet przypadł mi do gustu, jest mały, lekki no i szybki względnie. Natomiast z jakością wyników już gorzej, choć jak na tak mały programik to i tak nieźle, program przede wszystkim deformuje postać pierwotną pliku, w dalszej kolejności słabo rozpoznaje i gubi wiele polskich i innych jeszcze, uniwersalnych znaków.

Więc sobie myślę, a chciałbym się o tym przekonać, aby wyrobić sobie zdanie o tym - czy gdyby mu dorzucić te pliki bibliotek polskich może by się poprawił ? Napisz może jak to zrobić - jeśli to wiesz ?

Ten OCRZilla wydawał się być strzałem w 10, niestety efekt końcowy okazał się bardzo kiepski - rozpoznał tylko kilka znaków i wszystko. A przecież plik źródłowy wysłałem w rozdzielczości dokładnie 300x300 dpi.

Nie wiem, pliki screenów chyba powinno się konwertować i wysyłać w innej rozdzielczości - bo 96 dpi właśnie ?

Przetestowałem. I to zarówno w .txt , jak i w .pdf i .rtf.

Pod tym względem już o wiele lepiej wypada FreeOCR.net nawet bez tych bibliotek.

Zobacz: tak wygląda ten plik jako źródłowy w .jpg , a: tak jako ten przerobiony w OCRZilla w .txt ,: tak w .pdf , w .rtf od MS Worda wygląda bardzo podobnie. Być może od czegoś jeszcze to zależy ?

Właśnie tak się składa, że ostatnio myślałem o dysku Google i zintegrowanym z nim Google Docs jako o usłudze i edytorze plików zarazem. Ale nie korzystałem z niego dotychczas, choć konto Google posiadam, gdybyś napisał kilka słów kluczowych odnośnie wrzucania i edycji tam tych plików.

Czy Google Docs obsługuje także formaty .jpg i .png bo .pdf już raczej tak ?

I czy przechowywane tam pliki można swobodnie przesyłać później np. na forum do pokazania ?

Napisz jak tam u nich z jakością, nie tylko od strony polskiej poprawności językowej, ale też formatowania tzn. czy zachowana jest cała struktura i forma pliku wyjściowego w stosunku do źródłowego ?

Jaki jest max rozmiar pojedynczego dodawanego pliku ? :idea:

zobacz > http://www.paperfile.net/lang.html