Darmowy OCR

Potrzebny jest jakiś darmowy, w miarę sprawnie działający OCR. Testował ktoś różne wersje i może coś podpowiedzieć?

Tesseractem kiedyś się bawiłem. Z prostymi tekstami jakoś sobie radził z tego co pamiętam, ale jeśli chodzi o darmowe OCR z polskim językiem to nie jest kolorowo.
Tyle że to jest chyba konsolowe narzędzie, nakładka graficzna na niego to np

Ja używałem darmowego ABBYY Screenshot Reader; trochę stary z PC Format.

Nawet sobie radził, minus że przy pomocy zrzutów ekranów a nie, że przetwarzał plik.

Są tez rozwiązania online. Między innymi:
https://www.onlineocr.net/default.aspx

1 polubienie

Dzięki za info.
Z tego co czytam, to w przypadku darmowych rozwiązań nie wygląda to różowo.
Coś mi się wydaje, że trzeba będzie zainwestować…

Darmowy OCR? A kiedyś korzystałem z tego:


Ma takie opcje, potrzeba pobrać plugin.

Testuję OCR w PDF-XChange, ale cosik mi nie idzie.

Niby przetwarzanie dokumentu po kliknięciu w OCR idzie, ale nie przenosi do żadnego programu tekstowego. Jedyna zmiana po kliknięciu i przetworzeniu dokumentu przez OCR, to pytanie czy zapisać zmieniony dokument podczas jego zamykania.
Czego tu nie kumam?


Edyta
Dobra. Już to rozkminiłem.
Jednak jestem zawiedziony poziomem dokładności… a raczej niedokładności :frowning:

A bo dawno nie mam…
PDF - do wykrywanie tekstu - programów z OCR nie trzeba.
Sumatra:
Otwierasz PDF, dajesz PPM, potem zaznacz wszystko, potem kopiuj zaznaczenie. Wklejasz do notatnika, wordpada, czy do jakiego office.
Najlepszy z notatników, to akelpad - można wklejać i tysiąc stron tekstu z PDFu.

Swoją drogą, to onenote ma OCR, ale przy wykrywaniu tekstu z 20 stron, potrafi zamulić system.

Do samego tekstu z PDF może być malutki coolpdf reader. Za darmo, to kopiuje tekst aż miło z strony:

Wycinanie tekstu z PDF to nie OCR :roll_eyes:

Właśnie o tym zacząłem pisać…
Rzeczywiście większość programów do PDF poradzi sobie z plikiem PDF przygotowanym np Worda, ale już nie da rady z plikiem PDF przygotowanym np fotografii lub bezpośrednio ze skanera. Więc musi jednak być OCR.

1 polubienie

Z obrazków - to OCR online. Nie potrzebowałem, żeby OCR mulił system.

Poczytaj sobie co to jest OCR, a dopiero potem polecaj edytror PDFów.
Na pdfie formaty dokumentów się nie kończą :stuck_out_tongue:

Poznajesz tekst z obrazka?


To z convertio online.
Pewnie, że jest dużo formatów obrazów.
Zasugerowałem się pdf. Ze skanów - nawet z pisma odręcznego - starałem się latami wydobywać tekst.