Potrzebny jest jakiś darmowy, w miarę sprawnie działający OCR. Testował ktoś różne wersje i może coś podpowiedzieć?
Tesseractem kiedyś się bawiłem. Z prostymi tekstami jakoś sobie radził z tego co pamiętam, ale jeśli chodzi o darmowe OCR z polskim językiem to nie jest kolorowo.
Tyle że to jest chyba konsolowe narzędzie, nakładka graficzna na niego to np
Ja używałem darmowego ABBYY Screenshot Reader; trochę stary z PC Format.
Nawet sobie radził, minus że przy pomocy zrzutów ekranów a nie, że przetwarzał plik.
Dzięki za info.
Z tego co czytam, to w przypadku darmowych rozwiązań nie wygląda to różowo.
Coś mi się wydaje, że trzeba będzie zainwestować…
Darmowy OCR? A kiedyś korzystałem z tego:
Ma takie opcje, potrzeba pobrać plugin.
Testuję OCR w PDF-XChange, ale cosik mi nie idzie.
Niby przetwarzanie dokumentu po kliknięciu w OCR idzie, ale nie przenosi do żadnego programu tekstowego. Jedyna zmiana po kliknięciu i przetworzeniu dokumentu przez OCR, to pytanie czy zapisać zmieniony dokument podczas jego zamykania.
Czego tu nie kumam?
Edyta
Dobra. Już to rozkminiłem.
Jednak jestem zawiedziony poziomem dokładności… a raczej niedokładności
A bo dawno nie mam…
PDF - do wykrywanie tekstu - programów z OCR nie trzeba.
Sumatra:
Otwierasz PDF, dajesz PPM, potem zaznacz wszystko, potem kopiuj zaznaczenie. Wklejasz do notatnika, wordpada, czy do jakiego office.
Najlepszy z notatników, to akelpad - można wklejać i tysiąc stron tekstu z PDFu.
Swoją drogą, to onenote ma OCR, ale przy wykrywaniu tekstu z 20 stron, potrafi zamulić system.
Do samego tekstu z PDF może być malutki coolpdf reader. Za darmo, to kopiuje tekst aż miło z strony:
Wycinanie tekstu z PDF to nie OCR
Właśnie o tym zacząłem pisać…
Rzeczywiście większość programów do PDF poradzi sobie z plikiem PDF przygotowanym np Worda, ale już nie da rady z plikiem PDF przygotowanym np fotografii lub bezpośrednio ze skanera. Więc musi jednak być OCR.
Z obrazków - to OCR online. Nie potrzebowałem, żeby OCR mulił system.
Poczytaj sobie co to jest OCR, a dopiero potem polecaj edytror PDFów.
Na pdfie formaty dokumentów się nie kończą