OCR ze zdjęcia - jaka rekomendowana rozdzielczość?

roller_coaster · 15 Marzec 2020 15:08

Wiem, że dla OCR jest rekomendowane 300 DPI. Ale co w sytuacji, gdy nie mam wartości DPI, tylko wartości zdjęcia? Mój problem polega na tym, że mam duże jpg, np. 3 252x4 577 pixels, 14.9MP, 4,0MiB. Pdf z tego miałby około 1GB. Dlatego muszę zmniejszyć rozmiar zdjęć.

Wiem, że jakość zdjęcia, a jego rozmiar w pixelach to dwie różne sprawy. Ale przy założeniu, że obecnie zdjęcia nadają się do OCR, jakie wartości będą rekomendowane, żeby nie tracąc jakości zdjęcia, zmniejszyć je tak żeby się dało normalnie pracować?

stens1950 · 15 Marzec 2020 15:27

Spróbuj tu, może będzie mniejszy.
https://www.onlineocr.net/pl/

anon47021787 · 15 Marzec 2020 17:01

Klikasz prawym klawiszem na pliku-obrazku, z menu kontekstowego wybierasz - Właściwości, zakładka Szczegóły i masz wszystko co potrzeba.

roller_coaster · 15 Marzec 2020 19:03

Przecież nie pierwszy dzień korzystam z komputera. Ja chcę wiedzieć jak bardzo można zmniejszyć obraz, żeby nie miało to negatywnego wpływu na OCR. Zakładam, że jest jakaś granica, poza którą nawet jeśli pierwotny plik daje dobrze rozpoznany tekst, przy zmniejszaniu rozdzielczości w końcu będzie miało to zły efekt.

Inaczej mówiąc, jakbym skanował w 300 DPI, to efektem byłby jakiś plik graficzny o jakieś rozdzielczości. Ale ten krok pomijam i zaczynam od kroku drugiego, tj. od zmniejszenia pliku.

A OCR chcę zrobić w pdf-exchange viewer, bo działa dobrze pod Linuksem, z którego korzystam.

Wiem, że mogę sam przeprowadzać eksperymenty, ale wydawało mi się, że jak ktoś ma doświadczenie, to poradzi.

deton24 · 15 Marzec 2020 19:34

FineReader ma ustaloną dolną granicę, poniżej której pojawia się komunikat, że rozdzielczość jest za mała, i stanowi właśnie wykrycie poniżej 300 DPI.

We właściwościach obrazu, często też w dedykowanych przeglądarkach obrazów, a nawet we właściwościach na Windowsie, masz podaną wartość DPI dla każdego zdjęcia. Zmniejszasz w jakimś konwerterze wszystkie obrazy o ileś procent, aż zobaczysz nie mniej niż 300 DPI. Nie wiem, czy Xnview jest na Linuxie. Jest tam opcja batch conversion. Nie zalinkuję gotowego kalkulatora, bo z żadnym się specjalnie nie mogę obecnie “dogadać”.

PDF ze zdjęć wcale nie musi mieć oryginalnego rozmiaru i jakości.
Wręcz przeciwnie, odradza się to, bo przeglądanie potem takiego pliku trwa długo i jest uciążliwe.
Przeglądarki PDF nie radzą sobie z takimi obrazami.

Wiem z doświadczenia, że w przypadku zdjęć robionych telefonem i wrzucanych na FB nawet z włączoną opcją HD, taka rozdzielczość jest za mała do OCR, i najlepiej wtedy, gdy zdjęcie jest w oryginalnej jakości.
W przynajmniej części oprogramowania OCR nie ma problemu z importem oryginalnych obrazów, a na wyjściu możesz ustawić niższą rozdzielczość przy zapisie PDF, a pierwotne rozpoznanie OCR zostanie zachowane.
Inna sprawa jest pewnie, gdy źródłem zdjęcia jest np. ksero. Mimo wszystko nie widzę sensu zmniejszania obrazów na wejsciu do rozpoznania OCR, i nie spotkałem się, by z tego powodu program się wieszał, nawet na bardzo przeciętnym sprzęcie (przynajmniej nie do granic zupełnego braku responsywności programu). Dużo trzeba zarezerwować na surówki w pliku temp miejsca, i tylko tyle. Potem ew. na zapis projektu (nawet nie PDF). Zresztą sam możesz poeksperymentować na wybranym obrazie, jak dalece zmienia się poziom rozpoznawalności od rozdzielczości, bo każdy program pod tym względem może się różnić. Do tego na rozpoznawalność może mieć wpływ ustawienie OCR w trybie czarno - białym, zwłaszcza po obróbce zdjęć odpowiednim filtrem do rozpoznawania, jeśli są to zwykłe zdjęcia (robi tak, że przypominają ksero/kartki papieru; przynajmniej tak najlepiej działa FineReader, i również najfajniej to wtedy wygląda, jest tam taka opcja).

roller_coaster · 15 Marzec 2020 19:51

O widzę, że wiesz o co chodzi. W międzyczasie znalazłem informację dla abbyy:

In addition one should consider the following (and current) recommendations and limitations of OCR technology for a character size in pixels:
1-byte (simple script) languages like English, Russian
    Recommended: 20
    Minimal: 12

https://abbyy.technology/en:kb:images_resolution_size_ocr

To chyba dla każdego programu może być inna, choć pewnie zbliżona wartość. Przynajmniej jest to jakiś punkt odniesienia.

Chyba poeksperymentowanie z konkretnym plikiem graficznym będzie najlepszym rozwiązaniem.