Zdecydowanie gorszym. Żartujesz chyba, jeśli uzależniasz rozdzielczość plików od rozdzielczości monitora :shock: to ja dziękuję, to zupełnie co innego. Poza tym idąc tą ścieżką rozumowania to chyba nic nie dałoby się zrobić bez tych supernajwyższych rozdzielczości ekranu.
Bzdura totalna, nie ma takiej zależności, bo to ja decyduję w jakiej chcę mieć tej rozdzielczości dany plik jak zapisuję.
No to ja wiem, że to dwie różne sprawy. A wg Ciebie słowo Windows po polsku to jak wygląda, a nie przypadkiem tak samo, no niby to są te Okna , ale to jest trochę pójście w zaparte, bo język może nie ten sam, ale alfabet owszem. Problemem mogą byś jakieś znaki specjalne, te polskie ogonki, kreski, ale też inne znaki graficzne.
Tak zgadzam się przynajmniej tutaj, doszukuje się i doszukiwał dalej będzie, ale na tym to właśnie polega, gdyby było identycznie nie trzeba by było tego robić.
Nie chcę się rozpisywać, ale po dokładniejszym przetestowaniu FineReadera stwierdzam, że może nie spisuje się on do końca na miarę moich oczekiwań, ale efekt jest całkiem zadawalający. Myślę, że gdyby wprowadzić tam jeszcze jakieś korekty to rezultat byłby nienajgorszy, choć zapewne nie idealny. I potwierdziło się, że to naprawdę wszechstronny program.
Być może dlatego, ze jest to wersja testowa, pełna posiada większy wachlarz możliwości i opcji ?
Otóż zacznę od tego, że przede wszystkim zmniejszyłem rozmiar pliku źródłowego bo jest dość duży, by łatwiej na nim operować, rozdzielczość te pliki wszystkie niezależnie od wielkości i rozmiarów mają 300x30 ppi, bo mój domyślny edytor grafiki tak ma ustawione, ustawienia programu dopasowałem czyli język interfejsu polski, tryb koloru na kolor, język rozpoznawania dałem na automatyczny (jest w nim i angielski i polski, i inne), konwersję oczywiście do .txt , no i opcję zadania wybrałem _ PDF/Obraz do innych formatów _.
W przyszłości chyba lepiej jest tak duże pliki podzielić na mniejsze części jak się okazuje ?
Więc ten zmniejszony plik .jpg otworzyłem do początkowego rozpoznania, oczywiście doszukał się jakiegoś błędu w rozdzielczości, ale zawsze tak jest, no i efekt był nienajlepszy.
Dlatego w menu lewego panelu _ Edytuj obraz _ (są tam różne opcje i tam można to dostosować)) po różnych przetasowaniach dla pliku .jpg (300dpi), wybrałem tę ok.100 dpi (dokładnie 96 dpi - właśnie tak ) i okazało się że ta właśnie rozdzielczość była najlepszą dla tego pliku .jpg
. Dla .pdf okazała się być nią już inna, o tym dalej, później. I inne jeszcze opcje ustawiam według uznania, lecz bez większego jak widzę na to wpływu.
Ten plik rozpoznany i przetworzony w ten sposób do zwykłego tekstu ( .txt ), zaznaczyłem ( Ctrl+A ), skopiowałem ( Ctrl+C ) i wkleiłem ( Ctrl+V ) wprost do Notatnika. Zapisałem jako .txt.
No i tak to wygląda w Notatniku : klik, a tak po shostowaniu na serwer: klik. Efekt całkiem niezły jak na początek.
Tak on wyglądał pierwotnie w .jpg : klik Tam brakuje tych dwukropków i innych, niektórych znaków bo program nawstawiał kresek i tabelek, które je zasłoniły. Ale i tak jest dobrze, prawda ?
I analogicznie zrobiłem ze zmniejszonym plikiem .pdf , tylko że dostosowaną rozdzielczość wyjściową ustawiłem, a właściwie to program wykrył optymalną rozdzielczość w takiej opcji jako 278 dpi.
I taki jest efekt tej konwersji z .pdf do .txt w Finereaderze z zapisu do Notatnika , wygląda prawie tak samo jak ten poprzedni: klik, a tak na zewnętrznym serwerze: klik.
A tak wygląda dla porównania ten sam plik - tylko w większym rozmiarze (właściwie w pełnej wersji) profesjonalnie w .jpg z loga utworzonego później z programu, o którym pisałem wcześniej: klik, a tak w .txt : klik
Program jak zawsze w trakcie procesu doszukał się jakiegoś mankamentu, ale ostatecznie przetworzył plik i to nieźle.
Program nie odczytuje i nie rozpoznaje może idealnie tych plików i wszystkich znaków, co zaznacza też jako niepewne znaki i je podświetla, ale najważniejsze że ostatecznie efekty w postaci pliku przekonwertowanego są i co jeszcze ważniejsze - jest możliwość zapisu pliku na dysku.
W programie jest poza tym jeszcze całe mnóstwo różnych opcji, dzięki którym może da się to jeszcze skorygować.
Być może jeszcze da się jednak wprowadzić tutaj jakieś poprawki.
Tutaj jeszcze wracając do poprzednio poruszonej kwestii, że plik .jpg nie zawiera liter - to oczywiście prawda, plik .pdf też nie zawiera jako taki tych liter, ale pierwotnie plik ten zawierał właśnie te litery i znaki alfabetu. Zostały one zakodowane wówczas do tych formatów i teraz chodziło o to żeby je z powrotem rozpoznać, wyodrębnić, tak ?
Też podzielam zdanie, że ten sposób jest może niezbyt wydajny i czasochłonny, ale w końcu skuteczny, a ponieważ mam w zanadrzu i inne sposoby, które w międzyczasie znalazłem - nie pozostaje mi poza tym nic jak po prostu przesłać je w formie .jpg lub .pdf bezpośrednio.
Wiem też, że istnieją podobne tego typu sposoby konwersji OCR z .jpg , .pdf czy inych formatów do .txt on-line, ale jak sprawdzałem nie są to zawsze najskuteczniejsze sposoby, poza tym są tam często ograniczenia rozmiarowe dla tych plików .
Być może istnieją jakieś inne, najlepiej darmowe programy typu OCR , które potrafiłyby te pliki w miarę dobrze przetworzyć do formy tekstowej chociaż z pewnością profesjonalnie raczej zrobiłyby to edytory odpłatne.
Sam nawet próbowałem pobrać taki programik FreeOCR.net 4.2 i to aż z czterech różnych źródeł m.in. z DP , ale okazało się że są jakieś problemy z jego instalacją nie mam pojęcia z czego wynikające. :lol: