Jak przekonwertować plik .jpg na .txt Notepadem++?

Hawkeye · 13 Luty 2013 09:54

Witam.

Otóż pobrałem sobie Notepada++ celem sprawdzenia jego możliwości przekonwertowywania plików o różnych rozszerzeniach.

Mam bowiem problem z “przerobieniem” pewnych plików do formatu tekstowego .txt.

Są to pliki ze zrzutu ekranu z okienka przewijanego, w formie przypominającej bardziej tekst właśnie, ale z rozszerzeniem .jpg bo tylko tak można je było zapisać.

Te same pliki zapisałem też do formatu .pdf (co prawda nie wiem czy poprawnie, bo programy typu FineReader miały kłopot z rozpoznaniem znaków ?), ale chodzi mi o to by przetworzyć je do formatu zwykłego tekstu .txt.

Próbowałem je zapisywać w różnych edytorach grafiki, tekstu do tego .txt ( Adobe Reader , Foxit Reader , FineReader , MS Word ), zapisują i przetwarzają one do różnych formatów m.in. .doc , .xml , ale żaden z nich nie potrafi do końca i dobrze zapisać je do .txt ponieważ są to prawdopodobnie pliki sformatowane i nieedytowalne a mnie chodzi o format .txt jako format w pełni edytowalny.

I tu natknąłem się w końcu na Notepada++ , który podobno ma takie możliwości konwersji, zwłaszcza plików sformatowanych z poziomu ich kodu źródłowego. Tylko jako, że programu nie znam, a posiada on dość rozbudowany wachlarz opcji i możliwości chciałbym prosić was o pomoc jak krok po kroku dokładnie to zrobić ?

Wiem, że do tego może być potrzebne doinstalowanie dodatkowej wtyczki MIME Tools , które jest chyba możliwe z poziomu programu ?

Program posiada różne wtyczki, ale tej akurat nie posiada.

Podobno jest to możliwe, ale odbywa się to też kosztem niewielkiego zwiększenia rozmiarów pliku wyjściowego, ale ten można z powrotem jakoś skompresować ?

Pomóżcie proszę, jak należy się za to zabrać ?

skrzek · 13 Luty 2013 10:12

=D>

plik graficzny do tekstowego… to tylko OCR typu FineReader, a następnie tekst z np. Worda do Notatnika. Notepad++ cudów nie zrobi

j24 · 13 Luty 2013 13:22

Pytanie mi świadczy, że pytający nie bardzo wie co oznacza typ pliku i rozszerzenie. Jak piszesz zapisałeś pliki .jpg czyli mówiąc językiem laika zdjęcia. Że na tych zdjęciach jest tekst to dla komputera jest najmniej ważne i to na pewno nie jest pomocne do przekonwertowania tego tekstu na tekst. Żaden program a tym bardziej Notepat++ nie przeczyta ci tekstu ze zdjęcia i nie zapisze jako .txt. Programy typu OCR służą do tego ale i trochę kosztują. Odpowiedź SKRZEKa jest według mnie w 100% prawidłowa.

Hawkeye · 13 Luty 2013 14:09

Tak, ja właśnie wyczerpująco wypróbowałem możliwości FineReadera , on wiele potrafi, ale jednak podczas zapisu pliku do .txt na dysk napotyka na problemy z rozpoznawaniem znaków w przypadku pliku .jpg , a w przypadku pliku .pdf już wcześniej zgłasza jakieś problemy z rozpoznaniem elementów i znaków tego pliku.

Program owszem zapisuje te pliki, ale jako całkiem czyste arkusze.

Program prawdopodobnie próbując usuwać formatowanie z tych plików usuwa także wszystko z nich.

Nie potrafię tego rozszyfrować.

To chyba Ty masz jakieś kłopoty z czytaniem ze zrozumieniem, albo co gorsza w ogóle z czytaniem.

Ja dobrze wiem, że format .jpg to format graficzny, napisałem przecież że ten plik jest, a właściwie powinien być logiem ze skanu jednego z programów. A jest tylko screenem z tego. Jednak da się go zapisać tylko w formie .jpg lub .pdf właśnie.

Gdyby się dało od razu zapisać go do .txt , to tak. W tej opcji tego programu tak jest, że się nie da, w innej opcji tego programu już się da to zapisać do .txt.

A zdjęć tam żadnych nie ma tylko pewne znaki graficzne, ale jest i zapewne formatowanie, które czyni ten plik nieedytowalnym i w czymś przeszkadza.

Ale na jakiej podstawie tak sądzisz ? A próbowałeś chociaż robić tym Notepadem++?

Bo podobno to właśnie Notepad++ lub może Notepad2 ma możliwość usuwania tego kodowania żródłowego i przywracania do postaci pierwotnej czyli w tym przypadku tekstowej ?

A, że programy typu OCR - płatne, to ja dobrze o tym wiem, bo testowałem wersję demo.

deFco247 · 13 Luty 2013 16:53

Alternatywne programy do rozpoznawania tekstu i OCR:

http://alternativeto.net/tag/ocr/

http://alternativeto.net/tag/text-recognition/

Cedar · 13 Luty 2013 17:19

To własnie cały plik .jpg jest zdjęciem a zdjęcia nie można w jakiś cudowny sposób przekonwertować do .txt ani z niego liter wyciągnąć bo on liter nie zawiera.

Właśnie programy OCR służą do rozpoznawania tych znaków ale obraz/zdjęcie musi mieć odpowiednią jakość (nie być rozmazane) i jak największą rozdzielczość oraz jak największy kontrast, bo w innym przypadku program OCR nie może rozpoznać znaków graficznych i przypisać im odpowiednich liter.

j24 · 13 Luty 2013 17:51

Widzisz Cedar autora wątku szybko nie przekonasz, bo on uważa, że jak to był tekst to jest tekstem nawet po zapisaniu do .jpg. On nie rozumie, że w jpg nie ma liter tylko czarne, szare albo białe piksele. Poucza nawet, że nie wiem do czego służy Notepad++ gdy używam go od kilku lat do tworzenia kodu źródłowego dla stron internetowych.

Hawkeye · 14 Luty 2013 13:23

Po przetestowaniu tego w Notepadzie++ , okazało się że w ten sposób zupełnie nic z tego nie wyszło, a zapisany plik okazał się nieznanym typem pliku, a nie .txt.

To już lepiej to wypadło w FineReaderze , choć też niezupełnie do końca.

Czyli najpewniej mieliście rację, ale jak uważam o tym i tak lepiej się przekonać w drodze sprawdzenia w praktyce czy takiego testu niż np. wróżenia z fusów.

Chyba, że to jednak jakimś cudem jest możliwe, ja nie wiem ?

No więc panowie programiści jak sądzę , przepraszam, że tak na was trochę naskoczyłem na początku, ale nie wiedziałem że znacie tak dobrze i używacie Notepada++. No, ale niby skąd miałem wiedzieć ? :oops:

To chciałbym was jeszcze zapytać o radę, bo może ja w czymś popełniłem błąd lub inny problem czy mankament w OCR czyli Finereaderze?

Przede wszystkim chcę zapytać czy pliki, które zapisałem są poprawnymi plikami w swoich formatach, bo Finereader w większej części dobrze je przetwarzał, jednak zgłaszał też problemy z rozpoznawaniem na różnych etapach ?:

Więc pierwszy raport ze skanu z Odkurzacza zapisałem jako .jpg , a wygląda on: tak (jest to tylko mały fragment z całego pliku, który jest dość obszerny), ten sam plik zapisany w .pdf wygląda: tak , a: tak ten sam plik wygląda w .txt (niestety ten log powstał już akurat po usunięciu tych obiektów, a więc jest bez znaczenia dla mnie).

Są to tylko fragmenty tych plików, bo w całości są one w postaci długich screenów lub logów.

A więc kwestia konwersji z .jpg czy .pdf do .txt przez OCR w FineReaderze dla mnie wciąż jest istotna na przyszłość.

Piszecie, że plik musi mieć jak najlepszą jakość, rozdzielczość czy kontrast itp. To jaką waszym zdaniem ma tę jakość ten plik sądząc z tych screenów ? Czy powinienem je jednak wcześniej gdzieś w jakimś (ale jakim) edytorze odpowiednio jeszcze poprawić (co i jak) ?

Bo w przypadku np. .pdf to chyba jeszcze inne elementy są ważne by ten typ pliku był poprawny i rozpoznawalny (jakie) ?

Tam chodzi o te tabele, marginesy itp. Ten plik ich chyba nie zawiera ?

Właśnie cały sęk w tym, że te pliki nie są małe rozmiarowo, wtedy wystarczyłoby zwykłe shostowanie jako .jpg , tylko są to takie długie listy na screenach czy logach, tak jak np.: to To jest dokładnie ten sam plik w całości, ale shostowany już po usunięciu. Więc pierwotny sens czyli pokazanie go przed usunięciem jako .txt jest stracony.

Poza tym chciałbym bo ja się na tym nie bardzo znam, żebyście napisali ogólnie jak to w tym FineReaderze na poszczególnych etapach przetwarzania w tym konkretnym przypadku poprawnie to wykonać ?

Co ewentualnie zmienić i w jakich ustawieniach programu oraz w trakcie konwertowania.

Może tam w tym programie czegoś brakuje (to wszak tylko wersja testowa), jakiegoś dodatku, wtyczki itp. ?

Bo ja tak właśnie jak pisze skrzek robiłem, na .txt bo wyodrębnił ten tekst, ale już zapisał jak się okazało pusty plik (?)

A później ewentualnie przez MS Word do Notatnika.

skrzek · 14 Luty 2013 14:41

Dawno temu używałem FineReadera, to po przeskanowaniu pliku graficznego otwierał on sąsiadująco 2 okna - to z grafiką i to z przetworzonym obrazem na postać tekstową, umożliwiające wygodną korektę (podświetlało miejsce zczytania tekstu) - oknie z tekstem wystarczy wykonać: CTRL + A, CTRL+C, przejść do notatnika i zrobić CTRL+V. zapisać plik.

j24 · 14 Luty 2013 14:57

Trudno kogoś uczyć całek jak ma problemy z tabliczką mnożenia - to tak na przyszłość mała dygresja.

Przypuszczam też, że ja uczyłem się informatyki jak Twój wiek był jeszcze liczba ujemną i to może dwucyfrową.

A co do programu FineReader. Trudno to nazwać konwersją a dla laika to będzie po prostu czytanie tekstu na podstawie widzianego obrazka. Czy to jest .jpg czy też .pdf to według mojego głupiego rozumu jest żadna różnica. Program FineReader po prostu ocenia kształt znaków na obrazku i dopasowuje to do liter, aby potem zapisać całkiem nowy plik tekstowy. Ja sporo książek przepisałem FineReaderem do Worda bezpośrednio ze skanera. Mam wersję Home która nie czyta z .pdf a z .jpg jak również z innych formatów graficznych tak. Wersja pełna FineReader czyta całkiem dobrze z .pdf bo korzystałem z niej jako z wersji testowej działającej chyba dla 50 kartek (czytań). Na pewno dla programu poważnym utrudnieniem w twoim przypadku jest to, że tekstu w czasie analizy nie potrafi przypisać do żadnego języka bo to ani polski ani angielski ani żaden inny oraz to że jest cała masa ozdóbek - ramka okna, ikonki itp, itd. Jakość tekstu jest nie za specjalna. Gdy używamy skanera do przetwarzania tekstu to zalecana rozdzielczość jest 300dpi dla tekstu z przeciętnej książki. Przetwarzałem też teksty np z instrukcji obsługi pisane makiem i wtedy ustawiałem w skanerze 600dpi aby program się nie burzył. Uważam, że twoje zdjęcia ekranu nie spełniają tych wymogów a poza tym te problemy o których pisałem wyżej. Ogólnie jest to program do przepisywania dokumentów (książek) a nie do tego co ty chcesz zastosować. Nawet gdyby ci to przeczytał to nawstawia ci tysiące spacji, znaków akapitu i innego śmiecia.

Hawkeye · 16 Luty 2013 11:56

Chociaż wydawało mi się, że kiedyś robiłem to dokładnie tak jak piszesz, wcześniej oczywiście skonfigurowałem potrzebne ustawienia, łącznie z językiem (polskim bo jest dostępny, wbrew temu co twierdzi np. j24 ), przetworzyłem go właśnie w owych dwóch oknach na .txt. Txt czy również .pdf w tym drugim okienku wyglądał dobrze, był w postaci tekstowej, bez żadnych spacji, wcięć itp. Chociaż co do .pdf-a to wcześniej zgłaszał problem z rozpoznaniem czegoś.

I wszystko dotąd było dobrze, do momentu zapisu z poziomu Finereadera do .txt , do Notatnika - plik okazał się czysty, niezapisany.

Natomiast w drugiej metodzie czyli _ Zaznacz _ (Ctrl+A), następnie _ Kopiuj _ (Ctrl+C) i _ Wklej _ (Ctrl+V), nie wychodziło mi to, tzn. nie dało się tego zrobić bo z prawokliku na ten tekst opcja _ Kopiuj _ o ile pamiętam jest tam niedostępna.

Może gdybym użył skrótu klawiaturowego, czego wtedy nie zrobiłem (Ctrl+C), o którym piszesz to by zadziałało, nie wiem może ? Ja odinstalowałem wtedy program i nie zdążyłem sprawdzić tego.

Chyba ponownie go pobiorę by to jeszcze przetestować, bo program ma naprawdę spore możliwości.

Jeśli by natomiast to nic nie dało to będę się starał może zgodnie z wcześniejszymi sugestiami poprawić jakość pliku źródłowego, tak by FineReader miał jak najmniejsze kłopoty z rozpoznawaniem i przetwarzaniem tych plików na .txt.

Akurat są to dość duże pliki rozmiarowo, nie wiem czy to się uda zrobić w sposób jakiś znaczący, ale spróbuję.

Chyba głównie chodzi o rozdzielczość pliku.

j24 · 17 Luty 2013 09:46

Człowieku ja ci tam nic nie twierdzę. Ale jak tekst masz w sumie nie wiadomo jaki to ci program sam może doszukiwać się innego języka. Inna sprawa to wersja programu i czy ta wersja doszukuje się sama zmiany języka czy ustawiony przez ciebie jest na stałe. Gdybyś był zapoznany z programem od wersji 6.0 do wersji 11.0 a także w ostatnich wersjach z Home oraz Professional to nie doszukiwałbyś się nieścisłości w mojej wypowiedzi. A co do rozdzielczości to na pewno 300dpi jaki jest zalecany przy skanowaniu tekstu normalnego w FinRederze, jest prawie 10krotnie leprze od twoich obrazków z ekranu

Hawkeye · 17 Luty 2013 10:27

Spoko, tylko bez takich uniesień dobrze !

Tylko skąd wytrzasnąłeś tę rozdzielczość, tzn., że niby ja mam ją 10 razy gorszą od ideału czyli 300 dpi !

Nie podawałem żadnych danych rozdzielczości, sam to chciałbym wiedzieć i za chwilę to sprawdzę dla tego pliku.

Być może chodzi Ci o pełną wersję programu, tam może być faktycznie więcej opcji niż w testowej ?

Ja mówię o tej wersji: klik, i to z niej korzystam.

Co do języka, to FineReader jest przecież spolszczony, nie wiem jak to jest z wersjami, ale ta wersja nie doszukuje się żadnej zmiany języka, on jest domyślny. To ja wybieram i ustawiam taki język jaki chcę (domyślnie polski).

Problemem jest raczej czy taki język jest w ogóle dostępny, a jeśli tak to czy jest dobrej jakości ( w sensie znaków diakrytycznych itp.).

Także nie rozumiem o co idzie z tym nie wiadomo jakim tekstem i językiem, przecież to ja go ustawiam na początku nie ?

Plik .jpg to plik graficzny, nie zawiera liter jako takich, ale ma formatowanie czy też kodowanie znaków, które należy wyodrębnić w programie, czyli to raczej kwestia przetworzenia znaków, w przypadku .pdf dochodzi chyba jeszcze coś innego, przynajmniej tak mi się wydaje - tzn. plik taki musi być prawidłowo utworzony bo program coś takiego zgłasza jako jakiś problem, czyli zawierać te tabelki, marginesy itp. Nie znam się za bardzo na tym.

Czyli generalnie chodzi tutaj o kwestie jakości i rozdzielczości dla różnych plików.

Nie wiem, niebawem znów ściągam FineReadera testowego, zobaczymy co z tego wyjdzie w praktyce.

j24 · 17 Luty 2013 10:57

Jaka jest rozdzielczość twoich obrazków to zależy od tego jaką masz ustawioną rozdzielczość monitora i moje stwierdzenie na pewno jest tylko przybliżeniem lepszym lub gorszym. Poszukałem u źródła i wychodzi mi że jeżeli Monitor 24cali masz ustawiony na 1920x1080 to twoje skany są tylko około 2 razy gorsze od 300 dpi ale gdy masz ustawiony gorzej no to będzie gorzej. Język programu w jakim jest zainstalowany a język w jakim ma rozpoznawać tekst to są 2 różne sprawy. Twoje pliki (ścieżki dostępu nazwy folderów a nawet słowo Windows) trudno powiedzieć że to jest język polski i to nie jest ułatwieniem dla programu FineReader a tylko utrudnienie z którym się program męczy. Gdyby nawet pliki były dostatecznie dobre pod względem rozdzielczości to znając możliwości FineReadera stwierdzam, że on zawsze doszukuje się tego czego akurat nie powinien. Gdy przetwarzam normalny tekst typu książka to też na stronie zdarza się 2-3 literówki. Tu stwierdzam ze 100% pewnością jako doświadczony w korzystaniu z programu - szybciej by było przepisać to ręcznie niż korzystać z dobrodziejstwa tego programu. Możesz stwierdzić, że piszę niedorzeczności ale takie jest moje zdanie i tyle.

Hawkeye · 18 Luty 2013 19:06

Zdecydowanie gorszym. Żartujesz chyba, jeśli uzależniasz rozdzielczość plików od rozdzielczości monitora :shock: to ja dziękuję, to zupełnie co innego. Poza tym idąc tą ścieżką rozumowania to chyba nic nie dałoby się zrobić bez tych supernajwyższych rozdzielczości ekranu.

Bzdura totalna, nie ma takiej zależności, bo to ja decyduję w jakiej chcę mieć tej rozdzielczości dany plik jak zapisuję.

No to ja wiem, że to dwie różne sprawy. A wg Ciebie słowo Windows po polsku to jak wygląda, a nie przypadkiem tak samo, no niby to są te Okna , ale to jest trochę pójście w zaparte, bo język może nie ten sam, ale alfabet owszem. Problemem mogą byś jakieś znaki specjalne, te polskie ogonki, kreski, ale też inne znaki graficzne.

Tak zgadzam się przynajmniej tutaj, doszukuje się i doszukiwał dalej będzie, ale na tym to właśnie polega, gdyby było identycznie nie trzeba by było tego robić.

Nie chcę się rozpisywać, ale po dokładniejszym przetestowaniu FineReadera stwierdzam, że może nie spisuje się on do końca na miarę moich oczekiwań, ale efekt jest całkiem zadawalający. Myślę, że gdyby wprowadzić tam jeszcze jakieś korekty to rezultat byłby nienajgorszy, choć zapewne nie idealny. I potwierdziło się, że to naprawdę wszechstronny program.

Być może dlatego, ze jest to wersja testowa, pełna posiada większy wachlarz możliwości i opcji ?

Otóż zacznę od tego, że przede wszystkim zmniejszyłem rozmiar pliku źródłowego bo jest dość duży, by łatwiej na nim operować, rozdzielczość te pliki wszystkie niezależnie od wielkości i rozmiarów mają 300x30 ppi, bo mój domyślny edytor grafiki tak ma ustawione, ustawienia programu dopasowałem czyli język interfejsu polski, tryb koloru na kolor, język rozpoznawania dałem na automatyczny (jest w nim i angielski i polski, i inne), konwersję oczywiście do .txt , no i opcję zadania wybrałem _ PDF/Obraz do innych formatów _.

W przyszłości chyba lepiej jest tak duże pliki podzielić na mniejsze części jak się okazuje ?

Więc ten zmniejszony plik .jpg otworzyłem do początkowego rozpoznania, oczywiście doszukał się jakiegoś błędu w rozdzielczości, ale zawsze tak jest, no i efekt był nienajlepszy.

Dlatego w menu lewego panelu _ Edytuj obraz _ (są tam różne opcje i tam można to dostosować)) po różnych przetasowaniach dla pliku .jpg (300dpi), wybrałem tę ok.100 dpi (dokładnie 96 dpi - właśnie tak ) i okazało się że ta właśnie rozdzielczość była najlepszą dla tego pliku .jpg . Dla .pdf okazała się być nią już inna, o tym dalej, później. I inne jeszcze opcje ustawiam według uznania, lecz bez większego jak widzę na to wpływu.

Ten plik rozpoznany i przetworzony w ten sposób do zwykłego tekstu ( .txt ), zaznaczyłem ( Ctrl+A ), skopiowałem ( Ctrl+C ) i wkleiłem ( Ctrl+V ) wprost do Notatnika. Zapisałem jako .txt.

No i tak to wygląda w Notatniku : klik, a tak po shostowaniu na serwer: klik. Efekt całkiem niezły jak na początek.

Tak on wyglądał pierwotnie w .jpg : klik Tam brakuje tych dwukropków i innych, niektórych znaków bo program nawstawiał kresek i tabelek, które je zasłoniły. Ale i tak jest dobrze, prawda ?

I analogicznie zrobiłem ze zmniejszonym plikiem .pdf , tylko że dostosowaną rozdzielczość wyjściową ustawiłem, a właściwie to program wykrył optymalną rozdzielczość w takiej opcji jako 278 dpi.

I taki jest efekt tej konwersji z .pdf do .txt w Finereaderze z zapisu do Notatnika , wygląda prawie tak samo jak ten poprzedni: klik, a tak na zewnętrznym serwerze: klik.

A tak wygląda dla porównania ten sam plik - tylko w większym rozmiarze (właściwie w pełnej wersji) profesjonalnie w .jpg z loga utworzonego później z programu, o którym pisałem wcześniej: klik, a tak w .txt : klik

Program jak zawsze w trakcie procesu doszukał się jakiegoś mankamentu, ale ostatecznie przetworzył plik i to nieźle.

Program nie odczytuje i nie rozpoznaje może idealnie tych plików i wszystkich znaków, co zaznacza też jako niepewne znaki i je podświetla, ale najważniejsze że ostatecznie efekty w postaci pliku przekonwertowanego są i co jeszcze ważniejsze - jest możliwość zapisu pliku na dysku.

W programie jest poza tym jeszcze całe mnóstwo różnych opcji, dzięki którym może da się to jeszcze skorygować.

Być może jeszcze da się jednak wprowadzić tutaj jakieś poprawki.

Tutaj jeszcze wracając do poprzednio poruszonej kwestii, że plik .jpg nie zawiera liter - to oczywiście prawda, plik .pdf też nie zawiera jako taki tych liter, ale pierwotnie plik ten zawierał właśnie te litery i znaki alfabetu. Zostały one zakodowane wówczas do tych formatów i teraz chodziło o to żeby je z powrotem rozpoznać, wyodrębnić, tak ?

Też podzielam zdanie, że ten sposób jest może niezbyt wydajny i czasochłonny, ale w końcu skuteczny, a ponieważ mam w zanadrzu i inne sposoby, które w międzyczasie znalazłem - nie pozostaje mi poza tym nic jak po prostu przesłać je w formie .jpg lub .pdf bezpośrednio.

Wiem też, że istnieją podobne tego typu sposoby konwersji OCR z .jpg , .pdf czy inych formatów do .txt on-line, ale jak sprawdzałem nie są to zawsze najskuteczniejsze sposoby, poza tym są tam często ograniczenia rozmiarowe dla tych plików .

Być może istnieją jakieś inne, najlepiej darmowe programy typu OCR , które potrafiłyby te pliki w miarę dobrze przetworzyć do formy tekstowej chociaż z pewnością profesjonalnie raczej zrobiłyby to edytory odpłatne.

Sam nawet próbowałem pobrać taki programik FreeOCR.net 4.2 i to aż z czterech różnych źródeł m.in. z DP , ale okazało się że są jakieś problemy z jego instalacją nie mam pojęcia z czego wynikające. :lol:

j24 · 19 Luty 2013 07:38

Jak sam pisałeś robiłeś zrzuty ekrany więc od czego zależy rozdzielczość tych twoich plików jak nie od ekranu. Co innego gdyby te twoje zdjęcia pochodziły z innych źródeł aparat fotograficzny, czy coś w tym rodzaju to monitor nie miałby nic do rzeczy. Rozdzielczość 1920x1080 mam ustawioną u siebie i dlatego się nią posłużyłem. Twoje efekty są rzeczywiście dość dobre ale nie masz gwarancji że nie pojawiła się literówka w losowym miejscu. Czy to ci wystarcza czy nie to zależy tylko do czego to ma być wykorzystane, bo gdyby to miało być wykorzystane przez jakiś program komputerowy to najmniejsza literówka czyni całą pracę raczej bezużyteczną.

Hawkeye · 19 Luty 2013 09:47

Tak robiłem zrzuty ekranu, ale dokładniej były to screeny z aktywnego okienka, nie rozumiem więc o co Ci chodzi z tym monitorem czy też ekranem i ich rozdzielczością ?

Poza tym rozdzielczość takiego screena mogę później przecież dowolnie edytować w programach graficznych, choćby w samym FineReaderze.

To mi w zupełności wystarcza, choć mogłoby być troszeczkę lepiej. Ale to już kosmetyka, najważniejsze że w ogóle jest ten efekt końcowy. Wiele zależy z pewnością od pliku źródłowego i jego jakości.

Jeśli chodzi o wykorzystanie tego do programu komputerowego, który miałby to obsługiwać to już inna kwestia o którą mi nie chodzi tym razem, nie jestem programistą ani na tyle wprawnym w tym, żeby to ocenić a co dopiero zastosować to w praktyce do edycji czy zakodowania tego np. w Notepadzie++ , który właśnie do tego celu chyba służy.

To jeszcze zależałoby od rodzaju zadania, które chcemy w FineReaderze wykonać, jeśli miałoby to być np. zeskanowanie książki do postaci e-booka, to program nadaje się do tego wyśmienicie.

A błędy, literówki, no cóż od tego jest użytkownik posiadający szczegółową o tym wiedzę i używający np. Notepada++ , żeby ewentualnie ręcznie poprawiać tam to czego program nie potrafi bądź nie może.

Mam jeszcze takie dodatkowe pytanie, ponieważ w związku z tym, że pobrałem jak wiesz program Notepad++ , ale nie znam zbyt dobrze jego osiągów, a z tego co widzę Ty znasz go od podszewki, jak wiesz nie sprawdził się on w tej sprawie, ale chciałbym żebyś mi coś doradził.

Bo podobno Notepadem++ warto zastąpić systemowy Notatnik , czy w istocie tak jest, czy nie mogą one równocześnie obok siebie pracować i do czego takiemu zwykłemu użytkownikowi najczęściej Notepad++ właśnie może być przydatny poza edycją zwykłego tekstu ?

Bo Notepad++ lub Notepad2 to dość rozbudowane i wszechstronne narzędzia dla programistów głównie, ale tak dla przeciętnego użytkownika ?

j24 · 19 Luty 2013 11:36

Znam program Notepad++ jako przydatny do tworzenia stron internetowych. Chodzi o to, że po pierwsze chcielibyśmy aby program typu notatnik czy Notepad++ nie robił niczego co zakłóca czysty tekst źródłowy do pisania stron internetowych. Dla programistów najważniejsze jest to aby plik zawierał dokładnie to co ma zawierać i nic ponadto a w notatniku nie do końca tak jest. Jeszcze 10 lat temu ci co tworzą strony internetowe z palca a nie jakimś programem pokazującym grafikę mogli powiedzieć że te 2 programy niewiele się różnią. W tej chwili ta różnica jest zasadnicza bo o ile ci wiadomo stronę internetową tworzymy w przyjętym przez siebie typie kodowania polskich znaków Np: ISO–8859-2; UTF-8 albo np windows-1250. Ten ostatni typ kodowania ma najwięcej przeciwników i słusznie. Tu się pojawia zasadniczy problem w Notatniku po pierwsze nie ma kolorowania słów kluczowych dla języków programowania jak również przy pisaniu strony. Takie słowa jak

czy if, else, while itp są kolorowane w Notepadzie++ i to zasadniczo ułatwia pisanie dla programistów. Notepad++ pokazuje też nam zakres danego bloku w kodzie np początek i koniec danej pętli czy danej tabeli. Inny dość istotny problem to strona kodowana w ISO–8859-2 lub UTF-8 a pisana notatnikiem będzie miała krzaki potem w przeglądarce pochodzące nie wiadomo skąd i w żaden sposób pozbycie się tych krzaków jest nie możliwe. Jest to problem o którym pisałem na początku i tego się nie przeskoczy. Wymieniłem kilka różnic dla mnie istotnych a wiem, że jest ich o wiele więcej.

Podsumowując - wszystko zależy do czego używamy tych programów? Jeśli tylko do oglądania plików typu .txt to nie widzę różnicy ale jeśli to tworzenia czegokolwiek to różnica jest duża a nawet ogromna.

skrzek · 19 Luty 2013 11:40

Tak możesz edytować dowolnie - w dół. Screenshoty mają domyślną rozdzielczość 96dpi. Możesz je trochę “podciągnąć” w edytorze graficznym, ale z pustego i Salomon nie naleje. i fakt, że coś jest dla Ciebie czytelne, nie oznacza, że będzie czytelne dla programu OCR.

Często pomaga zwiększenie kontrastu.