Program do konwertowania PDF do WORD (darmowy, nie wstawiający zdjęć do worda, nie zaśmiecający komputer)

Hej!

 

Problem jak w temacie, poszukuje programu konwertującego PDF do Worda. Zależy mi, abym mógł edytować (dopisywać coś itp) ten plik przekonwertowany do worda. Po prostu żeby ten program przeczytał ten tekst w pdfie i go przepisał do worda. Wszystkie programy jakie znalazłem robiły zdjęcia tych pdf’ów i wstawiały je do worda co sie mijało z celem, bo tak czy siak tych plików nie zedytuję. Chciałbym aby ten program był darmowy.

 

Dzięki wielkie!

http://portable.info.pl/sumatra-pdf-portable/

Do tego nawet nie trzeba konwertora. Pobierz gdzieś na dysk SumatraPDF portable. W menu plik, wybierasz dodaj pliki i znajdujesz przykładowy plik. Otwierasz w sumatrze. Z menu widok wybierasz “Zaznacz wszystko” i na zaznaczonym polu z prawokliku wybierasz “Kopiuj”. Otwierasz notatnik i na polu notatnika wybierasz z prawokliku “Wklej”. Wklei Ci się tekst. Możesz go dać do worda, czy gdzie. Pamiętaj, że notatnik systemowy przy dużej objętości tekstu, ma jakieś ograniczenia. Ja 400 stron tekstu z PDF wklejam do AkelPad, taki notatnik, może zastąpić systemowy i jest o niebo lepszy.

Konwertor porozrzucał mi tak tekst, że było trudno dojść do ładu.

Mi to coś tutaj nie działa :confused:

A, też mam otwórz. Ale po otworzeniu wybieram zaznaczenie wszystkiego i PPM w oknie PDF wyświetla się, jak na zrzucie

http://prntscr.com/318pzv

 

Tak to jest, bo mam trzy czytniki i do kopiowania tekstu najlepszy jest sumatrapdf, bo w changeviewer woła o wtyczkę OCR, i muli.

http://prntscr.com/318rbv i potem do tego AkelPada - i jest dobrze. Wkleja się tylko tekst do tego notatnika.

 

CoolPDFReader - Mam jeszcze taką 1MB aplikację portable, tylko kopiowanie tekstu w PPM odbywa się na stronie, którą się czyta, więc 6 razy musiałbyś na każdej stronie klikać i kopiować, wklejać do notatnika. Jest na Dobrychprogramach

http://prntscr.com/318trp

Ja oprócz opcji kopiuj zaznaczenie mam jeszcze opcję kopiuj obraz. Masz najnowszą wersję? Może po jakiejś aktualizacji to nie działa?

Cóż… wymóg, żeby nie zaśmiecać komputera, to też i wskazówka. Trzeba wpisać w google PDF to text online i po kolei sprawdzać, znaleźć najlepszą dla siebie, bo wiele jest darmowych stron online. Ja nawet z takiej jednej korzystam do wyodrębnienia tekstu z JPG.

AkelPad ma w opcjach view, na dole language i klikasz w j polski.

Ciężko jest coś znaleźć. Jak na razie najlepsze rozwiązanie, które znalazłem to:

Jak już masz sumatraPDF, to przecież jest tam w menu plik “Zapisz jako” i wybierasz w “Zapisz jako typ” - pliki tekstowe. W dokumentach znajdziesz gotowy plik notatnika z tekstem, co był w PDFie.

Coś ten program chyba mnie nie lubi. Zapisuje mi w notatniku pusty plik. Cały waży 3 bajty. Tylko nazwa pliku jest taka sama

To usuń. Stąd pobierz z linka bezpośredniego:

http://www.dobreprogramy.pl/Sumatra-PDF,Program,Windows,22954.html Jest instalacyjna wersja i portable. Proponuję instalacyjną, jako domyślny edytor PDF w systemie.

Ogólnie biorąc istnieje kilka rodzajów dokumentów w pdf i różne są sposoby radzenia sobie z konwersją:

 

  1. Najprostrzy ale działa z prwidłowo wykonanym pdf (nie zabezpiecznym przed kopiowaniem)

-wyświetlasz dokument w Adobe reader, klikasz na tekst, ctrl+a, ctrl+c, przechodzisz do word czy inny edytor i wklejasz. Trzeba pamiętać, że jeśli w dokumencie były obrazki to zalecany edytor z obsługą, bo np notatnik wklei tylko tekst.

 

  1. Dokumenty które wyświetlają się jako 2 strony obok siebie.
  • wszystko jak w pkt 1 ale dodatkowo trzeba w meni Adobe reader ustwić: Widok–>Wyświetlanie strony–>Włącz przewijanie. Wszytko to aby zaznaczało całość tekstu a nie to co widoczne.

 

  1. Aby przyśpieszyć pracę nad dużą ilością pdf można wspomagać się programem Calibre - E-book management. Wprawdzie jest to program biblioteczy lecz 100% darmowy i potrafi bardzo ładnie konwertować pdf. Nie ma obsługi *doc ale ma rtf i to dla worda wystarczy. Potrafi przekowertowac dokumenty które mają ustwione blokady antycopy.

 

Problemy jakie mogą wystąpić:

 

Brak polskich znaków lub zasąpione innymi. Niestety tu problem polega na tym, że ktoś świadomie (czasem nie), nie ustawi aby do pliku były dołączane specyficzne czcionki, a tylko dane kodowe pojedynczych znaków. Mniejsza o to.

Jak sobie z tym poradzić ?

 

Wstawiamy taki tekst do worda, zaznaczamy znak który jest zły, wydajemy polecenie ady edytor zastąpił taki znak na właściwy w całym tekście uwzględniając wielkość liter. trochę żmudna robota ale po 5 min mamy tekst ok albo do kilku drobnych poprawek.

Już chyba wiem w czym rzecz. Programy te mają problemy z odczytaniem pdf;a który został stworzony ze skanu. Nie ma tam kodowania znaków, po prostu jest zdjęcie. 

Tekst na jpg odczytuję na stronce online. Klikam przeglądaj i wybieram plik z komputera. Ustawiam język polski wykrywania tekstu, ustawiam z boku na zwykły tekst i klikam w Wyślij. Wyświetla się cyfrowy kod, który trzeba przepisać w okienku i klikam w Recognize. Tyle. Bardzo wiernie odczytuje tekst z tego formatu pliku obrazu.

http://translate.google.pl/translate?hl=pl&sl=en&u=http://www.onlineocr.net/&prev=/search%3Fq%3Djpg%2Bto%2Btext%2Bconverter%26safe%3Doff

Widzę, że korzystasz z tego samego silnika do odczytywania jpg co ja proponowałem do pdfów. Tak sobie pomyślałem, że nie będzie to strategiczne zagranie konwertowanie do jpg i dalej odzcytywanie. Tak czy siak każdą stronę musiałbym robić oddzielnie. A pojedyncze strony mogę za free w pdfie odczytywać. 

http://www.finereader.pl/produkty/przetwarzanie-dokumentow/abbyy-pdf-transformer-pro

Kiedyś trialem dało się zrobić dokument. Nie wiem jak teraz.

Ale cudów się nie spodziewaj. Nie ma 100% udanego OCR-a. Tekst to pikuś. Gorzej z tabelkami i innymi nietypowościami.

Mówimy o tekście z pliku obrazu. Tekst z plików obrazu można odczytać w OneNote Worda, gdy się ustawi na kopiowanie tekstu z obrazu. Pliki obrazu konwertowane do PDF, to nadal pliki obrazu i czytnik PDF nie skubnie tekstu.

Znalazłem takie coś na softpedia:

http://translate.google.pl/translate?hl=pl&sl=en&u=http://www.softpedia.com/get/Office-tools/Other-Office-Tools/Boxoft-Free-OCR.shtml&prev=/search%3Fq%3DBoxoft%2BBezp%25C5%2582atny%2BOCR%26safe%3Doff%26client%3Dfirefox-a%26hs%3DnQ4%26rls%3Dorg.mozilla:pl:official%26channel%3Drcs

Virus Total online nie ma zastrzeżeń do instalatora.

Aby wyciągnąć tekst z pliku PDF składającego się z JPGów należy zrobić OCR.

 

Z darmowych narzędzi najlepiej radzi sobie z tym PDF-XChange Viewer http://www.dobreprogramy.pl/PDFXChange-Viewer,Program,Windows,15117.html

Po otworzeniu PDF-a w PDF-XChange Viewer wykonujemy:

MENU -> DOKUMENT -> Rozpoznaj tekst za pomocą OCR

Przy pierwszym uruchomieniu tej opcji na pewno nie będzie tam j. polskiego ale obok opcji wyboru języka jest napis “Więcej języków”. Po kliknięciu otwiera się strona z której można pobrać paczkę językową do opcji OCR. Ja wybieram zawsze European Languages Pack. Po pobraniu paczki instalujemy, ponownie uruchamiamy program i wchodzimy w opcje OCR.

Wybieramy język, dokładność rozpoznania i jaki ma być wynik - zachować tylko rozpoznany tekst usuwając fotkę, czy zachować fotkę a na niej ukrytą warstwę tekstową (ja zawsze wybieram to drugie). Należy też ustawić zakres stron na których ma być wykonana operacja.

Po dokonaniu OCR sprawa jest prosta

Zaznaczamy cały tekst Ctrl+A

Kopiujemy zaznaczony tekst Ctrl+C

Wklejamy do dowolnego programu

 

Oczywiście jakość wykonanego OCR jest zależna od jakości fotek, z których składa się PDF - z g##na bata nie ukręcisz :slight_smile:

Bogdan_G, tam nie ma języka polskiego. Jeżeli już nie mylę z tym programem od Fanboja :P. W każdym bądź razie jestem najbardziej zadowolony z programu zaproponowanego przez Vidivariusa. Jedyny mankament to całkowity brak formatowania i pojedyncze błędy, ale chyba nie znajdzie się idealnego programu. I tak jest super! Dzięki wielkie!

Cześć,

 

Trzeba korzystać z linków bezpośrednich, a nie z asystenta pobierania. Wówczas żadnych niespodzianek nie będzie.

a jest możliwość ściągania bezpośrednio aplikacji z dobreprogramy.pl? Nigdy nie podobał mi sie ten asystent pobierania. Czy może po necie szukać stron producentów?