Konwersja PDF do Worda


(rom50rom) #1

Nie wiem jakim programem wykonać konwersje zeskanowanego tekstu do Worda, tak aby można na nim dokonać zmian. Np. zmniejszyć ilustrację, dodać tekst, usunać zbędne elementy. UniPDF, czy inne owszem konwertują, ale na skonwertowanych tekstach nie można nic zrobić. Może ktoś mi pomoże.


(Pablo_Wawa) #2

Darmowe programy tego typu są do niczego, a komercyjne (bp. Abbyy Fine Reader) kosztują sporo.

Jednorazowo możesz skorzystać z jakiegoś serwisu umożliwiającego konwersję on-line, np. http://www.pdfonline.com/pdf-to-word-converter/


(rom50rom) #3

Dziękuję za odpowiedź, ale tak skonwertowany tekst też nie nadaje się do obróbki.Nic nie można z nim zrobić.


(Bogdan_G) #4

Jeśli chodzi Ci tylko o tekst, to skopiuj tekst z PDF. W Sumatra PDF otwiera się PDF i wybiera z menu widok, zaznacz wszystko. Potem z prawokliku wybiera się kopiuj. http://www.dobreprogramy.pl/Sumatra-PDF,Program,Windows,22954.html

Wkleja się do takiego lepszego notatnika, który przyjmie i tysiąc stron tekstu. Potem robisz z tekstem, co chcesz. http://portable.info.pl/akelpad-portable/

W jednym i drugim linku są wersje instalacyjne i portable. Darmochy. W change viewer zawiesza się OCR. A jak to wygląda? http://prntscr.com/4pbxh8

Zauważ, że w sekundę wkleja tekst z PDF 408 stron.


(rom50rom) #5

Ściągnąłem oba programy. Niestety z tekstem nic nie daje sie zrobić, nie wiem co robię źle. Może przyczyną jest, ze w tekście jest jeden obrazek.


(Suami777) #6

W Abbyy Fine Reader da się edytować 100% tekstu, nawet potrafi ze zdjęcia książki wydobyć 100% tekstu, więc coś nie tak robisz.


(Bogdan_G) #7

Drugie - Sumatra PDF ma proste rozwiązanie. Wystarczy w nim otworzyć dokument PDF i dać na menu plik i dać na zapisz jako. Na dole wybiera - zapisz do pliku tekstowego. No i jest plik tekstowy, nawet nie trzeba nic kopiować tekstu z PDF.

 

Jeśli to obraz z tekstem został skonwertowany do PDF, to tekstu z PDFa nie da się wyciągnąć. Jedyny sposób, to OCR z formatu obrazu.

To jest tak - można zapisać PDF do JPG. Zaś JPG, nawet z obrazkiem, można zapodać do OCR online, potem kliknąć w OCR i wyświetli się sam tekst.

Wrzuciłem pierwsze lepsze JPG, czyli tekst z obrazkiem na stronkę i oto wynik http://prntscr.com/4pd3ye

Jest sam tekst.

Ta stronka online, to: http://www.newocr.com/


(rom50rom) #8

Muszę faktycznie coś źle robić, bo jeśli już nawet tekst się skopiuje, to i tak nie mogę z nim nic zrobić. Pokazuje się jako całość, lub zapisany jako plik tekstowy, nie kopiuje się do notatnika ani do Worda. W OCR faktycznie się udało, tyle, że bez zdjęcia, ale to na razie chyba zostawię.

Dziękuję za pomoc, gdyby jednak jeszcze jakieś uwagi się znalazły, to bardzo będę wdzięczny.

przy okazji, nie wiem gdzie zadać pytanie dotyczące technicznego problemu komputera i problemu z touchpadem, proszę o podpowiedź.

Serdecznie pozdrawiam.

Romuald


(Vidivarius) #9

Tu ( http://forum.dobreprogramy.pl/program-do-konwertowania-pdf-do-word-darmowy-nie-wstawiaj%C4%85cy-zdj%C4%99%C4%87-do-worda-nie-za%C5%9Bmiecaj%C4%85cy-komputer-t468023/page-2#entry3003586) moja porada na podobny problem:

 


(rom50rom) #10

Bardzo dziękuję za pomoc. Program PDF-XChange pobrałem , zainstalowałem, język polski również. Nie mogę tylko poradzić sobie ze znalezieniem przetworzonego tekstu. Próbowałem wskazywać gdzie ma być zapisany tekst, ale nigdzie go nie ma. W PDF-X... też tego przetworzonego tekstu nie widzę. Proszę mi powiedzieć, co dalej.


(Vidivarius) #11

Bo tekst jest na warstwie ukrytej. Kliknij na stronę prawym klawiszem myszki i wybierz opcję ZAZNACZENIE (czwarte od góry). Następnie przeciągnij kursorem po linijkach jak byś zaznaczał tekst w Wordzie. Możesz też wcisnąć klawisze Ctrl+A (zaznacz wszystko).


(rom50rom) #12

Teraz wszystko jasne. Bardzo dziękuję! Może jeszcze poradzisz, co ze zdjęciami?

Pozdrawiam serdecznie.


(Vidivarius) #13

Jeśli dobrze cię zrozumiałem to...

Jeśli masz PDF-a składającego się ze skanów i chcesz wydobyć z niego obrazki będące na zeskanowanych stronach to masz dwie drogi:

 

  1. Musisz wyeksportować pliki strony będące plikami graficznymi, na których znajdują się obrazki. W PDF-XChange możesz to zrobić przez funkcję

a) Plik -> eksportuj -> Zapisz obraz jako

b) Określasz: I) które strony mają zostać wyeksportowane; II) w jakim formacie (TIFF, JPG, itd); III) w jakim miejscu mają być zapisane

c) wyeksportowane strony obrabiasz dowolnym programem do obróbki grafiki rastrowej ( http://www.dobreprogramy.pl/Tworzenie-i-edycja-grafiki-rastrowej,Programy,Windows,139.html): Gimp http://www.dobreprogramy.pl/GIMP,Program,Windows,13219.html, Photoshop, PaintNET http://www.dobreprogramy.pl/Paint.NET,Program,Windows,12332.html ; tak aby wyciąć z nich pożądane obrazki

 

  1. Możesz użyć programu do zrzutów ekranowych, np. Gadwin PrintScreen http://www.dobreprogramy.pl/Gadwin-PrintScreen,Program,Windows,12471.html

a) Powiększasz fragment strony w PDF-XChange tak aby pożądany obrazek zajmował możliwie duży obszar monitora

b) W programie Gadwin PrintScreen wybierasz opcję dokonywania zrzutu ekranowego z zaznaczonego obszaru - Capture rectangule Area

c) gdy na ekranie pojawi się czerwony prostokąt zaznaczania przeciągasz nim tak aby zaznaczyć obrazek na stronie w wyświetlanym PDF-e

d) wciskasz ENTER. Obrazek zapisze się w domyślnym katalogu zrzutów C:\Users\twoja nazwa użytkownika\Pictures\My Screen Shots

 

Pozyskane w ten sposób zdjęcia możesz wkleić do dowolnego tekstu, np. w Wordzie


(rom50rom) #14

Dziękuję za wyczerpującą informację. Mam nadzieję, że sobie poradę.

Mało jest ludzi, którzy potrafią pomagać.Z pewnością należysz do nich.

Pozdrawiam serdecznie.