Witam,
Szukam najlepszego/najszybszego programu do tworzenia plików pdf wyszukiwalnych. Konieczna jest obsługa dużych plików (do 60mb).
Testowałem już Phantom Foxit reader, Abby i kilka stron online do konwersji na wyszukiwalnego pdfa.
Jednak proces ten trwa zwykle bardzo długo.
Proszę o propozycje sprawdzonych programów do takiej konwersji .
Pewnie koledze chodzi o to, że jak ktoś zrobi np. skan jakiegoś dokumentu i prosto go wrzuci w pdf - to nie jest to prosty tekst (jak np. plik worda zapisany jako pdf) - tylko traktowany jest jako obrazek i m.in. funkcja wyszukania nie działa.
- Text-based or “true” PDFs: Digitally created PDFs, sometimes called “true” PDFs, are made by directly saving a document being drafted in a word processor (like Microsoft Word) as a PDF or by using the “print to PDF” function.
- Image-based PDFs: Image-only PDFs are created through scanning, taking photographs, or taking screenshots. These documents are “locked” in a snapshot type image and are not searchable, cannot be copied and pasted, and cannot be marked up.
- OCR’d or “made-searchable” PDFs: Image-based PDFs can be made text searchable via the application of optical character recognition (OCR). During the OCR process, characters and the document structure are “read.” As a result, a text layer is added to the image layer. Such documents become similar to “true” PDFs — though, depending on the quality of the image, or the recognizability of the writing, may not be 100% accurate.
OCR zazwyczaj trwa długo.
https://www.dobreprogramy.pl/Rozpoznawanie-tekstow-OCR,Programy,Windows,82.html