Czy są jakieś darmowe biblioteki do obsługi PDF?


(Utrivv) #1

Witam,

czy są jakieś darmowe biblioteki (np dla PHP) do wyciągania danych z plików PDF?

Albo chociarz dające możliwość sprawdzenia czy dany plik jest np. skanem czy też jest tam tekst który można wyciągnąć zapisując do pliku tekstowego?

Nie chodzi mi w żadnym razie o tworzenie PDF - do tego mam chocby FPDF.


(Sitemaster) #2

http://www.php.net/manual/en/ref.pdf.php

http://www.hotscripts.com/category/php/ ... ation/pdf/


(Utrivv) #3

Niezupełnie o to mi chodziło, nie chcę generować nowych plików tylko wyciagać tekst ze starych.

Pierwszy link niby pomaga ale na zasadzie:

odpal program do wrzucania pdf do pliku txt i edytuj plik tekstowy.

Drugi link prowadzi do powszechnie znanej biblioteki która nie umozliwia wyciagania tekstu z gotowych pdf'ów - jeżeli jest inaczej wskaż konkretną fukcję.

Trzeci link - być może by był ok ale link do jedynej biblioteki do edytowania istniejących pdf'ów prowadzi w ślepy zaułek, gdy przechodzi się do działu download jest do pobrania tylko plik odwrotny (generowanie pdf z html)

Przyznasz że to raczej nie jest pomocne?