PDF nie musi zachowywać spójności tekstu i faktycznie niektóre PDF’y tej spójności nie zachowują. Wszystko zależy od sposobu w jaki PDF został utworzony. Co można zrobić? Generalnie to dosyć trudna sprawa. Możesz spróbować przepuścić tekst przez OCR pdf ocr - Szukaj w Google ja kojarzę darmowy OCR gImageReader oraz OCR wbudowany w Xchange PDF Viewer.
Ewentualnie jak masz abonament w Adobe, to Acrobat Reader → Plik → Skonwertuj na format…