Czym ugryźć pliki xml z wordowego docx?


(Kmazur) #1

"docx" z worda 2007 to zwykłe archiwum zip, które można rozpakować lub wchodzić do niego jak do katalogu np. programem total commander. Tej metody używam do szybkiego wydobycia plików rysunków/zdjęć -- nie trzeba każdego osobno kopiować przez schowek.

Inne pliki obecne w docx to pliki xml. Czy ktoś wie czym można je otwierać?

Tekst z pliku worda też jest w takim xml, ale przypuszczam że jest to czysty tekst, a style i inne są w osobnych plikach.

Interesuje mnie czy da się czymś otworzyć taki plik xml i w szybki sposób wydobyć czysty tekst -- bez osadzonych równań, obrazków i ew. styli (ale z zachowaniem formatowania -- pogrubienia, kursywy itd.)


#2

Spróbuj jakiejś przeglądarki internetowej.


(P3ko00) #3

Tak jak pisze przedmówca np. IE (tylko podgląd) ja osobiście preferuję notepad++ (program jest darmowy) za pomocą którego możesz również edytować XML’e.


(Kmazur) #4

Areh ,

IE 8 (win xp) pokazuje mi zawartość pliku (czyli kod)

FireFox 20 tak samo, ale u góry strony wyświetla komunikat:

“Podany plik XML nie zawiera żadnych informacji o stylach z nim związanych. Poniżej wyświetlone jest drzewo dokumentu.”

p3ko ,

czy notepad++ oprócz całego kodu pokaże mi też jakiś wynikowy podgląd, żeby można było skopiować tekst?


#5

No i tak powinno to wyglądać.


(Chillout) #6

http://www.idg.pl/ftp/xml.editor.html

http://www.darmoweprogramy.org/440/XML-Viewer