Czym ugryźć pliki xml z wordowego docx?

“docx” z worda 2007 to zwykłe archiwum zip, które można rozpakować lub wchodzić do niego jak do katalogu np. programem total commander. Tej metody używam do szybkiego wydobycia plików rysunków/zdjęć – nie trzeba każdego osobno kopiować przez schowek.

Inne pliki obecne w docx to pliki xml. Czy ktoś wie czym można je otwierać?

Tekst z pliku worda też jest w takim xml, ale przypuszczam że jest to czysty tekst, a style i inne są w osobnych plikach.

Interesuje mnie czy da się czymś otworzyć taki plik xml i w szybki sposób wydobyć czysty tekst – bez osadzonych równań, obrazków i ew. styli (ale z zachowaniem formatowania – pogrubienia, kursywy itd.)

Spróbuj jakiejś przeglądarki internetowej.

Tak jak pisze przedmówca np. IE (tylko podgląd) ja osobiście preferuję notepad++ (program jest darmowy) za pomocą którego możesz również edytować XML’e.

Areh ,

IE 8 (win xp) pokazuje mi zawartość pliku (czyli kod)

FireFox 20 tak samo, ale u góry strony wyświetla komunikat:

“Podany plik XML nie zawiera żadnych informacji o stylach z nim związanych. Poniżej wyświetlone jest drzewo dokumentu.”

p3ko ,

czy notepad++ oprócz całego kodu pokaże mi też jakiś wynikowy podgląd, żeby można było skopiować tekst?

No i tak powinno to wyglądać.

http://www.idg.pl/ftp/xml.editor.html

http://www.darmoweprogramy.org/440/XML-Viewer