Вход на сайт
"decode" broken docx...
256 просмотров
Перейти к просмотру всей ветки
в ответ pakhomenko 25.05.12 13:11
файлы .docx - это просто .zip архивы с определенной структурой. Попробуйте открыть их в каком-нибудь архиваторе и вытащить оттуда XML файлы. Объекты в которых находится текст лежать в подкаталоге "word", основной текст соответственно - "word/document.xml"
