Вход на сайт
"decode" broken docx...
256 просмотров
Перейти к просмотру всей ветки
в ответ pakhomenko 25.05.12 14:57
в смысле нет заголовков? заголовок части в zip-файле состоит из бинарной сигнатуры и данных заголовка, как описано в APPNOTE.TXT (который есть в поставке unzip (в исходниках)) и собственно запакованных данных (обычно это deflate algorithm). Вот например кусок документа:
00000000: 504b 0304 1400 0600 0800 0000 2100 0381 PK..........!...
00000010: 683b 9001 0000 2807 0000 1300 0802 5b43 h;....(.......[C
00000020: 6f6e 7465 6e74 5f54 7970 6573 5d2e 786d ontent_Types].xm
00000030: 6c20 a204 0228 a000 0200 0000 0000 0000 l ...(..........
00000040: 0000 0000 0000 0000 0000 0000 0000 0000 ................
00000050: 0000 0000 0000 0000 0000 0000 0000 0000 ................
..........
00000230: 0000 0000 0000 0000 00b4 95cb 6ac3 3010 ............j.0.
00000240: 45f7 85fe 83d1 b6d8 4aba 28a5 c4ce a28f E.......J.(.....
00000250: 651b 68fa 018a 348e 4d6d 4948 93d7 df77 e.h...4.MmIH...w
сигнатура
файла тут 0x504b0304, а дальше идет заголовок, и только с 0x239 должны начинаться сами данные... Вот эти данные-то и можно вытащить, и потом распаковать (или распаковывать сразу при вытаскивании)