файлы .docx - это просто .zip архивы с определенной структурой. Попробуйте открыть их в каком-нибудь архиваторе и вытащить оттуда XML файлы. Объекты в которых находится текст лежать в подкаталоге "word", основной текст соответственно - "word/document.xml"