Пришёл файл в формате docx (это какой-то новый модный дефолтный формат MS Word, который zipped xml). google docs не осилил. Пришлось извлекать текст регулярными выражениями...
updated:Помог OdfConverter.exe взятый с
http://odf-converter.sourceforge.net/snapshots/cmd-line-tools/OdfConverter.exe /I input.docx
Он умеет конвертировать из docx в odf.
Так что товарищам, у которых по каким-то причинам установлен OpenOffice, а последний модный MS Office нет - рекомендую для чтения docx файлов.
Microsoft Word Viewer docx после
обновления (в сумме около 40 мегабайт) так же умеет открывать docx. По идее, старые MS-Офисы тоже должны научиться. (спасибо
dalesays за инфу).
Последняя версия OpenOffice (2.3) - не умеет.
updated:А ещё Microsoft Word Viewer может использоваться как конвертер - сконвертированный doc можно потом найти в папке %TEMP%