catdoc (рубеж в 50%)
voleyr 4 сентября, 2007 - 00:47
Приветствую всех. Установил пакет утилит catdoc, но возникла проблема такого плана:
При конвертации файла из *.doc в "человеческий" вид, часть текста (примерно 1 абзац) в центре документа, конвертируется с ошибками. При этом выдаётся по одному или несколько символов (? или набор бреда) в строке. В Гугле пусто...В багрепорте пусто...
Картина такая:
Цитата:
# catdoc -V
Catdoc Version 0.93.4
При конвертации:
Цитата:
>$ catdoc file.doc
...Более 60% всех своих активов в ценные бумаги одной отрасли
??
kdп
??iU??
kd0
kdп
???????i?Управляющий не может выдавать кредиты (займы) за счёт имущества ...
То есть, приблизительно на половине документа вылезает "косяк". И так на всех присланых файлах.
Предположения, что file.doc "битый" не состоятельны. Присланные файлы были проверены на соседском "обогревателе" с WinXP.
Может кто сталкивался?
P.S. Никакого заумного форматирования в документах нет. Обычный текст, разбитый на параграфы.
»
- Для комментирования войдите или зарегистрируйтесь
Видимо надо
Видимо надо слать багрепорт в апстрим (разработчик вроде даже просит присылать к нему документы конвертирующиеся с ошибками)... Можно попробовать версию из svn
Одно из двух.
Одно из двух. Либо док кривой либо прога. С конвертацией всегда так. Побробуй вот это
app-text/wv , может поможет.
общая трабла
это трабла стандарта, имхо.
есть прога - BookReaderFactory (ява книги для мобилы). у неё та же трабла с некотырыми текстами.
---
Бывает так, что Падлософт сам отклоняется от собственных стандартов. Тогда текст открывается в офисах и не открывается в "не их" софте. Попробуй конвертнуть глючный документ через Zoho или Google Office или другой онлайн конвертер. Если окажется, что правильно - вот тогда виноват конвертер.