Fine Reader, Wine и сканер
golovin 3 января, 2010 - 19:09
Не могу подключить сканер к Fine Reader в Wine.
Есть XSane. Сканирует нормально :)
Сканер Epson Perfection 1670. Fine Reader 7.0 - Новые ИМХО тяжелые и тормозные и ничего нового :)
Скорее всего всё просто - не знаю где копать :) Подскажите :)
»
- Для комментирования войдите или зарегистрируйтесь
Можно отсканировать под
Можно отсканировать под Linux'ом, а FineReader'у «подсунуть» готовые изображения.
Я ♥ Gentoo & Funtoo
- - -
Несмотря на то, что поддержка twain реализована, заставить работать его в FineReader мне не удалось.
Но я не вижу особой проблемы в предварительном сканировании из другой программы.
Ну если существенное повышение качества распознавания и распознавание с камеры, это "ничего нового", тогда наверное да, и правда ничего нового... (-:
Простота и удобство
Как раз такой подход легко реализовать (он и реализован):
Бумага -> XSane -> Файл; Файл -> Wine(FineReader) -> Файл; Файл -> OpenOffice.org -> cups -> Бумага.
А хотелось бы как в MS Windows (извините за выражение :) ):
Бумага -> Twain -> FineReader -> OpenOffice.org -> Бумага.
Такой укороченный процесс - без файлов - лучше управляем.
А процесс с записью в файл позволяет обрабатывать только один сканируемый лист до конца, либо же серию сканированных листов - но единообразно, конвейерным способом.
И не всегда предсказание толщины стопки/серии листов верное - у меня (в отличие от предсказания ветвления процессором :) ) не превышает 10...30% :)
Так что укороченный процесс, без промежуточной записи в файл, достаточно актуален :)
такой же сканер. сканирую в
такой же сканер.
сканирую в виртуальной машинке.
заставить сканировать файнридер из под вайна не получилось, может стоит попытаться ещё раз, давно не пытался.
вся эта хренотень со сканированием в линуксе, к сожалению, не очень годится: файнридер на лету определяет порогвые уровни при сканировании текста, такого качественного результата, добится сейном сразу не получается , да и качество не стабильным выходит, приходится пересканировать часто.
- - -
Для хорошей печати сканирование в grayscale с банальным автоуровнем в Xsane - дает ожидаемый результат. А вот сканирование плохой печати - тут уж я никогда не доверял FR определять уровни, так как мое определение ситуации с пороговыми значениями - всегда давала лучшие результаты, сколько бы я не экспериментировал. Ну а для более сложных сканов иногда даже приходилось применять кривые (если это конечно было оправданно, перед ручным набором и задача поддавалась пакетной обработке, после определения требуемой кривой).
Предлагаю посмотреть в
Предлагаю посмотреть в сторону app-text/cuneiform
Хоть и сыроват продукт, но работать уже можно.
emacs — отличная операционка которой не хватает только хорошего текстового редактора.
:)
И графприблуда к нему app-text/yagf
:)
kstati написал(а): Предлагаю
Ну о-о-очень «сырой» :(
Особенно при распознавании русских текстов.
Я ♥ Gentoo & Funtoo
/
Периодически сталкиваюсь с продуктами якобы не-сырого FineReader'а.
Если требовать надлежащего качества (за каждую ошибку раздавать люлей начиная с оператора и далее до разработчика), то проще набрать ручками.
:wq
--
Live free or die
Anarchist написал(а): Lupo
Именно из-за этого я освоил десятипальцевый «слепой» набор :)
Я ♥ Gentoo & Funtoo
Anarchist написал(а): Если
Если бы оно было практически возможно — CAPTCHA была бы бессмысленна.
/
Пример некорректен.
Ибо не учтён существенный фактор в виде параметров сканирования.
Иначе говоря: при соблюдении определённых условий оно вполне себе практически возможно.
:wq
--
Live free or die
Хм. уж не знаю что за тексты
Хм. уж не знаю что за тексты вы сканируете, но у меня обычно не больше 2-3х ошибок на страницу.
Сканирую тексты с книг/журналов/прочей печатной фигни.
- - -
Я так понимаю, Вы имеете в виду ошибки еще до проверки?..
Потому что, с книг, с нормальной печатью, а уж тем более с журналов, как правило вообще нет ошибок (имеется в виду уже после проверки).
Имею ввиду именно до
Имею ввиду именно до проверки. 1-2 буквы некорректно распознанных на страницу - вполне приемлемый результат.
Что больше напрягает в файнридере, так это его автоматическое разбиение на блоки, особенно на всяких-разных графиках.
А если идет голимый текст, без картинок, то результат нормальный.
.
Время/ресурсы, затрачиваемые на сканирование, учитываются?
Ошибки форматирования/структирования тоже необходимо считать :)
:wq
--
Live free or die
- - -
Нет, мы ничего не учитываем. Нам просто нравится сам процесс... Он такой технологичный, все так круто выглядит, аж до экстаза доводит. А что такое форматирование мы даже и не знаем. Мы и слепой метод печати не осваиваем, что бы только не лишать себя удовольствия работать с OCR, а то вдруг ручной набор окажется эффективнее и затраченные средства на коммерческое ПО не отобьются.
(-;