Kamrad.ru
 
 
дневники | кабинет | регистрация | календарь | участники | faq | правила | поиск | фотоальбом | каська | выйти
Kamrad.ru Kamrad.ru » Авторские форумы » Убей в себе ламера » Распознавание текста сканером
новая тема  ответить следующая тема | предыдущая тема
Автор
 
Gothic - offline Gothic
Question07-04-2005 16:58 URL сообщения      K-Mail    Профиль    Поиск    Контакт-лист   Редактировать
Камрад



Распознавание текста сканером

Купил себе сканер фирмы Cannon. Рисунки он считывает, конечно, замечательно, а вот с текстами проблема…
Там есть специальная программа, которая переводит писанину с листов в электронный текст. Так вот выходит это довольно паршиво. Русский текст читается просто ужасно, практически невозможно понять, что имеется в виду.
Я-то наивный думал, что если отсканировать страницу из книги, то потом этот текст легко можно будет перенести в электронный формат. А выходит, что не так…

Может, посоветуете какую-нибудь более совершенную программу, которая распознаёт русский шрифт лучше, чем моя? Или хотя бы дайте общие советы. А то ведь получается какая-то бесполезная покупка…

Надеюсь, что вы мне поможете.
Жду ваших ответов!


__________________
Игры всегда, игры везде.

Jazz - offline Jazz
07-04-2005 17:12 URL сообщения Дневник     K-Mail    Профиль    Поиск    Контакт-лист   Редактировать
Модератор
Freelancer



А как называется твоя программа?

А вообще - Finereader.


Но уровень распознавание сильно зависит от качества шрифта книги, качества листа бумаги. так что не с некоторыми экземплярами ничего сделать не получится.

Ну и ставить надо в настройках сканирования минимум 300dpi

Major Pronin - offline Major Pronin
07-04-2005 18:26 URL сообщения Дневник     K-Mail    Профиль    Поиск    Контакт-лист   Редактировать

Настоящий
генерал



При сканировании текста разрешение ставить не ниже 300 dpi, как сказал Jazz, а лучше - больше, если сканер позволяет.
Далее, сканирование производить не в цвете, не в градациях серого, а только в ч/б. Причем, экспериментально подобрать значения яркости и контраста, для примера несколько раз просканив одну страничку. Необходимо подобрать такой режим, чтобы текст ясно читался и вокруг него не было постороннего "мусора" в виде точек, которые могут затруднить распознавание.
Сканирование производить лучше одним махом. Т.е., если нужно книгу, к примеру, оцифровать, то и нужно ее за один раз обрабатывать, подобрав параметры. Таким образом весь подготовительный метериал будет в едином ключе сделан. Сохранять страницы лучше в tiff. Да, они занимают много места, но для сканирования это намного лучше, потом же все равно сканы можно будет стереть.
При необходимости, предварительно подготовленные сканы можно подчистить в фотошопе, удалить лишнее.
При качественной подготовке finereader выдает отличный результат.

Steel Lord - offline Steel Lord
08-04-2005 05:49 URL сообщения      K-Mail    Профиль    Поиск    Контакт-лист   Редактировать
Модератор
белый и пушистый



Major Pronin
не в градациях серого, а только в ч/б
Не согласен. Если это не черный текст на белом фоне, то сканирование в ч/б даёт результат хуже, чем при сканировании в оттенках серого.

Gothic - offline Gothic
08-04-2005 12:16 URL сообщения      K-Mail    Профиль    Поиск    Контакт-лист   Редактировать
Камрад



Большое всем спасибо за такие быстрые и конкретные ответы.
Я действительно совсем забыл написать главное – какая программа прилагалась к сканеру. Это ScanSoft OmniPage SE 2.0.
В настоящее время ищу по Интернету последнюю версию названной вами программой.
Если вдруг и на этот раз ничего не получится, то потревожу вас ещё разок-другой.

И ещё раз всем спасибо. Приятно, что люди так быстро откликаются.

Major Pronin - offline Major Pronin
08-04-2005 19:11 URL сообщения Дневник     K-Mail    Профиль    Поиск    Контакт-лист   Редактировать

Настоящий
генерал



Steel Lord, упс =) обычно сканятся книги или печатные материалы, подготовленные ранее на компьютере, а и те и другие имеют в подавляющем большинстве случаев вид - черный текст на белом фоне. Поэтому по ч/б и говорил.

madsurrge - offline madsurrge
09-04-2005 07:58 URL сообщения      K-Mail    Профиль    Поиск    Контакт-лист   Редактировать
Камрад



Gothic
Триальную версию FineReader можешь скачать с офсайта www.abbyy.com/finereader/
Потом поищи в сети keygen от SSG, но перед его использованием обязательно прочти инструкцию

Gothic - offline Gothic
09-04-2005 12:01 URL сообщения      K-Mail    Профиль    Поиск    Контакт-лист   Редактировать
Камрад



Да, я уже скачал триальную версию с официального сайта. Теперь вот ищу кряк.
Я ещё вчера скачал программу, а вот до кряка руки не дошли. Проверил качество сканирования – просто замечательно, особенно по сравнению с тем, что было.

Действительно отличная программа. Теперь вот кряк к ней найду, и всё будет путём.

Ещё раз всем спасибо, кто принимал участие в этой теме.

Текущее время: 12:25
новая тема  ответить следующая тема | предыдущая тема
 
Перейти:

версия для печати   отправить эту страницу по e-mail   подписаться на эту тему

 
Powered by: vBulletin Version 2.0.1
Copyright ©2000, 2001, Jelsoft Enterprises Limited.
Любое использование материалов сайта
возможно только с разрешения его администрации.


 

Рейтинг@Mail.ru
Рейтинг@Mail.ru