Романов
|
 |
« Ответ #45 : 22 Апреля 2014, 19:24:45 » |
|
2 Ахинеич Возможно. Распознавалок разных много.
|
|
|
Записан
|
|
|
|
Ахинеич
|
 |
« Ответ #46 : 22 Апреля 2014, 19:30:59 » |
|
Жаль, что сейчас во Пскове. С ноута строчу. А то выложил бы скриншоты, оно на домашнем компе (там восьмёрка 64 разряда).
|
|
« Последнее редактирование: 22 Апреля 2014, 19:31:56 от Ахинеич »
|
Записан
|
С точки зрения теории Банальных Эрудиций возможности далеко не каждого индивидуума способны игнорировать тенденции парадоксальных эмоций. Резюмируя вышесказанное, нивелируйте свои аппроксимации на ассоциации с ником!
|
|
|
tix ТС
|
 |
« Ответ #47 : 22 Апреля 2014, 20:27:24 » |
|
Меня ввели в заблуждение, а я вас, невольно. Документ исходный не пдф-ка, а вовсе даже джипег. Но это точно результат сканирования. Вот я один разворотик вам покажу. Сразу скажу, что я шапки табличек обрезал фотошопом, ну и сохранил, опять же в джипеге. Файл стал меньше исходного. ФАйнридер его жрет, распознает, ошибки есть, но немного, их надо все отловить, чтобы дальше не ушли...Вопрос - как можно улучшить распознавание - уменьшить по возможности ошибки (хотя их немного я увидел)? Второй вопрос - как быстрее провести контроль сравнением исходного и результата? Глядим - видим? Приложенный документик уменьшен безумно, для возможности приаттачивания. Исходный около полутора мб.
|
|
« Последнее редактирование: 27 Мая 2014, 19:57:49 от OVA »
|
Записан
|
ВСЕ можно устроить, если вертеть в руках достаточно долго! Алкоголь в малых дозах полезен, а в больших - даже приятен!
|
|
|
Ахинеич
|
 |
« Ответ #48 : 22 Апреля 2014, 20:31:10 » |
|
.Вопрос - как можно улучшить распознавание - уменьшить по возможности ошибки (хотя их немного я увидел)? Вводить в максимальном качестве. И только. Второй вопрос - как быстрее провести контроль сравнением исходного и результата? Включить проверку орфографии. Всё неправильно читаемое выделит красным.
|
|
|
Записан
|
С точки зрения теории Банальных Эрудиций возможности далеко не каждого индивидуума способны игнорировать тенденции парадоксальных эмоций. Резюмируя вышесказанное, нивелируйте свои аппроксимации на ассоциации с ником!
|
|
|
tix ТС
|
 |
« Ответ #49 : 22 Апреля 2014, 20:34:32 » |
|
Включить проверку орфографии. Ты глянь, какая там орфография? Мне в цифрах надо ошибки ловить.
|
|
|
Записан
|
ВСЕ можно устроить, если вертеть в руках достаточно долго! Алкоголь в малых дозах полезен, а в больших - даже приятен!
|
|
|
tix ТС
|
 |
« Ответ #50 : 22 Апреля 2014, 20:35:43 » |
|
Вводить в максимальном качестве. Все уже давно введено. Есть только куча таких электронных листочков. Коля, спасибо за дельные советы, плюсую.
|
|
|
Записан
|
ВСЕ можно устроить, если вертеть в руках достаточно долго! Алкоголь в малых дозах полезен, а в больших - даже приятен!
|
|
|
Ахинеич
|
 |
« Ответ #51 : 22 Апреля 2014, 20:37:19 » |
|
Мне в цифрах надо ошибки ловить. Ну это только ручками. Тут уж ничего не сделаешь. 
|
|
|
Записан
|
С точки зрения теории Банальных Эрудиций возможности далеко не каждого индивидуума способны игнорировать тенденции парадоксальных эмоций. Резюмируя вышесказанное, нивелируйте свои аппроксимации на ассоциации с ником!
|
|
|
Романов
|
 |
« Ответ #52 : 22 Апреля 2014, 20:48:00 » |
|
Вопрос - как можно улучшить распознавание - уменьшить по возможности ошибки (хотя их немного я увидел)? Играть яркостью-контрастом например в фотошопе, дабы убрать пробитый с оборотной стороны фон. Можно и нужно сохранять в тифах, а не в жипеге, смотреть ошибки, 99 проц их - нестандартные символы. В чем тебе надо получить результат? DOC или DOCX?
|
|
|
Записан
|
|
|
|
tix ТС
|
 |
« Ответ #53 : 22 Апреля 2014, 20:52:14 » |
|
Можно и нужно сохранять в тифах, Чем это лучше? DOC или DOCX? Не принципиально, вроде. Из ДОСа потом надо получать текст, который пойдет на обработку программой, его будут структурировать.
|
|
|
Записан
|
ВСЕ можно устроить, если вертеть в руках достаточно долго! Алкоголь в малых дозах полезен, а в больших - даже приятен!
|
|
|
Романов
|
 |
« Ответ #54 : 22 Апреля 2014, 21:02:57 » |
|
Кстати, таблицу он распознает не плохо, структура не летит. Нет, еще не залез, но залезу.
Как альтернатива предобработки фотошопом, но это на вкус и цвет. Собственно, там основная засада - пробивающаяся обратная сторона листа, и искажения в областях сгиба, но уже не так серьезно.
|
|
|
Записан
|
|
|
|
Романов
|
 |
« Ответ #55 : 22 Апреля 2014, 21:04:14 » |
|
А лист надо как две страницы сохранять или это единая таблица на весь разворот?
|
|
|
Записан
|
|
|
|
Ахинеич
|
 |
« Ответ #56 : 22 Апреля 2014, 21:07:17 » |
|
дабы убрать пробитый с оборотной стороны фон. На сколько я помню, Ридер сам прекрасно с шумами борется по анализу грницы контрастности. А вот формат Тифф сильно увеличивает время обработки картинки. Так что ещё посмотреть надо, что выгоднее. Но попробовать можно, если результат превысит ожидания.
|
|
|
Записан
|
С точки зрения теории Банальных Эрудиций возможности далеко не каждого индивидуума способны игнорировать тенденции парадоксальных эмоций. Резюмируя вышесказанное, нивелируйте свои аппроксимации на ассоциации с ником!
|
|
|
Романов
|
 |
« Ответ #57 : 22 Апреля 2014, 21:08:47 » |
|
вот формат Тифф сильно увеличивает время обработки картинки. Да, но при современных мощностях 0,1 или 0,3 сек на страницу.. ХЗ.. )))
|
|
|
Записан
|
|
|
|
Ахинеич
|
 |
« Ответ #58 : 22 Апреля 2014, 21:14:12 » |
|
0,1 или 0,3 Опять же на сколько помню, раз в 10...
|
|
|
Записан
|
С точки зрения теории Банальных Эрудиций возможности далеко не каждого индивидуума способны игнорировать тенденции парадоксальных эмоций. Резюмируя вышесказанное, нивелируйте свои аппроксимации на ассоциации с ником!
|
|
|
Романов
|
 |
« Ответ #59 : 22 Апреля 2014, 21:19:53 » |
|
tix, ЕМНИП тебе отсюда начинать настройку распознавания символов, скобки, например, фигово он твои понимает. Учить его немного надо.
|
|
« Последнее редактирование: 27 Мая 2014, 22:24:27 от OVA »
|
Записан
|
|
|
|
|