Тема: А как насчёт поставить CuneiForm и распознать текст самому?

Павел Евсеенков пишет:

Может когда-нибудь, долгими зимними, кто-то оформит.

http://www.plantarium.ru/page/view/item/47710.html


Павел, а как насчёт поставить CuneiForm и распознать самому? Делов-то на 5 минут.

Отредактировано Дмитрий Орешкин (2014-08-15 20:54:00)

Re: А как насчёт поставить CuneiForm и распознать текст самому?

Никогда этим не занимался, надо учиться с нуля. Если 5 минут, то может быстрее вы сделаете ?

Re: А как насчёт поставить CuneiForm и распознать текст самому?

Потратьте 10 минут на обучение, потом будет проще. А я что-нибудь другое распознаю.

Re: А как насчёт поставить CuneiForm и распознать текст самому?

Дмитрий Орешкин пишет:

Потратьте 10 минут на обучение,..

Я правда кажусь таким умным ? Это надо исправлять smile Кому 10 минут, а кому с 17-го года надо начинать учить.

Re: А как насчёт поставить CuneiForm и распознать текст самому?

Не надо до 17-го года откладывать wink Чтобы распознать текст, особого ума не нужно - нужны навык и внимательность.
И вообще, не боги горшки обжигают!

Re: А как насчёт поставить CuneiForm и распознать текст самому?

Ну скачал я эту прогу, но пока как баран на новые ворота. Чувствую, потратить придётся пол дня минимум что бы понять принцип работы. И этим я займусь видимо не скоро.
Кстати, будет не плохо если кто-нибудь напишет пошаговую инструкцию,- может пригодится не только мне.

Re: А как насчёт поставить CuneiForm и распознать текст самому?

Принцип работы прост - CuneiForm загружает изображения из файла или со сканера, распознаёт там буквы и представляет их как печатный текст. Этот текст можно скопировать в буфер обмена и куда-нибудь вставить (например, в форму на странице "Ботаническое описание") или сохранить как файл.

Кстати, тексты для распознавания можно легко получить из DjVu файлов, знакомых всем, кто пользуется библиотекой Шипунова - выделяешь нужный кусок и экспортируешь в PNG-файл.

Re: А как насчёт поставить CuneiForm и распознать текст самому?

1. Открываем файл (жмём кнопку с треугольничком).

http://forum.plantarium.ru/misc.php?action=pun_attachment&item=7019&download=0

В иконка на кнопке изменится и по умолчанию загрузка будет из файла - сразу можно жать на кнопку, а не на треугольник справа.

2. После выбора файла и его загрузки видим картинку:
http://forum.plantarium.ru/misc.php?action=pun_attachment&item=7020&download=0

3. Жмём кнопку "Распознавание", и программа в меру своих способностей превращает картинку в буквы, попутно выделяя незнакомые или сомнительные слова:
http://forum.plantarium.ru/misc.php?action=pun_attachment&item=7021&download=0

4. Внимательно читаем текст и исправляем ошибки (русские буквы зачастую заменяются английскими, вместо знаков пунктуации прога вставляет буквы и т.п.). После этого выделяем исправленный текст, копируем его в буфер обмена и вставляем в форму.

Аттачменты сообщения

Иконка аттачмента CuneiForm-1.png 33.1 kb, 73 раз(а) скачан с 2014-08-16 

Иконка аттачмента CuneiForm-2.png 55.66 kb, 56 раз(а) скачан с 2014-08-16 

Иконка аттачмента CuneiForm-3.png 71.99 kb, 54 раз(а) скачан с 2014-08-16 

Re: А как насчёт поставить CuneiForm и распознать текст самому?

Спасибо, вроде получается !

Re: А как насчёт поставить CuneiForm и распознать текст самому?

Павел, и Вам огромное спасибо! С почином!!!

Re: А как насчёт поставить CuneiForm и распознать текст самому?

При проверке текстов нужно обращать внимание, что при указании диапазонов значений тире пробелами окружать не нужно:

2—4 см в диаметре

Re: А как насчёт поставить CuneiForm и распознать текст самому?

И чтобы текст красиво разбивался на абзацы, между ними нужно вставлять пустую строчку. Впрочем, это уже из оперы о форматировании текстов.

Re: А как насчёт поставить CuneiForm и распознать текст самому?

Хотя бывает и так smile
http://forum.plantarium.ru/misc.php?action=pun_attachment&item=7022&download=0

Отредактировано Павел Евсеенков (2014-08-17 10:35:06)

Аттачменты сообщения

Иконка аттачмента 2014-08-17_113113.jpg 96.83 kb, 104 раз(а) скачан с 2014-08-17 

Re: А как насчёт поставить CuneiForm и распознать текст самому?

Да, если картинка - JPEG или просто плохого качества. Тексты лучше сохранять в PNG - он аккуратнее обращается с границами изображений, и распознаётся такой текст лучше.

Re: А как насчёт поставить CuneiForm и распознать текст самому?

Да, там изначально качество плохое.

Re: А как насчёт поставить CuneiForm и распознать текст самому?

Павел, а как догадаться про слова, которые распознаются неверно? Вот ещё "корневище" куда ни шло, а уже "симподиально" и пр. - только знаток такую анаграмму расшифрует  roll  Да и другие слова не легче... Но мне понравился процесс smile

Re: А как насчёт поставить CuneiForm и распознать текст самому?

Такие страшные слова программа сразу помечает как сомнительные, и тогда сверить с оригиналом уже не сложно.

Re: А как насчёт поставить CuneiForm и распознать текст самому?

Татьяна, я тоже не знаю про что, но это просто песня  big_smile
"Корневище удлиненное, симподильно ветвящееся, гипогеогенное, с многочисленными кладогенными корнями. Монокарпические побеги дициклические"

Re: А как насчёт поставить CuneiForm и распознать текст самому?

Для меня звучит также как стих "Бармаглот"

Варкалось. Хливкие шорьки
Пырялись по наве,
И хрюкотали зелюки,
Как мюмзики в мове.

Re: А как насчёт поставить CuneiForm и распознать текст самому?

Думаю, всё не так сложно, и с помощью жестов и матов это тоже можно объяснить  big_smile

Re: А как насчёт поставить CuneiForm и распознать текст самому?

Даже в таком серьёзном деле найдётся над чем пошутить и посмеяться  big_smile Два лайка от меня smile  smile

Re: А как насчёт поставить CuneiForm и распознать текст самому?

Мне посоветовали попробовать ABBYY FineReader. Попробовал. Действительно, плохое качество он "видит"лучше чем CuneiForm.

Re: А как насчёт поставить CuneiForm и распознать текст самому?

Распознавание текстов в Ubuntu