Есть ли у вас цифровая камера? А телефон с камерой? Думаю, что подавляющее большинство читателей ответит положительно хотя бы на один из этих вопросов. Что ж, продолжим наши исследования: снимали ли вы когда-нибудь документы, тексты, расписания и т.д? Вот на этот вопрос я не могу предугадать ответ. Поэтому отвечу сам: да, снимал. Снимал расписание поездов, потому что лень, да и не чем переписывать, фотографировал ровно по тем же причинам ценники и объявления, да мало ли что!
Обычно, затем упираешься в простую проблему -- ну тяжело работать с текстом, когда он заточен в оковы графического файла! Да, дома на компьютере установлен FineReader, да в конце концов, дома любимая "гнутая" клавиатура, на которой можно быстро и с комфортом набрать любой текст. Но вот "здесь и сейчас"... обычно в момент съемки под рукой компьютера нет, а есть лишь телефон/камера/кпк.
Именно для таких случаев и придумали . Идея проста -- снимаете, отправляете полученный снимок по e-mail, а в ответ получаете pdf с текстом. Честно говоря, никак не могу понять, почему именно pdf: какой-нибудь html, на мой взгляд, был бы гораздо удобнее и универсальнее. Кроме того, результат можно получить и в виде факса.
Идея проста и изящна до гениальности или идиотизма, тут уж вам судить. Более того, красота идеи подчеркивается тем, что сам не занимался разработками по распознанию текста -- в основе сервиса лежит... правильно, конечно же, разработки , создателя неподражаемого FineReader.
На самом деле, использование наработок давало надежду, что сервис действительно будет хорошо работать. Но хватит отвлеченных рассуждений, перейдем к делу.
В качестве камеры для первого теста был взят Loox 720 с его камерой 1,3 мегапикселя. Вполне средняя характеристика для современных камерофонов и КПК. Тексты брались русские -- то, что этот сервис сносно работает с английским было понятно по имеющимся отзывам и обзорам. Что ж, снимаем... Первая попытка окончилась полным провалом. Вместо pdf я получил письмо следующего содержания:
scanR: the document wasn't in focus. Try again, about 12" from the document, in a well-lit area. Hold your phone with two hands.
--scanR
Что ж, пробуем еще. На этот раз даже приходит долгожданный pdf. Вот только качество...
Понятно, что о том, чтобы прочитать основной текст, и речи не шло... Ладно, на компьютере нашелся снимок объявления, снятого летом в Гагре при помощи моей Konica Minolta Dimage Z20 (5 мегапикселей).
В этот раз результат "сканирования" выглядел гораздо более привлекательно:
Ура! Текст прекрасно читался!Однако, и тут счастье оказалось недолгим. Я попытался выделить текст на странице и скопировать его в обычный текстовый файл. Результат оказался плачевным:
На самом деле, у меня есть практически уверенность, что сервис-то отработал на отлично, просто словари для распознания русского языка не подключены.
Что я могу сказать в заключении? Мне очень понравилась идея. Идея действительно проста и изящна. Да и реализация, как мне кажется, достаточно проста. Поэтому, дорогие российские компании, у меня к вам просьба -- сделайте такой же!