Пользователи «Яндекс.Диска» смогут распознавать текст на картинках

На чем основана новая функция

Компанией «Яндекс» объявлено о том, что она запускает сервис, позволяющий пользователям «Яндекс.Диска» распознавать текст на загруженных изображениях. Обо всем этом можно прочитать в блоге «Яндекса».

Используя эту функцию, пользователь теперь сможет без проблем найти необходимые ему изображения форматов JPEG, GIF и PNG, которые содержат текст поискового запроса.

В тех случаях, если на диске несколько тысяч фотографий, которые разложены по папкам, можно будет найти нужную из них, используя поиск по текстам. Скажем, скан какого-то контракта или фото визитки делового партнера, если есть необходимость выйти с ним на связь.

Можно вести таким образом поиск не только документов, но и фотографий, изготовленных с целью сохранить текст. Это может быть как объявление для жителей подъезда, так и рекламная картинка для специального щита на улице.

На чем основана новая функция

В основе поиска текстов на изображениях заложена технология оптического распознавания символов. Она может распознать текст на картинках, которые отличаются своим видом, содержанием и качеством.

В системе есть классификатор картинок и модуль распознавания. Классификатор делает анализ всех изображений. Проводит отбор тех, на которых есть текст. После отбора изображений с текстом алгоритм отыскивает на них линии, которые предположительно изображают текст. Потом идет отбор только тех линий текста, в которых алгоритм уверен.

На очередном этапе модулем распознавания делается разбивка линии текста на отдельные символы. Для каждого символа производится выбор нескольких вариантов распознавания. Тех, которые в данном случае наиболее вероятны. Потом задействуется языковая модель - алгоритм выбирает наиболее подходящий символ-кандидат.

Языковая модель сделана с упором на словари и с учетом сходства символов с теми, что известны системе. Когда из вероятных символов получается слово, которое система знает, то она принимает решение, что на изображении именно оно. Причем, даже тогда, когда отдельные символы-кандидаты в этом слове менее вероятны.

Точность распознавания текста определяется типом изображения, а также его четкостью, фоном, где расположен текст, прочих факторов. Скажем, для документов, которые отсканированы, точность распознавания текста на русском языке – 80%, для фото с текстом – 63,2%. А для скриншотов она близка к 100%.

Система уже распознает английский, украинский и турецкий языки, а не только русский. Точность распознавания текстов всего потока изображений превышает 70%.

Аноним 2 года назад

Аноним 3 года назад

Статьи

Новости