10 лет назад
Компанией «Яндекс» объявлено о том, что она запускает сервис, позволяющий пользователям «Яндекс.Диска» распознавать текст на загруженных изображениях. Обо всем этом можно прочитать в блоге «Яндекса».
Используя эту функцию, пользователь теперь сможет без проблем найти необходимые ему изображения форматов JPEG, GIF и PNG, которые содержат текст поискового запроса.
В тех случаях, если на диске несколько тысяч фотографий, которые разложены по папкам, можно будет найти нужную из них, используя поиск по текстам. Скажем, скан какого-то контракта или фото визитки делового партнера, если есть необходимость выйти с ним на связь.
Можно вести таким образом поиск не только документов, но и фотографий, изготовленных с целью сохранить текст. Это может быть как объявление для жителей подъезда, так и рекламная картинка для специального щита на улице.
На чем основана новая функция
В основе поиска текстов на изображениях заложена технология оптического распознавания символов. Она может распознать текст на картинках, которые отличаются своим видом, содержанием и качеством.
В системе есть классификатор картинок и модуль распознавания. Классификатор делает анализ всех изображений. Проводит отбор тех, на которых есть текст. После отбора изображений с текстом алгоритм отыскивает на них линии, которые предположительно изображают текст. Потом идет отбор только тех линий текста, в которых алгоритм уверен.
На очередном этапе модулем распознавания делается разбивка линии текста на отдельные символы. Для каждого символа производится выбор нескольких вариантов распознавания. Тех, которые в данном случае наиболее вероятны. Потом задействуется языковая модель - алгоритм выбирает наиболее подходящий символ-кандидат.
Языковая модель сделана с упором на словари и с учетом сходства символов с теми, что известны системе. Когда из вероятных символов получается слово, которое система знает, то она принимает решение, что на изображении именно оно. Причем, даже тогда, когда отдельные символы-кандидаты в этом слове менее вероятны.
Точность распознавания текста определяется типом изображения, а также его четкостью, фоном, где расположен текст, прочих факторов. Скажем, для документов, которые отсканированы, точность распознавания текста на русском языке – 80%, для фото с текстом – 63,2%. А для скриншотов она близка к 100%.
Система уже распознает английский, украинский и турецкий языки, а не только русский. Точность распознавания текстов всего потока изображений превышает 70%.
Аноним 2 года назад
|
Аноним 3 года назад
|
Статьи
Новости