11 лет назад

Компьютер научился узнавать людей лучше самого человека

Компьютер научился узнавать людей лучше самого человека Фото 0

Ни у кого из специалистов нет сомнений в том, что человек лучше опознает лица, чем компьютер. Однако постепенно компьютеры наверстывают упущенное. И потому интересно будет узнать о том, что при идеальном освещении, при одинаковом положении в кадре и при одинаковом выражении лиц точность компьютерных алгоритмов уже давно стала такой, что она превосходит человеческую. 
 
Однако существующий мир на практике далек от совершенства. Он, увы, не идеален. Люди ходят в кепках, носят очки, кривляются, склонны менять прически и наносить макияж, не всегда любят позировать перед объективом. По этой причине разработчики продолжают решать проблему, как программе распознавать лица на подобных фотографиях «из жизни» с такой точностью, как демонстрирует человек.
 
О таких попытках пишут в своей статье двое ученых из Китая. Ее выложили на допечатном сервере arXiv. В эксперименте, который здесь описывается, компьютер впервые победил среднего человека по точности идентификации совпадений во внешности. Состязание проходило на парах снимков из эталонного массива фотографий LFW (Labeled Faces in the Wild). 
 
Тестовой основой для проверки новых алгоритмов в этой сфере по традиции стандартно служит именно база снимков Labelled Faces in the Wild. Она хранит 13 тысяч фото примерно шести тысяч известных людей, которые собрали в мировой паутине. 
 
Производя сравнение выбранных здесь произвольных пар фотографий, человек быстро находит соответствия или несоответствия, чтобы потом дать правильный ответ. В среднем это происходит в 97,53% случаев. Программам такой результат ранее был не по силам. Теперь ситуация изменилась.
 

Как работает новый алгоритм 

 
Ученые университета Гонконга доказали, что их программа впервые превзошла приведенный выше показатель. По мнению авторов, достижение стало возможным, прежде всего, за счет методики обучения программы, а не за счет усовершенствованного алгоритма. 
 
Алгоритм GaussianFace нормализует все лица на фотографиях, предварительно преобразовав их во фронтальное изображение 150х120 пикселей, по пяти базовым опорным точкам. Это расположение обоих глаз, носа и уголков рта. Потом изображение разделяют на несколько перекрывающихся фрагментов по 25х25 пикселей. Их затем сравнивают отдельно. 
 
Однако мы лучше узнаем те лица, которые чаще видим. Наверное, когда наблюдаешь за одним и тем же лицом под разными углами, то в голове накапливается дополнительная информация о нем. Чтобы точно определять идентичность людей на двух разных фото, компьютеру нужно учиться с использованием более обширного массива данных.
 
Программа GaussianFace поэтому тренируется на большом количестве картинок из четырех прочих популярных баз данных. Например, это Multi-PIE и Life Photos. В итоге она проходит тесты Labelled Faces in the Wild теперь с показателем 98,52%. Иными словами, она впервые обогнала человека, поскольку средний «человеческий» результат — 97,53%.