Облачный сервис SpeechKit Cloud от "Яндекса" сможет распознавать речь

Чем отличается новый сервис

О запуске нового облачного сервиса SpeechKit Cloud объявлено компанией «Яндекс». С его помощью разработчики будут иметь возможность добавлять в различные программы, сервисы и устройства функцию распознавания речи.

Предполагается, что данный сервис может быть полезен, например, для различных десктопов и ноутбуков. Речь идет про голосовой ввод и голосовые интерфейсы, которые применяются в приложениях и играх. Полезен он будет и для современных авто. Подразумевается при этом голосовое управление автомобилем в целом, а также навигационными и мультимедийными системами. А в телефонии речь про интерактивное голосовое меню, а также автоматизацию телемаркетинга и информирования.

Известно, что новый облачный сервис «Яндекса» уже использует компания Oktell, которая разрабатывает и продает программное обеспечение для колл-центров. И Cubic Robotics, которая разработала домашнего робота Cubic, тоже не осталась в стороне. Этот робот воспринимает вопросы, которые ему задают голосом. А вот система Oktell теперь способна распознать речь клиента, звонящего в колл-центр. И даже соединяет его с конкретным специалистом, который нужен.

Чем отличается новый сервис

Сообщается, что сервис SpeechKit Cloud в данный момент уже понимает русский и турецкий языки. Голосовые запросы на этих языках проходят обработку на серверах «Яндекса». Распознавание выполняется в реальном времени при одновременной передаче звуковых данных. На все это уходит менее секунды. Именно столько времени необходимо с момента, когда отправляются данные на сервер, до получения ответа.

Доступ к сервису SpeechKit Cloud организовали с использованием HTTP API. Этот способ самый простой. Для интегрирования новой технологии «Яндекса» нужно прочитать две страницы страниц документации, а потом написать пару строчек кода в своем продукте.

Разработчики вправе в течение месяца использовать сервис SpeechKit Cloud бесплатно. Как только пробный период закончится, стоимость будет определяться количеством запросов. Конкретные тарифы на сегодня пока никому не известны.

В основе нового сервиса заложена технология распознавания речи Yandex SpeechKit. «Яндекс» запустил ее в прошлом году. Базой технологии служат акустические и языковые модели, которые построили с применением нейронных сетей. Сегодня Yandex SpeechKit применяют уже в 400 мобильных приложениях для Android, iOS и Windows Phone. Он каждый день ведет обработку миллионов голосовых запросов.

Предназначение SpeechKit Mobile SDK в том, чтобы добавлять функции распознавания в различные приложения для iOS, Android и Windows Phone. А вот SpeechKit Cloud — новый сервис. Он дает разрешение интегрироваться практически в любую систему. Оба проекта – полностью разработка российской компании.

Статьи

Новости