Автор Тема: «Яндекс» представил технологию синтеза речи и голосового ввода  (Прочитано 1263 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Сергей Горбачевский

  • Administrator
  • Знаменитый писатель
  • *****
  • Сообщений: 82300
  • Пол: Мужской
  • Есть вопросы? Пишите в личку
    • Награды
30 октября на конференции для разработчиков Yet Another Conference «Яндекс» представил технологии синтеза речи, выделения смысловых объектов и голосовой активации. Для тестирования компания опубликовала в магазине «Яндекс.Store» приложение «Яндекс.Диктовка».

Технологии Yandex SpeechKit охватывают основные возможные сценарии речевого взаимодействия человека с устройством: голосовую активацию, распознавание речи произвольной тематики и её перевод в текст, синтез речи, то есть озвучивание текста с возможностью выбора интонации, а также голосовое управление с выделением смысловых объектов.

Технологии для разработчиков

В качестве примера применения технологий синтеза речи «Яндекс» приводит банковскую сферу, когда клиенту нужно озвучить состояние счёта в автоматическом режиме, или в робототехнике для озвучивания ответа. Cинтез речи также будет использоваться для мобильных приложений: голосовой ввод полезен в ситуациях, когда заняты руки или нет возможности читать текст с экрана.

«Яндекс» отмечает, что технология понимания естественного языка позволяет выделить в распознанном тексте объекты, например, дату, время, фамилию или адрес.

С помощью технологии голосовой активации любое приложение может создать собственную голосовую команду активации голосового взаимодействия.

«Яндекс.Диктовка»

Для демонстрации речевых технологий в магазине «Яндекс.Store» доступно приложение « Яндекс.Диктовка». Для активации голосового ввода, например, следует воспользоваться командой «Яндекс, записывай». Затем нужно продиктовать произвольную речь, которую программа переведёт в текст, а в некоторых случаях расставит знаки препинания.

Технология выделения смысловых объектов позволяет отредактировать текст с помощью голосовых команд. Например, допускаются команды «добавь веселый смайлик», «удали последнее слово», «замени слово осень на весна», «начни с новой строки».

Технология cинтеза речи прочитает запись с помощью команды «Прочитай все». Надиктованный в демонстрационном приложении текст можно скопировать в буфер и поделиться в сторонней программе с помощью голосовых команд. Все тексты автоматически сохраняются в заметки, которые доступны для загрузки на «Яндекс.Диск».

Все речевые технологии «Яндекса» доступны в библиотеках Yandex SpeechKit Mobile SDK (для мобильных разработчиков на iOS, Android и Windows Phone) и Yandex SpeechKit Cloud (API для других систем и устройств).

Напомню, что Яндекс собирается зарабатывать на этих технологиях и доступ к API платный.


 

«Яндекс» делает попытку монетизировать карты

Автор Сергей Горбачевский

Ответов: 0
Просмотров: 1156
Последний ответ 14, Августа 2014, Четверг, 09:43:38 am
от Сергей Горбачевский
«Яндекс» запустил облачную платформу распознавания речи

Автор Сергей Горбачевский

Ответов: 0
Просмотров: 1277
Последний ответ 04, Августа 2014, Понедельник, 10:34:14 am
от Сергей Горбачевский