Microsoft представила технологию, которая позволяет в реальном времени распознавать речь, переводить ее на другой язык и воспроизводить ее на новом языке с сохранением особенностей голоса говорящего. С ее помощью компания планирует сделать свой сервис интернет-телефонии, чата и видеозвонков Skype полезным для людей, не знающих языков друг друга.
В ходе демонстрационного видеозвонка речь главы направления Skype и Lync в Microsoft Гурдипа Сингха Пала переводилась на немецкий. Одновременно на экране отображался текст перевода. Обратный перевод также осуществлялся без проблем. Широкое бета-тестирование услуги в Skype планируют начать позднее в этом году.
Функция была разработана совместно инженерами Skype, Bing и лаборатории Microsoft Research. Специалисты лаборатории давно работают над технологиями анализа языка и машинного обучения. Распознавание речи в переводчике Skype осуществляет та же технология, которая обеспечивает голосовой ввод в Windows 8.1 и на которой работает «голосовой ассистент» Windows Phone, Cortana.
Отмечается, что новая разработка не нуждается в периоде финальной подстройки под речь конкретного пользователя. Распознавание речи такого типа более полезно, чем «тренирующееся», так как может быть использовано для работы с голосами, отсутствующими в базе данных.
Технология уже в ближайшем будущем начнет использоваться в популярном сервисе видеосвязи Skype. В будущем эта разработка будет использоваться во множестве других продуктов Microsoft и станет доступной для пользователей альтернативных мобильных платформ через App Store и Google Play.