Технология распознавания голоса появилась задолго до официального релиза голосового ассистента Siri в 2011 году. Этот путь был долгий и тернистый, но это дало свои плоды и теперь каждый имеет возможность использовать виртуального помощника в смартфоне, который понимает ваш голос:
- В 1779 году появился первый синтезатор речи Христиана Кратценштайна. Приспособление выдавало звуки, отдаленно похожие на звуки человеческой речи;
- 1937–1938 года ознаменовались появлением Voder (от Voice Operating Demonstrator) и Vocoder (от Voice и Encoder). Первый прибор синтезировал человеческую речь, имитируя эффекты человеческого вокального тракта, а второй распознавал звуки и преобразовывал их в электромагнитный сигнал;
- На Всемирной выставке в Сиэтле в 1962 году IBM представила инструмент под названием Shoebox. Он был размером с обувную коробку и мог выполнять математические функции и распознавать 16 произнесенных слов, а также цифры 0-9, а также выполнять математические функции.
- В 1970-х годах ученые из Университета Карнеги-Меллона в Питтсбурге, штат Пенсильвания, при существенной поддержке Министерства обороны США и его Агентства оборонных перспективных исследований (DARPA) создали Harpy. Он мог бы распознать 1011 слов, Что сопоставимо со словарным запасом трехлетнего ребенка.
- После того, как технологии научились распознавать последовательности слов, начали появляться первые самостоятельные приложения в разнообразных областях. Кукла Джули от компании «The Worlds of Wonder» вышла в 1987 году и могла распознавать голос ребенка и отвечать на него.
- В течение 1990-х годов такие компании, как IBM, Apple и другие, создавали элементы, которые использовали распознавание голоса. Apple начала создавать функции распознавания речи на своих компьютерах Macintosh с PlainTalk в 1993 году.
- В апреле 1997, компания Dragon выпустил Dragon NaturallySpeaking — первую программу голосового набора текста. Программа могла распознать около 100 слов в минуту и превратить его в текст.
- Настоящий прорыв произошел в 2010-х. Этот период ознаменовался появлением голосовых ассистентов: Siri, Google Now, Cortana, Alexa и другие.
- в России также вышло сразу несколько голосовых помощников. Сначала появилась отечественная разработка Дуся, а в 2017 году Алиса от Яндекса. На данный момент в разработке еще несколько ассистентов: Варвара от «Центра речевых технологий» и Маруся от Mail.ru Groupp.
Что дальше?
Кроме очевидных уже сегодня направлений: умный дом, личные ассистенты, в ближайшее время стоит ожидать настоящего прорыва в голосых технологиях:
- управление автомобилем: включение/отключение автопилота, мультимедиа, диагностика оборудования машины, навигатора, подсказки о заправках, магазинах, автосервисах;
- появление умных медицинских и узкоспециализированных устройств: диагностирующие устройства, оборудование, помогающее неходячим людям после операции и инвалидам, приспособления для слепых и т.д.
- распознающих голосовые команды, военные разработки: активация средств разведки, поиск раненых на поле боя и т.д.;
- образование и наука: активация мультимедиа во время презентации, начитывание узкоспециализированной периодики, выполнение повторяющихся сценариев, например, демонстраций экспериментов по голосовой команде;
- спорт и здоровье: виртуальные тренеры, понимающие ваш голос, персональные программы-диетологи, которые будут давать советы по питанию и режиму дня и др.
Подготовлено на основе материалов:
https://www.smartsheet.com/voice-assistants-artificial-intelligence
Voice Assistant Timeline: A Short History of the Voice Revolution
https://en.wikipedia.org/wiki/IBM_Shoebox
https://trashbox.ru/topics/117807/golos-buduschego-kak-poyavilis-golosovye-assistenty
https://en.wikipedia.org/wiki/Voder