Будущее начинается сегодня: как голосовые фичи могут помочь вашим мобильным приложениям добиться головокружительного успеха | Umbrella IT

Будущее начинается сегодня: как голосовые фичи могут помочь вашим мобильным приложениям добиться головокружительного успеха

 

В фильмах из серии научной фантастики, люди нередко взаимодействуют с разного рода говорящими девайсами. Технический прогресс стремительно развивается, особенно это касается смартфонов, ведь они всегда под рукой, более того –  реальность зачастую оказывается гораздо удивительнее, чем художественный вымысел.

В нашей новой статье мы расскажем вам о преимуществах и перспективах голосовых фич, приведём примеры индустрий, в которых они могут быть эффективно использованы, а также ответим на вопрос: сможет ли Voice полностью заменить Touch?

 

Эволюционирующая Мобильность

voice activated app development

Эта статистика показывает частоту, с которой владельцы смартфонов использовали технологию Voice в США в 2017 году.

Согласно статистике, 49% владельцев смартфонов в США используют технологию голоса не реже одного раза в неделю.

Телефон давно перестал быть просто устройством для звонка и отправления смс, в настоящее время это удобный инструмент для ведения бизнеса, пренебрегать которым просто неразумно. С каждым годом мобильные девайсы становятся более мощными и функциональными.

9 января 2007 года произошло событие, ставшее прорывом в мобильной индустрии – компания Apple выпустила первый сенсорный iPhone. Три года спустя Google добавил возможность персонализированного распознавания речи в Voice Search на телефонах платформы Android. Внедрение голосового интерфейса открыло большие возможности для разработчиков, пользователей и, конечно же, бизнеса.

Согласно специалистам компании Skyword, к 2019 году рынок распознавания речи будет представлять собой отрасль, стоимостью в 601 млн долларов.

voice feature

Инструменты работы с голосом с каждым годом становятся всё более совершенными.

В прошлом разработчикам приходилось интегрировать собственные решения для преобразования текста в речь. Если сравнивать ситуацию с сегодняшним днём, то следует отметить, что ранее существовал ряд недостатков:

  • более существенные затраты на реализацию;
  • разработка занимала больше времени;
  • приложения получались перегруженными.

Начиная с iOS7, Apple интегрировал API, позволяющий разработчикам легко реализовать в своих iOS-приложениях речевые фичи. API text-to-speech в свою очередь значительно упростила жизнь как разработчикам, так и заказчикам. В настоящее время Apple, Google и Microsoft предлагают в своих мобильных операционных системах прямое распознавание голоса в режиме преобразования речи в текст.

 

Преимущества использования Voice в мобильном приложении

4

  • Простота

Ввод текста или любая навигация с помощью Touch требует большей когнитивной нагрузки по сравнению с использованием голосовых команд, которые помогают совмещать несколько дел сразу, тем самым экономя ваше время.

Например, вам требуется выбрать один или несколько пунктов из длинного списка, который вы не хотите читать целиком. Вместо того, чтобы вводить ключевые слова, либо долго искать необходимые пункты на экране вашего мобильного устройства, вы можете просто воспользоваться голосовой командой, избавив себя от лишних действий.

Самый ценный ресурс – это ваше время.

Голосовые команды могут помочь пользователям оперативно искать и писать электронные письма, делать заметки, назначать встречи, озвучивать полученные сообщения и многое другое. Причём всё это можно делать в движении.

  • Колоритность

Touch обеспечивает чаще всего реферальное взаимодействие с девайсом, в то время как использование фичи Voice позволяет описывать объекты более многогранно с точки зрения их функций и характеристик.

  • Удобство использования

Использование голосового интерфейса помогает избежать ошибок, связанных с модальностью, что обеспечивает более удобное взаимодействие с мобильным приложением.

  • Живые эмоции

Люди живут ощущениями, по своей природе человек больше стремится к живому общению. Если помимо классного и удобного функционала он будет слышать приятный голос, это станет только плюсом. При разработке мобильного приложения с фичей Voice вы можете добавить, например, несколько вариантов голосов (в том числе и на разных языках).

Фича Voice может развлечь и порадовать ваших пользователей.

Известный тому пример: в приложении Яндекс.Навигатор были добавлены голоса актёров, озвучивавших героев “Звёздных войн”. Поездка пройдёт весело, ведь вам может проложить маршрут Дарт Вейдер или мастер Йода.

  • Широкий горизонт

Ни для кого ни секрет, что навигация на мобильном девайсе бывает не настолько удобна как на компьютере или ноутбуке. Это связано прежде всего с тем, что само устройство физически меньше, как и его экран.

Использование голосовых фич сможет значительно расширить границы ваших возможностей работы с мобильным приложением, а небольшой экран девайса при этом не будет ограничением.

 

Почему именно Voice фичи?

voice app

Помимо прочего, улучшается и совершенствуется качество самих приложений. Если вы находитесь в шумной обстановке, то, например, функция распознавания голоса хозяина может отлично помочь в решении поставленной задачи.

 

Voice и искусственный интеллект

6

Развитие голосовых фич идёт параллельно эволюции искусственного интеллекта, в том числе и в мобильных приложениях. Прогресс стремительно движется к тому, что вскоре приложения смогут сами прогнозировать потребности пользователей, а голосовой интерфейс станет при этом одним из наиболее простых и удобных инструментом взаимодействия.

Голосовой интерфейс позволит достичь удивительных результатов!

Только представьте себе: в ближайшем будущем ваше мобильное приложение с голосовым интерфейсом сможет самостоятельно анализировать не только данные, но и контекст, а также интонацию потребителей, таким образом вы сможете улучшить продажи, предоставляя пользователям возможность получить именно то, что они ожидают.

 

Сферы применения фич Voice

  • Здравоохранение

Применение голосовых фич в приложениях, связанных со сферой здравоохранения, может принести пользу как врачам, так и пациентам. При некоторых заболеваниях ограничивается физическая активность, голосовые команды могут значительно облегчить жизнь пациентам.

Кроме того, использование голосовых фич способствует меньшей утомляемости. Следует также отметить, что развитие технологии Voice может существенно облегчить жизнь людям с ограниченными возможностями.

  • Социальные сети

Если вы хотите создать приложение для социальных сетей, либо создать собственную социальную сеть, то голосовые фичи будут более чем актуальны. Это позволит вашим пользователям общаться и взаимодействовать друг с другом практически в любых ситуациях.

  • Изучение языков

Некоторые языки сложны не просто для понимания, но и для произношения. Голосовые фичи значительно облегчают процесс обучения новым языкам. Благодаря использованию голосовых фич в вашем мобильном приложении вы можете не просто прочитать какую-либо фразу, но и прослушать, как именно она произносится.

Голосовая фича – отличный помощник в путешествиях!

Даже если у вас по каким-то причинам не получится выговорить правильно нужную фразу, вы можете запустить на своём телефоне мобильное приложение, которое озвучит собеседнику необходимую информацию. Таким образом, во время путешествий или деловых поездок, вы сможете легко находить общий язык с людьми из разных стран.

Мы привели лишь часть сфер, в которых на сегодняшний день успешно реализуются голосовые фичи при разработке мобильных приложений, на самом деле их гораздо больше. У вас есть идеи? Обратитесь к команде высококвалифицированных специалистов.

 

Интеграция речи в мобильное приложение

Разработка голосовых фич базируется на двух составляющих:

  • Речевой синтезатор – Text to Speech (TTS)

Примеры использования: чтение текста по запросу пользователя и нотификация.

  • Технология распознавания речи

Примеры использования: голосовые команды приложению и надиктовывание сообщения.

На первый взгляд, задача кажется предельно простой – распознать фонетические звуки, идущие в определённой последовательности, но на практике всё гораздо сложнее.

Это связано с различного рода лингвистическими и вокализационными тонкостями, люди принимают их как должное при интерпретации письменного текста. Кроме того, в живой речи иногда бывают такие нюансы как акцент, заикание, чихание и т.д. На самом деле, задача требует детального изучения методов обработки естественного языка и цифровой обработки сигналов.

Чтобы разработать достойный речевой алгоритм с нуля, вам потребуются десятки тысяч часов программирования, поэтому более целесообразно использовать один из нескольких уже существующих инструментов. В настоящее время на рынке есть ряд технологий для приложений с поддержкой речи.

Прежде чем выбрать ваш речевой SDK, мы рекомендуем вам определиться с моделью разработки:

  • Облачная (Cloud)

В данном случае автоматическое распознавание речи (ASR) или преобразование текста в речь (TTS) происходит в облаке.

Это даёт существенное преимущество с точки зрения скорости и точности и является одним из наиболее часто используемых режимов.

С одной стороны, приложение постоянно будет требовать подключения к Интернету. С другой, ваше мобильное приложение при этом будет занимать значительно меньше места.

  • Встроенная (Embedded)

При встроенном распознавании мобильной речи или TTS, весь процесс происходит на мобильном устройстве локально.

При полностью встроенной голосовой функции, мобильное приложение может работать в автономном режиме, но в то же время становится более тяжеловесным.

Движки TTS используют, например, базу данных предварительно записанного голосового аудио, где есть клип для каждого возможного слога.

Использование мобильного приложения в автономном режиме включает в себя все эти клипы внутри вашего приложения.

Разработчики в IVONA Software, например, могут загружать голосовые данные для американского английского (Kendra) или британского английского (Amy) – объём данных при этом составляет приблизительно 150 МБ.

Одним из преимуществом таких систем является то, что на них не влияет латентность, связанная с передачей и получением информации с сервера.

 

Популярные речевые библиотеки

  • Nuance

Nuance является, пожалуй, самым популярным поставщиком речевых библиотек для мобильных приложений. Одним из самых известных приложений для преобразования речи на сегодняшний день является Dragon Anywhere. Приложению требуется беспроводное соединение, чтобы распознать вашу речь, сверив её образец в Интернете, после чего Dragon Anywhere отображает ваш текст с расшифровкой в главном окне.

  • OpenEars

OpenEars представляет собой автономную text-to-speech и speech-to-text библиотеку Opensource; поддерживает испанский и английский языки. Как и другие автономные библиотеки, OpenEars может значительно увеличить размер вашего мобильного приложения (более 200 МБ).

Тем не менее, разработчики могут уменьшить размер приложения, избавившись от неиспользуемых голосов или функций фреймворка. Таким образом, размер приложения может варьироваться в зависимости от количества доступных голосов.

Среди прочих SDK отметим Acapela, iSpeech, Ivona и Vocalkit – доступны онлайн, платные.

Какая из библиотек лучше всего подходит для вашего мобильного приложения – решать только вам. Всё зависит от целей и бюджета. Если у вас нет времени, чтобы разобраться в этом вопросе самостоятельно, то мы рекомендуем обратиться к квалифицированным специалистам.

 

Примеры успешной реализации Voice в мобильных приложениях

  • Kindle

Приложение Kindle было разработано компанией IVONA Software, которая была впоследствии куплена Amazon. В Kindle есть много удобных фич, среди которых: возможность конвертирования текста в речь, а также озвученный перевод. Приложение отлично подойдёт для людей, живущих насыщенной жизнью, любящих совмещать несколько дел сразу.

В настоящее время Kindle поддерживает следующие языки: английский, голландский, французский, немецкий, итальянский, японский, португальский, упрощённый китайский и испанский.

  • Google Voice Search

С 2011 года компания Google внедрила функцию распознавания речи не только на стационарные компьютеры, но и на мобильные устройства, функция голосового управления также поддерживается на телефонах с операционной системой Android.

Буквально за пару лет Google смог значительно усовершенствовать свой продукт, со временем появилась возможность распознавания не просто коротких фраз (из 35-40 слов), но и продолжительной непрерывной речи. Google Voice Search применяется в частности в Переводчике Google, который продолжает эволюционировать благодаря использованию технологии нейронных сетей.

 

Прогнозы развития фич Voice

voice search

К 2020 году от 30 до 50% всех запросов будет осуществляться посредством голосовых команд

 

Сможет ли Voice полностью заменить Touch?

В древние времена люди передавали задокументированные знания и информацию посредством рисуночного письма, позже пришла клинопись, письмо пером, ручки и карандаши.

В настоящее время мы чаще печатаем, чем пишем, ещё чаще используем Touch, есть тенденция к тому, что в ближайшем будущем люди будут просто использовать голосовой интерфейс.

Несмотря на все достоинства использования фичи Voice, не стоит быть слишком категоричным и полностью отказываться от Touch, ведь иногда проще и удобнее сделать что-то вручную.

Touch может быть более оптимальным в следующих ситуациях:

  • фото в одно касание;
  • сортировка почты;
  • быстрый ответ на сообщение (допустим, если человек на встрече и не может дать голосовую команду для приложения);
  • написание объёмных документов. Здесь нужна точность, человек быстрее редактирует глазом;
  • визуальное ориентирование на странице происходит проще и быстрее;
  • заполнение форм логина и пароля (посредством голоса весьма проблематично передать все нюансы сложного пароля, состоящего из символов, цифр, прописных и заглавных букв).

В любом случае, все великие свершения требуют времени. Не перегружайте пользователей голосовыми фичами, лучше добавляйте их постепенно, анализируя насколько они популярны и просты в использовании.

Компания Umbrella советует вам подходить к вопросу создания мобильного приложения с голосовыми фичами без излишнего фанатизма. На наш взгляд, более оптимальным решением будет сделать для начала ряд голосовых фич под основные функции вашего приложения. Это итерационный процесс.

Говоря о голосовых фичах, можно провести аналогию с текстом. Если ваше мобильное приложение будет чрезмерно перегружено текстом, то у пользователей возникнет ощущение, что всё ваше приложение – это просто одна большая инструкция к самой инструкции. В большинстве случаев, использование простых аудиоклипов принесёт гораздо больший профит, чем использование движка TTS с озвучиванием огромных монологов.

Дружеское напоминание: если вам требуется использование нескольких ключевых слов, то это задача Keyword Spotting, для решения которой используются иные алгоритмы, в подобной ситуации сервис для распознавания речи не нужен.

Дело в том, что при распознавании речи будет происходить поиск всех сказанных слов, в то время как поисковик ключевых слов попытается найти несколько выбранных ключевых слов или фраз, Keyword Spotting – это более простой и менее ресурсоёмкий процесс.

Использование фич Voice сможет сделать ваши мобильные приложения более современными и функциональными, в то же время нет необходимости полностью отказываться от использования Touch, более оптимальным решением будет совмещение в приложениях обеих технологий.

Многие люди всё ещё пользуются блокнотами или записными книжками, при желании могут от руки подписать открытку для друга. Обилие альтернативных инструментов позволяет сделать жизнь ярче и многограннее, в этом есть своя красота и разнообразие.

Touch не станет анахронизмом Voice.

Мы считаем, что Voice – это перспективная альтернатива для технологии Touch, использование которой в ближайшем будущем станет ситуационным. Предоставьте пользователям свободу выбора: использовать либо Voice, либо Touch в зависимости от требуемых задач. Пользовательский опыт очень помогает улучшать голосовые фичи, совершенству нет предела!

По мнению многих экспертов, в ближайшем будущем в SERP ожидается значительный прирост результатов поиска, осуществляемого как посредством Voice, так и при вводе текста.

 

Подводя итоги, отметим основные достоинствах Voice:

  • экономия времени и совмещение нескольких дел сразу;
  • распознавание голоса;
  • конвертирование голоса в текст;
  • живые эмоции;
  • разнообразие голосов, в том числе и на разных языках.

 

хотите свое мобильное приложение с голосовой фичей? напишите нам!

 

В качестве небольшого бонуса, предлагаем вам несколько советов по сео-оптимизации вашего приложения с фичей голосового поиска:

  • соберите статистику по наиболее частым голосовым запросам в вашей нише;
  • включите в ваше мобильное приложение основные вопросы и ответы на них;
  • продумайте структуру вашего мобильного приложения, чтобы пользователи смогли получить быстрые решения при работе с приложением, посредством голосовой фичи;
  • продумайте контент вашего приложения, структуру его ответов на голосовые команды.

Голосовые фичи – это дополнительные возможности для брендинга.

 

 

Фото: Shutterstock.com


Ещё

  • Umbrella IT вошла в Топ веб и мобильных разработчиков
    Umbrella IT вошла в Топ веб и мобильных разработчиков
    Скейтбордисты и банджи-джамперы любят риск. Будоражащее кровь чувство опасности – именно то, что заставляет их сердца биться быстрее. Но когда дело касается представления своего бизнеса в интернете – зачем рисковать? Umbrella IT – надежный партнер. Мы были первым официальным партнером Symfony в России. Наш опыт и экспертизу давно ценят наши клиенты, а теперь – и …
  • Создаем приложение с механикой Uber: руководство по разработке проекта на миллион долларов
    Создаем приложение с механикой Uber: руководство по разработке проекта на миллион долларов
    Uber стал первым, кто применил бизнес-модель совместного потребления и экономику по требованию и взял на абордаж целый мир. Дестабилизация традиционного рынка такси не мешает Uber позиционировать себя, прежде всего, как технологическую, а не транспортную компанию. И это вполне оправданно – образцовый сервис и эффективные технические решения – именно то, что привело компанию к оглушительному успеху. …
  • Как увеличить вовлеченность в мобильных приложениях: 6 полезных советов
    Как увеличить вовлеченность в мобильных приложениях: 6 полезных советов
    Что заставит пользователей возвращаться в ваше приложение снова и снова? Как запустить работу приложения на полную мощность и сделать его незаменимым для всех и каждого? Десяток, а может и два десятка установленных на смартфон приложений, но пользуетесь в реальности всего несколькими из них? Совсем не хочется, чтобы ваше приложение попало в список “однажды открою, вдруг …