ИИ от Google поможет сделать их голосовой ассистент лучшим на рынке

ИИ от Google поможет сделать их голосовой ассистент лучшим на рынке

На сегодняшний день голосовые ассистенты довольно неплохо распознают речь. Но есть одна проблема: как правило, помощники работают хорошо до тех пор, пока они слышат более или менее «правильную» речь. Стоит с ними заговорить с акцентом или же просто невнятно, и от «ума» ассистента не останется и следа. Однако же исследователи лаборатории Google AI, работающие совместно с учеными из Института по изучению бокового амиотрофического склероза (болезни, от которой страдал известный физик Стивен Хокиг), разработали ИИ-систему, которая может распознавать произношение людей с нарушениями речи или акцентом.

Зачем улучшать голосовых ассистентов?

Исследователи из Google говорят, что их подход поможет улучшить автоматическое распознавание речи, да и в целом их технологию можно без труда интегрировать в практически любую существующую систему по распознаванию голоса. Люди с боковым амиотрофическим склерозом часто имеют невнятную речь, но существующие системы ИИ обычно обучаются на голосовых данных от тех, кто говорит без каких-либо затруднений. Новый подход позволит значительно улучшить работу подобных алгоритмов. При этом голосовые ассистенты смогут куда лучше распознавать в принципе любую невнятную речь.

Сама система носит название Project Euphonia и для того, чтобы ее обучить, эксперты использовали более 36 часов голосовых аудиозаписей, полученных от 67 человек, страдающих боковым амиотрофическим склерозом. В результате после обучения, Project Euphonia сумел гораздо эффективнее распознавать речь. Если говорить о невнятной речи, то процент узнавания вырос на 62%, а вот в случае с акцентом данные куда скромнее — алгоритм справился «всего» на 35% лучше стандартных программ для распознавания голоса.

Это интересно: Как запретить голосовым ассистентам подслушивать вас.

Стоит заметить, что все тестирование проходило на английском языке, но алгоритм, по словам создателей, легко можно интегрировать и в другие голосовые пакеты. К тому же, сейчас Project Euphonia находится лишь на начальном этапе разработки и нельзя исключать улучшения показателей в будущем. О новейших разработках в этой сфере мы обязательно сообщим вам в нашем новостном Телеграм-канале. Так что рекомендуем подписаться.

Более того, Project Euphonia, наряду с другими похожими проектами Google, нацелен на то, чтобы в ближайшее время сделать Google Ассистент доступным для людей с ограниченными возможностями, поэтому сильно «затягивать» с разработкой поисковый гигант не намерен. Среди других интересных особенностей, которые может получить в будущем голосовой ассистент от Google, числятся Live Relay, функция, которая облегчает телефонные звонки для слабослышащих людей, а также Project Diva, нацеленный на введение функций для невербального общения.

__

[ оригинал ]

bishop