Искусственный интеллект превращает сигналы мозга в человеческую речь — послушайте сами

Исследователи из Калифорнийского Университета Сан-Франциско разработали алгоритм, который расшифровывает сигналы мозга, связанные с произношением слов, и переводит их в понятную речь. Такая технология в скором будущем должна позволить немым людям свободно и внятно произносить слова.

Ожидается, что устройство будет работать, когда человек мысленно или физически будет воспроизводить движения рта, даже если он не будет выдавать никаких звуков. Чтобы понять, какие области человеческого мозга активизируются при определенных движениях рта, исследователи вовлекли в испытание пять добровольцев. Им были прочитаны небольшие отрывки из детских рассказов — в ходе этого процесса внедренные в их мозги электроды считывали их активность.

В конечном итоге у исследователей получились две нейронные сети: первая согласовывала сигналы мозга с движениями губ, а вторая превращала эти движения в синтезированную речь. Добровольцы действительно смогли повторить отрывки предложений — на записи можно легко распознать около 69% синтезированных слов. Как и в других исследованиях, чем короче были предложения, тем точнее получался результат.

Исследователи могут улучшить технологию путем использования мозговых имплантатов с более плотным расположением электродов и сложных алгоритмов машинного обучения. Между реакцией мозгов разных участников исследования были найдены общие черты, что говорит о том, что будущие устройства для синтеза речи можно будет легко настраивать под каждого человека. Также исследователи заметили, что искусственный интеллект порой распознает и не использованные при обучении звуки, что тоже вселяет большие надежды.

Примечательно, что похожие технологии уже есть, и они тоже основаны на работе искусственного интеллекта. Прочитать об одном из них можно в нашем материале.

https://www.youtube.com/watch?v=kbX9FLJ6WKw&feature=youtu.be

Источник: https://hi-news.ru/

05.06.2019