«Мысли вслух» — как новый нейропротез вернул голос спустя 18 лет молчания

Врач-нарколог

SAYONARA 1 ПРОИЗВОДИТЕЛЬ❤️ https://say24.info/ ❤️9 ВАКАНСИЙ
Support
Сообщения
1.317
Реакции
1.014
47-летняя женщина, потерявшая речь из-за инсульта почти два десятилетия назад, стала первым человеком, чьи мысли превращаются в живую речь почти без задержки. Команда UCSF и UC Berkeley вшила ей массив из 253 электродов над зоной моторного контроля речи и обучила нейросеть на 23 000 «тихих» попытках произнести предложения. Уже через несколько недель пациентка услышала в наушниках собственный доврачебный тембр — и буквально «заговорила».


Что здесь прорывного
  • Скорость. Система обновляет декодирование каждые 80 мс и успевает вывести звук менее чем за четверть секунды — время меньше, чем мы моргаем. Для упрощённого словаря в 50 слов она выдаёт ~91 слово/мин, а для полного (1000+ слов) — 47–48 слов/мин, то есть в 3–6 раз быстрее прошлых имплантов.
  • Естественность. Алгоритм «накладывает» предзаписанный голос пациентки на синтез, поэтому собеседники слышат её родный тембр, а не роботизированный голос.
  • Надёжность. Точность распознавания превышает 99 %; система свободно строит новые фразы, которых не было в обучающем наборе, и может работать бесконечно долго, пока человек «говорит» про себя.
  • Универсальность. Те же архитектуры показали работоспособность на других типах интерфейсов — от проникающих микроэлектродов до накожной электромиографии лица, что открывает путь как к имплантам, так и к полностью неинвазивным гарнитурам.

Как это работает шаг за шагом
  1. Считываем импульсы. Электроды ловят микровсплески нейронов в моторной коре, где мозг планирует движение языка и губ.
  2. Пакуем в поток. Каждые 80 мс данные уходят на графический ускоритель ноутбука, где их ждёт каскад из сверточной и рекуррентной сетей.
  3. Декодируем артикуляцию. Модель сначала предсказывает, какие мышцы должны напрячься, а затем собирает фонемы и слоги. Такой подход оказался устойчивее к шуму, чем прямой «мысль → слово».
  4. Озвучиваем. Финальный модуль синтеза подтягивает записанный до инсульта голос и — в реальном времени — возвращает его в динамики.

Почему это важно уже сегодня
  • Диалог без «лагов». Паузы в 200 мс субъективно не ощущаются — речь звучит плавно, собеседник не перебивает.
  • Свобода эмоций. Исследователи уже обучают дополнительную сеть, которая ловит высоту тона и громкость, чтобы передавать смех, вопросительную интонацию или шёпот.
  • Шанс на бытовую версию. При текущей миниатюризации электроники чип можно будет упрятать в титановую пластину черепа и подключать к смартфону по Bluetooth — ориентир 5–7 лет до продукта.
  • Этический «замок». Декодируется только то, что человек сознательно пытается произнести; непроизвольные мысли не уходят в эфир.

Что дальше

Клиническая команда уже набирает новые группы пациентов с БАС и тяжёлыми формами ДЦП. Параллельно инженеры пытаются:
  • довести скорость до разговорных 120–150 слов/мин;
  • научить систему переключаться между несколькими языками;
  • добавить сенсорный канал (например, отслеживать жестикуляцию лица для эмоций).
Если испытания подтвердят стабильность и безопасность, то мы впервые получим устройство, которое возвращает не печатную, а живую речь тем, кто её утратил.
 
Назад
Сверху Снизу