23-11-2019 16:46

Синтезируемой речи можно придать индивидуальность

Синтезируемой речи можно придать индивидуальность

Об этом заявила Рупал Патель (Rupal Patel), профессор Северо-Восточного Университета (Бостон, США). По ее словам, главная проблема устройств синтеза речи на основе текста, которыми пользуются люди с нарушением коммуникативных возможностей, – абсолютная безликость воспроизводимых словосочетаний.

В результате одинаковыми голосами снабжаются все пациенты, обреченные на немоту: и маленькая девочка, и пожилая женщина, и Стивен Хокинг. Идея Рупал Патель основана на сочетании записи мнемоник донорами (на базе специально подобранных предложений и фраз) и специфических фильтров.

Исследователь уверена, что суррогатные голоса можно будет создавать, сопоставляя психотипы людей – пол, возраст, внешность, особенности характера и прочее. Работа, несомненно, займет много времени (каждому донору придется потратить несколько часов на запись фраз), но в итоге удастся сформировать уникальную базу данных, позволяющую синтезировать индивидуальный голос для каждого нуждающегося в нем.

Проект не носит теоретический характер: любой желающий может посмотреть и послушать результаты на видео, а тем временем специально организованная команда VocaliD ищет спонсоров для продолжения проекта. Приемлемые плоды пока что достигнуты на программном продукте, действующем под Windows, но ученые планируют сделать версии для Android и iOS.

Единственное ограничение – цена решения, которая находится в пределах $10 000, но Рупал Патель уверена, что с развитием технологий и этот барьер будет преодолен – тогда индивидуальные голосовые синтезаторы станут общедоступными.

Группа «Борлас» представила облачное решение для формирования отчетностиВам будет интересно:Группа «Борлас» представила облачное решение для формирования отчетности

Журнал: Журнал IT-Expert, Подписка на журналы

Поделиться: