https://frosthead.com

Как построить человеческий голос

Один из самых узнаваемых голосов в мире принадлежит Стивену Хокингу - хотя, конечно, это вообще не голос известного ученого, а тот, который генерируется компьютером в ответ на его движения лица. Он использует синтезатор, чтобы говорить уже почти 25 лет, его голос и способность двигаться давно утрачены из-за БАС или болезни Лу Герига. Сегодня британского астрофизика идентифицируют по его монотонному роботу, который действительно имеет американский акцент.

Но правда в том, что Хокинг делится этим сгенерированным компьютером голосом с тысячами других людей, некоторыми молодыми девушками, некоторыми пожилыми женщинами и другими людьми всех возрастов и этнических групп по всему миру. Все они, неспособные говорить естественно, думают об этом как о своем, хотя в этом нет ничего уникального.

И это просто не похоже на Рупала Пателя.

Патель - речевой ученый и директор нового Центра речевой науки и техники в Северо-Восточном университете. Она долго чувствовала, что голос помогает определить личность; это ясно формирует, как человек известен в мире. Даже если люди не могут говорить, она говорит, не должны ли они иметь возможность общаться через голоса, которые более правдивы, чем они являются?

Вот уже несколько лет она и ее коллега-речник Тим Баннелл разрабатывают способ конструирования собственных голосов, используя в качестве своей сущности все звуки, которые может издавать человек. Они фокусируются на высоте и громкости этих звуков, а также на том, как человек может произносить определенные буквы, такие как «ss» или «ch». Цель состоит в том, чтобы максимально сконцентрироваться на идентичности голоса.

Затем это становится вопросом построения нового голоса - голоса с большей ясностью - путем сбора звуков от донора аналогичного пола, возраста, размера и географического происхождения. Чтобы пожертвовать голос, человек записывается, читая подборку коротких предложений, которые кумулятивно охватывают каждую комбинацию звуков в языке. В идеале, он или она записывает до 3000 различных фраз. Это занимает часы. И хотя запись не должна происходить за один сеанс, чем больше доноров может дать звуков, тем лучше будет звучать голос.

Из этой коллекции звуков специально разработанное программное обеспечение создает слова в виде инженерного голоса, близкого к тому, что может звучать у человека, если у него нет речевого расстройства.

Это масштабируемое?

Разве не понадобится небольшая армия доноров, читающих огромное количество предложений, чтобы создать базу данных звуков, которые можно превратить в персонализированные голоса?

Да, это будет, Патель говорит в недавнем выступлении на TED, поэтому она продвигает вперед то, что она называет Инициативой Human Voicebank.

На сайте проекта, VocaliD.org, есть как страница регистрации для доноров, так и страница для тех, кто надеется получить личный голос. Последние должны представить свои имена и другую соответствующую информацию, такую ​​как их речевые способности, которые могут варьироваться от «совершенно не вокала» до «может издавать звуки, но не слова» до «может использовать некоторые слова для общения».

По словам Пателя, хотя в самом начале проекта было создано лишь несколько голосов, более 10 000 человек уже вызвались стать донорами голосов. «Несколько сотен» других, по ее словам, подписались, чтобы получить новые голоса.

Тем не менее, есть несколько препятствий, с которыми сталкивается банк голоса, говорит Патель, среди них, чтобы доноры прочитали весь материал, необходимый для создания голоса. Эта проблема становится еще более серьезной, если учесть, что на данный момент добровольцам необходимо записаться в профессиональной студии, чтобы обеспечить ученым высококачественные образцы. Патель говорит, что разрабатываются инструменты, которые позволят донорам записывать свои предложения дома.

Ее цель - собрать миллион различных образцов голоса к 2020 году. Но уже ее работа оказывает влияние. На сайте есть аудиофайл длиной всего в два предложения, предоставленный молодой женщиной, которая описала «серьезное нарушение речи». Ее слова ясны, как день:

«Этот голос только для меня. Я не могу дождаться, чтобы попробовать это с моими друзьями.

Вот Рупал Патель, объясняющий инициативу Human Voicebank в выступлении на TED:

Слышащие голоса

Вот более недавнее исследование о влиянии голосов:

  • Послушайте свою маму. Согласно исследованию, опубликованному в « Педиатрии», только звук голоса матери может заставить недоношенных детей лучше питаться . С помощью пустышек, оснащенных датчиками, исследователи из детской больницы им. Монро Карелла в Нэшвилле вознаградили младенцев, которые правильно сосали, записывая колыбельные песни своих мам. Дети в исследовании, которые использовали специальные пустышки и слышали голос своей мамы, могли выходить из трубок для кормления на неделю раньше, чем те, кто этого не делал.
  • Добро пожаловать в эхо-камеру: Предыдущее исследование показало, что люди предпочитают голоса, звучащие так, будто они исходят от маленьких женщин или крупных мужчин, но новое исследование Университета Британской Колумбии утверждает, что нам действительно нравятся голоса, которые звучат как наши особенно те, у которых есть акценты, с которыми мы знакомы. Исследователи также сказали, что люди, похоже, предпочитали голоса мужчин, которые использовали более короткие слова, и женщин, которые звучали хрипло.
  • Слоны никогда не забывают голоса: африканские слоны, видимо, очень хорошие слушатели. Согласно двухлетнему исследованию в Кении, они могут различать человеческие голоса по полу, возрасту и даже этнической группе. Исследователи записали крики масаев, мужчин и женщин и детей и проиграли их через громкоговоритель, скрытый от стада слонов. Только когда животные услышали голос взрослых самцов масаи - группы, с которой у слонов гораздо больше шансов столкнуться, - они отреагировали, прикрываясь телятами. Они не отвечали на голоса взрослых мужчин из другого племени камба, которые, как фермеры, редко вступают в конфликт со стадом.
  • Они слышат вашу боль: после завершения сканирования мозга на собаках ученые в Шотландии говорят, что собаки похожи на людей в том смысле, что у них есть область мозга, предназначенная для распознавания и интерпретации голосов. Именно поэтому, говорят исследователи, ваша собака может так настроиться на ваши чувства.
  • Я знал, что в тебе что-то другое: пластическая хирургия не просто меняет твою внешность; это также может изменить звучание человека. Согласно статье, опубликованной в журнале « Пластическая и реконструктивная хирургия», исследователи в Иране обнаружили, что пациенты, у которых была ринопластика или работа носа, часто думали, что их голоса звучали более носовыми после процедуры.
Как построить человеческий голос