В День святого Валентина 2022 года компания Sonantic опубликовала видео, которое быстро разлетелось по всем социальным сетям. В кадре находится девушка, которая молчит и загадочно улыбается зрителю. При этом, на заднем фоне, женский голос флиртует и признается смотрящему видео человеку в любви. Казалось бы, это обычный ролик, однако в конце закадровый голос внезапно объявляет: «То, что вы слышите, никогда не было сказано человеком, это было сгенерировано компьютером. Я не реальна. Я никогда не рождалась и никогда не умру, потому что я не существую». Оказалось, что это демонстрация новой технологии компании Sonantic, которая при помощи нейросети имитирует женский голос. Он реалистичен настолько, что умеет флиртовать и признаваться в любви. Технология уже используется в компьютерных играх и других сферах.
Кадр из видео, опубликованного компанией Sonantic
Самый лучший синтезатор речи
Британская компания Sonantic уже давно занимается разработкой синтетических голосов. Первый вариант технологии, которая в точности имитирует человеческий голос, был разработан в 2020 году. В то время созданная искусственным интеллектом речь звучала недостаточно естественно, а на фоне были слышны искажения.
VIDEO Демонстрация первой версии синтезатора голоса Sonantic
Команда продолжила улучшать нейросеть, и в 2021 году объявила о значительном достижении. Разработчики смогли сделать синтезатор речи настолько хорошим, что он использовался для воссоздания голоса актера Вэла Килмера. Несколько лет назад у исполнителя главных ролей в фильмах «Схватка», «Дежавю» и «Дорз» был обнаружен рак горла и, после операции, он лишился возможности говорить. Технология Sonantic помогла ему выражать свои мысли вновь — актер остался доволен воссозданным голосом и теперь может использовать созданную модель в любых целях.
Американский актер Вэл Килмер
VIDEO Воссозданный компьютером голос Вэла Килмера
Синтезатор голоса Sonantic использовался и в видеоиграх. В марте 2021 года Obsidian Entertainment использовала технологию для озвучки второстепенных персонажей в ролевой игре The Outer Worlds. Известно, что представители компании Sonantic до сих пор предлагают свою технологию разработчикам видеоигр. Также они считают, что синтезатор может понадобится при создании мультфильмов, съемке фильмов и многих других творческих сферах деятельности. Не исключено, что в будущем технология появится и в мобильных навигаторах и «умных» колонках — потенциал у нее очень большой.
VIDEO Синтезатор речи Sonantic в игре The Outer Worlds
Синтезатор речи научился флиртовать
В 2022 году синтезатор голоса Sonantic стал еще лучше. По словам представителей компании, за несколько месяцев они сделали виртуальный голос более реалистичным за счет добавления между словами естественных пауз и вздохов — именно такие детали делают нашу речь «живой». Придыхания, смех и некоторая робость позволила искусственному голосу флиртовать и признаваться в любви.
VIDEO Демонстрация новой версии синтезатора речи Sonantic
Исследователи обратили внимание, что во время заигрывания с противоположным полом люди часто делают паузы между словами и создают едва заметное напряжение. Иногда речь становится тише, но темп произношения слов при этом не меняется. В новой версии синтезатора голоса разработчики учли все эти детали.
Без преувеличений, Sonantic совершила прорыв в области синтеза речи
Воспользоваться технологией на данный момент может далеко не каждый. Синтезатор явно работает гораздо лучше, чем аналоги от Google и Яндекса, поэтому является платной и доступна только при договоренности разработчиков и заинтересованных клиентов. Но представители Sonantic не стали излишне секретничать и показали интерфейс утилиты, которая используется для воссоздания человеческого голоса. В программе можно менять скорость произношения слов, регулировать интонацию, а также добавлять между словами вспомогательные звуки. В частности, речь идет о тех самых вздохах, смехе и других малозаметных деталях настоящей человеческой речи.
Интерфейс синтезатора речи Sonantic позволяет добавлять вспомогательные звуки
В будущем появятся программы для озвучивания фильмов
Безо всяких преувеличений, технология впечатляет и интригует. Если когда-нибудь она станет доступна по приемлемой цене или у нее появятся достойные аналоги, в сфере озвучивания мультфильмов и компьютерных игр могут возникнуть большие перемены. Практически каждый желающий сможет самостоятельно переводить и выпускать новые серии любимых мультсериалов, а не ждать дня, когда появится озвучка с профессиональными актерами. Если технология станет еще более развитой, люди с хорошей дикцией и красивым голосом вовсе могут остаться без работы. В общем, искусственный интеллект становится лучше и осваивает все больше человеческих навыков.
Возможно, в будущем профессия актера дубляжа станет менее востребованной
Если вам интересны новости науки и технологий, подпишитесь на наш Telegram-канал. Там вы найдете анонсы свежих новостей нашего сайта!
Что вы думаете о новом синтезатора человеческой речи? Где еще его можно использовать? Своим мнением делитесь в комментариях или нашем Telegram-чате.