Adobe VoCo

Adobe VoCo

На конференции MAX, компания Adobe явила миру весьма интересный продукт. Очередное детище калифорнийских айтишников под названием VoCo умеет редактировать и синтезировать человеческую речь. Разработчики уверены в превосходстве над конкурентами, поскольку новая программа делает это на порядок реалистичней, а также отличается простым и удобным интерфейсом. В общем, получился этакий речевой Photoshop.



Как это работает

Программе требуется речевой материал, из которого она создаст библиотеку фонем. Разумеется, качество результата в большой мере зависит от объёма исходных данных, т.е. от продолжительности записанного монолога. Разработчики говорят о двадцатиминутном минимуме, но чем больше слов получит VoCo, тем реалистичней всё будет звучать на выходе. Можно использовать готовый аудиофайл или наговорить что-нибудь в микрофон. После обработки семантическое содержимое исходника появляется в текстовом поле, где его можно отредактировать или полностью переписать, а программа озвучит итоговый вариант. Предусмотрена также функция замены или компиляции голосов при наличии записей речи других людей.

Создатели программы Adobe VoCo работали над методиками обработки звука в кооперации с Принстонским университетом. Такой тандем позволил получить принципиально новую технологию голосового синтеза. Воспроизводимая на выходе речь отличается внятностью, чёткостью и более естественным интонированием, чем в аналогичных приложениях. Это было продемонстрировано на презентации, но даже о примерной дате коммерческого релиза там ничего не сказали.

Перспективы использования

Нет сомнений, что подобная технология пригодится во всех отраслях, где записывают аудиодорожки. Например, с её помощью станет проще исправлять ошибки дубляжа в кинофильмах. Для этого больше не придётся заново созывать персонал, тащить на студию актёров и тратить на всё это продюсерские деньги. Рядовому пользователю возможности программы Adobe VoCo тоже откроют новые горизонты. Наверняка многим понравится идея самостоятельно переозвучить любимые аудиокниги голосами известных актёров или своих близких.

Сейчас компания решает, как не допустить вредоносного использования нового продукта. Всегда найдутся желающие сфальсифицировать запись важного интервью или переговоров, что в условиях нынешних реалий крайне опасно. Будем надеяться, что программисты из Сан-Хосе решат эту проблему, хотя, конечно, на каждую PlayStation есть свой Geohot.