Компания «Наносемантика» синтезирует «голос Победы» Юрия Левитана к юбилею диктора
Разработчик нейросетевых решений «Наносемантика» в год 110-летия со дня рождения знаменитого советского диктора Юрия Левитана представит синтез его голоса. К юбилею человека, чей голос объявлял по Всесоюзному радио о победе в Великой Отечественной войне, компания представит голосовую модель, созданную на базе платформы NLab TTS и обученную на редких записях, из архива Левитана.
В 2024 году со дня рождения Юрия Левитана исполнится 110 лет. С предложением о разработке голосовой модели всесоюзного диктора в компанию обратился его правнук Артур Левитан-Судариков. Идея проекта заключается в том, чтобы увековечить в цифровом формате голос, который объявлял в Советском Союзе о самых значимых событиях XX века. Голос Левитана звучал из репродукторов и радиоточек, когда в СССР передавали сводки с фронтов Великой Отечественной войны, именно Левитан на всю страну зачитывал новость о начале войны в 1941-м году и о победе в ней в 1945 году.
Голосовая модель Левитана будет работать на базе платформы «Наносемантики» NLab TTS (Text-to-Speech), специализирующейся на синтезировании голоса из текстового формата. Для обучения модели будет использован массивный архив записей из Госфильмофонда. Кроме того, правнук диктора Артур Левитан-Судариков попросил открыть разработчикам доступ к аудиоматериалам, которые хранятся в музее Левитана на его родине – во Владимире.
Перед разработчиками стоит непростая задача синтезировать узнаваемый тембр голоса с помощью аудиозаписей с разным уровнем качества. Записи сильно отличаются друг от друга по громкости, компрессии, эквализации, уровню шума и искажению, что связано с дефектами, которые получены уже после непосредственной записи голоса Левитана, а также в результате перезаписи или копирования мастер-пленки. Такая неоднородность материала всегда осложняет процесс создания голосовой модели, которая должна генерировать «чистый», ровный голос без лишних помех.
В то же время разработчики отмечают, что технические особенности записи во времена работы Юрия Левитана повлияли на его запоминающийся тембр, что тоже важно передать в голосовой модели. «"Нулевой исходник" – очень чистый, теплый, ламповый звук, который изящно подчеркивает голос Левитана. Эти теплота и гармоники играют далеко не последнюю роль в восприятии итогового голоса диктора, каким его запомнили. Нам удалось убрать 80% лишних дефектов, но, где необходимо, мы даже добавили фоновые шумы, чтобы записи звучали одинаково приятно, узнаваемо и при этом не теряли звучание той эпохи», - комментирует Станислав Ашманов, генеральный директор компании «Наносемантика».
Сейчас «Наносемантика» занимается разработкой первой версии модели. Участники проекта обсуждают вопросы открытого доступа пользователей к ней в будущем, а также возможность интеграции голосовой модели с генеративными технологиями. Уже известно, что голос Юрия Левитана будет доступен на платформе орфоэпического сервиса – в приложении «Ударения», которое запущено в 2015 году. Релиз продукта намечен на 2024 год.
«Принимать участие в проекте создания голосовой модели одного из самых важных голосов XX века в нашей стране – большая честь для нас. Важно, чтобы такие голоса как у Левитана, снова зазвучали, но уже в новом формате – из современных гаджетов и приложений. Это откроет широкие возможности на пути сохранения памяти об этих людях, чьими голосами можно будет озвучивать книги, новостные сводки и виртуальных интерактивных персонажей. Благодаря таким проектам голос продолжит жить и напоминать о человеке», – комментирует Станислав Ашманов, генеральный директор компании «Наносемантика».
Справка:
«Наносемантика» — ведущий российский производитель решений и продуктов на основе нейросетей. За 18 лет на рынке ИТ-компания разработала более 12 собственных интеллектуальных продуктов и платформ, реализовала свыше 130 проектов для бизнеса. Команда из научных сотрудников и разработчиков обладает обширной базой знаний и практик в области машинного обучения.
Коммуникации компаний на Хабре: привлекаем внимание IT-специалистов. Вебинар Хабра и iTrend
10 сентября 202424 сентября в 16:00 Хабр и коммуникационное агентство iTrend проведут открытый вебинар, в рамках которого эксперты поделятся своим опытом ведения блога на самой популярной технологической площадке.
iTrend организует панельную дискуссию «Российские ИТ на глобальном рынке: стратегия выживших» на Международном технологическом Конгрессе-2024
2 сентября 2024Ключевые игроки ИТ-отрасли и представители профессиональных ассоциаций обсудят перспективы российского технологического бизнеса в контексте расширения БРИКС.
iTrend начал работу с DCLogic
21 августа 2024iTrend начал работу с DCLogic. Компания входит в топ-10 самых эффективных ИТ-компаний страны 2023 года, а также в топ-100 крупнейших интеграторов и разработчиков отечественного ПО по версии CNews.
iTrend выступит информационным партнером Международного технологического Конгресса-2024
20 августа 2024Мероприятие пройдет с 17 по 19 сентября 2024 года в Конгрессно-выставочном центре «Патриот» (Московская область).
iTrend проведет дискуссию о маркетинге и PR в ИТ на ИТ-форуме РУССОФТ
15 августа 20248-10 сентября 2024 года в Санкт-Петербурге состоится ИТ-форум РУССОФТ-2024, приуроченный к 25-летнему юбилею Ассоциации.