AI

Fugatto — новая нейросеть для генерации звука от Nvidia

Fugatto — новая нейросеть для генерации звука от Nvidia

Nvidia представила Fugatto — инновационную модель искусственного интеллекта, которая способна создавать и изменять звуки по текстовому описанию.

Эта технология открывает новые возможности для музыкантов, разработчиков игр, рекламных агентств и других креативных индустрий. Подробности далее.

Читайте также: 5 бесплатных нейросетей для генерации музыки

Что умеет нейросеть Fugatto

Рассмотрим основные возможности, которые были заявлены разработчиками.

Создавать уникальные звуки: например, звуковой эффект «ливня с раскатами грома» или превращение звука поезда в игру струнного оркестра.

Работать с голосами: генерировать речь с заданным акцентом, эмоциональной окраской и изменением тональности.

Редактировать аудио: удалять вокал из трека, добавлять новые инструменты или преобразовывать один звук в другой, например, фортепиано в вокал.

В каких областях Fugatto найдёт применение:

  • Музыка: быстрое создание черновых версий песен, экспериментирование с жанрами, инструментами и эффектами.
  • Реклама: адаптация озвучки под разные регионы, изменение акцентов или эмоций в голосе.
  • Игры: генерация новых звуков или изменение существующих в реальном времени для большей динамичности.
  • Уникальные звуки: Fugatto может создавать аудиофайлы, которых раньше не существовало, например, «трубу, которая лает».

Fugatto работает на базе 2,5 миллиарда параметров и обучалась на огромной базе данных. В отличие от других -моделей, таких как решения от Stability AI или , Fugatto позволяет создавать действительно уникальные звуковые эффекты, а не только модифицировать существующие.

Пока дата выхода Fugatto не объявлена, но уже ясно, что это шаг вперёд в аудиотехнологиях и составит серьёзную конкуренцию Suno AI.

Ранее DeepL представил голосовой ИИ-переводчик — DeepL Voice, который распознает 13 языков, включая русский.

Источник

Добавить комментарий

Кнопка «Наверх»