Google превратил каждого в музыканта за 30 секунд

Революция в кармане - музыка по щелчку пальца

Представьте: вы просто описываете настроение или показываете фотографию, а через несколько секунд получаете готовый музыкальный трек с текстом и оформлением. Звучит как фантастика? Нет, это реальность, которую Google только что сделал доступной для всех пользователей Gemini.

Компания встроила свою новую модель Lyria 3 непосредственно в популярный AI-ассистент. Теперь создание музыки перестало быть привилегией профессионалов или технически подкованных энтузиастов. Достаточно иметь смартфон и фантазию.

Система работает удивительно просто. Вы загружаете текстовое описание, фотографию или даже видео - и алгоритм самостоятельно определяет жанр, темп, стиль вокала и создает тексты песен. Всё это упаковывается в 30-секундную композицию с готовой обложкой.

DeepMind разрабатывал технологию Lyria с 2023 года, но только сейчас она вышла на массовую аудиторию. Это принципиально меняет ситуацию - миллионы людей получили инструмент, о существовании которого многие даже не подозревали.

Защита от подделок встроена с первого дня

Google понимает риски распространения AI-контента и сразу внедрил систему защиты. Каждая созданная композиция автоматически помечается цифровым водяным знаком SynthID. Это невидимая метка, которая позволяет определить происхождение трека.

Более того, Gemini дает возможность проверить любой аудиофайл на предмет создания с помощью искусственного интеллекта. Просто загрузите композицию - и система скажет, была ли она сгенерирована алгоритмом.

Такой подход помогает бороться с дезинформацией и защищает права создателей контента. В эпоху, когда AI может имитировать голоса знаменитостей, прозрачность происхождения контента становится критически важной.

Для создателей на YouTube технология открывается через Dream Track для Shorts. Это позволяет быстро добавлять уникальное музыкальное сопровождение к коротким видео без поиска треков в библиотеках или переживаний об авторских правах.

От нишевого инструмента к массовому явлению

Платформы вроде Suno и Udio уже давно умеют создавать музыку, способную обмануть большинство слушателей. Но эти сервисы остаются малоизвестными широкой публике. Интеграция Lyria в Gemini - совсем другой уровень.

Миллионы людей, которые никогда не слышали о специализированных музыкальных AI-моделях, теперь могут создавать треки одним промптом. Это похоже на то, как появление Instagram превратило фотографию из хобби профессионалов в повседневное занятие каждого.

Технология становится невидимой - пользователю не нужно разбираться в тонкостях генерации звука или музыкальной теории. Просто опишите идею, и система сделает остальное.

Хотите узнать больше о практическом применении AI в бизнесе и творчестве? Загляните на AI Projects за экспертными рекомендациями и кейсами.

OpenAI охотится за доверием Голливуда

Пока Google демократизирует музыку, OpenAI решает другую задачу - завоевать доверие индустрии развлечений. Компания переманила Чарльза Порча, который 15 лет руководил партнерствами со знаменитостями в Instagram.

Порч стоял за вирусными моментами вроде неожиданного релиза альбома Бейонсе в 2013 году и привлечения Папы Римского на платформу. Теперь его задача - построить мосты между OpenAI и скептически настроенным Голливудом.

Назначение произошло после сделки на $1 млрд с Disney в декабре, которая открыла доступ к платформе Sora для анимационных персонажей Marvel, Pixar и «Звездных войн». Порч планирует начать с «тура прослушивания» по творческим сообществам этой весной.

Отношение индустрии развлечений к AI остается прохладным в лучшем случае. Но человек с репутацией переводчика между технологиями и талантами может изменить ситуацию. Его связи и опыт - именно то, что нужно для смены настроений.

AI-аватары научились читать эмоции собеседника

Компания Tavus представила Phoenix-4 - модель для создания реалистичных человеческих аватаров в реальном времени. Система генерирует каждый пиксель лица и головы с нуля для каждого кадра, обучаясь на тысячах часов реальных человеческих разговоров.

Главное отличие от предыдущих поколений - способность обрабатывать более 10 эмоциональных состояний и плавно переходить между ними во время беседы. Никаких неловких несоответствий реакций или застывших выражений лица.

Технология работает в HD-качестве со скоростью 40 кадров в секунду, обеспечивая плавность живого видеозвонка. Tavus позиционирует разработку для здравоохранения, образования и продаж - сфер, где ощущение «быть услышанным» напрямую влияет на результат.

Текстовые AI-взаимодействия становятся всё более человечными, и видеоаватары наконец догоняют этот темп. Зловещая долина роботизированных эмоций остается позади, уступая место собеседнику, который действительно слушает.

Превращаем фото продукта в вирусное видео

Хотите создать цепляющий контент для соцсетей из обычной фотографии товара? Вот простой способ с использованием Runway:

Возьмите фото продукта или попросите Gemini сгенерировать макет для вашего бренда
Загрузите изображение в любой AI с промптом: «Напиши краткое описание для создания видео в Runway на основе этого фото продукта. Добавь анимацию или движение камеры, если применимо»
Откройте Runway, перейдите в раздел Video, добавьте стартовый кадр и сгенерированный промпт
Повторите процесс для остальных фотографий, экспериментируя с текстовыми наложениями и музыкой при публикации

Этот метод отлично работает для создания согласованных клипов, готовых для рекламных кампаний и анонсов продуктов. Попробуйте добавить их в существующие рекламные наборы Google или Meta.

Индустрия на пороге больших перемен

Бывший исследователь DeepMind Дэвид Сильвер привлекает $1 млрд при оценке $4 млрд для своего лондонского стартапа Ineffable Intelligence. Это крупнейший посевной раунд в истории Европы.

«Крестная мать AI» Фей-Фей Ли объявила о раунде в $1 млрд для World Labs, включая $200 млн от Autodesk. Компания планирует внедрить свои модели мира в 3D и индустрию развлечений.

Perplexity полностью убирает рекламу с платформы - руководство считает, что спонсорский контент подрывает доверие к AI-ответам. Смелое решение в эпоху, когда все гонятся за монетизацией.

OpenAI приобрел команду стартапа Nerve, специализирующегося на корпоративном AI-поиске. Специалисты присоединятся к разработке поисковых возможностей ChatGPT в большем масштабе.

Трейлер документального фильма «The AI Doc: Or How I Became an Apocaloptimist» набирает популярность перед премьерой. В нем интервью с лидерами отрасли, включая Сэма Альтмана и Дарио Амодеи.

Выводы - AI становится частью повседневности

Интеграция Lyria 3 в Gemini знаменует переломный момент - создание музыки с помощью AI перестает быть уделом технических энтузиастов и становится массовым инструментом. Миллионы людей получили доступ к технологии, о которой раньше даже не подозревали.

Параллельно OpenAI выстраивает отношения с Голливудом, Tavus делает видеоаватары неотличимыми от живых людей, а европейские стартапы привлекают рекордные инвестиции. Искусственный интеллект перестает быть футуристической концепцией - он становится повседневным инструментом для творчества, бизнеса и общения.

Главный вопрос теперь не в том, способен ли AI создавать контент, а в том, как общество адаптируется к миру, где границы между человеческим и машинным творчеством размываются с каждым днем. Системы защиты вроде SynthID - важный шаг, но впереди еще много вызовов.

Готовы применить AI-инструменты в своих проектах? Посетите AI Projects для практических руководств и консультаций экспертов.