OpenAI запускает Sora 2 и приложение Sora для iOS с контролем согласия

Компания OpenAI выпустила модель Sora 2, которая преобразует текст в видео и аудио с упором на физическую достоверность, управляемость несколькими кадрами и синхронизированный диалог/спецэффекты.

Команда OpenAI также выпустила новое приложение Sora для iOS (сначала в США и Канаде), которое позволяет создавать социальные проекты, создавать ремиксы и использовать «камео» с контролем согласия для вставки верифицированных образов в сгенерированные сцены.

Возможности модели

Sora 2 утверждает, что обладает значительно улучшенным моделированием мира (например, рикошет при промахе вместо «телепортации» объекта), поддерживает состояние между кадрами для редактирования в соответствии с инструкциями и генерирует собственный, синхронизированный по времени аудиоряд (речь, фоновые звуки, эффекты).

Это представлено как предпосылки для создания видео уровня симуляции, а не для синтеза одного клипа.

Архитектура приложения и «камео»

Приложение Sora построено на основе «камео»: пользователи записывают короткое видео+аудио в приложении для подтверждения личности и захвата образа; владельцы «камео» контролируют, кто может использовать их образ, и могут отзывать или удалять любое видео, включая черновики, в которых они участвуют. Приложение доступно на устройствах iOS и будет расширяться после запуска в США и Канаде.

Безопасность

В документах OpenAI по Sora 2 описан поэтапный запуск с ограничениями по времени запуска и контролем происхождения:

* Загрузка/генерация: при запуске OpenAI ограничивает использование загрузок изображений, на которых изображены фотореалистичные люди, и всех видеозаписей. Sora 2 не поддерживает преобразование видео в видео при запуске, блокирует преобразование текста в видео с участием публичных фигур и блокирует генерацию с участием реальных людей, кроме случаев, когда пользователь согласился через функцию «камео».
* Происхождение: все выходные данные содержат метаданные C2PA и видимый движущийся водяной знак при загрузке, а внутренние инструменты обнаружения предназначены для оценки происхождения.

Родительский контроль

Параллельно с Sora компания OpenAI внедрила родительский контроль, интегрированный через ChatGPT: родители могут подключить подростков к неперсонализированному каналу, управлять разрешениями личных сообщений и контролировать, разрешён ли непрерывный просмотр — в соответствии с философией канала Sora «создание важнее потребления».

Доступ и цены

Приложение Sora для iOS уже доступно для загрузки; доступ открывается по приглашению, а Sora 2 изначально бесплатна с ограничениями по вычислительным ресурсам. Пользователи ChatGPT Pro получают доступ к экспериментальному уровню Sora 2 Pro на sora.com (и скоро в приложении). Доступ к API планируется после запуска для потребителей. Существующее содержимое Sora 1 Turbo остаётся доступным в пользовательских библиотеках.

Резюме

Sora 2 продвигает преобразование текста в видео в сторону управляемой, физически достоверной, синхронизированной по аудио генерации — и OpenAI выпускает её в приложении для iOS с контролем согласия через «камео», а также с метаданными C2PA и видимыми водяными знаками для подтверждения происхождения.

Первоначальный запуск в США и Канаде ставит во главу угла ограничения безопасности (например, ограничения на изображения публичных фигур), планируя более широкий доступ и планы по API, сигнализируя о преднамеренном переходе от демонстрации базовых возможностей к управляемым, готовым к производству инструментам для работы со СМИ.

1. Какие новые возможности предоставляет модель Sora 2 по сравнению с предыдущими версиями?

Ответ: модель Sora 2 преобразует текст в видео и аудио с упором на физическую достоверность, управляемость несколькими кадрами и синхронизированный диалог/спецэффекты. Она также поддерживает состояние между кадрами для редактирования в соответствии с инструкциями и генерирует собственный синхронизированный по времени аудиоряд.

2. Какие меры предпринимает OpenAI для контроля согласия при использовании верифицированных образов в приложении Sora?

Ответ: в приложении Sora пользователи записывают короткое видео и аудио для подтверждения личности и захвата образа. Владельцы «камео» контролируют, кто может использовать их образ, и могут отзывать или удалять любое видео, включая черновики, в которых они участвуют.

3. Какие ограничения по безопасности установлены при запуске Sora 2?

Ответ: при запуске OpenAI ограничивает использование загрузок изображений, на которых изображены фотореалистичные люди, и всех видеозаписей. Sora 2 не поддерживает преобразование видео в видео при запуске, блокирует преобразование текста в видео с участием публичных фигур и блокирует генерацию с участием реальных людей, кроме случаев, когда пользователь согласился через функцию «камео».

4. Какие дополнительные функции были внедрены компанией OpenAI параллельно с Sora 2?

Ответ: параллельно с Sora компания OpenAI внедрила родительский контроль, интегрированный через ChatGPT. Родители могут подключить подростков к неперсонализированному каналу, управлять разрешениями личных сообщений и контролировать, разрешён ли непрерывный просмотр.

5. Как пользователи могут получить доступ к приложению Sora для iOS?

Ответ: доступ к приложению Sora для iOS открывается по приглашению. Пользователи ChatGPT Pro получают доступ к экспериментальному уровню Sora 2 Pro на sora.com (и скоро в приложении).

Источник