Компания OpenAI выпустила модель Sora 2, которая преобразует текст в видео и аудио с упором на физическую достоверность, управляемость несколькими кадрами и синхронизированный диалог/спецэффекты.
Команда OpenAI также выпустила новое приложение Sora для iOS (сначала в США и Канаде), которое позволяет создавать социальные проекты, создавать ремиксы и использовать «камео» с контролем согласия для вставки верифицированных образов в сгенерированные сцены.
Возможности модели
Sora 2 утверждает, что обладает значительно улучшенным моделированием мира (например, рикошет при промахе вместо «телепортации» объекта), поддерживает состояние между кадрами для редактирования в соответствии с инструкциями и генерирует собственный, синхронизированный по времени аудиоряд (речь, фоновые звуки, эффекты).
Это представлено как предпосылки для создания видео уровня симуляции, а не для синтеза одного клипа.
Архитектура приложения и «камео»
Приложение Sora построено на основе «камео»: пользователи записывают короткое видео+аудио в приложении для подтверждения личности и захвата образа; владельцы «камео» контролируют, кто может использовать их образ, и могут отзывать или удалять любое видео, включая черновики, в которых они участвуют. Приложение доступно на устройствах iOS и будет расширяться после запуска в США и Канаде.
Безопасность
В документах OpenAI по Sora 2 описан поэтапный запуск с ограничениями по времени запуска и контролем происхождения:
* Загрузка/генерация: при запуске OpenAI ограничивает использование загрузок изображений, на которых изображены фотореалистичные люди, и всех видеозаписей. Sora 2 не поддерживает преобразование видео в видео при запуске, блокирует преобразование текста в видео с участием публичных фигур и блокирует генерацию с участием реальных людей, кроме случаев, когда пользователь согласился через функцию «камео».
* Происхождение: все выходные данные содержат метаданные C2PA и видимый движущийся водяной знак при загрузке, а внутренние инструменты обнаружения предназначены для оценки происхождения.
Родительский контроль
Параллельно с Sora компания OpenAI внедрила родительский контроль, интегрированный через ChatGPT: родители могут подключить подростков к неперсонализированному каналу, управлять разрешениями личных сообщений и контролировать, разрешён ли непрерывный просмотр — в соответствии с философией канала Sora «создание важнее потребления».
Доступ и цены
Приложение Sora для iOS уже доступно для загрузки; доступ открывается по приглашению, а Sora 2 изначально бесплатна с ограничениями по вычислительным ресурсам. Пользователи ChatGPT Pro получают доступ к экспериментальному уровню Sora 2 Pro на sora.com (и скоро в приложении). Доступ к API планируется после запуска для потребителей. Существующее содержимое Sora 1 Turbo остаётся доступным в пользовательских библиотеках.
Резюме
Sora 2 продвигает преобразование текста в видео в сторону управляемой, физически достоверной, синхронизированной по аудио генерации — и OpenAI выпускает её в приложении для iOS с контролем согласия через «камео», а также с метаданными C2PA и видимыми водяными знаками для подтверждения происхождения.
Первоначальный запуск в США и Канаде ставит во главу угла ограничения безопасности (например, ограничения на изображения публичных фигур), планируя более широкий доступ и планы по API, сигнализируя о преднамеренном переходе от демонстрации базовых возможностей к управляемым, готовым к производству инструментам для работы со СМИ.
1. Какие новые возможности предоставляет модель Sora 2 по сравнению с предыдущими версиями?
Ответ: модель Sora 2 преобразует текст в видео и аудио с упором на физическую достоверность, управляемость несколькими кадрами и синхронизированный диалог/спецэффекты. Она также поддерживает состояние между кадрами для редактирования в соответствии с инструкциями и генерирует собственный синхронизированный по времени аудиоряд.
2. Какие меры предпринимает OpenAI для контроля согласия при использовании верифицированных образов в приложении Sora?
Ответ: в приложении Sora пользователи записывают короткое видео и аудио для подтверждения личности и захвата образа. Владельцы «камео» контролируют, кто может использовать их образ, и могут отзывать или удалять любое видео, включая черновики, в которых они участвуют.
3. Какие ограничения по безопасности установлены при запуске Sora 2?
Ответ: при запуске OpenAI ограничивает использование загрузок изображений, на которых изображены фотореалистичные люди, и всех видеозаписей. Sora 2 не поддерживает преобразование видео в видео при запуске, блокирует преобразование текста в видео с участием публичных фигур и блокирует генерацию с участием реальных людей, кроме случаев, когда пользователь согласился через функцию «камео».
4. Какие дополнительные функции были внедрены компанией OpenAI параллельно с Sora 2?
Ответ: параллельно с Sora компания OpenAI внедрила родительский контроль, интегрированный через ChatGPT. Родители могут подключить подростков к неперсонализированному каналу, управлять разрешениями личных сообщений и контролировать, разрешён ли непрерывный просмотр.
5. Как пользователи могут получить доступ к приложению Sora для iOS?
Ответ: доступ к приложению Sora для iOS открывается по приглашению. Пользователи ChatGPT Pro получают доступ к экспериментальному уровню Sora 2 Pro на sora.com (и скоро в приложении).