Известная во всем мире своим чат-ботом ChatGPT компания OpenAI представила 15 февраля новую генеративную модель искусственного интеллекта под названием Sora. Она позволяет генерировать по текстовому описанию видеоролики, реалистичность которых изумила наблюдателей. Появление такого инструмента породило еще больше опасений насчет развития дипфейков, а также того, существование каких профессий Sora может поставить под угрозу уже сейчас. Руководитель лаборатории научных исследований искусственного интеллекта Tinkoff Research Сергей Колесников размышляет о том, как OpenAI удалось создать такую модель, где ее можно использовать и почему риски ее использования могут быть преувеличены Почему Sora — не шаг, а гигантский скачок
Примерно месяц назад Google анонсировал запуск нейросети Lumiere, которая умеет генерировать 5-секундные ролики с разрешением 512×512 пикселей. И теперь OpenAI сделала, казалось бы, невозможное — создала генеративную модель Sora с реалистичными минутными роликами.
OpenAI обучал модель на видеороликах в оригинальном разрешении, как FullHD (1920×1080), а не на коротких видео с разрешением 512х512, как это было принято. По этой причине Sora может создавать и вертикальные, и горизонтальные видео, а также уходит от привычных квадратных генеративных роликов.
