OpenAI’dan yeni nesil video üretim modeli Sora 2

OpenAI, video üretim teknolojisinde önemli bir adım atarak Sora 2 modelini duyurdu. Yeni model, fiziksel gerçekçiliği, kontrol edilebilirliği ve ses senkronizasyonu ile önceki sürümlere kıyasla büyük ilerlemeler sunuyor.

Şubat 2024’te tanıtılan ilk Sora modeli, video üretiminde bir dönüm noktası olmuş ve basit davranışların yapay zeka tarafından simüle edilebildiğini göstermişti. Sora 2 ise bu temel üzerine inşa edilerek, gerçek dünya fiziğine daha yakın sonuçlar ve daha gelişmiş kontrol seçenekleri sağlıyor.

Fiziksel gerçeklik ve gelişmiş kontrol

Sora 2, önceki modellerin sıkça yaşadığı “gerçekliği bozma” sorunlarını büyük ölçüde geride bırakıyor. Örneğin, bir basketbol oyuncusu potayı kaçırdığında topun sihirli bir şekilde çembere gitmesi yerine, model gerçekçi bir şekilde ribaundu simüle ediyor. Bu tür fiziksel doğruluk, yapay zekâ tabanlı dünya simülasyonları için kritik bir aşama olarak öne çıkıyor.

Model ayrıca çok aşamalı sahneleri yönetebiliyor, dünya durumunu koruyabiliyor ve hem sinematik hem de anime tarzlarında yüksek doğrulukla üretim yapabiliyor. Sora 2 aynı zamanda arka plan sesleri, konuşmalar ve efektler üreterek daha bütünlüklü bir video-audio deneyimi sunuyor.

“Cameo” ile kullanıcıyı sahneye taşıyor

Sora 2’nin dikkat çeken yeniliklerinden biri de kullanıcıların kendi görüntü ve seslerini modele aktarıp videolara dahil edebilmesi. OpenAI’nin “cameo” adını verdiği bu özellik, kısa bir video ve ses kaydıyla doğrulama yapıldıktan sonra kişilerin kendilerini yapay zeka tarafından üretilen sahnelere yerleştirmesine olanak tanıyor.

OpenAI, bu özelliği yeni duyurduğu Sora iOS uygulaması üzerinden kullanıcılarla buluşturuyor. Uygulama içinde kullanıcılar video üretebiliyor, birbirlerinin içeriklerini yeniden düzenleyebiliyor ve kişisel cameo’larını paylaşabiliyor.

Sosyal deneyim ve güvenlik önlemleri

OpenAI, Sora 2’nin sosyal yönünü öne çıkarırken, kullanıcıların platformda daha sağlıklı vakit geçirmesi için yeni önlemler de açıkladı. Doğal dil ile yönlendirilebilen öneri algoritmaları, kullanıcı kontrolüne önem veren bir akış mantığı ve genç kullanıcılar için içerik sınırlandırmaları bu önlemler arasında yer alıyor. Ayrıca ebeveynler için ChatGPT üzerinden ebeveyn kontrolü seçenekleri de sunulacak.

OpenAI, kullanıcıların kendi “cameo”larını kontrol edebilmesi için tam yetki sağlıyor: kişiler kendi görüntülerinin kimler tarafından kullanılabileceğini belirleyebiliyor ve istedikleri zaman içerikleri kaldırabiliyor.

Sora 2 erişimi ve gelecek planları

Yeni Sora uygulaması ilk etapta ABD ve Kanada’da kullanıma açıldı. Kullanıcılar davet yoluyla uygulamaya katılabiliyor ve kısa süre içinde daha fazla ülkede erişime açılması planlanıyor. Model başlangıçta ücretsiz olarak kullanılabilecek, ancak işlem kapasitesine bağlı bazı sınırlamalar bulunacak. Ayrıca ChatGPT Pro kullanıcıları, “Sora 2 Pro” modeline erken erişim sağlayabilecek.

OpenAI, ilerleyen dönemde Sora 2’yi API üzerinden de geliştiricilerin kullanımına sunmayı hedefliyor. Şirket, bu adımı yapay zekâ tabanlı genel amaçlı dünya simülasyonlarına ve geleceğin robotik sistemlerine giden yolda önemli bir kilometre taşı olarak değerlendiriyor.