OpenAI’ın Metinden Video Üretme Aracı Sora’nın Yapabilecekleri, Sizi Büyülenmekle Ürpermek Arasında Bırakacak

OpenAI, DALL-E modelini karşımıza birinci çıkardığında kolay tanımlarla o devir kaliteli sayılabilecek görseller elde edebilmemize şaşırıyorduk. O vakitten bu vakte kadar esaslı formda gelişen görsel üretme araçları DALL-E’yi geride bırakırken ChatGPT’nin doğuşuna ve günümüzdeki GPT-4’e kadar süren gelişimine şahit olduk.

Güncel olarak da GPT-4 kullanan ChatGPT, kullanımı en kolay ve en âlâ sonuç veren model olarak biliniyor. En azından OpenAI, şimdiye kadar ortaya koyduğu en büyük lisan modeli olan Sora’yı çıkarana kadar durum buydu. Alışılmış gecenin bi’ vakti önümüze konulan bu modelin ne olduğunu ve başkalarından farkını birinci bakışta anlamamız güç. Bu yüzden de Sora’nın ne olduğunu, nasıl çalıştığını ve nelere imkân sağlayacağını sizlere anlatacağız.

DALL-E bize nasıl tanımlardan görsel veriyorsa Sora da tıpkı formda görüntü veriyor. Lakin hepsi bu değil.

YouTube video
  • Sora’dan örnek video

Sora, dediğimiz üzere OpenAI’ın şimdiye kadar ürettiği en büyük lisan modeli. Yapabildikleri de görüntü üretimiyle hudutlu değil. Sabit fotoğrafları canlandırıyor, görüntüleri ileri ya da geri saracak formda uzatabiliyor, görüntü haricinde sade fotoğraf üretebiliyor, görüntüleri birbirine bağlayabiliyor, hem görsel, hem görüntü hem de prompt ile tanım alabiliyor, kamera hareketinde daha objeleri ve insanları daha dengeli hareket ettiriyor, nesne karenin dışına çıkıp döndüğünde bile tutarlı görünmesini sağlıyor vb. birçok hususta Sora, benzerlerinin çok ötesinde.

Peki bu model, farklı bölümlerde nasıl karşımıza çıkabilir?

Bağımsız oyun geliştiricileri, Sora sayesinde daha az eforla daha kaliteli orta sahneler yapabilirler.

YouTube video

Sora hem yazı hem görüntü hem metin hem de görsel girişiyle kaliteli görüntü çıktıları verdiği ve bunları dengeli bir biçimde birleştirebildiği için bu alanda iş görecektir.

Hayatını kaybetmiş oyuncuların yeni üretimlerde yer alması, bu yapay zekâ modeliyle daha az iş gücü gerektirebilir.

Sinema tarafına bir öbür katkısı da oyuncuları, tonla makyaj yapmadan gençlendirip yaşlandırma imkânı olabilir.

Stok görüntü ve fotoğraf arayışınızı saniyeler içinde çözebilir.

YouTube video

Normal kaidelerde After Effects üzere programlarda saatlerinizi alacak efektleri Sora ile saniyeler içinde görüntülerinize ekleyebilirsiniz.

YouTube video

Sora, benzerleri üzere küçük boyutlu görüntüler üzerinde çalışmıyor. Onun yerine 1080 x 1920 ve 1920 x 1080 aralığındaki tüm görüntüleri örnekleyebiliyor. 

YouTube video

Bu da farklı platformlar için farklı en/boy oranına sahip görüntüler üretebilirsiniz demek.

Yine oyun tarafına dönersek, Sora ile görüntülerin belli kısımları üzerinde oynayıp nesneleri değiştirebiliyorsunuz.

Bu da ortam yahut obje değiştirmek için maskeleme, alan doldurma üzere yüklerle uğraşmadan sahneleri oluşturup objenizi oraya eklemenizi mümkün kılacaktır. Bu durum tam aykırısı de olabilir, yaratıcılığınıza kalmış. Örneğin üstteki görüntüde farklı ortamlara kayıpsız geçiş yapıldığını görebilirsiniz.

Bağımsız oyun geliştiricilerinden bahsettik. Ama kısa sinema çekenler de olağanda devasa fiyatlara denk gelecek sahneleri gerçekçi bir biçimde oluşturabilir.

Tabii modelimiz, start-up ve girişimcilik tarafındaki pazarlama formüllerini de esaslı formda değiştirecektir.

Arkaya oyun imajları koyup üzerine konuşan içerik üreticileri de Sora’nın imkânlarından faydalanabilir.

Sadece süreksiz imgeler değil, tasviri sıkıntı olan anlatımlar da Sora sayesinde basitçe önümüze gelebilir.

Tabii Sora şu an için pek de harika değil.

Şu an için bu model, birtakım fizik kurallarını işleyemediği için üstteki görüntüde gördüğünüz plastik sandalyeyi yahut kırılması gereken bir cam bardağı tam olarak olması gerektiği üzere işleyemiyor. Lakin alttaki görüntüye bir bakın.

Daha üzerinden 1 yıl geçmemişken bu etaba gelebildiysek, Sora çok kısa vakitte bu sorunları de aşacaktır. Sizin fikirleriniz neler?