ChatGPT’nin geliştiricisi OpenAI, bugün dünyayı kasıp kavuran yapay zekâ modellerine bir yenisini daha ekledi. “Sora” ismi verilen model, metinden görüntü oluşturabiliyor. Şirketin paylaştığı örnek imajlar ise modelin korkutucu derecede yeterli olduğunu gösteriyor.
Sora, şu anda dezenformasyon, nefret içerikleri ve ön yargı üzere bahislerde uzman olan bireyler tarafından test ediyor. Şirket, modeli kullanıma sunmadan evvel gerekli güvenlik adımlarını atmak istediğini söz ediyor.
Sora, metin komutlarıyla 60 saniyelik gerçekçi görüntüler oluşturabiliyor
https://twitter.com/twitter/status/1758192957386342435
“Güzel, karlı ve hareketli Tokyo kenti. Kamera, hoş karlı havanın tadını çıkaran ve yakındaki tezgahlarda alışveriş yapan birkaç kişiyi takip ederek kentin hareketli caddesinde ilerliyor. Muhteşem sakura yaprakları kar taneleriyle birlikte rüzgarda uçuyor.”
*Videoyu görüntüleyemiyorsanız buradaki kontağa tıklayın.
Başta da belirttiğimiz üzere Sora bir metinden görüntü oluşturma modeli. Yani yazdığınız bir metin komutunu görüntüye çevirebiliyor. OpenAI, Sora’nın 60 saniye, yani bir dakikaya kadar görüntü oluşturabildiğini açıkladı.
Bu görüntülerin görsel kalitesinin yüksek kalabildiği, son derece detaylı olduğu, karmaşık hareketleri içerdiği ve canlu hislere sahip birden fazla karaktere yer verebildiği tabir edildi. Aslında görüntülere baktığımızda korkutucu derecede gerçekçi olduğunu görebiliyoruz. OpenAI’ın yaptığı açıklama şu formda:
Sora, güvenlik için test edenlerin yanı sıra sanatkarlar, sinemacılar ve dizayncılar üzere şahıslara de açılacak. Bu şahıslar, yapay zekâ aracını kullanarak geri bildirim sağlayacaklar ve modelin daha gelişmiş hâle gelmesine katkıda bulunacaklar.
Görsellerden de görüntü üretebiliyor
https://twitter.com/twitter/status/1758192960116785459
*Videoyu görüntüleyemiyorsanız buradaki bağlantıya tıklayın.
Bunun dışında OpenAI, yalnızca metinden değil, görsellerden de görüntü oluşturabildiğini ekledi. Şirketin Açıklamasına nazaran hâlihazırdaki bir görseli alıp ondan görüntü üretebiliyor. Bu görüntüde da küçük ayrıntılara ve detaylara dikkat ediyor.
Bazı zayıf tarafları de yok değil
Tabii ki model şimdi test kademelerinde olduğu için zayıf tarafları de var. OpenAI da bunu kabul ediyor. Şirket, bazen karmaşık sahnelerin fiziğini doğru bir formda simüle etmekte zorlanabileceğini ve neden-sonuç örneklerini anlayamayabileceğini söylüyor.
Mesela oluşturulan bir görüntüde bir kişinin kurabiye ısırdığını lakin sonrasında bu kurabiyede rastgele bir ısırık izi kalmadığını görebiliriz. Ayrıyeten sol ve sağ üzere ayrıntıları karıştırabileceğini ve kameranın gidişini takip etmek üzere vakit içinde meydana gelebilecek olayları açıklamada zorlanabileceği söyleniyor.
Yine de örnek görüntülere baktığımızda Sora’nın ne kadar çok potansiyele sahip olduğunu görebiliyoruz. Yapay zekâ modelleri konusunda ihtilal yaratma potansiyeline sahip olduğu aşikar. Herkese geldiğinde neler yapabildiğini göreceğiz.
Sora ile üretilen başka görüntü örnekleri
https://twitter.com/twitter/status/1758192961496760376
*Videoyu görüntüleyemiyorsanız buradaki bağlantıya tıklayın.
https://twitter.com/twitter/status/1758192964222988506