OpenAl tarafından metin üzerinden yüksek kaliteli videolar oluşturmayı sağlayan text-to-video Al modeli Sora tanıtıldı. İşte detaylar!
OpenAl’ın dün tanıttığı araç, şimdilik güvenlik uzmanları tarafından test ediliyor. Korkutucu derecede 60 saniyelik videolar oluşturabilen aracın geleceğiyle ilgili şu an kesin bilgi vermek doğru değil. Çünkü Sora; ön yargı, dezenformasyon ve nefret içeriklerinde uzman kişilerce test ediliyor. OpenAl, aracı kullanıma sunmadan evvel gerekli önlemleri almayı hedeflediğini belirtiyor.
Sora, Gerçekçi Videolar Oluşturuyor
Sora; belirli hareketler, birden fazla özne ve karakterle arka plana dair doğru ayrıntıların olduğu karışık sahneler tasarlayabiliyor. Text-to- video Al modeli, sadece kullanıcılarının komut isteminde ne istediğini anlamıyor. Bunun yanı sıra özne, karakter ve hareketlerin fiziksel dünyada nasıl algılandığı hakkında da bilgi sahibidir.
Model, derin bir dil anlayışına sahiptir. Komutları doğru şekilde yorumlayabiliyor. Aynı zamanda canlı duyguları ifade eden dikkat çekici karakterlerde oluşturuyor. Model, oluşturduğu tek video üzerinde yer alan görsel stil ve karakterle de doğru şekilde birden çok çekim tasarlayabiliyor.
Sora, metin talimatlarından video oluşturmanın yanında hareketsiz bir görüntüden de çeşitli videolar oluşturuyor. Görüntülerin içerisindeki en küçük detayları dahi dikkate alıyor. Model, halihazırdaki bir videoyu alıp genişletme ve eksik kareleri doldurma özelliklerine de sahiptir.
Yalnız OpenAl, modelin zayıf yönlerinin olduğunu da belirtiyor. Model, şu an karışık sahnenin fiziğini doğru şekilde simüle ederken zorlanıyor. Sora, belirli neden-sonuç örneklerini de anlayamıyor. Sora, bir komut isteminin uzamsal ayrıntılarını karıştırmakta da zorluk yaşıyor. Ayrıca belirli kamera yörüngesini takip etmek vb. zamanla gerçekleşen olayların kesin tanımlarında da zorlanmaktadır.
Aslında OpenAl, yukarıda belirtilen problemleri geliştirilebilir. Ancak OpenAl, Sora’yı OpenAl ürünlerine entegre etmeden önce çeşitli güvenlik önlemleri almayı planlıyor. Bunun içinde önyargı, yanlış bilgilendirme ve nefret içeriklerine karşı Sora’yı eğitecekler. Modelle ilgili aynı zamanda bir videonun nasıl oluşturduğunu söyleyen araçlarda tasarlanacak.
Modelin oluşturduğu videolara linkten bakabilirsiniz.
İlginizi Çekebilir: Microsoft Eğitim Girişimi ile O Ülkeyi Yapay Zeka Alanında Lider Yapmak İstiyor!
Bu habere henüz yorum yazılmamış, haydi ilk yorumu siz bırakın!...