Google’ın DeepMind yapay zeka laboratuvarı, videolara eşlik edecek müzikler ve hatta diyaloglar oluşturabilen yeni bir teknoloji üzerinde çalışıyor.
Laboratuvar, Google Veo ve OpenAI’nin Sora’sı gibi diğer video oluşturma araçlarıyla eşleştirilebilen videodan sese (V2A) teknoloji projesindeki gelişmeleri bir videoyla paylaştı.
DeepMind ekibi, blog yazısında sistemin ham pikselleri anlayabildiğini ve ekranda olup bitenler için ses efektleri oluşturmak üzere bu bilgileri metin istemleriyle birleştirebildiğini iddia ediyor.
Yeni yapay zeka aracı sayesinde, sessiz filmler ve diğer sessiz videolar gibi geleneksel çekimler için arka plan müzikleri oluşturmak için de kullanılabilmesi olası görünüyor.
Yapay zekayı nasıl eğittiler?
DeepMind’ın araştırmacılarına göre bu yapay zeka, videolar, ses kayıtları ve seslerin ayrıntılı açıklamalarını içeren açıklamalar üzerinde eğitildi. Bu sayede, yapay zeka belirli sesleri görsel sahnelerle ilişkilendirmeyi öğrendi.
Yeni araçta metin istemi kullanmak isteğe bağlı olsa da, son ürünü mümkün olduğunca doğru ve gerçekçi olacak şekilde şekillendirmek ve iyileştirmek için kullanıcı metin üzerinden yapay zekaya müdahalede bulunabiliyor. Örneğin çıktıyı istediğiniz sesleri oluşturmaya yönlendirmek için olumlu istemler veya istemediğiniz seslerden uzaklaştırmak için olumsuz istemler girebiliyorsunuz. Aşağıdaki videoda izleyeceğini örnekte ekip şu ipucunu kullanmış: “Sinematik, gerilim, korku filmi, müzik, gerilim, ambiyans, beton üzerindeki ayak sesleri.“
Videodaki ses efektleri henüz çok etkileyici ve gerçekçi görünmese de bu alanda bir başlangıç olduğunu ve kısa sürede kendini geliştireceğini de unutmamak gerekiyor.
Kaynak: Chip – https://www.chip.com.tr/haber/google-deepmind-ile-simdi-de-videolara-fon-muzigi-olusturacak_164239.html