Şirkete göre, Voice Engine lisanslı ses kayıtları ve halka açık veri tabanları ile eğitildi. Dolayısı ile herhangi bir telif hakkı sorunu yok. OpenAI, kötüye kullanım tehlikeleri nedeniyle bu teknolojiyi şu anda geniş çapta kullanıma sunmayı kesinlikle düşünmüyor.
OpenAI’ın kaleme aldığı blog yazısında bu teknolojinin ne için geliştirildiği hakkında bilgilere yer verilmiş. Bunlar arasında görme engelli veya okuma güçlüğü çeken kişilere okuma yardımı sağlamak, farklı dilleri konuşan kişiler için çeviri ve dublaj yapmak, konuşma zorluğu olanlara yardımcı olmak, içerik üreticilerine yeni araçlar sunmak, dil edinimi ve konuşma terapisi gibi alanlarda yeni araştırma imkanları oluşturmak bulunuyor.
Voice Engine nasıl çalışıyor?
Voice Engine, bir kaydı 15 saniye boyunca dinledikten sonra ses tonu ve diğer ses özelliklerini analiz ederek orijinal sese oldukça benzeyen sentetik bir ses üretiyor. Yapay zeka modelinin genel kullanıma açılmaması da zaten sentetik sesin orijinaline çok yakın olduğunu gösteriyor.
Voice Engine’in potansiyel tehlikeleri oldukça korkutucu. Ses taklidi yoluyla dolandırıcılık, kimlik hırsızlığı, yanlış bilgi, dezenformasyon veya deepfake videolar oluşturma gibi riskler mevcut. OpenAI, bu endişeleri ele almak için çalıştığını ve Voice Engine’i halka açık hale getirmeden önce “yetkililer ve uzmanlarla” görüşmeyi planladığını belirtiyor.
Voice Engine’in geliştirilmesi, etik ve yasal açıdan da önemli soruları gündeme getiriyor. Bu tür güçlü yapay zeka modellerinin nasıl kontrol edileceği ve kötüye kullanımdan nasıl korunacağı, önümüzdeki yıllarda ele alınması gereken önemli bir konu olacak. OpenAI’ın blog sayfasında klonlanan seslerle ilgili örnekleri dinleyebilirsiniz.
Kaynak: Donanimhaber – https://www.donanimhaber.com/openai-15-saniyede-ses-klonlayabilen-yapay-zeka-modelini-tanitti–175858