Elon Musk’a Göre Elimizde Yapay Zekâyı Eğitecek Veri Kalmadı: Geliştirilme Süreçleri Tamamen Değişebilir

Hayal edebileceğiniz her şeyle eğitilen yapay zekâ modelleri, gün geçtikçe çok daha düzgün hâle geliyordu. Fakat xAI ile bu alanda da öne çıkmaya başlayan Elon Musk tarafından yapılan yeni bir açıklama, yapay zekânın gelişiminde esaslı değişiklikler olabileceğini ortaya koydu.

X üzerinden bir canlı yayına katılan dünyanın en varlıklı insanı, yapay zekâ modellerini eğitmede kullanılabilecek gerçek dünya datalarının çok az kaldığını düşündüğünü söyledi ve birçok yapay zekâ uzmanının son vakitlerde söyledikleriyle tıpkı fikirde olduğunu gösterdi.

Yapay zekâ modellerinin kendi ürettiği “sentetik veriler” geliştirilmelerinde yeni periyot olacak

Musk tarafından yapılan açıklamada, “Artık temelde yapay zekâ eğitiminde insan bilgisinin kümülatif toplamını tükettik. Bu da geçen yıl oldu.” sözleri kullanıldı. Eski OpenAI yöneticisi Ilya Sutskever’in söylediklerini tekrarlayarak dalın şu anda “zirve veri” denen şeye ulaştığını da ekledi.

Ünlü milyardere nazaran bu dataların azalması, modellerin nasıl geliştirildiğini değiştirecek. Musk, yapay zekâ modellerinin kendi ürettiği bilgilere denen “sentetik veriler” bu araçların geliştirilmesinde yeni devir olacak. Bu formda yapay zekâ kendi kendine öğrenme sürecinden geçmeye başlayacak.

Hâlihazırda Microsoft’tan Meta’ya, OpenAI’dan Anthropic’e kadar birçok şirket modellerini eğitmek için sentetik dataları kullanıyor. Hatta iddialar, 2024’te eğitimde kullanılan dataların %60’ının yapay olarak üretildiğini söylüyor. Örneğin Microsoft’un yeni tanıttığı Phi-4 modeli hem sentetik bilgiler hem de gerçek dünya bilgileri kullanılarak geliştirilmiş.

Sentetik dataların çok daha düşük masraflı olduğunu belirtelim. Örneğin bu formülü kullanan Writer isimli bir şirket, büsbütün yapay kaynaklarla geliştirdiği Palmyra X 004 modeline yalnızca 700 bin dolar harcamış. Olağanda 4,5 milyon dolardan fazla masraf olduğunu düşündüğümüzde ortada önemli fark var.

Tabii sentetik datalar hakkında birtakım dezavantajlar olduğunu da söylemek gerekiyor. Bu sistemin, modellerin yaratıcılığını kaybetmesine ve daha fazla ön yargılı olabileceğini söyleyen birçok uzman var.