Tweet yazar tarafından silindi.
Ama biz her şeyi kaydettik 🙂.
Yapay zeka metin ve görüntülerin ötesine geçerek sanal ortamlar yaratmayı ve bunların içinde hareket etmeyi öğreniyor. Bu yaklaşım dünya modelleri olarak biliniyor: her eylemin bir sonucu olduğu uzayı, nesneleri ve etkileşim kurallarını yeniden yaratan sistemler. Bu paradigma robotik, otonom ulaşım ve karmaşık yapay zeka ajanlarının anahtarı haline gelebilir; ancak şu anda ilerlemeyi yavaşlatan bir sorun var.
Bu makale orijinalinden tercüme edilmiştir. Muhabirimiz tarafından hazırlanan orijinal versiyonu okumak için buraya tıklayın.
Modern modellerin çoğu verileri analiz etmede ve yanıtlar üretmede mükemmeldir, ancak alan ve neden-sonuç ilişkileri için bir "sezgiden" yoksundurlar. Ne yapılması gerektiğini tanımlayabilirler, ancak genellikle bir eylemden sonra ne olacağını anlamazlar: bir nesnenin tam olarak nereye varacağı, neyin çarpışacağı veya çevrenin nasıl değişeceği.
Dünya modelleri bu açığı kapatır. Yapay zekaya kararların güvenli bir şekilde test edilebileceği, rotaların planlanabileceği, hatalardan kaçınılabileceği ve sonuçların tahmin edilebileceği bir eğitim alanı sağlarlar. Robotik, otonom araçlar ve yapay zeka ajanları için bu bir bonus değil, gerçek dünyada güvenilir davranışın üzerine inşa edildiği bir temeldir.
Uygulamada günümüzde iki ana yaklaşım kullanılmaktadır. Birincisi gerçek zamanlı dinamik simülasyondur. Bu durumda, ortam önceden saklanmaz. Bir kullanıcı veya aracı uzayda hareket ettikçe, bakış açısını değiştirdikçe veya nesnelerle etkileşime girdikçe kare kare oluşturulur. Model, fizik ve nesne davranışını dikkate alarak ortamın durumunun nasıl değişmesi gerektiğini sürekli olarak tahmin eder.
Bu yaklaşım yüksek esneklik sunar ve ortamların katı, önceden tanımlanmış senaryolar olmadan oluşturulmasına olanak tanır. Aynı zamanda, önemli hesaplama kaynakları gerektirir, bu nedenle bu tür simülasyonların kararlılığı şu anda sadece birkaç dakika ile sınırlıdır.
Google'ın kısa ömürlü ancak mantıksal olarak tutarlı 3B ortamlar yaratan araştırma platformu Genie 3 ile izlediği yol budur. Benzer bir yaklaşım Meta tarafından fiziksel yapay zeka ajanlarını ve robotları eğitmek için tasarlanan Habitat 3 platformunda da kullanılmaktadır.
İkinci yaklaşım kalıcı, kayıtlı ortamlara odaklanır. Burada model, metin, görüntü veya videoyu geometri, dijital nesneler ve fiziksel süreçleri tanımlayan meta verilerle tam teşekküllü üç boyutlu bir sahneye dönüştürür. Böyle bir dünya kaydedilebilir, diğer yazılım ortamlarına aktarılabilir ve yeniden kullanılabilir.
Bu yön Fei-Fei Li liderliğindeki World Labs tarafından geliştirilmektedir. Marble modeli, sonuçların istikrarının ve tekrarlanabilirliğinin kritik önem taşıdığı mühendislik, bilim ve tasarım görevlerine uygun taşınabilir 3D ortamlar yaratmayı amaçlıyor.
Tüm bu modellerin geliştirilmesi önemli miktarda sermaye harcaması gerektiriyor ve bu durum büyük teknoloji şirketlerinin stratejilerine de yansımış durumda.
Meta Platforms, gelecekteki ürünlerinin temel altyapısı olarak yapay zekaya güvenerek sermaye yatırımlarını 135 milyar dolara çıkarmayı planlıyor. Yapay zeka bölümünü yeniden yapılandırdıktan sonra şirket yeni modeller ve platformlar hazırlarken, reklamcılık işindeki güçlü mali performans bu yatırımları finanse etmesine olanak tanıyor. Piyasa bu stratejiye olumlu yanıt verdi.
Tesla ve Elon Musk'ın xAI'si farklı bir yaklaşım seçti. Şirket, xAI'ye ek yatırımlarla birlikte yapay zeka, otonom sürüş ve robotik için yaklaşık 20 milyar dolar harcamayı planlıyor. Musk, tescilli yarı iletken altyapısına olan ihtiyacı açıkça vurgulayarak modellerden hesaplamaya kadar tüm yığın üzerinde tam kontrole sahip olma iddiasının altını çizdi.
Her iki strateji için de dünya modelleri nihai bir ürün değil, otonom sistemlerde daha fazla ilerlemenin yavaşladığı veya çok riskli hale geldiği bir eğitim ortamıdır.
Pazar için dünya modelleri ne tek başına bir ürün ne de yeni bir tüketici yapay zeka segmentidir. Yatırımcılar bunları, sektörün bir sonraki gelişim döngüsünde şirketlerin rekabet gücünü belirleyecek bir altyapı katmanı olarak görüyor.
Bu uzun vadeli bir bahis. Yapay zekaya alan, hareket ve neden-sonuç ilişkileriyle çalışmayı ilk öğreten şirketler, robotikten endüstriyel uygulamalara ve ulaşıma kadar otonomiyle ilgili tüm alanlarda avantaj elde edecek. Bu nedenle bugün piyasa, sermaye harcamalarındaki keskin artışları ve hızlı geri dönüşlerin yokluğunu tolere etmeye istekli.
Yatırımcıların Meta'nın planlarına verdiği tepki de bunu gösteriyor. Büyük yapay zeka yatırımlarına rağmen, şirketin hisseleri kazançlardan sonra yükseldi - piyasalar, ana işletmenin istikrarı kaybetmeden bu maliyetleri finanse edebileceğine inandı. Bu durumda, dünya modelleri riskli bir deneyden ziyade mevcut bir platformun uzantısı olarak görülüyor.
Musk'ın bahsi farklı bir risk profili taşıyor. Tesla yatırımcıları yalnızca yapay zeka gelişimini değil, aynı zamanda modellerden çiplere kadar dikey entegrasyon girişimini de etkin bir şekilde finanse ediyor. Bu strateji daha pahalı ve daha karmaşık olmakla birlikte, başarılı olması halinde şirkete otonom sistemlerin temel bileşenleri üzerinde tam kontrol sağlayacaktır.
Sonuçta piyasa belirli bir teknoloji üzerine değil, bir yaklaşım üzerine bahis oynuyor. Yatırımcılar, bir şirketin uzun bir yatırım döngüsüne dayanıp dayanamayacağını ve kısa vadeli karlılık üzerinde baskı yaratmadan dünya modellerinin geliştirilmesini finanse edebilecek bir işletmeye sahip olup olmadığını değerlendiriyor.