DeepSeek’in gelişen yapay zeka stratejileri, ABD ve Çin arasındaki rekabeti nasıl etkileyebilir?

20 Ocak’ta DeepSeek-R1’in piyasaya çıkışı sonrası çip üreticisi Nvidia’nın paylarında ve birçok teknoloji şirketinin bedelinde keskin düşüş görüldü.

Yaşananlar bazılarınca Çin ile Amerika ortasındaki yapay zeka yarışının “Sputnik anı” ilan edildi Bu türlü bir uyanış Amerikan yapay zeka dalı için güzel sayılabilir. Ancak son gelişmeler birtakım önemli sorular da getirdi.

Oksijen’den Daron Acemoğlu “Yapay zeka için uyanma vaktı: DeepSeek” başlıklı yazı kaleme aldı.

Acemoğlu’nun yazısının tamamı şu formda:

ABD teknoloji dalı yapay zekaya devasa yatırımlar yaptı ve yapıyor. Goldman Sachs’ın kestirimine nazaran, “Önümüzdeki yıllarda mega teknoloji firmaları, kurumsal şirketler ve kamu hizmeti veren kuruluşların yapay zekayı güçlendirmek üzere 1 trilyon doları civarı sermaye harcaması yapması bekleniyor.” Lakin ben de dahil birçok gözlemci ABD’deki yapay zeka yatırımlarının ve geliştirme çalışmalarının rotasını çoktandır sorguluyor.

Kısmen açık kaynaklı modeliyle biraz ayrışan Meta bir yana, bütün şirketlerin birebir usullerle ilerlediği dal bütün yumurtaları tıpkı sepete koymuş görünüyor. Amerikalı teknoloji şirketleri istisnasız biçimde büyüklüğe kafayı takmış durumda. Şimdi ne olduğu muhakkak olmayan “büyütme yasalarına” atıfta bulunarak daha fazla kabiliyete giden tek yolun mevcut modellere daha da fazla bilgi ve bilişim gücü sağlamaktan geçtiğini savunuyorlar. “Tek gereksiniminiz olan şey büyüme” argümanında bulunanlar bile var.

20 Ocak öncesinde Amerikalı şirketler dizilerdeki bir sonraki sözcüğü öngörmek üzere devasa bilgi kümeleri üzerinden eğitilmiş temel modellerin alternatiflerini dikkate almakta isteksizdi. Öncelikleri sebebiyle neredeyse büsbütün insan yahut insan gibisi misyonları yerine getirmeye yönelik difüzyon modelleri ve sohbet robotlarına odaklanıyorlardı. DeepSeek de genel olarak birebir yaklaşımı benimsemesine karşın destekli öğrenme, daha küçük ve tesirli modellerden oluşan uzmanların karışımı (MoE) prosedürü, bilgi distilasyonu ve rafine fikir dizisine dayalı akıl yürütmeye daha fazla yük vermiş görünüyor.

Söylenenlere bakılırsa bu strateji DeepSeek’in çok daha az maliyetle rekabetçi bir model üretmesini sağladı.

Yaşananlar ABD yapay zeka kesimi içindeki “tek fikirliliği” ortaya döktü. Kesimin alternatif, daha ucuz ve daha çok şey vaat eden yaklaşımları görmezden gelmesi ve süregelen abartılar, Simon Johnson ile üretken yapay zeka çağının çabucak öncesinde yazdığımız “İktidar ve Teknoloji” kitabında öngördüğümüz yaklaşımı yansıtıyor. Şu anki temel problem Amerikan yapay zeka kesiminin öbür ve daha da tehlikeli kör noktaları bulunup bulunmadığı. Örneğin Amerika’nın önde gelen teknoloji şirketleri, modellerini daha “insan yanlısı” hale getirme fırsatını kaçırıyor olabilir mi? Bu türlü olduğu istikametinde önemli kuşkularım.

TEPEDEN İNME ATAK İNOVASYONU BALTALAR

Bir de Çin’in ABD’yi geride bırakması sorunu var. Sahiden böyleyse mevcut durum James A. Robinson ile “dışlayıcı kurumlar” olarak tanımladığımız otoriter ve doruktan inme yapıların inovasyonu destekleme konusunda tabandan zirveye ilerleyen sistemlerle baş edebileceği, hatta onları geride bırakabileceği manasına mı geliyor?

Robinson ile “Ulusların Düşüşü” kitabında doruktan inmeci denetimin inovasyonu baltaladığını yazmıştık. Birebir fikirdeyim. DeepSeek’in başarısı bu iddiayı yalanlıyor üzere görünse de dışlayıcı kurumlar idaresindeki inovasyonun kapsayıcı kurumlardakiler kadar güçlü ve güçlü olabileceği tarafında kesin delil olmaktan uzak. DeepSeek ABD’nin ve kısmen Avrupa’nın yıllardır kaydettiği gelişmeler üzerinden hareket ediyor. Kullandığı temel tekniklerin öncüleri ABD’den. Uzmanların karışımı (MoE) modelleri ve destekli öğrenme on yıllar evvel akademik araştırma kurumlarında geliştirilmişti. Dönüştürücü modelleri, niyet zinciri olarak bilinen akıl yürütmeyi ve distilasyonu birinci defa hizmete koyan da Big Tech olarak bildiğimiz Amerikalı büyük teknoloji şirketleriydi.

DeepSeek’in başarısı mühendislik alanında oldu ve ismi geçen metotları Amerikalı şirketlerden daha verimli biçimde birleştirmeyi başardı. Çinli firmaların ve araştırma kurumlarının bir sonraki adımı atıp kendi özgün çığır açıcı teknikleri, eserleri ve yaklaşımlarıyla sahneye çıkıp çıkmayacakları şimdi meçhul.

Dahası, DeepSeek birçok Çinli yapay zeka firmasından da farklı. Çinli şirketler ekseriyetle teknolojileri ya hükümet için ya da hükümet finansmanıyla üretiyor. DeepSeek bugüne kadar hakikaten de göze çarpmadan faaliyet göstermişse epey ilgiden sonra yaratıcılığını ve dinamizmini sürdürmesi mümkün olacak mı? Tek şirketin başarısı Çin’in inovasyon alanında açık toplumları yenebileceğine dair kesin ispat olarak okunamaz.

İşin bir de jeopolitik boyutu var. DeepSeek olayı ABD’nin Çin’deki yapay zeka araştırmalarını dizginlemeye yönelik ihracat denetimlerinin ve öbür önlemlerinin başarısız olduğu manasına mı geliyor? Burada da karşılık net değil. DeepSeek son modelleri olan V3 ile R1’i eski ve daha zayıf çipler üzerinden eğitmiş olsa da ilerleyişini sürdürmek ve büyümek için hala en güçlü çiplere muhtaçlık duyabilir.

Ne var ki Amerika’nın sürdürdüğü ve kimsenin kazanmadığı oyunun uygulanamaz ve yanlış değerlendirilmiş olduğu aşikar. Bu türlü bir stratejinin manalı olabilmesi için her bilişsel vazifede beşerlerle tıpkı seviyeye gelebilecek yapay genel zekaya hakikat ilerlediğimize ve bunu birinci elde edenin muazzam bir jeopolitik avantajı eline geçireceğine inanmak gerekiyor. Lakin hiçbir garantisi bulunmayan bu varsayımlara tutunarak Çin’le birçok alanda verimli olabilecek işbirliğinin önünü kesiyoruz. Örneğin iki ülkeden biri insanların randımanını artıran modeller üretir ve bu model yaygın biçimde kullanılmaya başlarsa bu türlü bir inovasyon iki ülkeye de fayda getirir.

Amerikalı kuzenleri üzere DeepSeek de yapay genel zeka geliştirme niyetinde ve eğitilmesi çok daha ucuza gelen bir model kurmak çok şey değiştirebilir. Fakat geliştirme maliyetlerini bilindik yollarla aşağı çekmek mucize yaratıp birkaç yıl içinde yapay genel zekaya ulaşmamızı sağlamayacak. Yapay genel zekanın kısa vadede erişilebilir olup olmadığı sorusu ortada. Bunun istek edilecek bir şey olup olmadığı üzere daha büyük bir soru da var.

DeepSeek’in modellerini nasıl geliştirdiğine ve görünürdeki muvaffakiyetinin yapay zeka bölümünün geleceği için ne mana söz ettiğine tam olarak hakim olmasak da bir gerçek kesin görünüyor: Sonradan ortaya çıkan Çinli bir firma teknoloji dalındaki büyüklük takıntısını boşa çıkardı. Dalı kapıldığı rehavetten uyandırması bile mümkün.

patronlardunaysi.com

DeepSeek’in gelişen yapay zeka stratejileri, ABD ve Çin arasındaki rekabeti nasıl etkileyebilir?

Benzer İçerikler