Yapay zeka modeli GPT-4.5 resmi olarak Turing testini geçti

UC San Diego’nun Lisan ve Biliş Laboratuvarı tarafından yürütülen ve şimdi akran değerlendirmesi basamağında olan çalışmada, iştirakçiler bir insan ve bir yapay zeka ile eş vakitli sohbet etti ve hangi tarafın insan olduğunu belirlemeye çalıştı. Yapay zeka modellerine makul bir kişilik benimsemeleri talimatı verildiğinde, GPT-4.5’in %73 oranında insan olarak değerlendirildiği tespit edildi. Bu oran, %50’lik rastgele varsayım düzeyinin epey üzerinde bulunuyor ve testin geçildiğini gösteriyor.
FARKLI MODELLER DE TEST EDİLDİ
Çalışmada sadece OpenAI’nin GPT-4.5 modeli değil, Meta’nın LLama 3.1-405B modeli, OpenAI’nin GPT-4o modeli ve 1960’larda geliştirilen ELIZA isimli erken devir sohbet botu da değerlendirildi. Araştırmanın baş muharriri Cameron Jones, GPT-4.5 ve LLama modellerinin (kişilik yönlendirmesi yapıldığında) insanlardan ayırt edilmesinin bahttan daha uygun olmadığını belirtti.
Turing testi, İngiliz matematikçi Alan Turing tarafından 1950’de ortaya atılmış ve bir makinenin insan gibisi düşünme yeteneğine sahip olup olmadığını ölçmek maksadıyla geliştirilmişti. Bu testte, bir sorgulayıcı, bir insan ve bir yapay zeka ile yazılı olarak bağlantı kurarak, hangisinin insan olduğunu belirlemeye çalışıyor. Şayet sorgulayıcı yanıtlayıcıları yanlışsız bir halde ayırt edemezse, makinenin insan üzere düşünebildiği kabul ediliyor.
YAPAY ZEKA KİŞİLİK BENİMSEDİĞİNDE DAHA İKNA EDİCİ
Araştırmada, yapay zekalara iki farklı formda talimat verildi:
-Kimliksiz yönlendirme: Yapay zeka sadece “Bir Turing testine katılmak üzeresiniz, gayeniz sorgulayıcıyı insan olduğunuza ikna etmektir” halinde yönlendirildi.
-Kişilik yönlendirmesi: Yapay zekaya, internet ve kültür hakkında bilgi sahibi genç bir kişi üzere davranması söylendi.
Sonuçlar, kişilik yönlendirmesinin büyük fark yarattığını gösterdi. GPT-4.5, kimliksiz yönlendirmeyle %36 oranında insan olarak algılanırken, kişilik yönlendirmesiyle bu oran %73’e yükseldi. GPT-4o ise sadece %21 muvaffakiyet oranı elde etti. Farklı bir formda, eski ELIZA modeli bile %23 oranıyla GPT-4o’yu geride bıraktı.
TURİNG TESTİ GERÇEK BİR ZEKA ÖLÇÜTÜ MÜ?
Bu sonuçlar yapay zekanın insan taklidinde ne kadar ileri gittiğini gösterse de, uzmanlar Turing testinin yapay zekanın gerçek zekasını ölçmek için kâfi olup olmadığı konusunda farklı görüşlere sahip. Google’da yazılım mühendisi olan François Chollet, Nature mecmuasına verdiği demeçte, “Turing testi daha çok bir fikir deneyi olarak görülmelidir” dedi.
Jones da çalışmanın yapay zekaların hakikaten insan gibisi bir zekaya sahip olup olmadığı konusunda net bir karşılık sunmadığını belirtti. Fakat LLM’lerin (Büyük Lisan Modelleri) kısa etkileşimlerde insan üzere davranabildiğine dair değerli ispatlar sunduğunu vurguladı. Jones, bu durumun iş dünyasında otomasyonun yaygınlaşmasına, toplumsal mühendislik ataklarının gelişmesine ve toplumsal tesirler yaratabileceğine dikkat çekti.
Turing testinin yalnızca makineleri değil, birebir vakitte insanların teknolojiye bakış açısını da incelediğini belirten araştırmacılar, gelecekte halkın yapay zeka ile daha fazla etkileşime girdikçe, onları daha düzgün tanıyabileceğini düşünüyor.
patronlardunyasi.com