Manifold

21/05/2023 ÖMER SÜMER

Yapay Zekâ Araştırmalarına
Altı Ay Ara

Korku ve Tartışmalar

Tarihin farklı dönemlerinde, farklı yerlerde fikirlerin, yeni icatlar ve bilimsel buluşların yasaklandığını biliyoruz. Hatta, tarihe gitmeden bilgiye erişimin ve teknolojik araçların engellenmesine ülkemizde bugün de sıklıkla şahit oluyoruz. Peki ya araçların ötesinde, “araştırma ve geliştirmenin yasaklanması” fikrine ne demeli? Geçtiğimiz ay, GPT-4’ten daha güçlü yapay zekâ modellerinin geliştirilmesinin altı ay boyunca durdurulmasını (ben bunu bir “denetim” ya da “yasak” olarak değerlendiriyorum) öneren bir açık mektup yayımlandı. Bu yazıda, bu mektuptan ve daha genel olarak yapay zekâ temelli araçların potansiyel risk ve tehlikelerinden bahsedeceğim.

Mektubu yayımlayan The Future of Life Institute (FLI), 2014 yılında ABD’de kurulmuş kâr amacı gütmeyen bir araştırma enstitüsü. Misyonunu, güçlü teknolojilerden kaynaklanan küresel felaket ve varoluşsal riskleri azaltmak olarak açıklıyor. Teknolojiden kaynaklı sorunları ele alan ve politika oluşturmayı amaçlayan raporlar yayımlıyor. Danışmanları arasında Elon Musk gibi popüler isimler de var. FLI tarafından 29 Mart’ta bir açık mektup yayımlandı ve bir ayın sonunda otuz binin üzerinde kişi tarafından desteklendi.

“Güncel YZ sistemleri artık genel görevlerde insanlarla rekabet edebilir hâle geliyor ve kendimize şu soruyu sormalıyız: Makinelerin bilgi kanallarımızı propaganda ve gerçek dışı bilgilerle doldurmasına izin vermeli miyiz? Tüm işleri otomatikleştirmeli miyiz? Sayıca bizden üstün ve akıllı, bir noktada, biz insanları modası geçmiş hâle getirecek ve yerimizi alacak zihinler mi geliştirmeliyiz? Uygarlığımızın kontrolünü kaybetme riskini göze almalı mıyız? Bu tür kararlar seçilmemiş teknoloji liderlerine devredilmemelidir. Güçlü yapay zekâ sistemleri ancak etkilerinin olumlu olacağından ve risklerinin yönetilebilirliğinden emin olduğumuzda geliştirilmelidir. Bu güven iyi gerekçelendirilmeli ve bir sistemin potansiyel etkilerinin büyüklüğü ile artmalıdır. OpenAI’nin yapay genel zekâ ile ilgili son açıklaması, ‘Bir noktada, gelecekteki sistemleri eğitmeye başlamadan önce bağımsız inceleme yapmak ve büyük çabalar sarf ederek yeni modeller oluşturmak için kullanılan bilgisayar hesaplamasını sınırlamayı kabul etmek önemli olabilir’ diyor. Biz de aynı fikirdeyiz. O nokta şimdi.

Bu nedenle, tüm YZ laboratuvarlarını GPT-4’ten daha güçlü YZ sistemlerinin eğitimini en az altı ay süreyle derhal durdurmaya çağırıyoruz. Bu duraklama kamuya açık ve doğrulanabilir olmalı ve tüm kilit aktörleri içermelidir. Böyle bir duraklama hızlı bir şekilde yürürlüğe konamazsa, hükümetler devreye girmeli ve bir moratoryum başlatmalıdır.”¹

Mektubun imzacıları arasında önemli isimler de var. 2018 yılında prestijli ACM A.M. Turing Ödülü’nü alan derin öğrenme araştırmacısı Yoshua Bengio, psikoloji alanında New York Üniversitesi’nde fahri profesör olan ve aynı zamanda teknoloji şirketleri kuran girişimci Gary Markus, Türkçeye de çevrilen Sapiens ve Homo Deus isimli kitaplarıyla geniş kitlelere ulaşan İsrailli tarihçi Yuval Noah Harari bunlardan birkaçı.

Geçtiğimiz ay, mektubu destekleyenler, destekleyip bir yandan yetersiz bulanlar ve karşı çıkanlar arasında tartışmalar oldu. Zaten, mektupta da belirtildiği gibi birçok görevde inanılmaz bir performans gösteren büyük dil modelleri bu tartışmayı yoğunlaştırdı. Çünkü ChatGPT gibi büyük dil modelleri aynı zamanda gerçekte olmayan bilgiler de uyduruyor (Buna halüsinasyon da deniyor). Bu durum, büyük dil modellerinin günlük hayatın içinde kullanımında yalan haber ve dezenformasyon gibi farklı tehlikelere kapı arılıyor.

GPT modellerini geliştiren OpenAI’nin internet sitesindeki ifadelerine göre², alignment probleminin farkındalar. Alignment ya da uyumlama, geliştirilen yapay zekâ sistemlerinin, insanın amaçlanan hedefleri, tercihleri ve etik ilkeler doğrultusunda düzenlenmesini ifade ediyor. OpenAI bu soruna özellikle şu üç yönden yaklaşacağını geçtiğimiz sene ifade etmişti: Yapay zekâyı insan geri bildirimini kullanarak eğitmek (pekiştirmeli öğrenme), insan değerlendirmesine yardımcı olmak için yapay zekâ sistemlerini eğitmek ve yapay zekâ sistemlerini uyumlama araştırması yapmak üzere eğitmek.

Birkaç ayda, büyük dil modellerinin farklı kitlelere yayılması ve milyonlarca kullanıcıya ulaşması, potansiyel tehlikeleri daha görünür kıldı. Ancak OpenAI, DeepMind, Google ve Meta gibi büyük teknoloji şirketlerinin yapay zekâ temelli araçları geliştirmesine ve muhtemel riskleri bilmelerine rağmen hâlâ açık bir planları olduğunu söylemek güç.

“Yapay zekânın babaları” diye anılan üçlüden Geoffrey Hinton (bugünkü derin öğrenme yöntemlerine önemli katkılar yapan diğer ikisi Yoshua Bengio ve Yann LeCun), geçtiğimiz günlerde Google’daki görevinden istifa etti. İlerleyen yaşı da istifasında muhakkak etkili olmalı, ancak kendi gerekçeleri ilginç: Geliştirilen yapay zekâ teknolojilerinin dezenformasyona sebep olması, yapay zekâyla otomatize edilen işleri yapan çok sayıda insanın mesleklerini kaybedeceğini öngörmesi ve Google çalışanı olmadan bu riskleri daha açık şekilde dillendirebilmek istemesi.³

Tepkilerde Seçicilik

Mektup üzerine yapılan yorumlardan ve kendi görüşümden bahsetmeden önce, malum, Türkiye’de her politika yorumcusunun hatta gündemi takip eden vatandaşın verdiği reaksiyonu vereceğim ben de: “Zamanlama manidar. Peki, neden şimdi?” Bu soruyu sormanın ve bir parça şüpheci olmanın kimseye zararı yok. Nitekim derin öğrenmenin popülerleştiği son on yılda, veriye dayalı sistemler, birçok alanda muhtemel riskler yeterince sorgulanmadan ticari ürünlerin bir parçası oldu. Yüz tanıma sistemlerinin farklı etnik gruplardan insanların yüzünde farklı performans göstermesi, bu örneklerden biri. Aynı parayı ödeyip aldığımız telefonun ekran kilidini sadece ten rengimiz yüzünden yüz tanımayla açamamak basit görünse de önemli bir sorun. Ne de olsa bu algoritmalar internetten toplanmış veri setlerinden oluşuyor. Yani derin öğrenme temelli yüz tanıma sistemlerinin farklı gruplara önyargılı olacağını öngörmek zor değildi.

Tabii sorun her zaman veride ya da algoritmalarda da değil. ABD’de Harrisburg Üniversitesi’nden bir grup araştırmacı, yüz resimlerinden bir insanın kriminal olup olmadığını tahmin eden bir makale yazdıklarında dünyadan yüzlerce araştırmacı tepki göstermiş ve makaleleri de yayıncı tarafından reddedilmişti.⁴ Maalesef, Batı kamuoyu, araştırma dünyası ve akademik sosyal medya, benzer hassasiyeti her durumda göstermiyor. Yine yüz örneğinden devam edelim. The Washington Post, 2020’nin sonunda Huawei’in Çin’de yüz resimlerinden Uygur tanıma sistemi geliştirdiği ve bunun güvenlik videolarında kullanıldığı bilgisine ulaşmıştı.⁵ Habercilik açısından önemli bir başarıydı bu. Güvenlik kamerasından insanların ırkını tespit etmenin, tahmin edebileceğiniz üzere pek de insani bir amacı yok. Bu teknoloji de soykırımın bir aracıydı ve insanları toplama kamplarına hapsetmek için kullanılıyordu. Şu an aynı şirket Avrupa’da onlarca araştırma merkezine sahip ve benzer konularda araştırma ve geliştirmeye devam ediyor. Burada dikkat çekmek istediğim nokta, bazı risk ve tehlikelerin tepki çekmesi, ama bazılarının hiç önemsenmiyor olması.

Benzer örnekler farklı konularda da var. Mesela bugün bu tehlikeleri dile getiren Geoffrey Hinton, 2016 yılında “Radyologları eğitmeyi artık bırakmalıyız. Beş yıl içinde derin öğrenmenin radyologlardan daha iyi sonuç vereceği çok açık” demiş ve bu çok yankı uyandırmıştı. Bunun aksine, her geçen gün bize tıbbi görüntülemede de insan ve yapay zekâ işbirliğinin önemini gösteriyor. Yani yapay zekâ radyolog ve patoloji uzmanları bu teknolojileri anlamalı, algoritmaların test resimlerinde ya da elektronik hasta kayıtlarındaki sonuçlarını yorumlayabilmeli, ancak insan nihai karar verici konumda kalmalı. Maalesef, otonom araçlarda, savunma sanayisinde ve birbirinden farklı alanlarda, veriye dayalı olan derin öğrenme sistemlerinin riskleri var. Aslında bunlar uzun zamandır biliniyor, ancak araştırma ve endüstri dünyası bir şekilde ekonomideki pastadan astronomik paylar alabilmek için görmezden geldi ve bir hype’in oluşmasına hizmet etti.

Şimdi ise büyük dil modellerini milyonlarca insanın deneyimlemesi gibi farklı şekillerde, riskler daha görünür hâle geldi. Ancak şu noktada açık şekilde tartışılmadan alınacak alelacele bir yasaklama ya da dayatmalar, zaten tüm kazancı arasında bölüşen birkaç aktör ile dünyanın geri kalanı arasındaki uçurumun daha da açılmasına sebep olacak.

Denetimin Zorluğu

Mektupta önerildiği gibi, global ölçekte tüm şirketlerin ve araştırma kuruluşlarının büyük dil modelleri geliştirmemek kararında birleşebilmesi çok zor. Birçok şirket büyük yapay zekâ modellerini bulut sistemleri kullanarak eğitse de bunu kendi imkânlarıyla da yapabilecek şirket sayısı hiç az değil. Batı dünyasında olup bu konularda araştırma ve geliştirme yapanlar böylesi bir ara dönemi boş geçirmeyip belli işleri paravan başka şirketlere de yaptırabilir.

Aslında konu sadece ABD’de bile uygulanması imkânsız olan böyle bir ara dönem (ya da yasak) değil. Mevcut sorunlara dikkat çekilmesi ve büyük kitleler tarafından bu risk ve tehlikelerin tartışılması, içinde olduğumuz hype’dan çıkılıp daha gerçekçi bir zeminde olmayı sağlayabilir. Bugün kullandığımız bir şarj aletinin kablosundan prizlere, elektronikten yapı teknolojilerine, hatta tarım ve hayvancılığa kadar birçok konuda ulusal ya da uluslararası standartlar var. Aynı şekilde, böyle konuların tartışılıyor olması, yapay zekâ temelli ürünlerde de belli kalite standartlarının oluşmasını hızlandırabilir.

Farklı Eleştiriler

Mektuptan bir cümle şöyle: “Yapay zekâ araştırma ve geliştirme çalışmaları, günümüzün güçlü, son teknoloji sistemlerini daha doğru, güvenli, yorumlanabilir, şeffaf, sağlam, uyumlu, güvenilir ve sadık hâle getirmeye yeniden odaklanmalıdır.”

Bu cümlede belirtilen “doğruluk”, yapay zekâ sistemlerinin birincil amacı ve performans ölçüsü oldu. Belki büyük dil modelleriyle ve şirketlerin “yapay genel zekâ”yı hedef olarak koyup bunu amaçlamalarıyla daha karmaşık bir hâl aldı. Aynı yapay zekâ sisteminden program kodu yazmasını, bilimsel bir konuda cevap vermesini ve hatta ilaç geliştirmesini, önceki yazıda denediğimiz gibi mimari hakkında teknik bir yazı yazmasını bekliyoruz. Geliştirilen sistemlerin mühendislik yönünden bir amacı olması gerek. Ancak, dil modelleri için ortada bir değil belki yüzlerce amaç var. Durum böyle olunca, genel kullanım için tasarlanan sistemlerin bu görevlerdeki doğruluğunu test etmek dahi imkânsız bir hâl alıyor.

Doğruluğunu test etmenin böylesi zor olduğu modellerin güvenliğini sağlamak daha da zor. Belki, ChatGPT gibi modellerin hangi veri setleri üzerinde eğitildiklerini bilmiyoruz. Kullandığımızda soru sorduğumuz içerikler eğitim setlerinde de olabilir ve biz bunu bilmediğimiz için cevapları etkileyici bulabiliriz. Veri setlerini ve modellerinin nasıl eğitildiğiyle ilgili tüm detayları bilsek dahi, yorumlanabilirlik, şeffaflık ve sağlamlık çözülmesi gereken daha zor sorunlar. Milyonlarca parametresi olan sistemler bu metinleri biz insanların anlayabileceği mantıksal süreçlerle üretmiyor ve açıklayamıyor.

Daha önce, OpenAI’nin amaçlarından bahsederken uyumlamadan söz etmiştik. Uyumlama ve yapay genel zekânın hedefleniyor olması da diğer bir eleştiri konusu. Sadık olmak ise, ne anlama geldiğini ve nasıl ölçülebileceğini anlayamadığımız ayrı bir kavram. Kime ve neye göre?

Tüm bunların ötesinde resim, video ve yazıya dayanan yapay zekâ sistemleri tüm bu metinleri telif durumlarını gözetmeksizin kullanıyor. Mesela bu yazı içinde bir haber ajansından foto muhabirinin çektiği fotoğrafı kullanacak olayım, fotoğrafın lisansı buna müsaade etmiyorsa ya irtibat kurup izin istemeliyim ya da kullanım ücretini ödeyip satın almalıyım. Böyle, basit bir görselin kullanımında dahi mülkiyetin sınırları hukukta çok net çizilmiş. Büyük dil modelleri, resim ve video üreten sistemler ve dahası, eğitim setlerinin kullanım haklarına dikkat etmiyorlar. Durum böyleyken üretilen bir yazı ya da resim kimin eseri oluyor? Bunu bir intihal olarak mı ele almalıyız? Eğitim setinde kendi verisini kullanılan kişilerin telif alması söz konusu mu? Farklı disiplinlerden uzmanların üzerinde düşünmesi gereken bunun gibi onlarca soru var.

Eleştiriler ve tartışmalar bunlarla sınırlı değil. Emily M. Bender ve Timnit Gebru gibi araştırmacıların da dikkat çektiği, uzun-dönemcilik denen, yer yer bilimkurguya kayan düşünce yapısı diğer bir ayrışma noktası. Zaten FLI da bu ideolojide olan insanlar tarafından kurulmuş ve fonlanmış. Kısaca, insanlığın uzun dönemdeki hedeflerini ve potansiyelini gerçekleştirmek, böylelikle gelecekteki insanların geneline hizmet etmek olarak ifade edebiliriz uzun-dönemciliği. Bu, yapay zekânın da ötesinde iklim krizi gibi bir dizi konuyla ilgili ve ayrı bir yazıda ele almak daha yerinde olacak.

Diğer birçok konuda olduğu gibi, sosyal medyada farklı kişilerin yorum ve eleştirilerini okumak çok yönlü bakabilmeyi sağlıyor. Hatta gayet ilgisiz görünen konularla bağlantı kurulması, insana “Bunu hiç düşünmemiştim” dedirtebiliyor. Buna örnek olarak New York Üniversitesi’nde profesör olan ve aynı zamanda uzun yıllar Meta (Facebook) için de araştırma yapan, derin öğrenmenin önemli isimlerinden Yann LeCun’un tweetini⁶ ve ardından Lübnan asıllı Amerikalı yazar Nassim Nicholas Taleb ve tarihçi Emrah Safa Gürkan’ın ona verdiği cevapları verebilirim: “Osmanlı İmparatorluğu, dini ve siyasi kargaşadan korktuğu için basılı kitapların yayılmasını sınırlandırdı. Bunun sonucunda da Aydınlanma çağını kaçırdı, bilim ve teknolojideki hâkim konumunu kaybetti ve nihayetinde ekonomik ve askeri nüfuzunu yitirdi.” Yann LeCun’un bu tweeti mektupla bağlantılı bir yorum üzerine. Gerçekten, bugün yapay zekâ çalışmalarını durdurmak, matbaayı yasaklamaya çok benziyor. Emrah Safa Gürkan’ın cevabı ise Osmanlı İmparatorluğu’nun matbaayı yasakladığına işaret eden yeterli kaynak olmadığı ve durumun daha çok kültürel bir direnç, belki halkın ucuz kitap okumaya ilgi duymaması üzerine. Aslında şu ana kadar okullarda öğretilen ve çocukluktan beri duyduğum matbaanın yasaklanması hikâyesinin gerçek olup olmadığını hiç düşünmemiştim. Biraz araştırınca Emrah Safa Gürkan’ı destekleyen tarih makalelerine de rastladım. Demek ki birçok konuyu aşırı basitleştirmek, daha dar bir çerçeveden bakmamıza ve sübjektif değerlendirmemize yol açıyor. Aynısı güncel tartışmalar için de geçerli.

Bu yazıda, FLI tarafından yayımlanan açık mektup, genel hatlarıyla tartışılan konular ve kendi düşündüklerimi ifade ettim. Yapay zekânın günlük hayattaki uygulamaları psikoloji, sosyoloji, etik ve hukuk gibi farklı disiplinleri ilgilendiren karmaşık bir konu. Kısaca ifade ettiğim çoğu noktada da mutlak bir doğrudan bahsetmek zor. Kamuoyunda farkındalık oluşması ve bu konuların bilinir ve tartışılır olması önemli. Gelecek yazılarda farklı örnekler üzerinden bu sorunları daha detaylı ele almaya çalışacağım.

{fold içindeki görsel: Robot, Rock’n Roll Monkey}

1. The Future of Life Institute, “Pause Giant AI Experiments: An Open Letter”, 29 Mart 2023. [Alıntı, yazar tarafından çevrilmiştir.]

2. OpenAI, “Our approach to alignment research”, 24 Ağustos 2022.

3. Madhumita Murgia ve Richard Waters, “Why AI’s ‘godfather’ Geoffrey Hinton quit Google to speak out on risks”, Financial Times, 5 Mayıs 2023.

4. Sidney Fussel, “An Algorithm That ‘Predicts’ Criminality Based on a Face Sparks a Furor”, Wired, 24 Haziran 2020.

5. Drew Harwell ve Eva Dou, “Huawei tested AI software that could recognize Uighur minorities and alert police, report says”, The Washington Post, 8 Aralık 2020.

6. Yann LeCun.

büyük dil modelleri, ChatGPT, Ömer Sümer, teknoloji, yapay zekâ