Manifold

26/11/2023 ÖMER SÜMER

Nedensellik Devrimi ve Düşünen Makineler

Bu yazıda¹, birkaç yıl önce okuduğum Judea Pearl ve Dana Mackenzie’nin Neden Sorusunun Kitabı - Neden-Sonuç İlişkisinin Yeni Bilimi² adlı kitabından bahsedeceğim. Kitabın yazarlarından Judea Pearl, ABD’li ve İsrailli bilim insanı ve hâlen University of California, Los Angeles’ta (UCLA) bilgisayar bilimleri profesörü olarak çalışıyor. 2011 yılında yapay zekâya getirdiği olasılıksal yaklaşımlar ve Bayes ağları konularındaki katkısıyla Turing Ödülünü kazanmıştı. Pearl’ün bir devrim olarak nitelediği ve geçtiğimiz on yıllar içinde ciddi katkılar yaptığı “nedensellik” öyle önemli bir konu ki yapay zekâyla da ilişkili. Bugünkü popüler akıllı öğrenme algoritmaları birçok konuda nedensel çıkarım yeteneğine kavuşmadan insan zekâsı düzeyine ulaşamayacak.

Başta belirteyim, Neden Sorusunun Kitabı matematik bilgisine ihtiyaç duymadan anlaşılabilir. Zaten diğer yazar Dana Mackenzie bilim iletişimi konusunda uzman. Judea Pearl’ün yıllarını vererek araştırdığı nedensellik konusundaki metni genel okur için ilgi çekici ve anlaşılır hâle getiren kişi Dana Mackenzie olmalı. Konuyu daha da derinlemesine öğrenmek ve nedensellik üzerine düşünmek isterseniz kitabı mutlaka okumanızı tavsiye ederim. Bu yazıda birkaç örnekle kitabın genel çatısını oluşturan nedensellik merdiveninden bahsedeceğim.

Pearl, Âdem ve Havva mitini Eski Ahit’in ilk kitabı olan Yaratılış Kitabı’ndan alıntı yaparak ilk bölümde anlatıyor. Belki de aynı kutsal kitabı kendisi gibi on binlerce İsrailli öğrenci okumuş, ancak onun düşündüğünü düşünmemiştir. Kutsal bir kitaptan bilimsel bir çıkarım yapmak biraz sıra dışı görünse de hiç zorlama değil. Aden Bahçesi’nde (cennet) Tanrı, Âdem’e Bilgi Ağacı’ndaki meyveyi yemeyi yasaklıyor. Âdem’in meyveyi yemesi üzerine “Sana yememeni buyurduğum ağaçtan mı yedin?” diye soruyor. Âdem ise “Meyveyi, benden yarattığın kadın verdi ve yedim” diyor. Sonra benzer soruyu bu kez Havva’ya yöneltiyor Tanrı: “Ne yaptın?” Havva ise yılanın kendisini saptırdığını söylüyor. Pearl’ün dikkat çektiği nüans, Tanrı’nın “Ne?” sorusuna, ikisinin de “nedenler”le cevap vermesi. Yani ikisi de “Evet, elmayı yedim” demiyor.

Yazarın hikâyeden çıkardığı mesaj şu: Dünya kuru gerçeklerden oluşmaz, onların ötesinde neden-sonuç ilişkileriyle örülüdür. Yuval N. Harari’nin Sapiens adlı kitabında geçen “Gerçekte olmayan şeyleri hayal edebilme yeteneği daha iyi iletişim becerisi kazandırıyor” ifadesiyle de ilişkilendiriyor bunu. Yani Âdem’in elmayı yemesinin nedenine “karşı olgusal” bir dünyayı hayal etmeden ulaşmak mümkün değil. Neden ilişkisi hep gerçekte olmayan, soyut hayallerle ilişkili. Bunu birazdan daha detaylı göreceğiz.

Nedensellik Merdiveni

“Korelasyon, nedensellik değildir” ifadesini bir istatistik dersinden ya da başka bir yerden mutlaka duymuşsunuzdur. Korelasyonun anlamını dahi hatırlayabilirsiniz: İki değişken arasındaki doğrusal ilişkinin yönünü ve gücünü ifade eder. Diğer bir ifadeyle, bu iki değişkenin bağımsız olmaktan ne kadar uzaklaştığının ifadesidir. Aslında, istatistik bilimi var olan gözlemler üzerinden çıkarımlar yapar. Bugün bilimin birbirinden farklı birçok dalı da gözlemler üzerine kurulmuştur. İşte bu seviye hem yapay zekâyı insan zekâsı seviyesine taşıyabilmek hem de nedensel çıkarımlar yapabilmek için yeterli değil.

1999-2009 yılları arasında ABD’nin bilim, uzay ve teknoloji harcamaları ile kendini asma ve boğma yoluyla yıllık intihar vakalarının sayılarının değişimi, kaynak: Tyler Vigen

Ciddiyetten biraz uzaklaşacağız, ancak konuyu anlamak için buna ihtiyacımız var. Şekilde bir korelasyon örneği görüyorsunuz. ABD’nin bilim, uzay ve teknoloji harcamaları ile kendini asma ve boğma yoluyla yıllık intihar vakalarının sayıları görülüyor. Buradan “Bilim ve teknolojiye çok bütçe ayrılması insanların daha fazla intihar etmesine sebep oluyor” gibi bir sonuç çıkaramayız. Bu tür korelasyonlara, sahte korelasyon [spurious correlation] adı veriliyor. İşte, istatistik bize nedensellik ilişkisiyle ilgili bir şey söylemiyor. Korelasyonun -1 ile +1 arasında değer aldığını düşününce, 0.99789 çok güçlü bir ilişkiye işaret ediyor.

Nedensellik yönünden baktığımızda ise burada birbiriyle ilişkisini incelediğimiz bir değişkenin etkilediği ve onun tarafından etkilenen başka bir aracı [mediator] değişkenin var olması mümkün. Ya da incelediğimiz her iki değişkeni de etkileyen bir karıştırıcı [confounder] değişkenin olması da mümkün. Tabii ki bu örnekteki gibi birbirinden çok uzak iki değişken arasında belki yüzlerce başka değişken var olabilir.

Buna benzer farklı örnekler var: Biraz geçmişe gidecek olursak, 1926 yılında Pearson ve Yule’ün bir makalesi, İngiltere’de ölüm oranları ile evlilik oranları arasında bir korelasyon bulmuş. Tabii, bu korelasyonu neden sonuç ilişkisi içinde kabul etsek “Allah evlenenleri cezalandırıyor” sonucu da çıkarılabilir. Gerçekte olan ise ölüm oranları düştüğünde kiliseye üyeliğin de düşmesi. Bu da daha az evlilik kaydı olmasına yol açmış. Evlilik ile ölüm arasında nedensel bir ilişki yok. Daha güncel bir örnek, ülkelerin çikolata tüketimi ile Nobel Ödülü almış bilim insanı sayıları arasında korelasyonun 0.791 olması. Burada, olsa olsa konum ya da ülkelerin zenginliği gibi karıştırıcı değişkenlerin var olduğu düşünülebilir. Eğlenceli başka örneklere Tyler Vigen’in web sitesinden ulaşabilirsiniz.

Pearl’ün nedensellik merdiveni, kaynak: Alycia N. Carey ve Xintao Wu, “The causal fairness field guide: Perspectives from social and formal sciences”, Frontiers in Big Data 5 (2022): 892837.

Kitaptaki nedensellik merdivenine dönelim. Üç basamağın ilki, ilişkilendirme [association]. Var olan veriyi gözlemleme üzerine kurulu. Örneğin: “Diş macunu alan müşterilerin diş ipi de alması ne kadar olası?”, “Bu semptom bana hastalık hakkında ne söylüyor?” ya da “Bu seçim anketini değerlendirerek seçimler hakkında nasıl bir varsayımda bulunabilirim?”

Makine öğrenmesi ve derin öğrenme yöntemleri ile onlara dayanan teknolojiler, ilişkilendirme seviyesinde çok iyiler. Var olan büyük veri üzerinde bizim gözümüzle görüp öğrenemeyeceğimiz istatistiksel ilişkileri öğrenebiliyorlar. Ancak, bu seviye hem gerçek dünyanın bir modelinden uzak, hem de esneklik ve uyum sağlama yeteneğinden yoksun.

Buradan bir sonraki basamak olan müdahaleye [intervention] geçelim. Eğer diş macunu fiyatını iki katına çıkarırsak, diş ipi satışlarımız nasıl olur? Bu basamaktan itibaren istatistik ve ona dayanan birçok yapay zekâ yöntemi tıkanıyor. Çünkü çoğu zaman kolayca elimizdeki veri setine gidip hesaplayabileceğimiz bir olasılık değil bu. “Eğer bunu yaparsam ne olur?” ve “Nasıl?” gibi bir değişkene müdahale ettiğimizde ne olacağını anlamaya yönelik sorular, bir nedensellik modeli gerektiriyor.

Sosyal bilimlerde, eğitim bilimlerinde müdahalelere dayalı çok sayıda örnek bulabiliriz. Örneğin eğitimciler rastgele okullar ve sınıflar seçerek, bir kontrol grubunda hiçbir şeyi değiştirmeden sabit tutup diğer gruptaki öğrencilere daha az ödev vererek bir dönem sonunda bu durumun öğrencilerin motivasyonuna ve başarısına olan etkisini inceler. Bunlara “randomize kontrollü denemeler” de denir. Gerçek hayatta her şeyi böyle müdahalelerle test etmek mümkün değildir. İşte, nedensel muhakeme bu yüzden gerekli. Hem diyelim ki mümkün olsun ve bir insan hayatı boyunca her gün Aspirin aldığı ve baş ağrısının geçtiği zamanları kaydetsin. Yine de bu bize baş ağrısını durduran şeyin Aspirin olduğunu söylemez. Yediği şeyler, aldığı iyi bir haber ya da başka bir şey de baş ağrısının geçmesine sebep olmuş olabilir. İşte, bu bizi merdivenin en üst basamağına taşıyor.

Karşı olgusal [counterfactual] muhakeme dediğimiz bu aşama, geçmişe dönüp tarihi yeniden yazmak gibi. Eğer Aspirin almasaydım ne olurdu? Yılan, Havva’yı aldatmasaydı ne olurdu? Diş macunu fiyatlarını iki katına çıkarsaydık, insanlar satın almaya devam eder miydi?

İşte bu aşama da dahil, neler olup bittiğini anlamak için bir nedensellik modeli oluşturmak gerekiyor. Başta da belirttiğimiz gibi, karşı olgusal düşünme somut düşünmeyle çok yakın bir ilişki içinde. Yuval N. Harari’nin bilişsel devrim diye tanımladığı şey efsaneleri, mitleri ve tüm gerçek olmayan kavramları anlamamızı sağlayan evrimsel değişim. Nedensel düşünme, özellikle karşı olgusal aşama buna dayanıyor.

Çiçek Aşısı Öldürür mü?

Covid-19 pandemisi bize, basit gördüğümüz istatistiksel bilginin dahi toplumun önemli bir kısmına ulaşmadığını ve aşının korkulara sebep olduğunu gösterdi. Bu ilk değildi. Bunun bir benzeri de kitapta da anlatılan ve ilk bakışta kafa karıştırıcı görünen çiçek aşısı örneği. Zamanında Avrupa’da tartışmalara da sebep olmuş.

1 milyon çocuktan %99’unun aşılandığını ve sadece %1’inin aşı olmadığını düşünelim. Aşılanan çocuklarda sadece %1 ihtimalle istenmeyen bir reaksiyon görülsün ve bu durum reaksiyonun geliştiği çocukların da %1’inin ölümüne sebep olsun. Bir çocuk aşılanmadığında hâliyle böyle bir reaksiyon oluşma ihtimali yok, ama ellide bir çiçek hastalığına yakalanma ihtimali var. Çiçek hastalığı da beşte bir oranında ölümle sonuçlanır.

Her şeye rağmen aşılanmanın daha mantıklı bir seçim olduğu görünüyor. Biraz önceki olasılıkları uygulayalım şimdi: 1.000.000 çocuktan 990.000’i aşılansın. Aşılanan çocukların 9.900’ünde reaksiyon görülsün. Bu reaksiyon, çocukların %1’inin, yani 99 çocuğun ölümüne sebep olsun. Benzer hesabı aşı olmayan çocuklarda uygulayınca, 10.000 çocuktan 200’ü çiçek hastalığına yakalanır ve 40 çocuk ölür.

Bu tabloya istatistik bilgisi olmadan bakınca, “Aşılanıp ölen çocuk sayısı (99), aşı olmayıp çiçek hastalığından ölen çocuk sayısından (40) daha fazla” diyebiliriz. Öyleyse, çiçek aşısı hastalıktan daha ölümcül mü diyeceğiz? Tabii ki, hayır! Gözleme dayalı seviyede, iki grupta da ölüm sayılarını toplam popülasyona oranlayıp ölüm istatistiğine bakınca bile aşı olan grubun ölüm oranının daha düşük olduğunu görürüz (99/999.000 ve 40/10.000).

Ama biz nedenselliği ve karşı olgusallığı kullanalım. Eğer bu %99’luk grup (yani 990.000 çocuk) aşı olmasaydı ne olurdu? Aynı olasılıkları kullanıp hesapladığımızda 3.861 çocuğun hayatına mal olacağını görüyoruz. Öte yandan gerçek senaryoda %99’u aşı olup (99), %1’i de aşı olmayıp (40), toplam 139 çocuğun ölmesi söz konusu. Karşı olgusal soruyu cevaplamak ve öyle değerlendirmek, aksi senaryoda çok daha fazla çocuğun hayatını kaybedeceğini gösterdi.

Aşı örneği için nedensellik diyagramı: Aşı yararlı mıdır yoksa zararlı mı? Hazırlayan: Ömer Sümer

Kitaptaki diğer örneklerde de şekildeki gibi bir diyagram kullanmış. Bu noktalarla ve oklarla gösterilen ifade, aslında matematiksel bir ifade. Yukarıdaki aşı örneğinde gördüğümüz durumu açıklayan nedensel bir modelin diyagramı. Bunun gibi nedensel bir modelde değişkenlerin birbiriyle ilişkisi doğrusal ya da doğrusal olmayan, deterministik ya da olasılıksal türde olabilir.

Bu Kitabı Neden Okumalısınız?

Bu yazıda, Judea Pearl ve Dana Mackenzie’nin Neden Sorusunun Kitabı’nda bahsettiği birkaç örnekten yola çıkarak nedensellik merdivenini anlattım. Kitap, bu yazıda ele aldıklarımıza benzer, birbirinden ilginç örnekler üzerinden müdahale ve karşı olgusal çıkarım aşamalarını detaylandırıyor.

Profesör Pearl’ün geliştirdiği Bayes ağları, bir uçak kazasından gelen ceset parçalarından DNA’sı bozulmuş örneklerin ailelerle eşleştirilmesi ve tanımlanmasında kullanılmış. Daha çok yürümek emeklilerde ölüm oranını düşürür mü? Sigara içmek akciğeri kanserine sebep olur mu? Bunlar gibi örnekler üzerinden karıştırıcı değişkenler de ele alınıyor. Ele alınan birçok konu ilgi çekici, tarihi örneklerle açıklanıp grafik modeli verilmiş. Tüm bunlar okumayı kolay ve oldukça keyifli bir hâle getiriyor. Kitapta, nedensel çıkarımda kullanılan ve yapılan bir müdahalenin nedensel etkisini hesap etmeye yarayan do-calculus yöntemi de açıklanıyor.

Kitabın son bölümüne kadar yazarlar adım adım nedensel çıkarım konusunda uzun yıllara yayılan çalışmalarını anlaşılır bir dille aktarıyor. Son bölümde ise büyük veri, yapay zekâ ve büyük sorular başlığıyla, tüm bu araştırmanın ve bugünün teknolojilerinin bir karşılaştırmasını yaparak bir gelecek perspektifi çiziyorlar. Bugün para kazandıran ve birçok problemi çözen bu sistemler derin öğrenmeye dayanıyor. Belki kısıtlı bir alanda kalınca istatistik ve derin öğrenme yeterli gibi görünebilir ama ekonomiden genetiğe, ekolojiden jeolojiye ve iklim bilimine kadar nedenselliğe ihtiyacımız olan onlarca alan var.

Yapay zekâ çalışan araştırmacılar kabaca iki kampa ayrılmış diyebiliriz. İlki, öğrenmeye dayalı sistemlerin şeffaf, hareketlerinin açıklanabilir ve matematiksel garantilerinin olmasını isteyenler. Diğer grup da istenen problemleri çözsün ve çalışsın diyenler. Profesör Pearl ilk görüşü benimseyenlerden. İşte, bu son bölümde taşınabilirlik, kararların rasyonelleştirilmesi, özgür irade gibi boyutlardan mevcut yapay zekâ sistemlerinin eksiklerini ve nedenselliğe olan ihtiyacı ele alıyor. Karamsar bir bakış açısı yok; düşünen, iyi ile kötüyü ayırt edebilen makineler inşa edebileceğimize olan inancını ifade ediyor. Temel bilimler ve mühendisliğin herhangi bir alanında çalışıyorsanız, bu kitap bir popüler bilim kitabı olsa da ilgili konulara ve referanslara gitmenizi sağlayabilir. Nedenselliğe ihtiyaç duyan bir alanda çalışıyorsanız dahi, felsefi olarak bu konuların farkında olmak, sağlık teknolojileri, çevre ve iklim değişikliği gibi farklı konulardaki gelişmelere daha geniş bir açıdan bakmanıza yardım edecektir.

1. Geçen hafta bir arkadaşım birkaç tane ayva verdi. Hiç sormadım da marketten mi aldı, yoksa bir bahçeye mi gidip topladı diye. Hemen ayva tatlısı yaptım. Şeker miktarını biraz az tutup karanfil ve birkaç parça kuru tarçınla kaynattım. Üstüne de küçük bir parça kaymakla kışın en sevdiğim tatlılardan biri hazır oldu. Tatlıyı kaynatırken, Mirkelam’ın Elma Değil Ayva şarkısı dilimin ucuna geldi. Açıkçası, bir pop şarkısının bana bir yazı konusu vereceğini düşünmezdim, ama oldu. “Âdem döndü sonra Havva’ya / Hımm, ne güzelmiş bu elma / Âdem bir müddet düşündü sonra / Elma değil bu yediğimiz galiba / Ayvaaa” Yasak elma hikâyesini kutsal kitaplardan okuyup farklı sonuçlar çıkarmak mümkün. Benim aklıma ilk gelen, Judea Pearl ve Dana Mackenzie’nin yazdığı Neden Sorusunun Kitabı’nın ilk bölümündeki Âdem ve Havva hikâyesiydi. Bundan önceki birkaç yazıda, günümüzün popüler yapay zekâ sistemlerinin başarılı ve eksik yönlerini yazdım. Nedensellik, önemli bir eksik. Pearl ve Mackenzie’nin kitabı da mutlaka okunmayı hak ediyor. Bu konuda doğrudan araştırma yapmadığım için, kendi yazacağım şeyler pek özgün olmayacaktı. Ben de birkaç örnek paylaşıp kitap incelemesi gibi yazmayı tercih ettim.

2. Judea Pearl ve Dana Mackenzie, The Book of Why: The New Science of Cause and Effect (New York: Basic Books, 2018). Profesör Judea Pearl’in kişisel websitesinden ilk iki bölümünü okuyup devamı için kitabı satın alabilirsiniz. Kitabın Türkçesi Murat Havzalı’nın çevirisiyle 2020’de Ginko Bilim Yayınları tarafından yayımlanmıştır.

nedensellik, Neden Sorusunun Kitabı - Neden-Sonuç İlişkisinin Yeni Bilimi, Ömer Sümer, yapay zekâ