Manifold

21/12/2023 ÖMER SÜMER

Görsel Sanatlarda
Üretken Yapay Zekâ

Üretken yapay zekâ [generative AI] olarak bilinen araçların ne olduğunu gayet iyi biliyoruz. En azından yöntemler bizim için bir black box olsa da sonuçlarını her gün sosyal medyada, haber sitelerinde görüyor, hatta kendimiz de kullanıyoruz. “Veriye dayalı algoritmalar ya da üretken yapay zekâ, sanat eseri üretebilir mi?” Bu soruyu cevaplamak güç. Ama şüphesiz Dall-E, Stable Diffusion ya da Midjourney gibi araçlarla üretilen her şeye sanat eseri de diyemeyiz. Üretken yapay zekânın güncel sorunları var ve bu yazıda kısaca bunları ele alacağım.

2018 yılının ekim ayında, yapay zekâyla üretilen bir tablo Christie’s New York müzayede evinde beklenenin kırk katı bir fiyata, hem de 7 dakikadan kısa süren bir açık artırmada, 432.500 dolara satıldı¹. Yağlıboya tabloya benzeyen “Edmond de Belamy’nin Portresi” adlı bu resmin tek özel tarafı, çekişmeli üretici ağ [Generative Adversarial Networks, GAN] adı verilen derin öğrenme yöntemiyle üretilmiş olması. Hatta 19 yaşında bir lise öğrencisi olan Robbie Barrat’ın kaynak kodunu kullanarak Fransız sanat kolektifi Obvious tarafından üretilmişti. Kendi yazdığı kod kullanılarak üretilen bir görselin böyle bir fiyata satılmış olması Barrat’ı da şaşırtmıştı².

Fransız sanat kolektifi Obvious tarafından üretilen “Edmond de Belamy’nin Portresi”

Açıkçası, o tarihten çok daha önce bu algoritmayı geliştiren, makalesini yazan, hatta ardından benzer çalışmalar yapan çok insan varken, bunu bir sanat örneği olarak pazarlayan bir sanat kolektifinin bu parayı kazanmış olması haksızlık duygusu uyandırmıyor değil. Üstelik, bu tarihten de önce 2017 yılının ocak ayında, ben de benzer GAN algoritmalarıyla oynayıp şekildeki köpekleri üretmekle meşguldüm. Boş zamanımda denediğim şey, birbirine çok benzeyen köpek türleri arasında üretilmiş resimleri kullanarak farklı köpek türleri arasında nesne sınıflandırma algoritmalarını iyileştirmekti. Zaten, o günlerde üretken modellerin sanat olarak kullanılacağı günleri öngörmek kolay da değildi. Bugünkü başarıyı, üretken çekişmeli ağlar [generative adversarial networks], varyasyonel oto kodlayıcılar [variational autoencoders, VAE], akış tabanlı üretken modeller [flow-based generative models] ve difüzyon modeller gibi birbirinden farklı yöntemlere borçluyuz. Birbirinin eksiklerini tamamlayan ve üretilen resimlerin daha gerçekçi olmasını sağlayan deneysel keşifler binlerce araştırma makalesine konu oldu.

Çekişmeli üretici ağlar kullanılarak üretilmiş köpek resimleri, Ömer Sümer, 2017

Peki, algoritmalarla üretilmiş bir resim gerçekten sanat eseri olabilir mi? “Edmond de Belamy’nin Portresi” hakkında fikri sorulan Columbia Üniversitesi’nden sanat tarihçisi Frédérique Baumgartner, yapay zekânın niyet ve eser sahipliği konusunda yeni tartışmalar getirdiğini ifade ediyor. Ancak bu yeni değil. Marcel Duchamp’ın 1917’de yaptığı, daha doğrusu “R. Mutt” diye bir köşesini imzaladığı ve bir heykel olarak sergilediği pisuvar bunun erken örneklerinden biri. Burada eleştirilen şey pisuvar değil, o pisuvarın kendi üretimi olmaması. Bunu Duchamp “sanatçının seçimiyle bir sanat eseri olma onuruna yükseltilen günlük objeler” olarak ifade etmiş. Aslında, sanat eserinin formundan devam edecek olursak daha sıra dışı şeyler de var. İlk aklıma gelen, İtalyan sanatçı Maurizio Cattelan’ın 18 karat altından yapılma Amerika adındaki klozet eseri.

Konuyu çok dağıtmadan, yapay zekânın bir fırça ya da boya türü gibi, bir araç olarak kullanılmasının sanat değeri olmalı. Resim olarak pek özel bir yanı olmasa da “Edmond de Belamy’nin Portresi”ne olan ilgiyi bununla açıklayabiliriz.

Üretken yapay zekâ yöntemleri son birkaç yılda inanılmaz gelişti. 2021 yılında OpenAI’nin Dall-E modelini, kısa bir süre sonra Stable Diffusion ve Midjourney izledi. Bugün, verilen bir metinden resim üretebilmek ya da üretilen resmi farklı yollarla parametreye çeviren bir sanatçının bunu daha esnek şekilde kullanması mümkün.

Dall-E modeline Piet Mondrian stilinde küçük karelerden oluşan tablolar yapmasını isteyince çıkan sonuçları görüyorsunuz. 5-6 yıl öncesine kıyasla detaylar içeren, metne dayalı, bir sanatçının tarzını taklit edebilen içerikler üretmek mümkün.

Dall-E ile üretilmiş Piet Mondrian stilinde küçük kareler içeren resimler

Hâlihazırda bir görselin sadece bu araçlarla üretilmesi sanat eseri olmasına yetmese gerek. Yani burada sanatçının yorumu, resimdeki içeriğini hangi bağlamda ele aldığı önem taşıyor. Şüphesiz bir pisuvarda da altın bir klozette de sanat çevrelerince değerli görülen bir şey var. Öyle olmalı ki, Maurizio Cattelan’ın Amerika’sı Guggenheim Müzesi’nde bir heykel olarak sergilendi. Cattelan, bu heykeli Donald Trump’ın ABD başkanlığına adaylığını açıkladığı günlerde yapmış olsa da politik gelişmeleri pek yakın takip etmiyordu. Vermek istediği mesajı ise “200 dolarlık yemek de yesen 2 dolarlık hot dog da, sonuç aynı” diye açıklamıştı³.

En zor konulardan biri de eser sahipliği ve telif hakları. Polonyalı grafik sanatçısı Greg Rutkowski, farklı oyunlar için illüstrasyonlar yapan bir sanatçı. Özellikle de son zamanlarda Stable Diffusion kullanarak yapılan on milyon aramanın 93.000’inde Rutkowski’nin tarzını kullanarak bir şeyler üretmesi istenmiş. Rutkowski bir süre sonra internette basit bir arama yapıldığında, kendi özgün eserleriyle değil, insanların onun ismini kullanarak ürettiği resimlerle karşılaşılacak olmasından endişe duyuyor⁴.

Üretken yapay zekâ modellerinin, eğitim setlerinin ne olduğunu bilmek çok zor. Birçoğu, uygun telif hakları ve lisanslar gözetilmeden internetten toplanmış içerikler. Bu durum çözümü pek de kolay olmayan hukuki sorunlar doğuruyor. Çok satan bir kitabın kapağının üretken modellerle üretilmiş olduğunu ve üretken modelin bir sanatçının eserlerini rızası olmadan kullandığını kabul edelim. Şüphesiz, nasıl yorumlayacağımız, ülkelerin sanat telif yasalarına göre değişkenlik gösterecek bir durum. Ancak, ticari amaçlarla kullanılan üretilmiş içeriklerin gelecekte kanun yapım süreçlerine konu olma ve telif ihlaline konu olma ihtimali var.

Kişisel veri güvenliğini ihlal konusu da sorunun ayrı bir boyutu. LAION-5B adında metin ve resim ikililerinden oluşan, üretken modeller eğitmek için kullanılan veri setinde, nadir genetik bir hastalığı olan bir bireyin sadece klinik amaç için çekilmiş resmi tespit edildi⁵. Bunun ötesinde, eğitim setlerinde üzerinde insanların açık isimleri yazan resimler ve pornografik içeriklere de rastlanan durumlar da var. LAION, üretken yapay zekâ araştırmalarının ve geliştirilen modellerin daha şeffaf olmasını sağlamak için kurulan bir girişim. Benzer sorunların, OpenAI ya da benzeri şirketlerin bilmediğimiz, ticari ürünler olduğu için saklı tutulan eğitim setlerinde de var olduğunu öngörmek mümkün.

Sorunun veri yönetimi boyutu büyük önem taşıyor. Spawning isimli bir girişim, yüklenen bir resmin, bu modellerin eğitildiği veri setlerinde olup olmadığını sorgulayan bir internet sitesi yapmış⁶. Bu şekilde ortaya çıkan çok ihlal söz konusu. Spawning, Stability AI ve Hugging Face ile işbirliği içinde, eğitim setinde kullanması istenmeyen resimlerin bir tür kara listesini oluşturmuş.

Neyin sanat olup olmadığı, sanat eleştirmenlerinin, sanat tarihçilerinin, araştırmacıların ve izleyicinin kararı. Sübjektif bir konu. O yüzden üretken modelleri ne kullanarak ne de kullanmadan ama sıra dışı şekilde yapılmış modern yorumları “Bu sanat değildir” diye reddetmek önyargı olur. Yapay zekâ da en nihayetinde sanatçının kendini ifade etmesi, eserini ortaya koyması için bir araç olabilir. Ancak, telif hakları, kişisel veri güvenliği sorunları, internet ortamındaki görsel kirlilik gibi birbirinden farklı sorunlar mevcut.

Her ne kadar üretken yapay zekâ algoritmaları çok karmaşık olsa da eğitildikleri gerçek resimlerin kullanım hakları gözetilerek daha şeffaf hâle getirilmeleri de mümkün. Bugün için uzak görünse de internet ortamındaki tüm görsel içeriklerin gerçek mi yoksa üretilmiş mi olduğunu ve lisanslarının uygunluğunu gözetecek dosya formatları ya da metadata standartları geliştirilebilir. Böylelikle hem telif haklarına zarar verilmemiş hem de hâlihazırda üretilen içeriklerin gelecekte eğitilecek üretken modellerin eğitim setlerinde yer alması önlenmiş olur.

Görsel sanatlarda üretken yapay zekânın sınırları telif sorununu da aşıyor. Üretilen içerikler, stok fotoğrafı içeren arşivleri ve daha da önemlisi belgesel fotoğrafçılığını tehdit ediyor. Üretilmiş içeriklerin gerçek olduğunu zannetmemiz, karar alma süreçlerini ve demokrasiyi olumsuz yönde etkiliyor⁷.

Bu yazıda, görsel sanatlarda üretken yapay zekâ kullanımının sorunlu bazı yönlerini ele aldım. Algoritmaların ve eğitilen modellerin her geçen gün gelişmesine, daha iyi görsel kalitede ve çeşitliliğe ulaşmasına rağmen, sanat eserlerinin sahipliği üzerinde düşünülmesi gereken bir konu ve veri yönetimi de çok daha şeffaf olmalı. Bu araçların böyle yoğun kullanımı yaratıcılığı artıracak mı, yoksa internet ortamını ressamların ve grafik tasarımcıların üsluplarının ucuz kopyası içerikler mi dolduracak, yakın gelecekte hep birlikte göreceğiz.

{fold içindeki görsel: Ömer Sümer’in “A futuristic digital art showing how AI can be used for scientific discovery” promptu ile Dall-E kullanarak yaptığı deneme.}

1. Gabe Cohn, “AI Art at Christie’s Sells for $432,500”, The New York Times, 25 Ekim 2018.

2. Robbie Barrat, kaynak: X.

3. Matt Stevens, “Museum Told White House: No Van Gogh, but Here’s a Gold Toilet”, The New York Times, 25 Ocak 2018.

4. Melissa Heikkilä, “This artist is dominating AI-generated art. And he’s not happy about it”, MIT Technology Review, 16 Eylül 2022.

5. Laurie Clarke, “When AI can make art – what does it mean for creativity?”, The Guardian, 12 Kasım 2022.

6. Spawning ve Have I Been Trained?

7. Ömer Sümer, “Yapay zekâ demokrasileri nasıl etkileyecek?”, Aposto, 6 Aralık 2023.

görsel sanatlar, Ömer Sümer, sanat, telif hakkı, yapay zekâ