Fotoğrafta güzelliği ölçmek

Fotoğraf: Hakan Deliç (Castelmezzano, İtalya)

Yapay zekâ tekniklerinin, uzmanlara özgü alanlarda bile insan performansını aşan sonuçlara eriştiği artık biliniyor. Örneğin go, satranç gibi strateji oyunları, tıbbi tanı problemleri, film veya kitap tavsiye sistemleri makine zekâsının insan performansına üstünlüğünün kanıtlandığı örnek olaylar. Yapay zekânın uygulama alanlarından biri de “güzellik” ölçümü. Algoritmalar aracılığı ile bir fotoğrafın güzelliğini ya da fotoğraftaki güzelliği otomatik olarak ölçmeye yönelik birçok çalışma bulunuyor [1] .

Neden?

Önce, fotoğrafların güzelliğini kim ve niçin otomatik olarak ölçmek ister sorusunu ele alalım. Fotoğraf arşivlerinin günbegün hızla büyüdüğünü, her yıl 2 trilyon fotoğraf çekildiğini, sadece bir günde Facebook’a ortalama 350 milyon resim yüklendiğini göz önüne alalım. Buna paralel olarak iyi fotoğraf, güzel fotoğraf belirleme doğrultusunda bir estetik arayışının gereksinim olarak ortaya çıktığını belirtelim.

Arşiv uygulamalarında güncel hedef artık belirli bir gereksinimi karşılayacak bir imge, bir resim bulmak değil; sorun istenen amaca uygun çok büyük sayıda imge dağarcığından dikkati en fazla çekecek olanı ve en güzeli bulmak. Bir fotoğrafın beğenilirliğini, göze çarpıcılığını belirleyen ölçütler arasında fotoğrafın “güzelliği” en önde gelenlerden birisidir.  Bu ölçüt, foto muhabirliği için olduğu kadar katalog tasarımı, dergi editörlüğü, reklam fotoğrafçılığı için de önemlidir.

Bireysel kullanıcılara gelirsek, hemen hemen herkes kişisel albümlerindeki binlerce dosya arasından iyi fotoğrafları seçmek, düzenlemek ve arşivlemek amacıyla böyle bir yardımcı araca gereksinim duyuyor.  Tam da bu yüzden birçok kamera imalatçısı en baştan, daha fotoğraf çekilirken kameraya fotoğrafın güzelliğini garanti edici yazılımları koyuyor.

Güzellik ve kalite aynı şey değil

Bu noktada fotoğrafın niteliğinin ve fotoğrafın güzelliğinin farklı kavramlar olduğunu hemen belirtelim.  Nitelik, çözünürlük, netlik, kontrast, renk dağılımı, elektronik gürültü gibi birçok ölçülebilir özelliğin sonucudur. İyi bir fotoğraf niteliği elde etmek için, kamera özellikleri, ışığın yön, miktar ve tayfı, pozlandırma, elektronik imge dosyasının nasıl sıkıştırılarak saklandığı gibi birçok teknik faktörü göz önüne almak gerekli [2] . Öte yandan güzelliği belirleyen ana unsur fotoğrafa baktığında kişide uyandırdığı etki,  yol açtığı hoşluk duygusudur. Dolayısıyla güzellik ile nitelik arasında birebir bir ilişki yoktur. Söz gelimi, net olmayan bir fotoğraf, tam da bu nedenden ötürü güzel sayılabilir, ama fotoğraf tekniği açısından kaliteli sayılmaz.

Yeri gelmişken soralım: Bir fotoğrafı cazip kılan nedir? Sadece güzellik midir?

Çekici bir fotoğrafın üç önemli niteliği vardır:

  1. İlginçlik, yani dikkatimizi çekebilmesi ve kendi dünyamızla bir ilişki kurabilmesi;
  2. Şaşırtıcılık, yani beklenmedik bir tema ile görsel deneyimimize bir yenilik katması;
  3. Güzellik, yani içeriğinden bağımsız olarak bileşenlerinin düzenlenişi sonucu bizde bir hoşluk duygusu yaratması.

Bu yazıda fotoğrafın bu üçüncü niteliği üzerinde duracağız, çünkü fotoğrafın beğenilirliğini, göze çarpıcılığını belirleyen en önde gelen ölçüt “güzellik”tir.

Solda:  Glacier National Park, Montana’da Triple falls (Sean Bagshaw) Çözünürlük, netlik, renk paleti, doku gibi teknik özellikler bakımından kusursuz; ama AVA veritabanında yüksek bir güzellik puanı almamış. Kaynak: https://www.outdoorexposurephoto.com/) Sağda: Seydou Keïta tarafından çekilen adsız bir fotoğraf. Teknik olarak gerek objenin çevresi, gerekse fotoğrafın kirliliği bakımından vasat nitelikte, ama estetik niteliği insanı içine çekiyor.

Peki, bir fotoğrafın güzelliğini nasıl saptayacağız?

Bu doğrultuda ilk çalışmalar profesyonel fotoğrafçıların ve fotoğraf uzmanlarının zaman içinde verdiği tavsiyeler ve saptamış olduğu ilkelere dayanır. Bu tavsiyeler, simetri, objelerin konumlanışı, üçte bir kuralına göre çerçevelenmesi gibi kompozisyon kuralları ve kontrast miktarı, ışıklandırma, renk uyumuna ilişkin kurallar şeklinde dile getiriliyor.

Elektronik fotoğraf çağında ise güzelliği doğrudan fotoğrafı oluşturan pikseller üzerinde ölçümler yaparak saptama çalışmaları sürüyor.  Güzeli güzel olmayandan ayırmak ya da 0-10 arasında güzellik puanları verebilmek için bir takım ayırt edici özellikleri, yani öznitelikleri hesaplamak gerekiyor.  Bu öznitelikler arasında, objeleri kuşatan çevritler (konturlar) ve köşeler gibi belirginlik noktaları, insan görme sistemi göz önüne alınarak değerlendirilmiş istatistiksel kromatik özellikler, homojen bölgeleri (bölütler) sıralayabiliriz. Bunlar çeşitli alt düzey imge işleme teknikleri ile hesaplanır.

Böylelikle güzelliğini ölçmeye çalıştığımız bir “test” fotoğrafı, özniteliklerinin sayısal değerlerini içeren büyük bir vektörle ifade edilir.  Diğer yandan uzmanların güzellik puanlamasına tabi tuttukları çok sayıda başka fotoğrafın öznitelik vektörleri ise eğitim kümesini oluşturur. Test fotoğrafının öznitelik vektörü, puanlanmış kümedeki öznitelik vektörleri ile ölçüştürülür. Eğer test fotoğrafının vektörü eğitim kümesindeki bir vektöre çok yakınsa, o fotoğrafın güzellik puanı ile yeterince yakınsa, komşuluğundaki belirli sayıdaki fotoğrafın puanlarının ortalamasıyla etiketlenir. Buradaki yakınlığı ve uzaklığı Öklid uzaklığı, kosinüs uzaklığı gibi uygun bir metrikle belirleriz.

Bu yöndeki araştırmalar 1995-2015 yılları arasında yürütüldü ve bazı uygulamalarda oldukça yararlı sonuçlar verdi. 2015 yılı sonrası güzellik ölçen algoritmalar derin öğrenme ağlarıyla yürütülmeye başlandı ve çok daha başarılı sonuçlar elde edildi [3] .  Çok sayıda nöron katmanını peş peşe koyarak eğiten (dolayısıyla derin) öğrenen ağlar son on yıl içinde istatistiksel bilgi işleme uygulamalarında olağanüstü performanslara erişti.  Dolayısıyla derin öğrenen ağlar estetik değerlendirmelerde de kullanılır oldu. Ancak derin ağların tanıma ve kestirim işlemlerinde eriştikleri üstün başarımlarının iki faturası var:

  • Birincisi, uzmanlar tarafından etiketlenmiş çok sayıda fotoğrafın elde bulunması zorunluluğu ki bu oldukça zahmetli ve pahalı bir iş.
  • İkincisi, bir on yıl öncesinde hayal bile edilemeyecek büyük sayılarda ağ parametresinin öğrenilmesi ve dolayısıyla çok büyük hesaplama gücü gerekliliği.

Bu sorunları aşmak için araştırmacılar fotoğraf güzelliğini otomatik olarak kestirebilmek üzere, sosyal medya sitelerinde yer alan çok sayıda fotoğrafı ve internet kullanıcılarının değerlendirme ya da beğenme puanlarını kullandı. Bunlardan biri DPChallenge [4] (Digital Photography Contest) fotoğraf sitesinden puanlanmış 250.000 fotoğrafın bulunduğu AVA [5] (A Large-Scale Database for Aesthetic Visual Analysis) veritabanı [6]. Buradaki her fotoğrafa, birkaç yüzden az olmayan denekler tarafından, 0-10 arasında değişen estetik puanları verilmiş. Halen üzerinde çalışılmakta olan fotoğraf estetiği puanı kestirici algoritmalar bu veritabanı üzerinde sınanıyor. Söz konusu “güzellik” algoritmaları ya ortalama bir puan veriyor ya deneklerin puanlama dağılımına benzer bir histogram üretiyor ya da bir eşiğin üstünde ve altında kalmaya göre sadece “güzel”, “güzel değil” şeklinde kategorik bir değerlendirme yapıyor.

Bu algoritmalar hâlâ geliştiriliyor, ama yapay zekâ uygulamaları daha şimdiden fotoğrafları iki sınıfa ayırmada insanların verdikleri puanları %80 oranında tutturuyor [7][8].

Güzellik nedir?

Elde edilen sonuçların ışığında bilgisayarların güzelliği insanlar kadar ve hatta onlardan daha iyi değerlendirecekleri günlere doğru gidiyor muyuz sorusu akla gelebilir. Böyle bir sonuca varmak için bu kadar acele etmemek, özellikle geçmişe, klasik çağa kadar uzanıp güzelliğin ne olup olmadığına dair anlayışın gelişimine bakmak iyi olur. Güzellik kavramı üzerinde neredeyse 25 yüzyıldan fazla süre filozoflar kafa yormuş olmalarına rağmen net bir anlayışa varıldığı söylenemez. Bu bağlamda eski çağlardan 15. yüzyıla kadar Yunan filozofların görüşü egemen oldu; onlara göre güzellik nesnenin içkin bir özelliğiydi ve bakan kişinin simetri, oran, harmoni gibi nesneye özgü özelliklerden yola çıkarak eriştiği bir vargıydı. Dikkati çekmek istediğimiz husus, Antik Yunan felsefesinde güzelliğin kökenindeki niteliklerin gözlemciden, gözlem durumu, zamanı ve yerinden bağımsız olarak var olduklarına,  tıpkı Kürelerin Armonisi gibi evrenin kalıcı özellikleri olduğuna inanılmasıydı. Güzelliğin bu tür nesnelci yaklaşımla kavranışı yüzyıllar boyu düşünceye egemen oldu. Klasik diye adlandırılan resim ekolünün ve Rönesans sanatının ortaya çıkışında da bu güzellik nosyonu rol oynamıştır.

Yeniçağ ve Aydınlanma Çağının filozofları, güzelliğin gözlemcinin deneyimlediği bir tepki, dolayısıyla özneye ait bir algı olduğunu ileri sürdüler [9] . Giderek güzelliğin öznenin yaşadığı bir görsel tepki olduğu ve dolayısıyla öznel, durumdan duruma değişen, koşullara bağlı olduğu konusunda hemfikir oldular. Güzelin ne olduğu ve nasıl duyumsandığı kişinin eğitim ve kültür düzeyi, bulunduğu bağlam, ruh hali gibi birçok faktöre bağlı olan öznelci yorumlar benimsendi.  Bu kavram 19. yüzyılda gerek Romantizm akımıyla gerekse İzlenimcilik (Empresyonizm) ekolü ressamlarıyla pekiştirildi. Bir yandan da gene bu yüzyılda doğmaya başlayan psikanaliz bilimi güzelliğin bu yorumuna destek verdi.

20. yüzyıl ise nesnelci ve öznelci görüşlerin çatıştığı, görüşler arasında ikilemin yaşandığı bir çağdır. Çok sayıdaki nörobiyolojik araştırmanın nesnelci ve öznelci akımlardan birine kanıt sağlaması ya da üçüncü bir yorum yolu açması beklenir. Ne var ki hâlâ insanın bir imgeye hangi nörobiyolojik dayanaklara göre karar verdiği açık değildir [10] .

Gözlemciyi de hesaba kalan algoritmalar

O halde, algoritmalara dayalı fotoğraf ve resimlerdeki güzelliği ölçmeye çalışan yaklaşımları nasıl ele almalıyız?

Buradaki kargaşayı şöyle açıklayabiliriz: Güzellik ölçen algoritmalar nesnelci bir yaklaşımla kullanıcılardan toplanan veritabanındaki puanları “evrensel bir doğruymuş” gibi göz önüne alıyor, bu puanı imgenin içkin bir özelliği olarak varsayıyor, ama gözlemcinin görgü ve eğitimini, özelliklerini, ruhsal durumunu hesaba katmıyor.

Birinci zafiyet noktası, estetik uzmanlığı düzeylerini bilemediğimiz internet kullanıcılarının puanlarına gereğinden fazla önem verilmesi. İkinci bir nokta, gözlemcinin kişisel karakteristiklerinin, tercihlerinin, kültürel olgunluğunun bir faktör olarak hesaba katılamayışı. Bu ikinci zafiyet noktasını telafi edebiliriz, örneğin, kişinin medya üzerindeki tercihlerinden yola çıkarak kişinin yönsemelerini ve puan ağırlığını kestirebiliriz.  Nitekim kitap ve filmler için giderek yaygınlaşan tavsiye sistemleri bu hususta bir yol gösterici olabilir.

Vargılar 

Bilgisayar ve yapay zekâ ile fotoğrafın güzelliğini ölçebilmek hoş bir kuramsal problem ama pratikte çözümü birçok güçlük içeriyor. Bu amaçla güzellik sorunsalını bir yandan felsefe, estetik, bir yandan görsel algı ve nöroloji, bir yandan da matematik, bilişim gibi farklı disiplinlerde ele alıp düşünmeye ve çözmeye çalışmalıyız. Bu sayede aralarında pek de diyalog olmayan bu üç disiplin grubunu bir masa etrafında oturtma fırsatı çıkabilir.

Henri Maitre (Telecom Paris- Emeritus öğretim üyesi)
Yorumlayarak çeviren: Bülent Sankur (Bilim Akademisi üyesi,  Boğaziçi Üniversitesi Emeritus öğretim üyesi)


Notlar/Kaynaklar: 

[1] Henri Maître. Qu’est-ce qu’une belle photo ? Essai sur l’esthétique en photographie numérique. 2018. ⟨hal-01864135⟩
[2] Talebi, H., & Milanfar, P. (2018). NIMA: Neural image assessment. IEEE Transactions on Image Processing, 27(8), 3998-4011
[3] Marchesotti, L., Perronnin, F., and Meylan, F. (2013). Learning beautiful (and ugly) attributes. BMVC, 7, 1-11
[4] Digital Photography Challenge – https://www.dpchallenge.com/
[5] A Large-scale Datebase for Aesthetic Visual Analysis –http://www.tamaraberg.com/teaching/Spring_16/slides/ava.pdf
[6] Murray, N., Marchesotti, L., and Perronnin, F. (2012). AVA: a large –scale database for for aesthetic visual analysis. In CVPR: Intern. Conf. on Comp. Vision and Pattern Recognition, 2408-2415
[7] Ma, S., Liu, J., and Chen, C. (2017). A-lamp : Adaptive layout-aware multi-patch deep convolutional neural network for photo aesthetic assessment. arXi: 1704.00248
[8] Doshi, N., Shikhenawis, G., & Mitra, S. K. (2019). Image Aesthetics Assessment using Multi Channel Convolutional Neural Networks. arXiv preprint arXiv:1911.09301
[9] Kant, I. Kritik der Urteilskraft (1790); Hegel, G. Vorlesungen über die Aesthetik
[10] Brown, S., Gao, X., Tisdelle, L., Eicko, S., and Lotti, M. (2011). Naturalizing aesthetics: Brain areas for aesthetic appraisal across sensory modalities. Neuroimages, 58: 250-258

Önceki İçerik28 + 0,24217 Şubat
Sonraki İçerikÇin’den “Sayıların Diktatörlüğü*”ne darbe
Henri Maitre

Henri MAITRE, Télécom Paris üniversitesinde, imge teknolojilerinde uzman olan emerit profesördür. H. Maitre bu kurumda uzun yıllar bölüm başkanlığı ve araştırmadan sorumlu rektör yardımcılığı görevlerini de üstlenmiştir.

Araştırma alanları sayısal holografi, imge işleme, bilgisayarla görü, imge analizinde yapay zekânın kullanımı ve bu tekniklerin uydu imgelerinde, güzel sanatlarda ve tıpta uygulamalarıdır. Halen estetik ve fotoğraf üzerinde çalışmaktadır.

TELECOM-Paris 19 place Marguerite Perey F-91120 Palaiseau – France
E-mail: [email protected]
https://perso.telecom-paris.fr/maitre/