Bu günlerde sosyal medyada “yapay zekâ insanların politik görüşlerini yüzlerinden anlıyor” gibi bir haber gözünüze çarpmış olabilir. George Orwell’in 1984 romanını okumuş herkesin ilk duyduğunda irkileceği bir haber… Böyle bir teknoloji – eğer varsa- sisteme açıktan muhalefetin imkansız hale geldiği bir distopyada otoritenin elinde büyük bir baskı aracına dönüşebilir. Fakat bu teknoloji gerçekten var mı? Varsa nasıl ve hangi koşullar altında çalışır?
Yapay zekâya dayalı yüz analizi üzerinde uzun yıllardır çalışılan bir konu. Bir bilgisayarın kişiyi yüzünden tanıması (yüz biyometrisi) ile ilgili ilk doktora tezini Takeo Kanade 1973’te, Kyoto Üniversitesi’nde yazmış.[2]Kanade, T. (1973). Picture processing by computer complex and recognition of human faces. Ph.D. Tezi, Kyoto Üniversitesi. O yıllarda henüz bunun bir ticari uygulaması yok, yüz tanıyarak ekran kilidi açılan cep telefonları çok uzakta. Kanade tezinde tek bir renkli yüz görüntüsünün saklanabilmesi için her biri 730 metrelik manyetik rulolardan 1000 tanesine ihtiyaç var diye sızlanıyor…
Bilgisayarların belleğinin ve işlem gücünün artması ile yüz işleme çözülebilir bir problem haline geliyor, derin öğrenme yaklaşımları ve GPU çiplerindeki ilerlemeler ile artık bir milyar insanı birbirinden ayırabilecek bilgisayar sistemlerinden söz edebiliyoruz. Yüz tanıma dışında başka uygulamalar da geliştiriliyor, yüz görüntülerinden duygusal ifadelerin tanınması 90’lardan beri çalışılan bir konu, görüntüdeki herkes gülümseyince fotoğraf çeken fotoğraf makinesi uygulamaları bu sayede gerçekleşiyor. Şimdilerde büyük sosyal medya şirketlerinin daha video çekilirken yüz tespiti yapıp farklı filtrelerle yüz görüntüsünü değiştiren, makyaj ve aksesuar ekleyen, yüzü başka bir yüz görüntüsüne dönüştüren uygulamalar geliştirdiğini görüyoruz.
İnsan yüzünden biraz daha zor anlaşılacağını düşündüğümüz niteliklerin arasında kişilik özellikleri, cinsel yönelimler, politik görüşler ve bunun gibi, aslında yüz görüntüsü ile ilgili olmamasını beklediğimiz pek çok özellik var. Max Frisch’in tiyatro eseri Andorra’nın (1961) meşhur bir sahnesinde bir “Yahudilik müfettişi” görürüz; yüz fizyonomisine bakarak bir kişinin Yahudi mi, yoksa Ari mi olduğunu tespit eder bu kişi. Yüz analizinin menfur kullanımlarından birisi… Fakat etnik kimlik, yüz analizi ile nispeten kolaylıkla anlaşılabilecek bir kategoridir. Zira farklı etnik grupların yüz morfolojisi (genetik sebepler yüzünden) değişik olabilir. Japonya’ya bir yıllığına çalışmaya gittiğimde o sırada ilkokula giden oğlum bana “Ya benim Japon olmadığımı anlamazlarsa ve benimle Japonca konuşurlarsa?” diyerek endişesini belirtmişti.
Bir Japon öğrencinin, yahut bir bilgisayar sisteminin Japon ve Türk etnik kökenli kişileri birbirinden ayırması aslında çok da zor değil, elbette. Örneğin Çin’de hükümetin yüz tanıma teknolojisi kullanarak Uygur Türklerini izlediği biliniyor.[3]How China is Using A.I. to Profile a Minority (2019) https://www.nytimes.com/2019/04/14/technology/china-surveillance-artificial-intelligence-racial-profiling.html Bu amaçla yaratılan sistemler farklı etnik kökenden yüzleri örnek olarak alıp, bunları doğru olarak sınıflara ayıracak özniteliklerin bulunması için “denetimli öğrenme” dediğimiz bir yaklaşımı kullanıyor. Her yüz görüntüsünü çok boyutlu bir uzayda bir nokta olarak düşünün, bu yaklaşımda “öğrenme” dediğimiz iş yüz gruplarını bu uzayda birbirinden ayıran düzlemleri bulmaya karşılık geliyor.
Bilgisayarların yapabileceğini bildiğimiz her şeyi bilgisayarlara yaptırmalı mıyız? Burada ciddi etik problemler yok mu?
Özellikle de bilgisayarın verdiği kararın bir insan için ciddi sonuçları olacaksa, burada bir noktayı atlamamak gerekiyor. Bilgisayar sistemi iki grubu çok boyutlu öznitelik uzayında ayıran düzlemi ararken yaptığı hataların toplamını azaltmaya çalışıyor. Ama bu hatalar “karşılaştırılabilir” olmayabilir. Mesela Amerika’da hapis cezası almış bir kişinin daha sonra suç işleyip işlemeyeceğini kestirmeye çalışan COMPAS sistemini düşünün,[4]Larson, J., Mattu, S., Kirchner, L., Angwin, J. (2016) How we analyzed the COMPAS recidivism algorithm, https://www.propublica.org/article/how-we-analyzed-the-compas-recidivism-algorithm bu sistemin suç işleyecek bir kişiye “suç işlemeyecek” demesi ile işlemeyecek bir kişiye “suç işleyecek” demesi aynı şey değil. Aslında gelecekte bir insanın suç işleyip işlemeyeceğini kestirmeye çalışmak için yapay zekâ kullanmak tamamen yanlış… Böyle bir sistemin yapacağı hata nadir de olsa kabul edilemez bir hata. Dahası, yapay zekâ sistemlerini eğitirken insanlardan gelen değerlendirmeleri kullandığımız için bu sistemler ufak fikir ayrılıklarını ve önyargılarını bile alıp daha büyük bir ölçeğe taşıyabilir, toplumdaki kutuplaşmaları derinleştirebilir. Joy Buolamwini ve Timnit Gebru 2018’de yaptıkları bir çalışmada piyasadaki yüz tanıma algoritmalarının koyu ten rengine sahip kadınlarda beyaz ten rengine sahip erkeklere kıyasla çok daha kötü çalıştığını ortaya koydu.[5]Buolamwini, J., & Gebru, T. (2018). Gender shades: Intersectional accuracy disparities in commercial gender classification. In Conference on fairness, accountability and transparency (pp. 77-91). PMLR. Bu aslında toplumda var olan bir ayrılığın yapay zekâ sistemlerine yansımasıydı. Yapay zekâ sistemlerinin eğitildiği veritabanlarında beyaz erkekler çoğunluktaydı, bu demografik özelliklere sahip bireyler toplumda genel olarak daha görünür olduğu için veritabanları üzerinden sistemler de bir tür ayrımcılığı “öğreniyorlardı”.
Peki yüz görüntüsü bir insanın politik görüşünü açık edebilir mi?
Kendi kendimize şöyle bir deney yapabiliriz. TBMM’nin resmi sitesinde 1920 yılından beri bütün milletvekillerinin bilgilerini içeren “Milletvekili Albümü” yer alır. Bu albümlerden birisini indirelim ve fotoğraflara bakalım. Acaba bu fotoğraflardan milletvekillerinin hangi partinin üyesi olduğunu tahmin edebilir miyiz? Eğer biz edebiliyorsak, yapay zekâ da bu işi yapabilir, zira bugün yapay zekâ dediğimiz sistemlerin temel fonksiyonu otomasyondur. Biz hangi niteliklere bakarak sınıflandırma yapıyorsak, yapay zekâ da benzer bir mantıkla çalışabilir. Örneğin partilerin cinsiyet dağılımı farklıysa, yahut bir partinin üyeleri arasında belli bir bıyık veya sakal tarzı popülerse, bu nitelikleri kullanarak bir tahmin yürütebilir. Bu deneyi biraz daha ileri götürerek parti değiştirmiş milletvekillerinin yüz görüntülerinin değişiklik öncesi ve sonrası karşılaştırmasını da yapabiliriz.
Korelasyon ve nedensellik
Burada iki özellik arasında kurulan bağlantı korelasyona dayanıyor. Dolayısıyla aslında istatistiksel bir durumu ortaya koyuyoruz. Yüz görüntüsünden sosyolojik veya psikolojik nitelikleri kestirmeye çalışan pek çok çalışma için de bunu söyleyebiliriz. Mesela yüz görüntülerinde gözlük tespit edilen kişilerin ortalamada gözlük tespit edilmeyen kişilere göre daha eğitimli olduğunu ortaya koyabiliriz belki, ama herhangi bir birey için sadece gözlüğe bakarak eğitim durumunu saptayamayız. Yani birey seviyesinde bir çıkarım yapmak doğru değil, sadece aynı anda pek çok kişiye baktığımızda ortalamalar ile ilgili bir şeyler söyleyebiliriz. Gazetelerde gördüğümüz “her gün zeytin yedi, yüz yaşına kadar yaşadı” gibi haberler de bu tip mantık hatalarından kaynaklanıyor.
2021’de Kosinski tarafından yapılan bir çalışmada Amerika, Birleşik Krallık ve Kanada’dan yaklaşık bir milyon katılımcının yüz görüntüsü ve politik tercihleri toplanmış, bu ikisi arasındaki ilişki incelenmiş.[6]Kosinski, M. (2021) Facial recognition technology can expose political orientation from naturalistis facial images, Scientific Reports, 11(1), 1-7. Liberal ve muhafazakar olarak iki ana sınıfa ayrılan katılımcıların yaş ve cinsiyet demografilerinde önemli farklılıklar olduğu için, sadece kişinin yaşını ve cinsiyetini tahmin edebilen bir yapay zekâ sisteminin, bu demografik bilgi ile korelasyonları kullanarak politik yönelimi bir ölçüde kestirebileceği saptanmış. Mesela Kanada’da liberallerin dağılımı %67 kadın, %33 erkek olarak görülüyor, yapay zekâ sistemi bir kadın yüzü gördüğünde doğrudan “liberal” derse yüzde ellinin üzerinde bir başarım sergileyebilir. Çalışmada Kosinski bir derin öğrenme sistemi kullanarak elindeki bütün veritabanı üzerinde %72’lik bir başarıya ulaşıyor. Aslında çok da parlak bir sonuç değil, sistem her dört kişide bir hata yapıyor. Yine de aynı problemi insanlara versek sadece %55 başarıyla tahmin yaptıkları düşünülürse, fena bir sonuç değil. Kosinski benzer sonuçları kişilik özellikleri ve cinsel yönelim için de alabileceğimizi söylüyor.
2021’de Blavatskyy bir çalışmasında eski Sovyet ülkelerindeki politikacıların yüz görüntülerinden Vücut Kitle Endeksi (Body Mass Index – BMI) kestirerek, obez politikacıların sayısı ile ülkedeki yolsuzluk arasında bir ilişki kurulabileceğini iddia ediyor.[7]Blavatskyy, P. (2021). Obesity of politicians and corruption in post‐Soviet countries. Economics of Transition and Institutional Change, 29(2), 343-356. Bu çalışma “güldürürken düşündüren”, aykırı niteliği ile Ig Nobel Ödülü almış.[8]The 2021 Ig Nobel Prize Winners, https//improbable.com/ig/winners/#ig2021 Yüz görüntüsünden bir insanın kitle endeksini kestirmek birey seviyesinde yapılabilir,[9]Kocabey, E., Camurcu, M., Ofli, F., Aytar, Y., Marin, J., Torralbe, A., ve Weber, I. (2017) Face-to-BMI: Using computer vision to inter body mass index on social media, Proceedings of the international AAAI Conference on Web and Social Media, Vol. 11, no.1, pp. 572-575. fakat bunun yolsuzlukla ilişkisini kurmak artık birey seviyesinde yapılabilecek bir şey değil; sadece istatistiksel bir etki göstermek mümkün olabilir.
Yapay zekâ sistemleri bulunan korelasyonlar içinde hangi özniteliklerin “önemli” olduğunu hesaplayabiliyor, ama bu bir nedensellik içermediği için bazen ciddi hatalar yapabiliyor. Mesela gözlük ve eğitim arasında bir ilişki bulabileceğimiz gibi, tamamen alakasız iki faktör arasında da korelasyon saptayabiliyoruz, bu tamamen tesadüfen gerçekleşebiliyor. Sosyal bilimciler bu faktörlerin nasıl birbirine bağlanacağını detaylı olarak araştırırken, sadece istatistik veya yapay zekâ ile veriye bakanlar bu tip hatalara açık.
Her ne kadar yüz görüntüsü ve politik yönelim arasındaki ilişki korelasyona dayalı olduğu için nedensellikten kolayca söz edemesek de, Kosinski vd. (2023)[10]Kosinski, M., Khambatta, P., ve Wang, Y. (2023) Facial recognition technology can expose political orientation from facial images even when controlling for demographics and self-presentation. arXiv preprint arXiv: 2303.16343 yüz görüntüsünden politik yönelimi kestirmeye çalışırken üç yoldan nedensellik ilişkisi kurabileceğimizi iddia ediyor:
- Yüzden zihne giden nedensellik: Eğer belli bir stereotipe oturan bir yüz yapımız varsa, zaman içinde bu stereotip bizim kimliğimize dönüşebilir. Mesela “melek yüzlü” birinin etrafındaki insanlarda oluşan beklentiye cevap verecek şekilde davranmaya başlaması ve çok yardımsever bir insana dönüşmesi gibi…
- Ortak faktör: Politik yönelim üzerinde etkili olan bazı genetik faktörler yüz morfolojisini de etkiliyor olabilir. Örneğin bir ülkede yaşayan etnik bir grup kendi haklarını destekleyen partiye oy verebilir, etnisite aynı zamanda yüz morfolojisinde de ortaya çıkabilir.
- Zihinden yüze giden nedensellik: Zihinsel bazı niteliklerin yüz görüntüsü üzerinde sonuçları olabilir. Örneğin otokontrolü yüksek bir kişi yediklerine dikkat ettiği için sağlıklı bir yüz görüntüsüne sahip olabilir.
Yaklaşık yirmi beş yıldır bilgisayar tabanlı yüz analizi üzerinde çalışan bir araştırmacı olarak bu nedensellik arayışının bana zorlama geldiğini söylemek durumundayım. Dahası, birey seviyesinde kestirim yapmanın doğrudan bireyler için sonuçları var. Yüz görüntülerinden bir kişinin suç işleme ihtimalini tahmin etmeye çalışan, yahut cinsel yönelimi kestirdiğini iddia eden uygulamalar sadece bilimsel olmadıkları için değil, etik olmadıkları için de sorunlular.
Kate Crawford’un Atlas of AI kitabında eleştirdiği gibi, yüz analizi teknolojilerini geliştirirken bu teknolojilerin daha geniş toplumsal sonuçlarına da bakmak gerekiyor.[11]Crawford, K. (2021). The atlas of AI: Power, politics, and the planetary costs of artificial intelligence. Yale University Press. Örneğin İngiltere’de büyük şehirlerde kamuya açık alanlar çok yüksek sayıda kamera ile izleniyor. Eğer politik gösterilere katılan insanların yüz görüntülerinden otomatik kimlik tespiti yapılırsa (politik görüş kestirmenin çok daha basit bir yolu), bu kolaylıkla ülkede demokrasiyi baltalayacak bir baskı aracı olabilir. Bu sebeple 2022 Ocak ayında Birleşik Krallık parlamentosu bir dizi kuralı içeren bir düzenleme yaparak[12]Update to surveillence camera code of practice accessible version, https://www.gov.uk/government/publications/update-to-surveillance-camera-code/amended-surveillance-camera-code-of-practice-accessible-version kamera sistemlerinin meşru amaç doğrultusunda, şeffaf, mahremiyeti gözetecek ve hesap verilebilir şekilde kullanımını şart koştu.
Yüz analizi ve politik görüşlerden bahsederken, psikolog Alexander Todorov’un çalışmalarından da söz etmek gerek. İnsanların tanımadıkları kişiler hakkında, sadece onların yüzlerine bakarak çok hızlı yargıya vardığı uzun zamandır biliniyor. Todorov bu durumun demokrasi için sonuçlarını inceliyor. Mesela muhtarlık seçimlerinde oy kullanırken oy verdiğimiz adayın ve rakiplerinin politikalarını, özgeçmişlerini detaylı inceliyor muyuz? Yoksa sadece adayların sağda solda asılı duran posterlerine bakarak, yüz görüntüsünden bir “fikir” mi ediniyoruz? Todorov, öğrencisi Ballew ile 2007’de yayınladığı bir çalışmada Amerika’da milletvekili seçimlerinde yarışan politikacıların yüzlerini deneklere sadece bir saniyenin onda biri kadar süre göstererek hangi adayın daha güvenilir olduğunu soruyor. Bu şekilde elde ettiği değerlendirmelerle %72,4 başarımla milletvekili seçim sonuçlarını kestirebiliyor.[13]Ballew, C. C., & Todorov, A. (2007). Predicting political elections from rapid and unreflective face judgments. Proceedings of the National Academy of Sciences, 104(46), 17948-17953. Bu şekilde elde edilen “güvenilirlik” değerlendirmelerinin aslında kişilerin gerçek güvenilirliği ile bir ilişkisi yok, bunlar çoğunlukla birer önyargıdan ibaret. Fakat yine de politikacının “temiz yüzlü” olması seçimlerimizi etkiliyor…
Yüz tanıma ve analizi üzerine çalışan araştırmacılar son yıllarda geliştirdikleri teknolojilerin etik kullanımı için çaba harcıyor, farkındalık oluşturuyor, hukukçular ve etik uzmanları ile ortak çalışmalar yürütüyor.[14]Yapay zekâ, etik ve hukuk, https://sarkac.org/podcast/yapay-zeka-etik-ve-hukuk/ Bu konudaki en önemli bilimsel toplantılardan biri olan IEEE Conf. on Automatic Face and Gesture Recognition 2024’te İstanbul’da, Istanbul Teknik Üniversitesi bünyesinde gerçekleştirilecek.[15]The 18th IEEE International Conference on Automatic Face and Gesture Recognition, 27-31 May 2024 SDKM, ITU Campus, Istanbul, https://fg2024.ieee-biometrics.org/
Bu yazının hazırlanmasında desteği için Dr. Ferda Ofli’ye teşekkür ederim.
Albert Ali Salah
Utrecht Üniversitesi, Enformasyon ve Bilgisayar Bilimleri Bölümü,
Boğaziçi Üniversitesi, Bilgisayar Mühendisliği Bölümü, BAGEP 2017
Bu eser Creative Commons Atıf-GayriTicari 4.0 Uluslararası Lisansı ile lisanslanmıştır. İçerik kullanım koşulları için tıklayınız.
Notlar/Kaynaklar
↑1 | Kanade, T. (1977), Computer recognition of human faces, https://link.springer.com/book/10.1007/978-3-0348-5737-6 |
---|---|
↑2 | Kanade, T. (1973). Picture processing by computer complex and recognition of human faces. Ph.D. Tezi, Kyoto Üniversitesi. |
↑3 | How China is Using A.I. to Profile a Minority (2019) https://www.nytimes.com/2019/04/14/technology/china-surveillance-artificial-intelligence-racial-profiling.html |
↑4 | Larson, J., Mattu, S., Kirchner, L., Angwin, J. (2016) How we analyzed the COMPAS recidivism algorithm, https://www.propublica.org/article/how-we-analyzed-the-compas-recidivism-algorithm |
↑5 | Buolamwini, J., & Gebru, T. (2018). Gender shades: Intersectional accuracy disparities in commercial gender classification. In Conference on fairness, accountability and transparency (pp. 77-91). PMLR. |
↑6 | Kosinski, M. (2021) Facial recognition technology can expose political orientation from naturalistis facial images, Scientific Reports, 11(1), 1-7. |
↑7 | Blavatskyy, P. (2021). Obesity of politicians and corruption in post‐Soviet countries. Economics of Transition and Institutional Change, 29(2), 343-356. |
↑8 | The 2021 Ig Nobel Prize Winners, https//improbable.com/ig/winners/#ig2021 |
↑9 | Kocabey, E., Camurcu, M., Ofli, F., Aytar, Y., Marin, J., Torralbe, A., ve Weber, I. (2017) Face-to-BMI: Using computer vision to inter body mass index on social media, Proceedings of the international AAAI Conference on Web and Social Media, Vol. 11, no.1, pp. 572-575. |
↑10 | Kosinski, M., Khambatta, P., ve Wang, Y. (2023) Facial recognition technology can expose political orientation from facial images even when controlling for demographics and self-presentation. arXiv preprint arXiv: 2303.16343 |
↑11 | Crawford, K. (2021). The atlas of AI: Power, politics, and the planetary costs of artificial intelligence. Yale University Press. |
↑12 | Update to surveillence camera code of practice accessible version, https://www.gov.uk/government/publications/update-to-surveillance-camera-code/amended-surveillance-camera-code-of-practice-accessible-version |
↑13 | Ballew, C. C., & Todorov, A. (2007). Predicting political elections from rapid and unreflective face judgments. Proceedings of the National Academy of Sciences, 104(46), 17948-17953. |
↑14 | Yapay zekâ, etik ve hukuk, https://sarkac.org/podcast/yapay-zeka-etik-ve-hukuk/ |
↑15 | The 18th IEEE International Conference on Automatic Face and Gesture Recognition, 27-31 May 2024 SDKM, ITU Campus, Istanbul, https://fg2024.ieee-biometrics.org/ |