Cep telefonları ve büyük veri COVID-19’a karşı

Güney Kore'de 31. vaka olarak bilinen hastanın hikayesi. https://graphics.reuters.com/CHINA-HEALTH-SOUTHKOREA-CLUSTERS/0100B5G33SB/index.html

COVID-19 salgını toplumun bütün kesimlerinin hızlı ve koordine hareket etmesini gerektirdi. Burada elbette hükümetlere çok önemli bir iş düşüyor, hükümetlerin aldıkları kararlar hepimizin hayatını derinden etkiliyor. Daha önce yaşanan H1N1 ve Ebola gibi salgınlar bize salgının yayılması ile ilgili sağlıklı bilgiye erken ulaşmanın ne kadar önemli olduğunu gösterdi. Hükümetlerin doğru kararlar verebilmesi ve salgını kontrol altına alabilmesi için hem veriye, hem de bu veriyi yorumlayacak uzmanlara ihtiyaç var. Bu yazıda cep telefonlarından elde edilen verinin Türkiye’de ve dünyada salgın kontrolü için nasıl kullanılabileceğini anlatacağım.

Salgın ve İnsan Hareketliliği

Salgının kontrol edilebilmesindeki en önemli faktörlerden biri insan hareketliliğinin gözlemlenmesi. Sosyal temas, yani insanların ne kadar bir araya geldiği ve dolayısıyla birbirlerine hastalığı ne kadar bulaştırdıkları, salgının zaman içerisindeki dinamiğini etkileyen, çok önemli bir faktör.

Farklı salgınlarda sosyal temasın önemi değişiyor. Mesela Ebola hastaları hem belirtiler ortaya çıktığında zaten yatağa düştükleri ve çok hareket edemedikleri için, hem de bulaşmanın vücut salgıları ile gerçekleşmesi nedeniyle, hastalığı nispeten az kişiye bulaştırabiliyorlar. Buna karşılık kızamık, bilinen en bulaşıcı hastalıklardan biri. Şu anda mücadele ettiğimiz COVID-19 yüksek bir bulaşıcılığa sahip değil, ama uzun kuluçka süresi, hava yoluyla bulaşabilmesi, bulaştığı yüzeylerde uzun süre aktif kalabilmesi ve belirtilerin geç görülmesi sebebiyle çok hızlı bir şekilde yayıldığını görüyoruz.

Salgın (epidemi) bir hastalığın toplumda çok fazla görülmesi, pandemi ise salgının dünyanın büyük bir bölümüne yayılması demek. COVID-19 Dünya Sağlık Örgütü tarafından pandemi olarak nitelendirildi. Buna göre artık mücadelenin de küresel bir boyuta taşınması gerekiyor. Ama yine de toplumsal farklılıkları ve ülkelerin sahip olduğu kaynakların farklılığını gözardı etmek mümkün değil, bu yüzden her ülkenin kendine has stratejiler geliştirmesi de gerekiyor. Özellikle de yoğun bakım ve hastanelerde müdahale gerektirecek salgınlarda bölgedeki yatak kapasitesi, sağlık çalışanlarının sayısı ve bu çalışanların sağlığının korunması için gereken malzeme, yoğun bakım üniteleri ve solunum destek cihazlarının sayısı çok önemli.

Salgın hastalık kontrol altına alınamazsa, bir anda yükselen hasta sayıları sağlık sistemini çökertiyor ve normalde kurtarılabilecek hastalar bile kaybedilebiliyor. Sağlık personelinin hastalanması ve zorlu çalışma şartlarına yenik düşmesi de bu salgınlarda karşımıza çıkan durumlardan. Dahası, sağlık sistemi bu salgınla uğraşırken diğer hastalıklardan ölümler de doğal olarak artıyor.

Kısaca ‘kontrol’ salgınla mücadelede ilk hedeflerden biri. Bu amaçla hükümetin aldığı tedbirler son derece önemli, bunların erken alınması da doğrudan daha fazla hayat kurtarılması demek. Bunun meşhur bir tarihsel örneği İspanyol Gribi sırasında gerçekleşmiş. 1918 yılında Philadelphia’da salgının belirtileri görülmüş [1]. 21 Eylül’de birkaç kişide belirtiler kaydedilmiş, doktorlar da bu bir salgın olabilir diye yetkilileri uyarmış. Fakat belediye 28 Eylül’de gerçekleşmesi planlanan bir resmi geçidi iptal etmeyi reddetmiş. Halk sokakları doldurmuş, geçit töreni gerçekleşmiş. Bundan 72 saat sonra Philadelphia’nın 31 hastanesi tamamen hastalarla dolmuş, hafta bitmeden ölü sayısı 2600’e ulaşmış.

1918 yılında kullanılması mümkün olmayan, ama bugün salgınları kontrol altına almak için kullanılabilecek çok önemli bir silahımız var: cep telefonları. Cep telefonlarının kullanım bilgisi sayesinde bir bölgede (veya bir ülkede) insanların nasıl hareket ettiğini, nerelerde toplandığını, birbirlerine hastalık bulaştırma ihtimallerinin nasıl yükselip alçaldığını görmek mümkün.

Cep telefonu ile insan hareketliliğinin ölçülmesi

Cep telefonlarının insan hareketliliğinin ölçülmesi için kullanılmasının iki temel yolu var.

  • Birincisi telefona kurulacak bir uygulama yoluyla bu bilginin toplanması.
  • İkincisi de doğrudan telekom operatörlerinin kullanıcılarının bulundukları yerleri saptaması.

Birinci yaklaşımda kullanıcılar belli bir uygulamaya kişisel veri paylaşımı için izin veriyorlar. 2011’de geliştirilen FluPhone uygulaması ve özellikle COVID-19 salgını için MIT’de yeni geliştirilen SafePaths uygulaması bu yaklaşıma güzel örnekler [2]. Bu şekilde hem uygulamayı kullanan kişiye salgın ile ilgili pratik bilgiler ulaştırılabiliyor, hem de bu kişinin belirtilerinin ve hareketliliğinin izlenmesi sağlanıyor. SafePath uygulaması şu anda bir kaç ülkede COVID-19’a karşı kullanıma alınıyor [3]. Bu uygulama kişisel verinin temelde telefonda kalmasını öngörüyor. Risk taşıyan izler sağlık otoriteleri tarafından belirlenip telefona gönderiliyor, eğer bireyin kişisel izleri ile kesişim varsa, uygulama bireye risk altında olduğunu söylüyor. Birinci yaklaşımın dezavantajı ancak uygulamanın kurulduğu ve aktif kullanıldığı durumda bilgi alınabilmesi. Ayrıca bu uygulamanın başarılı olabilmesi için ülke çapında yaygın kullanılması gerekiyor.

İkinci yaklaşımda ise çok daha geniş çaplı veri toplamak mümkün, zira bu yaklaşımda doğrudan telekom operatörü bilgi sağlıyor. Her cep telefonu, bağlı bulunduğu operatöre sahibinin bulunduğu nokta ile ilgili bilgi verir. Cep telefonunuzdan bir konuşma yaptığınızda, operatör sizin hangi baz istasyonunun yakınında olduğunuzu öğrenir. Bu bilgi yapılan konuşmaların içeriği yahut yollanan mesajların ne olduğu gibi bir bilgi değil, fakat yine de kişisel bilgi açısından hassas bir veri: operatör bir kişinin aşağı yukarı nerede olduğu saptayabilir. Eğer bunun gibi birkaç nokta verilirse, büyük bir veri seti içerisinden bu kişinin kim olduğunu da tespit etmek mümkün [4]. Dahası, bu basit bilgi ile operatör kullanıcı hakkında yeni şeyler öğrenebilir. Mesela akşam yediden sabah yediye kadar yapılan konuşmaların evden, sabah dokuz akşam beş arası yapılan konuşmaların işyerinden yapıldığını varsayarak kullanıcının hangi semtte oturduğunu ve hangi semtte çalıştığını belirleyebilir. Kesin bir sonuç olmasa da, milyonlarca kullanıcı için böyle bir analiz yapılırsa insanlar şehrin neresinde oturuyor, nereye işe gidiyorlar, hangi yolları ne kadar kullanıyorlar, bunları görmek mümkün olur.

Dünyanın pek çok ülkesinde belediyeler ve operatörler anonim hale getirilmiş, kişisel bilgiden arındırılmış mobil veri ile toplu taşıma hizmetlerini iyileştirmek için birlikte çalışıyorlar. Operatör belediyeye temelde çok basit bir bilgi sağlıyor: “şu semt ile şu semt arasında saat başı şu kadar insan hareket ediyor.” Görüleceği gibi, böyle bir veriden bireylere ulaşmak mümkün değil, dolayısıyla kişisel veriler riske atılmamış oluyor. İşte bu tip anonim veri ile salgın hastalıkların takibine yardımcı olmak operatörlerin elinde.

Bu iki yaklaşımın kişisel bilginin mahremiyeti ve etik açılarından farklı yönleri var. Birinci yaklaşımda kullanıcı uygulamayı kurarken bir kullanıcı sözleşmesi yoluyla hangi bilgilerin toplandığı, ne amaçla toplandığı, bu bilgilerin ne kadar süreyle saklanacağı, ne zaman yok edileceği, kullanıcının kendi bilgilerini silmek istemesi durumunda ne yapması gerektiği söylenebiliyor. Bu şekilde bir ‘bilgilendirilmiş onam’ alınabiliyor. İkinci yaklaşımda ise telekom operatörü ile imzalanmış olan kullanıcı sözleşmesinin hukuksal çerçevesi içinde bir veri işlemesi söz konusu. Örneğin İsrail’de 2002’de yapılmış bir kanun düzenlemesi ile hükümetin telekom verilerine erişimi sağlanmış [5]. Virüs taşıdığı belirlenen bir kişinin cep telefonu verisine ulaşıp, bu kişinin son iki hafta içinde bulunduğu yerleri saptayabiliyorlar, aynı yerlerde bulunmuş olan diğer kullanıcıların kimler olduğunu bulabiliyorlar, bu kullanıcılara ‘risk altındasınız’ diye mesaj atabiliyorlar. Bu elbette kişisel verinin mahremiyetinin hiçbir şekilde korunmadığı bir durum. Demokratik ülkelerin pek çoğunda böyle düzenlemelerle karşılaşmıyoruz. Fakat kişisel bilgiyi paylaşmadan da operatörün hükümeti ve ilgili bakanlıkları bilgilendirmesi pekala mümkün.

Veri işbirlikleri

COVID-19 krizinden çok önce, daha Ebola salgını sırasında hükümetler ve telekom operatörleri arasında insan hareketliliğini izleme imkanı verecek bir işbirliğinin başlatılması gerektiği, bunun kişisel verinin mahremiyetine zarar vermeyecek ve hızlıca işletilecek bir şekilde düzenlenmesi gerektiği anlaşılmıştı. Bugün hala böyle bir altyapımız yok. Çeşitli ülkelerde (örneğin Belçika’da) bu tip işbirlikleri var, ama bunlar bireysel çabalarla ilerleyen, uluslararası bir çerçeveden yoksun girişimler. Oysa böyle bir işbirliğinin hukuksal ve teknolojik düzenlemesi yapıldığı takdirde, bir salgın (veya doğal felaket) anında bir düğmeye basarak operatörlerden gerekli karar merkezlerine veri akışını sağlamak mümkün olabilir. Bu şekilde kriz yönetiminde çok önemli olan anlık veri sağlanabilir.

Böyle bir altyapının kurulması kişisel verinin korunmasını tehlikeye atar diye düşünebilirsiniz. “Veri işbirlikleri” adı verilen bu tip girişimler yeni değil, daha önce çeşitli ülkelerde gerçekleştirilen bu gibi işbirliklerinde oluşturulan etik çerçeveler ve veri paylaşımı prensipleri bu işin kişisel bilgiyi hiçbir şekilde açmadan da yapılabileceğini ortaya koyuyor. Türkiye’de de 2018-19 yılları arasında Boğaziçi Üniversitesi, TÜBİTAK ve Türk Telekom tarafından ortaklaşa düzenlenen ve IOM, UNHCR, UNICEF gibi sivil toplum kuruluşları tarafından desteklenen Mülteciler için Büyük Veri Yarışması bunun bir örneği [6]. Bu yarışmada Türk Telekom bir milyon kullanıcısından topladığı ve tamamen anonim hale getirilmiş cep telefonu hareketlilik verisini mültecilerin yaşam koşullarının iyileştirilmesini hedefleyen proje gruplarına açmıştı. Bu veride bir baz istasyonunun civarından saat başına kaç konuşma yapıldığı gibi bilgiler yer alıyordu. Verinin nasıl toplanması gerektiği, kişisel bilgilerin nasıl korunacağı, nasıl paylaşılacağı, nasıl işleneceği gibi konuları düzenlemek için bir uluslararası etik komitesi kurulmuş, ayrıca hukuk birimleri veri paylaşımının kanuna uygun bir şekilde gerçekleştirildiğini denetlemişti. Yani gerekli önlemleri alarak kişisel verilerin korunarak paylaşıldığı bir altyapı kurgulamak mümkün.

Cep telefonu verisi kullanarak salgınla nasıl mücadele edilebilir?

Salgının her aşamasında farklı ihtiyaçlar ön plana çıkıyor. Örneğin salgının başında sosyal teması azaltarak hastalığın çabuk ilerlemesinin durdurulması gerekiyor. COVID-19 salgını sırasında İtalya’nın kırsal kesiminde pek çok vaka ancak çok geç tespit edilebildi, zira hastaların izlenmesi hastanelerden gelen veriye bağlıydı. Bir sonraki aşamada kaynak kullanımının planlanması gerekiyor. Mesela burada veriye dayalı tahmin modelleri ile her bölgede karşılaşılacak hasta sayıları, bu hastaların ihtiyacı olacak kaynakların kestirimi yapılabilir. COVID-19 salgınında yoğun bakım üniteleri ve solunum destek cihazları kısıtlı sayıda bulunan kaynaklar. Bunların etkin kullanımı için iyi planlamaya ihtiyaç var. Daha ileri aşamalarda cep telefonu uygulamaları ile hızlı teşhis ve yönlendirme sağlayarak hastanelerin yükünü hafifletmek, sosyal medya kanalı ile kaynak ve servislerin dağıtımına yardımcı olmak, gönüllüleri organize etmek gibi sorunlar var. Bütün bu problemler için cep telefonu verisi yardımcı olabilir.

COVID-19 gibi bir salgın sırasında özellikle şu soruları cevaplamak için cep telefonu bilgileri kullanılabilir:

1- İnsanlar nasıl hareket ediyorlar?

Basit hareketlilik matrisleri (nereden nereye kaç kişi gidiyor) hastalığın yayılımının modellenmesini kolaylaştırır. Bu matrisler yaş gruplarına göre hazırlanırsa, gençler ve yaşlıların farklı şekilde etkilendiği COVID-19 gibi salgınlarda çok kritik bir veri elde edilebilir.

2- Riskli konumlar nereleri?

İnsanların bir araya geldikleri ve hastalığın bulaşma riskini arttıran yerler (veya olaylar) nerede? Futbol maçlarını iptal etmek ve okulları kapatmak yüksek düzeyde sosyal temas içeren etkinlikleri durdurduğu için ilk akla gelen önlemler, ama çok sıkı güvenlik önlemleri alınmadığı sürece (bazı ülkelerde sokağa çıkma yasakları başladı), insanlar riskleri tam anlamayarak bir araya gelmeye devam ediyorlar. Cep telefonlarından toplanan hareketlilik verisi anlık oluşumları da izleme olanağı veriyor. Örneğin İtalya’nın kuzey bölgelerinde karantina uygulamaları başladığında güneye doğru ani bir hareketlilik gözlemleniyor. Bu tip beklenmedik durumların yarattığı riskleri anlık olarak belirlemek mümkün.

3- Alınan önlemlerin etkileri ne?

Büyük veri analizi ile önlemlerin etkilerini ölçmek mümkün [7]. Bir bölgede okulların kapatılmasının, yahut iki bölge arasında uçak ve tren seferleri durdurulmasının insanların hareketliliği üzerindeki etkilerini ölçebiliyoruz. Ayrıca insanların önlemler karşısındaki sıra dışı davranışlarını da görebiliyoruz. Mesela maçlar seyircisiz oynanmaya başladığında, insanların yine de bir araya gelerek maç izlediğini görebiliyoruz.

4- Hasta olduğu bilinen bireyler kimleri riske atmış olabilir?

Bu sorunun cevaplanması detaylı telefon bilgisi gerektiriyor. Güney Kore’de “31 numaralı vaka” olarak bilinen kişinin kimlere hastalığı bulaştırmış olabileceğini kestirmek için bütün önceki kişisel temaslarının haritasının çıkartılması gerekti ve binin üzerinde riskli temas saptandı. Bu çok zahmetli işin yüksek sayıdaki hasta için yapılması ancak otomatik yöntemlerle mümkün.

Yakın zamanda Güney Kore’de COVID-19 hastalarının detaylı izlenmesi için güvenlik kameraları ve kredi kartı işlemlerinin kullanılması gündeme geldi [8]. Cep telefonu kullanım bilgisi anonim hale getirilmesi çok daha kolay bir veri kaynağı olduğundan, büyük ölçekli salgın kontrolünde kullanımı daha avantajlı görünüyor.

Kısaca özetlemek gerekirse, büyük veriyi salgına karşı kullanmak çok önemli. Bunun kişisel veriyi riske atmadan, yetkililerin işini kolaylaştıracak biçimde ve veri sahibi kuruluşları da zor durumda bırakmadan yapılabilmesi için acilen hükümet, telekom operatörleri ve araştırma grupları arasında “veri işbirliklerinin” başlatılması gerekiyor [9].

Albert Ali Salah
Utrecht Üniversitesi, Bilgisayar Bilimleri (BAGEP 2017)

Kaynaklar:

[1] Dave Roos, How U.S. Cities Tried to Halt the Spread of the 1918 Spanish Flu, History, 16 Mart 2020. https://www.history.com/news/spanish-flu-pandemic-response-cities
[2] Will Knight, Phones Could Track the Spread of Covid-19. Is It a Good Idea?, Wired, 15 Mart 2020. https://www.wired.com/story/phones-track-spread-covid19-good-idea/
[3] Rachel Barber et al., “Apps Gone Rogue: Maintaining Personal Privacy in an Epidemic” MIT Whitepaper, 16 Mart 2020. https://drive.google.com/file/d/1nwOR4drE3YdkCkyy_HBd6giQPPhLEkRc/view?usp=sharing
[4] Yves-Alexandre De Montjoye, Cesar Hidalgo, Michel Verleysen, Vincent Blondel, Unique in the crowd: The privacy bounds of human mobility. Scientific reports, 3, 1376, 2013.
[5] David M. HalbfingerIsabel Kershner, Ronen Bergman, To Track Coronavirus, Israel Moves to Tap Secret Trove of Cellphone Data, The New York Times, 16 Mart 2020. https://www.nytimes.com/2020/03/16/world/middleeast/israel-coronavirus-cellphone-tracking.html
[6] Albert Ali Salah, Alex Pentland, Bruno Lepri, Emmanuel Letouzé (ed.) Guide to Mobile Data Analytics in Refugee Scenarios, Springer International, 2019. https://link.springer.com/book/10.1007%2F978-3-030-12554-7
http://d4r.turktelekom.com.tr/
[7] Shengjie Lai, Nick W. Ruktanonchai, Liangcai Zhou, Olivia Prosper, Wei Luo, Jessica R. Floyd, Amy Wesolowski et al. “Effect of non-pharmaceutical interventions for containing the COVID-19 outbreak: an observational and modelling study.” medRxiv, 2020. https://www.worldpop.org/events/COVID_NPI
[8] Sarah Wray, South Korea to step-up online coronavirus tracking, Smart Cities World, 12 Mart 2020. https://www.smartcitiesworld.net/news/news/south-korea-to-step-up-online-coronavirus-tracking-5109
[9] The GovLab, A Call for Action, 16 Mart 2020. https://medium.com/data-stewards-network/a-call-for-action-813669f32244

Önceki İçerikÜssel artış nedir, COVID-19 nasıl yayılıyor?
Sonraki İçerikCOVID-19 hakkında kısa kısa
Albert Ali Salah

Albert Ali Salah 1994 yılında İstanbul Alman Lisesi’nden, 1998 yılında Boğaziçi Üniversitesi Bilgisayar Mühendisliği Bölümü’nden mezun oldu. 2006 yılında Avrupa Biyometri Ödülü’nü, 2014 yılında BÜVAK Araştırmada Üstün Başarı Ödülü’nü, 2017 yılında Bilim Akademisi BAGEP Ödülü’nü aldı. 2018 yılında Suriyeli mültecilerin sağlık, eğitim, işsizlik, güvenlik ve entegrasyon sorunlarına büyük veri yöntemleri ile çözümler getirmeyi amaçlayan D4R: Data for Refugees projesinin yürütücülüğünü yaptı. Araştırma konuları insan davranışının bilgisayarla analizi, örüntü tanıma ve yapay öğrenmedir. Halen Hollanda’da Utrecht Üniversitesi’nde öğretim üyesi, Boğaziçi Üniversitesi Bilgisayar Mühendisliği Bölümü’nde ilintili öğretim üyesi olarak çalışmaktadır. Albert Ali Salah’ın websitesi