Bu derste 2000’li yılların başından günümüze haber merkezlerinin Wikileaks, Panama Belgeleri, Paradise Belgeleri, HSBC Belgeleri, Swiss Leaks, FinCen Belgeleri gibi sızdırılmış verilerle nasıl çalıştıklarını öğrenecek, gazetecilerin sızdırılmış verileri nasıl doğruladıklarını, nereden çalışmaya başladıklarını anlayacaksınız. Veri gazeteciliğinin bu süreçteki rolünü anlayacak, veriyi haberin bir parçası yapmada ne tür prensiplere dikkat etmek önemlidir, ödül almış projelerin özellikleri nelerdir detaylarıyla göreceksiniz.
Veri Gazeteciliği yapan haber merkezlerinin ortak özellikleri yapılandırılmış / yapılandırılmamış verilerle çalışma yöntemleri geliştirmiş olmalarıdır. Ancak bu şekilde milyonlarca veriyle etkili çalışma yürütülebilir, haber değeri olan ortaya çıkabilir. Sızıntılar hangi nedenle olursa olsun, ortaya çıkarılan belgeler elinize ulaşmış ham içeriklerdir. Onlarla çalışmadan önce verileri doğrulamalı, analiz etmeli ve kullanılır bir yapıya dönüştürmeniz gerekmektedir.
Wikileaks, Panama Belgeleri, Paradise Belgeleri, HSBC Belgeleri, Swissleaks, FinCen Belgeleri ve daha nicesi son 20 yılda haber merkezlerinin incelediği ham verilerdir. Politikacıların, şirketlerin, iş insanlarının veri kaçırma yöntemlerini, para aklama maceralarını bu sızıntıları inceleyen yüzlerce gazeteci sayesinde doğru kronoloji ve ilişkilerle öğrenebiliyoruz.
Panama Belgeleri örneği üzerinden gidersek sızan 11,4 milyon belge; e-posta, veritabanı, pdf, fotoğraf ve metinden oluşuyordu. Uluslararası Araştırmacı Gazeteciler Konsorsiyumu Panama Belgeleri için 370 gazetecinin çalıştığını ve 40 yıla ait arşivi incelediklerini belirtti. Kullandıkları teknolojilerinin veriyi hem doğrulama sürecinde, hem de analiz edip habere dönüştürmede etkin rol oynadığını görüyoruz.
Solda ve sağda yer alan şablonlar verinin ham olması durumunda veritabanı oluşturularak belgelerin araştırılabilir hale getirilmesine dikkat çekiyor. Ancak bunu yaparken de belge tipini tespit edip OCR yazılım kullanarak veriyi yapılandırma biçimini anlıyoruz.
Bu iki şablonda da görüyoruz ki 35 sunucu ile çalışıldığında milyonlarca veriyi analiz etmede, araştırmada zaman kazanıyor gazeteciler. Haber merkezleri, büyük veri teknolojilerini sızıntılarla çalışırken etkin şekilde kullanırlar. Ancak öncesinde mutlaka iyi bir veri ekibinin olması gerekmektedir.
ICIJ örneğinde gördüğümüz üzere veri gazetecisi, veri denetleyicisi, veri analisti bu süreçte önemli becerilere sahip insanlardır.
Örnek sızıntı verisi ile ICIJ veri ekibin çalışma yöntemini görüyorsunuz.
1.1) Veri Gazeteciliği Nedir, Nasıl Yapılıyor?
Veri gazeteciliği, sayısal verilerin dijital çağda bilginin üretimi ve dağıtımında kullanılmasının artan rolünü yansıtan bir gazetecilik türüdür. Veri ile gazetecilik alternatif bir habercilik modeli olarak karşımıza çıkıyor. Birçok tanımı var ama tek bir amacı var: Daha etkin habercilik yapmak. Bilgisayar destekli gazetecilik (Computer- assisted reporting), veri güdümlü gazetecilik (Data Driven Journalism), yapılandırılmış gazetecilik (Structured Journalism), excel gazeteciliği (Excel Journalism) gibi terminolojik bir kronolojisi de var. Ancak sızıntılar ile “Veri Gazeteciliği” (Data Journalism) tanımını aldı.
Veri gazeteciliği, veri toplama, veri temizleme, veri doğrulama, veri analizi, veri görselleştirme aşamalarından yararlanılarak yürütülür.
Veri Toplama: Veri setleri, verilerin değişik yöntemlerle toplanmasından oluşur. Manuel ya da otomatik ölçümler (hava durumu verileri), anketler (nüfus sayımı verileri), kararların kayıtları (bütçe verileri) veya devam eden işlemler (harcama verileri), birçok kaydın toplanması (suç verileri), matematiksel modelleme (nüfus oranları) gibi.
Veri Temizleme: Veri gazeteciliğinde veri setlerini kullanmayı daha kolay hale getirme işlemine denir. Bu işlem tutarsızlıkları, hataları düzeltmeyi biçimlendirmeyi, makine tarafından okunamayan unsurları, satır ve sütun başlıkları için standart etiketler kullanmayı, sayıların, tarihlerin ve diğer birimlerin uygun bir şekilde temsil edilmesini garanti etmeyi, uygun bir dosya formatına dönüştürülmesini ve etiketlerin diğer veri setleri ile uyumlu bir şekilde kullanılmasını sağlar.
Veri Doğrulama: Veri geçişi yapıldıktan sonra farklı veri türlerinin doğruluk ve tutarsızlıklar açısından kontrol edildiği bir süreçtir. Veriler bir kaynaktan diğerine aktarılırken verilerin doğru bir şekilde aktarılıp aktarılmadığının belirlenmesine yardımcı olur. Doğrulama sırasında, uyumsuzluk alanlarını belirlemeye yardımcı olur ve hatalı veri kaybını önler.
Veri Analizi: Veri setinde/kümesinde yararlı bilgileri keşfetmek, sonuçları anlamak ve karar vermeyi desteklemek amacıyla verileri inceleme, temizleme, dönüştürme ve modelleme sürecidir.
Veri Görselleştirme: Verilerin daha iyi anlaşılması için çeşitli araçlar kullanılarak hazırlanan çalışmalardır.
Tüm haber üretim süreçleri için araçlar önemli ancak veri gazeteciliği çalışması yürütürken gazetecilerin kullandığı araç sayısı kullanılan veriye, haber merkezinin büyüklüğüne ve veri ile çalışan gazeteci sayısına göre değişmektedir. Örneğin Financial Times’ın veri bölümü web tabanlı veri görselleştirme aracı https://fastcharts.io/‘yu geliştirdi kendi kullanımı için, ancak bu alanla ilgili sayısız açık kaynak araç mevcut. Bu e-tabloda veri gazetecileri için düzenli olarak güncellenen veri kazıma, veri analizi, harita oluşturma, renk paleti kullanım araçları, veri toplama eklentileri, veri görselleştirme ve veri doğrulama araçları yer alıyor. Dersin ilerleyen bölümlerinde bu araçların bazılarını kapsayan örnekleri işleyeceğiz.
1.2) Veri Gazeteciliği Projesi Nasıl Planlanır?
Çalışılacak konuya ait mevcut olan veriyi tespit etmekle başlanmalıdır. Örneğin pandemi sürecinde hayatını kaybeden sağlık çalışanları üzerine bir haber hazırlıyorsanız, önceliğiniz bu konuya dair elinizde hangi verilerin mevcut olduğunu belirlemektir. Örneğin, Covid-19 verisi çok geniş olabilir; çalışmak için Covid-19’da sağlık çalışanlarının durumuna odaklanmak planlamayı kolaylaştıracaktır. Olmayan verileri aramakla değil, mevcut verileri anlamakla başlanır. Konu daraltılıp derinleştirilmelidir. Bunun için de önce hangi verilere sahip olduğumuz, hangisine sahip olmadığımız üzerinden gidilmelidir.
Haber merkezlerinde veri ile haber üretim biçimleri:
-
Veri ile hazırlanmış olan haberler
“Doğrulama: İlk kez Trump ve Clinton Tartışması”, NPR). Bunlar, geleneksel haberleri doğrulamak için kullanılan verilerdir. -
Araştırma İçin Verinin Kullanıldığı Haberler
Örneğin “Asılsız”, The Globe and Mail). Bu haberlerde gazeteci verilere açıklık getirir veya verilerde gizlenmiş bir detayı ortaya çıkarır. Bu tür haberler üretmek, algoritma oluşturma, etkili görselleştirmeler üretmek uzun sürebilir ve bir dizi beceri gerektirebilir. -
Verileri Açıklayan Haberler
“Her Zaman Doğru Değildir”, Berliner Morgenpost). Veriye erişimin giderek kolaylaşması, gazetecilerin okuyuculara veri araçlarını kullanarak sayılardan daha fazla anlam sunabilmelerini sağlıyor.
Veriye dayalı çalışacağınız için veri gazetecilerinin düzenli olarak yaptığı çalışmalardan biri veri oluşturmaktır. Örneğin Covid-19’da hayatını kaybeden sağlık çalışanlarına dair veri topluyorsunuz. Öncelikle mevcut verileri ön çalışma yürüttüğünüz dosyanıza ekleyerek başlamalısınız. En az 15 kaynaktan yararlanarak çalışma yürütülen solo taslak dosyayı incelediğinizde gazeteciler, verilerle çalışmadan önce yöntemini, kaynaklarını, sorularını, haberinin amacını belirler. Bilgi edinme başvurusu, çalışma konusu ile ilgili akademik makaleler, anket çalışması, veri kazıma, açık kaynaklardan verileri toplamak, resmi/yarı resmi kaynaklardan veri toplama; hepsi bu aşamada veri girişi yaparak veri gazeteciliği çalışmasının ön çalışma aşamasıdır. Veri toplarken hem teknik hem donanımsal sorunlar oluşabiliyor. Veri girişini yapmak için zaman gerekiyor, veriler tutarsız olarak girildiğinde ise doğrulamak, yanlış girişi engellemek için tekrar çalışma yürütmek gerekiyor. Örnek HIV projesi incelenebilir.
Yani;
-
Konu Belirlenmelidir.
-
Amaç Belirlenmelidir.
-
Kaynaklar İçin Veri Biyografisi oluşturulmalıdır (ham veri, anket verileri, röportaj verileri, veri kazıma vb).
-
Bilgi Edinme Başvuru Soruları Hazırlanmalıdır (Kılavuzdan yararlanma).
-
Uygulanacak Metot Belirlenmelidir.
Örnek ön hazırlık veri gazeteciliği dosyasını inceleyebilirsiniz. Solo proje üretim taslağını ise buradan indirebilirsiniz.
1.3) Veri Gazeteciliği Prensipleri
-
Veri gazetecileri, verileri kendi başına bir güç unsuru olarak sorgulamaya çalışmalıdırlar.
-
Veri gazeteciliğinde editöryal bağımsızlık, teknolojik bağımsızlığı da içerir.
-
Veri gazeteciliği sadece kullanılan kaynaklarda ve dilde değil, tasarlanan araçlarda da tarafsızlık ilkesini gözetmelidir.
-
Verilerin ulaşılabilir ve mevcut olduğu konulardaki hikâyelere odaklanmak “tarafsızlık” değildir.
-
Veri gazeteciliği ve veri gazetecisi, veriyi üreterek ve açarak verilerde göz ardı edilenlerin sesi olmayı amaçlamalıdır.
-
Veri gazetecisinin kişiselleştirilmiş haberlerde haberin bağlamı ve kapsamında editöryal bir sorumluluğu vardır.
-
Veri gazetecisi, verinin ışık tuttuğu insan hikâyelerini arayıp bulmak, doğru bir şekilde anlatarak önemli, ilgi çekici hale getirmelidir.
-
Veri gazeteciliğinde kullanılan algoritmalar incelemeye ve gözetime açık olmalıdır.
-
Kullanılan kodları, metotları paylaşmak daha verimli çalışmayı ve gazetecilik standartlarını yükseltmeyi sağlar.
-
Veri gazeteciliği okuyucuları hak ve sorumluluklarını kullanmaları için güçlendirmeye çalışmalıdır.
-
Ortak çalışmaya ve ekip çalışmasına açık olmalıdır veri gazeteciliği.
1.4) Ödüllü Veri Gazeteciliği Projeleri
Küresel Editörler Ağı tarafından 2012-2019 yılları arasında ilk uluslararası veri gazeteciliği ödülleri yarışması düzenlendi. Ödüller farklı kategorilerde veriliyor olsa da temel motivasyon veriyle çalışan veri gazetecilerinin, haber merkezlerinin hangi teknikleri kullanarak etkili habercilik yaptıklarını dünyada görünür kılmayı hedeflemekti. Büyük ölçüde başarılı da olundu. Aşağıda detayları ile tüm kategorilerde ödül almış olan veri gazeteciliği çalışmaları yer alıyor.
2012 yılından itibaren verilen Küresel Veri Gazeteciliği Ödülleri, 2019 yılında son buldu. Aynı yıl veri gazetecileri, akademisyenler, uzmanlar tarafından bağımsız veri gazeteciliği yarışması Sigma Awards Aron Pilhofer, Reg Chua, Simon Rogers, Marianne Bouchart, Kuang Keng Kuek Ser tarafından hayata geçirildi. Data Journalism Platform ve Google News Initiative tarafından desteklenen yarışmanın geçen yıl kazananlarını buradan ya da aşağıdaki yer alan sunumda üzerinden Türkçe olarak inceleyebilirsiniz.
Ödüllü Projelerde Hangi Teknolojiler Kullanılıyor?
Aşağıda 2019 yılında ödül almış veri gazeteciliği çalışmalarında kullanılan/yararlanılan yöntemler/araçlar ve yazılımları görüyorsunuz.
“HTML, CSS, Javascript, QGIS, Illustrator, Ruby, PostGIS, Dave’in Yeniden Dağıtım Uygulaması, Node, D3, R, Tabula, OpenRefine, Google E-Tablolar, UI-Kit Framework, Adobe Photoshop, Microsoft Excel, Planet satellite imagery, DigitalGlobe images, Adobe Creative Suite, Corel Painter, Canvas, JQuery, CSS3, Json, CSV, SVG, RStudio, PostgreSQL, PostGIS, OpenStreetMap, DJI Mavic Pro drone, Knightlab’ın Juxtapos aracı, Python, PHP, jsFeat, TrackingWorker, Vuforia, GL Matrix, Open CV, Three.js, After Effect, Ink to script the game, inkjs, anime.js, SCSS, Node JS, Postgres database, Zeit Micro, Heroku 1X dynos, Standard-0 size Heroku Postgres database, Framer, Affinity Designer, Tesseract, RapidMiner, Extract, Linkurious, Neo4j, Apache Solr, Apache Tika, Blacklight, Xemx, Oxwall, MySQL vs Semaphore, Webpack, Vue.js, Leaflet.js, GPG, VeraCrypt, Google Authenticator, SSL (istemci sertifikaları), CARTO ve daha pek çoğu!” – Kaynak
Yarışmaya katılan veyahut katılmayan çoğu haber merkezinin açık kaynak veri gazeteciliği araçlarını kullandıklarını görebilirsiniz. Aşağıda yer alan bazı veri gazeteciliği bölümü olan haber sitelerinde de olduğu gibi en yüksek teknolojileri kullananlar da var, küçük haber merkezi olup sınırlı imkânlarla çalışanlar da. Bu haber sitelerinin ortak noktası verilerini erişime açmış olmaları, veri görselleştirme kodlarına ulaşma, çoklu veri setlerini inceleme şansınızın olması ve github hesaplarına da eklemeleri. Yani haber merkezleri veri gazeteciliği prensiplerine sahipler. Daha iyi habercilik yapmak dışında farklı bir motivasyonu olmayan bu alanı farklı kılan şeyi belki bu detaylarla açıklamak doğru olacaktır: Nihayetinde toplanan verilere rahat erişebiliyorsunuz, verilerin formatı açık, üst veri bilgisine ulaşmak mümkün ve haberi doğrulamada ihtiyaç duyulan çoğu unsura sahip.
Test
Bu modülde “Sızıntı Verileri Doğrulamada Veri Gazeteciliği Nasıl Kullanılıyor?” başlığı altında Veri Gazeteciliği Nedir, Nasıl Yapılıyor, Veri Gazeteciliği Prensiplerinin Gazeteciler İçin Önemi, Ödüllü Veri Gazeteciliği Projeleri ve Github başlıklarına ve alt başlıklarına yer verildi. Bu modülü daha verimli kılmak için 8 sorudan oluşan testi buraya tıklayarak çözebilirsiniz.