Bu derste açık verinin veri gazeteciliği sürecinde nasıl bir rol üstlendiğini, tanımını, kamu faydacılığı odaklı habercilikte nasıl bir yer edindiğini, açık lisansları ve veri kaynaklarını öğreneceksiniz.
Vergilerimizin ne kadarının sokak lambaları veya kanser araştırmaları için harcandığını tam olarak biliyor musunuz? Evinizden işinize en kısa, en güvenli bisiklet yolu nedir? Yol boyunca nefes aldığınız hava temiz mi? Neler içeriyor? Bölgenizde bulunabilecek en iyi iş olanakları hangileri? Derinden önemsediğiniz konularla ilgili kararları nasıl etkileyebilir ve kimlerle konuşabilirsiniz? Veri gazetecileri yerel yönetimlerin halka açmaya başladığı yapılandırılmış verilerle artık bu sorulara daha şeffaf şekilde yanıt bulabiliyor, okuyucularını bilgilendirebiliyorlar, doğrulama kanallarını açabiliyorlar. Bu bağlamda vurgulamak gerekiyor ki açılan ve lisanslanan veriler, gazetecilik için önemli bir fırsat. Hatta 2012 yılından beri düzenlenen veri gazeteciliği yarışmalarında açık veri kategorisinde ödül alan haber merkezleri ve solo projeler de var.
Açık veri kategorisinde ödül almış olan 2019 veri gazeteciliği siteleri şunlar (Projelerin isimlerinin üstünü tıklayarak inceleyebilirsiniz):
- The post-conflict numbers, Consejo de Redacción – www.consejoderedaccion.org / Colombiacheck.com, Colombia
- Sold From Under You, The Bureau of Investigative Journalism and HuffPost UK, United Kingdom
- OCCRP Data, Organized Crime and Corruption Reporting Project, Bosnia and Herzegovina
- Database on proceedings against public officials, Center for Investigative Journalism of Serbia, Serbia
- Foreign Lobby Watch, Center for Responsive Politics, United States
- FiveThirtyEight’s Open Data initiatives, FiveThirtyEight, United States
1.1) Açık Veri ve Veri Gazeteciliği İlişkisi
Open Definition’ın tanımına göre açık veri (open data) herhangi bir telif hakkı, patent ya da diğer kontrol mekanizmalarına tabi olmaksızın herkes tarafından ücretsiz ve özgürce ve tekrar kullanılabilen, dağıtılabilen veridir.
Açık Veri Türleri Neler Olabilir, Özellikleri Nedir?
-
Açık verinin temel özellikleri: Kullanılabilirlik-erişim, tekrar kullanım-dağıtım, evrensel katılım ve makine okunabilirliği;
-
Veri hangi durumda açıktır: Teknik ve yasal;
-
Veri neden açılmalıdır: Şeffaflık, sosyal ve ticari değerin serbestleşmesi ve katılımın sağlanması.
Veri Nasıl Açılır?
-
Basit tutularak: Küçük, basit ve hızlı şekilde işlenmesi. Tüm veri setlerinin hemen açılması gerekmez.
-
Veri seti/setleri seçimi yapılarak: Açılması düşünülen veri setinin seçilmesi.
-
Açık lisans uygulayarak: Veride hangi fikri mülkiyet haklarının bulunduğunun belirlenmesi ve en uygun açık lisansın uygulanması.
-
Veri kullanılabilir yapılarak: Verinin herkes tarafından kullanılabilir bir yapıya dönüştürülmesinin sağlanması.
-
Veri bulunabilir yapılarak: Açılan veri setlerinin bir liste halinde İnternet üzerinden yayımlanarak bulunması sağlanarak.
Örnek açık devlet verileri: opendata.go.ke, data.gov, data.gov.be, data.gov.uk, data.norge.no, geodata.gov.gr, opendata.ru, data.gov.au, open.canada.ca, dati.gov.it, datos,gub.uy. Bu örneklere farklı ülkeler de eklenebilir. Ancak henüz Türkiye’nin data.gov.tr bölümü mevcut değildir.
1.2) Açık Veri ve Kamu Yararı
Açık veri projeleri çoğunlukla yönetişimi geliştirme, okuyucuları güçlendirme, fırsat ve iş olanakları yaratma ve sosyal problemleri çözme amaçlı sonuçlar üretmeyi hedefliyor. Örneğin Meksika Rekabet Enstitüsü (IMCO) tarafından hazırlanan Mejora Tu Escuela (Okulunu Geliştir: http://mejoratuescuela.org) projesi, vatandaşlara okul performansı hakkında bilgi veren çevrimiçi bir platform şeklinde açık verilerden yararlanılarak hazırlandı. Bu veriler ebeveynlerin çocuklarının eğitimi için en iyi opsiyonu seçmelerine yardımcı olmakla kalmıyor, hem daha kaliteli eğitim talep etmelerini sağlıyor hem de çocuklarının eğitim hayatına katılmalarını kolaylaştıran bir zemin sunuyor.
Bu proje ayrıca Meksika’daki genel eğitim kalitesini yükselten süreçte okul yöneticilerine, politika yapıcılara ve STK’lara nelerin iyileştirileceğini ve hangi alanlarda yolsuzlukla mücadele edilmesi gerektiğini tespit etmek için birtakım yeni değerler sağlıyor. Bu çerçevede ailelerin de dahil edildiği dört adımla okulları tanıma, karşılaştırma, puan verme, geliştirme imkânı sunuyor. Bu adımlarla ebeveynlerin okulları daha iyi tanıması ve çocukların eğitimlerinde aktif olarak rol almasının yanı sıra mevcut okulların eğitim kalitesi de vatandaşın katkısıyla artıyor.
Platform okullara dair veriler barındırıyor. Hâlihazırda 25 veri tabanı var ve bu gün geçtikçe artıyor. Projenin internet sitesi günlük 50 bin ziyaretçi alıyor. Veri gazetecileri bu platform sayesinde Meksika eğitim sisteminin hesap verebilirliğinin artmasında, özellikle de yolsuzlukların önlenmesinde ve eğitim fonlarının gereksiz kullanılmasında sorunlara ışık tutarken bu verilerden çok etkili şekilde yararlandılar ve yararlanmaya devam ediyorlar.
İstanbul Büyükşehir Belediyesi’nin Açık Veri Portalı de (https://data.ibb.gov.tr/dataset) da Türkiye özelinde bir önemli bir açık veri kaynağı olarak gösterilebilir. Gazeteciler İstanbul’a ait yedi kategoride konuyla ilgili açık lisanslı verilere ulaşabildikleri gibi, aynı zamanda veri talebinde de bulabiliyorlar. Örneğin “İstanbul’un Sağlık Hizmetlerini Haritalamak: Bir Açık Veri Egzersizi” projesi açık verinin nasıl kullanıldığına iyi bir örnektir. Araştırmacı, İstanbul’un sağlık hizmetlerinin dağılımındaki potansiyel eşitsizlikleri açık veriyi kullanarak bulmaya çalışıyor. Analiz yönteminde eksiklikler olduğunu da okuduğumuz yazıda kullanılan açık verilere Github hesabından ulaşabiliyorsunuz.
1.3) Açık Veri Lisans Tanımı, Açık Lisanslar ve Örnek Açık Veri Siteleri
Açık Lisans: Verilerin yasal olarak ücretsiz kullanımına izin veriyorsa, söz konusu lisans açıktır. Bazı hükümetler kendi lisanslarını yazmayı veya yaygın olarak kabul edilen açık lisanslara benzer kullanım hakları veren “kullanım şartları” formüle etmeyi seçmiştir. Bu durum, hükümetlerin kullanıcılar için gereksiz bilgiler eklemesini, uyumsuzluğa neden olmasını ve verilerin tekrar kullanılmasını önemli ölçüde azaltabilir. Genel lisanslar, kullanım haklarını açıkça bildirerek bu sorunları azaltmak, verilerin paylaşımını ve yeniden kullanımını mümkün kılmak için tasarlanmıştır.
Açık/Genel Lisanslar: Telif hakkı lisansları, kanunun oluşturduğu geleneksel “tüm hakları saklıdır” yapısı içinde bir denge oluşturur. Bireysel lisans yaratıcılarından büyük şirket ve kamu kurumlarına kadar herkese basit, standartlaştırılmış bir yol ile telif izinleri verilmesini sağlar. Telif haklarının korunması çerçevesinde bu verilerle kopyalanabilir, dağıtılabilir, düzenlenebilir, karıştırılabilir ve üzerine inşa edilebilir bir içerik havuzu oluşturulabilir.
CC Lisansları ve Örnekleri: Attribution CC BY, Attribution ShareAlike CC BY-SA, Attribution-NoDerivs CC BY-ND, Attribution-NonCommercial CC BY-NC, Attribution-NonCommercial-ShareAlike CC BY-NC-SA, Attribution-NonCommercial-NoDerivs CC BY-NC-ND.
Attribution CC BY: Bu lisans, orijinal dosyanın oluşturulması için sizi desteklediği sürece ticari olarak bile çalışmanızı başkalarının dağıtmasına, yeniden düzenlemesine, değiştirmesine ve geliştirmesine olanak tanır. Bu, sunulan lisansların en uygunudur. Lisanslı materyallerin maksimum dağıtımı ve kullanımı için önerilir. Örnekler: PLOS, Saylor.org, Chris Zabriskie
Attribution ShareAlike CC BY-SA: Bu lisans, başkalarının sizi destekledikleri ve yeni tasarımlarını aynı şartlar altında lisansladıkları sürece, ticari amaçlarla bile çalışmanızı yeniden düzenlemelerine, değiştirmelerine ve geliştirmelerine olanak tanır. Sizinkine dayanan tüm yeni işler aynı lisansı taşıyacaktır, bu nedenle tüm türevlerin ticari kullanımına da izin verecektir. Örnekler: Wikipedia ve Wikimedia Commons, Arduino, Peer 2 Peer Üniversitesi (P2PU)
Attribution-NoDerivs CC BY-ND: Bu lisans, başkalarının ticari işi de dahil olmak üzere atandığı içeriğin başka amaçlar için de yeniden kullanılmasını sağlar; ancak başkalarıyla uyarlanmış biçimde paylaşılamaz ve size bir destek sağlanmasını şart koşar. Örnekler: Drupal Güvenlik Raporu, Behance, GNU / Linux ve Özgür Yazılım Vakfı (FSF)
Attribution-NonCommercial CC BY-NC: Bu lisans, başkalarının işinizi ticari olmayan şekilde yeniden düzenlemesine, değiştirmesine ve geliştirmesine olanak tanır. Yeni çalışmalarında size atıfta bulunulması ve bilgilendirilmeniz koşulu yoktur. Bu lisans altındaki çalışmalar ticari olmamasına rağmen, türev çalışmaların aynı koşullarda lisanslanması zorunlu kılınmaz. Örnekler: Brooklyn Müzesi, Jonathan Coulton, Wired.com fotoğrafçılığı
Attribution-NonCommercial-ShareAlike CC BY-NC-SA: Bu lisans, başkaları sizi destekledikleri ve yeni tasarımlarını aynı şartlar altında lisansladıkları sürece, ticari durumlar hariç çalışmalarınızı yeniden düzenlemelerine, değiştirmelerine ve geliştirmelerine olanak tanır. Örnekler: MIT OpenCourseWare, Cory Doctorow, Jonathan Worth
Attribution-NonCommercial-NoDerivs CC BY-NC-ND: Bu lisans, burada değinilen altı lisans arasında en kısıtlayıcı olanıdır. Bu lisans altında yalnızca başkalarının çalışmalarınızı indirmesine ve sizi desteklediği sürece başkalarıyla paylaşmasına izin verilir, ancak bunları hiçbir şekilde değiştirilemez veya ticari olarak kullanılamaz. Örnekler: TPB AFK, TED Sohbetleri videoları Propublica
1.4) Veri Kaynakları
Bazı Uluslararası Veri Kaynakları:
Uluslararası veri kaynakları çok çeşitli veritabanlarından ve kurumlardan yararlanılarak oluşturulur. Dünya Bankası verilerini çok sayıda organizasyonlardan yararlanarak oluşturuyor ve düzenli olarak güncelleniyor. Diğer taraftan, Uluslararası Araştırmacı Gazeteciler Konsorsiyumu’nun (ICIJ) Dünya Bankası projelerini Dünya Bankası’nın kendi verileriyle ele alarak gerçekleştirdiği araştırmacı gazetecilik çalışmalarını yakından incelediğimizde, dünya genelinde pek çok kişinin söz konusu projelerden zarar gördüğü belgeleniyor. Üç milyondan fazla kişinin 2003- 2013 yılları arasında yaşam alanlarını terk etmek zorunda kaldığını, yerinden olduklarını görüyoruz.
Diğer önemli bir veri kaynağı ise şirketlerin bilgilerine ulaşabildiğiniz Opencorporates sitesi. Bu açık veritabanında 188 milyon şirkete ait bilgi, veri ve kayıt mevcut. Araştırdığınız şirket ve konu hakkında csv, xml, json, xls formatlarında verileri indirme olanağınız da var. Platformda ayrıca görselleştirme bölümü de bulunuyor. BP, Bank of America, Citigroup, Goldman Sachs, Morgan Stanley, JP Morgan, Wells Fargo gibi çok sayıda önemli şirkete dair bilgi mevcut. Sitede bu şirketlerle ülkelerin ilişkisini, vergi ağlarını görselleştirerek görebiliyorsunuz.
Bir başka önemli uluslararası veri kaynağı ise Birleşmiş Milletler’e ait UNdata. 60 milyon kayıt, 34 veritabanı bulunan portalda araştırma konunuz ve ihtiyacınız olan veri formatına göre filtreleme yaparak veri indirebilir, bunlardan yararlanabilirsiniz.
Google’ın Public Data platformu veri ile çalışanlar için oldukça yararlı bir adres. Türkçe bölümü de mevcut. Filtreleme yapabilir, verileri görselleştirebilir, bölgeler arasında karşılaştırma yapabilir, erişime açarak, sitenize de yerleştirebilirsiniz. Tek dezavantajı, veri setlerini bir bütün olarak indiremiyorsunuz, sadece orijinal kaynağa gidip verileri indirebiliyorsunuz.
armsglobe.chromeexperiments uluslararası veri kaynağı adresi ise 1992- 2010 yılları arasında dünya genelinde küçük silah ve mühimmat ticareti verilerine, ülkelerin ithalat ve ihracat trafiğine ulaşmanızı sağlıyor.
Düzenli olarak güncellenen Ekonomik Kalkınma ve İşbirliği Örgütü’nün Veri bölümü de güncel ve yararlı bir uluslararası veri kaynağı. Filtreleme yapabilir, görselleştirme ile analiz ettiğiniz konuyu daha net görebilir, veri setlerini dilediğiniz formatta indirip kullanabilirsiniz. Ayrıca çalışmanızı erişime açarak, sitenize de ekleyebilirsiniz.
-Dünya Bankası veritabanı: http://data.worldbank.org/
-Örnek çalışma: ICIJ – Yerinden Edilme & Terk Edilmeye Zorlanma http://www.icij.org/project/world-bank
-Dünya genelinde tüm şirketlerin bilgilerinin toplandığı açık beritabanı: Open Corporates https://opencorporates.com/
-OpenCorporates görselleştirme: https://opencorporates.com/viz/financial/index.html
-OpenCorporates hakkında: http://www.verigazeteciligi.com/daha-iyi-bir-gazeteci-olmaya-yardimci-olan-14-veri-araci/
-BM Veri tabanı: http://data.un.org/
-Google halka açık veri arama bölümü: Public Data Explorer https://www.google.com/publicdata/directory
-Dünya genelinde ülkelerin küçük silah ve mühimmat – ithalat & ihracat trafiği: Small Arms and Ammunition – Imports & Exports http://armsglobe.chromeexperiments.com/
-Ekonomik Kalkınma ve İşbirliği Örgütü veritabanı: https://data.oecd.org
-Önemli bir uluslararası veri kaynağı olarak Data Catalogs: Data Catalogs
Bazı Ulusal Veri Kaynakları:
Bu veri kaynakları çeşitli veri tabanlarından ve kurumlardan yararlanılarak oluşturuluyor. Türkiye İstatistik Kurumu’nun (TÜİK) veri yayımlama takvimi bulunuyor, raporlar düzenli olarak bu takvime göre erişime açılıyor. Ayrıca, kurumun internet sitesinde bir filtreleme alt yapısı mevcut. Dosya tiplerinin ise ağırlıkta excel ve pdf olarak paylaşıldığını görüyoruz. Kategorilerine göre verilerin düzenli olarak güncellendiğini de söyleyebiliriz. Örnek olarak verilen “2020 Yılında Dolaşım Sistemi Hastalıklarına Bağlı Ölümler Arttı” haberinde kullanılan TÜİK raporunun Resmi İstatistik Programı (RİP) ve Ölüm Bildirim Sistemi kaydı ile tutularak güncellendiğini görüyoruz.
Önemli bir diğer veri kaynağı da 1921’den bugüne tüm arşivine çevrimiçi erişilebilinen Resmi Gazete. İnternet sitesinin yanı sıra Resmi Gazete’nin arşivini e-uygulamadan da incelemek mümkün. Ayrıca, sistemde ilanları, günlük yargı ilanlarını, ihale duyurularını takip etme olanağı da var. Ağırlıkta pdf formatında yer alan arşivi taramanın yollarını ilerleyen bölümlerde yer alacak olan pdf’ten Veri Kazıma bölümünde göreceksiniz.
Başta seçim dönemlerinde olmak üzere verilerine sıklıkla başvurulan kurumlardan Yüksek Seçim Kurulu’nun oylama vb. verileri Seçim Sonuçları Paylaşım Sistemi’nde illere, ilçelere göre filtrelenip, csv, excel formatlarında indirilebildiği gibi görselleştirilebiliyor.
Türkiye Odalar ve Borsalar Birliği (TOBB), Sosyal Güvenlik Kurumu (SGK), Türkiye Bankalar Birliği (TBB), Bankacılık Düzenleme ve Denetleme Kurulu (BDDK), Sermaye Piyasası Kurulu (SPK), Hazine Müsteşarlığı, Kalkınma Bakanlığı gibi kurumların paylaşıma açık bir veritabanı ve filtreleme alt yapısı mevcut. Maliye Bakanlığı’nın Bütçe ve Mali Kontrol Genel Müdürlüğü’nün aylık bütçe istatistikleri, e-bütçe vb. vd. hesaplamalarına yönelik verileri de erişime açık. Aşağıda örnek olarak bu verilere dayalı olan 2016 bütçe tasarısına yönelik bir habere yer veriyoruz.
-Türkiye İstatistik Kurumu (TÜİK): http://www.tuik.gov.tr
-Resmi Gazete: http://www.resmigazete.gov.tr/default.aspx#
-Örnek: “Resmi Gazete” Konusu Meclis’te
-Yüksek Seçim Kurulu: http://www.ysk.gov.tr
-Örnek: Seçim sonuçlarına güvenilemeyeceğinin somut kanıtını buldum
-Türkiye Odalar ve Borsalar Birliği: http://www.tobb.org.tr
-Sosyal Güvenlik Kurumu: http://www.sgk.gov.tr
-Türkiye Bankalar Birliği: http://www.tbb.org.tr
-Bankacılık Düzenleme ve Denetleme Kurulu: http://www.bddk.org.tr
-Sermaye Piyasası Kurulu: http://www.spk.gov.tr
-Hazine Müsteşarlığı: http://www.hazine.gov.tr
-Kalkınma Bakanlığı: http://www.kalkinma.gov.tr
-Merkez Bankası: http://www.tcmb.gov.tr
-Örnek:Merkez Bankasının Gerçek Faizini Birlikte Hesaplayalım
-Maliye Bakanlığı: http://www.bumko.gov.tr/
-Örnek: 2016 Bütçe Tasarısı|Gelecek Yıl Bütçeden Bin 400 Araca Daha Harcama Yapacağız
-Başbakanlık İletişim Merkezi: http://www.bimer.gov.tr/Forms/pgMain.aspx
-Örnek: Türkiyede Kamusal İletişim ve Bilgi Edinme:10 Yılın Ardından Panoramik Bir İnceleme
Veri Kataloğu: Türkiye