Çeviri: Yaren Akkaya
Orijinal metin/ kaynak: What I use for data-driven journalism
İnsanlar düzenli olarak veri güdümlü gazeteciliği (ddj) öğrenmek için hangi araçları kullanmaları gerektiğini veya hangi programlama dilini kullanmaları gerektiğini sorarlar. Bunun için doğru bir cevap yok, özellikle teknoloji ve kullanılabilir araçların nasıl hızlıca geliştiği göz önüne alınınca.
FollowinData’dan Nathan Yau geçenlerde veri görüntülemede nasıl çalıştığını tanımladı. Onun gönderisi veri güdümlü gazetecilik araçlarına verilmiş mükemmel bir cevaptı:
“Hangi aracı öğrenmeliyim? Hangisi en iyisi? Cevap vermekte tereddüt ettim, çünkü hangisi benim için en iyisi ise ben onu kullanırım, bu başkası için en iyi olan veya “en iyi” olan olmayabilir.”
Eğer siz şimdiden bir yazılım setine alışık değilseniz, bildiğiniz şeyi bitirmeniz daha iyi olacaktır, çünkü numaralara dayandırılmış şekiller çizebiliyorsanız, veriyi gözünüzde canlandırabilirsiniz.
Benim kendi araçlarımı eleştirmek için ilgiliydim. Spoiler alarmı- bu gönderi kod merkezidir ve birçok R’ den bahseder. Çünkü bu benim alışık olduğum şeydir. Herkesin benim iş akışımı kullanması gerektiğini düşünmüyorum. Excel, Python, Javascript hakkında pek konuşmayacağım. Onların daha çok DDJ’de kullanıldığının farkındayım.
Benim tipik iş akışım ve 2016’nın araçlarına giriş yapmadan önce, haberciliğimde tek veri- gazeteci olarak çalıştığımdan bahsetmeliyim. Veri/ görsel gazetecilik takımları olabilmesi için haber çıkışlarında veri güdümlü gazeteciliğin belirli alanlarında uzmanlaşan insanlarla olması daha yaygındır. Benim iş akışım daha çok küçük bütçe üzerine veri gazeteciliğidir. Aynı zamanda ideoloji tarafından ve benim inek oluşumdan dolayı, ben sadece (neredeyse) açık kaynaklı ücretsiz araçları kullanırım. Tekrarlamak gerekirse, çünkü onlar benim daha çok alışık olduğum şeyler. Ama eğer bir şeyleri daha hızlı ve daha iyi yapabileceğim özel bir çerçeve olsaydı hiç düşünmeden değiştirebilirdim.
VERİ TOPLAMA, TEMİZLİK VE BİÇİMLENDİRME
Tabula: Bazen veri gazeteciliğinin en büyük düşmanı ile uğraşmak zorunda kalırsınız: Bir PDF’deki veri tuzağı. Bu kolay bir araçtır, kodlama gerektirmez, PDF’den daha kolay veri tablosu alma sürecini yaratır.
Open Refine: Ben genellikle direk R ‘deki işlenmemiş veri ile çalışırım. Ama eğer veri çok karışık ise, komut dosyası tarafından veya manuel olarak verinizin temizlenmesi sıkıcı olabilir. Refine açmak veri temizlenmesini interaktif ve tekrarlanabilir yapar. Bu her iki dünyanın da, komut dosyası ve manuel temizlik, en iyisini sunar.
LiberOffice/ Google sheet/ MS Excel: Daha az tablo yazılımı kullandığımda daha mutlu oluyorum. Excel ne yazık ki hala veri dağıtımında bir standart formattır. Ben genelde veriyi denetlemek ve daha kolay temizleme veya tekrar şekillendirme için onu kullanırım.
R: Benim sevgili İsveç ordu çakısı dilime tekrar geleceğim, R.R. ücretsiz açık kaynaklı istatistiksel hesaplama dili. İstatistiksel çerçeve kulağa kitlelere hikâyeler yayınlamak için katletmek gibi mi geliyor? Sadece onu veri ile başa çıkmak için en popüler programlama dillerinden biri olarak düşünün. Onun işlevselliğini genişletmek için paket yığınları ve büyük bir yardımcı kullanıcı topluluğu vardır.
Veriyi R ile kazıyabilirsiniz. (örneğin rvest ile, Python’un beautiful soup’una benzer.) Veya veriyi açık veri portallarından direkt olarak alabilirsiniz. ( World Bank, Eurostat, …) Fakat R gerçekten verinizi tidyr & dplyr gibi paketlerle şekillendirmek için diğerlerinin arasından sivrilir.( birleştirme, alt küme, toplama)
ANALİZ
Veri güdümlü gazetecilikte, verinizi hızlıca keşfetmek büyük bir öneme sahiptir. Bu veriyi sorularınızla sorgulama veya verinizde şablon veya aykırılık arama anlamına gelir.
Veri keşfi tipik bir verinizi kazdığınızda ortaya çıkan fikirler veya yeni sorular içeren tekrarlamalı bir süreçtir. Bana göre hiçbir şey R ‘yi veri analizi araştırması konusunda alt edemez. Verinizi hızlıca tekrar şekillendirebilir ve değişik grafiklerin bir dizisini üretebilirsiniz. Özellikle ggplot2 R paketi, bunun için çok yardımcıdır. Ayrıca, R indirimi ile güzel PDF’ler, kod karıştırma html raporları ve grafik sonuçları yaratabilirsiniz. İşinizi belgelemek için bu çok güzel bir özelliktir ama aynı zamanda hikâyenizle birlikte tüm metodolojinizi yayınlamanız için de güzeldir. Bilimsel makalelerle olan benzerliği, veri güdümlü gazetecilik açık, transparant ve tekrar üretilebilir bir methodla uygulanabilirdir.
ÜRETİM GRAFİĞİ
R (ggplot2 + Inkscape/ Illustrator): R ile üretilen varsayılan grafikler sadece mühendisler için geçerli olabilir… Gerçi birkaç satır kod ile güzel bir şekilde grafiğe şablon ekleyebilir ve geliştirebilirsiniz. ( örnek için ggplot2 grafiğini kontrol edin.)
Grafiğinize metin ve açıklama eklemek önem taşır. Bu tabii ki programlı R ile yapılabilir, ama eğer çok fazla ek açıklamalar varsa sıkıcı hale gelebilir. R grafikleri PDF veya SVG olarak kaydedilebilir ve manuel olarak açıklama katmanı ekleyebilmek için Inkscape Adobe Illustrator ‘da editlenebilir. Bu, benim nasıl grafiği yarattığımın örneğidir.
Ben gelecekte daha fazla statik grafiği sadece R ile üretmeyi hedefliyorum. Eğer bazı mobile- first stratejileri takip ediyorsanız, interaktif grafiklerden tasarruf ve daha fazla “ duyarlı” vektör üretmek isteyebilirsiniz. Vektör (SVG temelli) grafiklerinizin canlı ve herhangi bir ekran boyutunda mükemmel piksel görüntüsü sağlar. Duyarlı tasarım farklı cihaz boyutları ile düzeni açısından zarifçe başa çıkar. Örneğin bu R ile yapılmış grafik çoklu haritaları gösterir.
Ekranınızın boyutuna bağlı olarak, bir satırda birçok harita kutularınız olacaktır ve eğer küçükse daha az harita kutularınız olacaktır.
ETKİLEŞİMLİ VERİ GÖRSELLEŞTİRME
Datawrapper: Veri güdümlü gazetecilik ≧ süslü dataviz. Sanırım insanlar veri güdümlü gazeteciliğin süslü veri görselleştirmesinden daha fazla olduğunu biliyorlardır. Veri hikâyeleri her zaman mesajı en iyi şekilde iletmek için yenilikçi grafiklere ihtiyaç duymaz. Standart bar veya çizgi grafiği sıklıkla ifade etmek için en iyisidir. Bunun için, ben datawrapper grafik aracına düşkünüm. O açık kaynaklıdır ama duyarlı interaktif grafikler için ucuz ödeme seçenekleri sunar. Tüm gazeteciler ve bizim tarafımızdan da kullanılmaktadır. Bizim web sitemize uyan datawrapper grafik düzenimiz var, bu yüzden küçük Tweak tasarımları üzerinde zaman harcamak , genelde kod yazdığımda yaptığım gibi, bana cazip gelmiyor. Ve son zamanlarda o grafik seçeneklerini geliştirilmiştir: choropleth, kabarcık haritalar, yönlü çubuk grafikler, mermi grafik,…
R + rCharts/htmlwidgets: d3.js çok önemli etkileşimli veri görselleştirmesi için bir programlama dilidir. Bana göre, javascript/d3.js konusunda yeterisiz olan kimseler ve çalıştığım medya için 10 dilde grafik yaratmak zorunda olduğum gerçeği bakımından d3.js veri görselleştirme kodlaması çok fazla zaman alıyor.
Benim durumumda, javascripte bağlayarak R ile interaktif veri görselleştirme yaratımını güzel bir alternatif olarak buluyorum. ( rCharts veya htmlwidgets gibi paketler) Tabii ki bu d3.jd kodlaması gibi özgür bir görselleştirme sunmuyor. Ama ben limitli olanakları/ kişiselleştirmeleri zaman kurtarmaya değer olarak değerlendiriyorum. Ve iş akışı avantajında veri analizi ve üretim grafiği kodu aynı temel verilere dayanan bir komut olabilir. Bu durum tekrarlanabilirlik ve güncelleme grafiğini esintili yapar.
R’dan leaflet.js’e (harita) veya Highchart’a ( grafik kütüphanesi) bağlama sadece iki paketi isimlendirmek ve interaktif olanak zenginliği sunuyor. Burada bazı örnekler var: Bu konudakiler bunlar. Bu yazı umduğumdan uzun oldu. Ama iş akışımın anlatmak kullanmaktan daha zor olduğunu hissediyorum. Diğer DDJ insanlarının/takımlarının nasıl çalıştığını veya bazı şeyleri daha iyi veya daha hızlı yapma konusunda ipuçları olup olmadığını merak ediyorum.
Yorum ekle