[Çeviri] Çeşitli Veri Setlerinden Önyargıyı Temizleyebilecek Beş Araç ve Sistem

Kaynak: https://analyticsindiamag.com/heres-how-to-fight-prejudice-in-artificial-intelligence/

Yapay zekâ ve makine öğrenmesi modellerindeki algoritmik önyargı birçok araştırmacının araçlar ve çerçeveler oluşturarak teşhis etmeye ve azaltmaya çalıştığı bir problemdir. Yaygın önyargılar arasında cinsiyet ve ırk önyargısı örnek olarak gösterilmektedir. Makine öğrenimi modelleri insan kaynaklı veriler tarafından eğitildiği için önyargıyı tamamen ortadan kaldırmak imkansızdır. Ne var ki araştırmacılar bu sorunu engellemek için önyargıları tanımlayacak ve üzerinde çalışacak araçlar geliştirmek için aktif olarak çalışmaktadırlar.

Princeton Üniversitesi’nde yapılan son çalışmalarda, araştırmacılar, yapay zekâ gibi bilgisayarlı görü modellerini eğitmek için kullanılan görüntü veri setlerindeki olası önyargıları tanımlayan bir araç geliştirdi. REVISE adındaki açık kaynaklı araç, görsel veri setlerindeki olası yargıları otomatik olarak açığa çıkarabilmektedir. Princeton Görsel Yapay Zekâ Laboratuvarındaki bu bulgular daha önceki araştırmalarla karşılaştırıldığında önyargıyı azaltmakta daha etkili bir yol olduğunu ortaya koymuştur.

REVISE (REvealing VIsual biaSEs (Görsel Önyargıları Ortaya Çıkarma)), veri setlerini incelemek ve üç boyutta (nesne, cinsiyet ve coğrafya tabanlı) karşımıza çıkan önyargıları tanımlamak için istatistiksel yöntemler kullanır. Araştırmacıların belirttiği üzere, REVISE, bir veri setindeki görüntüleri kullanıcıdan daha fazla yönlendirme gerektirecek şekilde filtreleyip, dengeleyerek çalışır. Araştırmanın alıntıları belirtiyor: “Objelerin sayısı, objelerin ve insanların ortak bulunuşu ve fotoğrafların ait olduğu ülkeler gibi var olan fotoğraf notlarını ve ölçümlerini kullanarak önyargıyı inceliyor.”

Şubat 2020’ye uzanan çalışmada, Princeton ve Stanford Üniversitesi’nden araştırmacılar, yapay zekadaki önyargı sorununu ele alarak insanların görüntülerini içeren daha adil veri setleri oluşturacak yöntemler geliştirdi. Bu yöntemler, bilgisayarlı görü modelleri geliştirmek için yaygın olarak kullanılan ve 14 milyondan fazla resme sahip veri tabanı Image Net’te iyileştirmeler önererek çalıştı. Örneğin, Image Net’in kişi kategorileri arasında ırk ve cinsiyet özellikleri gibi görsel olmayan kavramları ve saldırgan kategorileri belirleyerek bunların veri tabanından kaldırılmasını önerdi.

Görüntü veri setlerinde önyargıyı saptamaya yönelik bu gelişmeler bilgisayarlı görü alanında devrim yaratırken, yapay zekâ ve makine öğrenmesi modellerindeki önyargıyı kaldırmak için kullanılan beş araç ve çerçeveye aşağıda yer verilmiştir.

FairML

Makine öğrenimi modellerindeki önyargıyı tanımlayan bir çerçeve olan FairML, doğrusal ve doğrusal olmayan modeldeki önyargıyı ortaya çıkarmak için makine öğrenimi modelinde kullanılan özelliklerin önemini ve göreceli anlamını tespit ederek çalışır. Bu çerçeve, önyargılı olabilecek verileri bulmak için cinsiyet, ırk ve din gibi özellikler üzerinde çalışabilir. FairML, modelin adilliğini değerlendirmeye yardımcı olan girdideki göreceli önemin miktarını belirleyerek tahmin modellerini kontrol eder.

IBM AI Fairness 360

IBM’in, 70’ten fazla adalet göstergesi ve 10 önyargı azaltma algoritması üzerine geliştirilen açık kaynaklı araç seti büyük veri setlerinden kaynaklanan önyargıların azaltılmasına yardımcı olur. Bu önyargı algoritmaları, yeniden ağırlıklandırma ve optimize edilmiş ön işleme alanlarında çalışır. Bir geliştirici, bu önyargı azaltma algoritmalarını adilliği tanımlamak ve orijinal modelle karşılaştırmak için kullanabilir. Açık kaynaklı bir araç seti, yapay zekâ uygulamalarının yaşam döngüsü boyunca, makine öğrenimi modellerindeki ayrımcılığı azaltmak, raporlamak ve açıklamak için kullanılabilir.

Accenture’s “Teach and Test” Methodology

Accenture tarafından 2018’de tanıtılan bu çerçeve, yapay zekâ sistemlerinin iki aşamada doğru kararlar üretmesini sağlar – öğret ve test et. Öncelikli odak makine öğrenimini eğitmek için kullanılan algoritmalara, modellere ve veri seçimi üzerindeyken, ikincisi yapay zekâ modeli puanlama ve değerlendirme üzerinde çalışır. Bu metodoloji, herhangi bir formda önyargı veya risklerden kurtulurken, üretime yerleştirilecek en iyi performans gösteren modeli seçmek için farklı modelleri dener ve istatistiksel olarak değerlendirir. Çoğunlukla finansal hizmetlerde kullanılan bu ürün, müşteri önerilerinde %85 doğruluk oranına ulaşmaktadır.

Google’ın What-If Aracı

Google’ın etkileşimli açık kaynak aracı, kullanıcının makine öğrenimi modellerini görsel olarak araştırmasına olanak tanır. Açık kaynak TensorBoard’un bir parçası olarak, eğitimli TensorFlow modellerine ek veri setlerini analiz edebilir. Ayrıca modellerin farklı senaryolar altında nasıl çalıştığına dair bir anlayış sağlar ve model performansını açıklamak için zengin görselleştirmeler yapar. Önyargı algılama özelliği, kullanıcının bir veri kümesindeki örnekleri manuel olarak düzenlemesine ve bu değişikliklerin etkisini ilgili model aracılığıyla incelemesine olanak tanır. Algoritmik adalet analizi, özellikleri algılayabilir ve önceden tanımlanamayan kalıpları keşfedebilir.

Microsoft’s Fairlearn

Microsoft’un açık kaynaklı araç seti, yapay zekâ araştırmacılarına ve veri bilimcilerine, kendi yapay zekâ sistemlerinin adilliğini tespit etmelerine ve düzeltmelerine olanak sağlar. Etkileşimli görselleştirme paneli ve önyargı azaltma algoritması olmak üzere iki bileşenden oluşan bu araç, modelin adilliğini ve performansını oldukça büyük ölçüde iyileştirmeye çalışır. Şirketin belirttiği üzere, yapay zekâ sistemlerindeki adalete öncelik vermek sosyoteknik bir zorluktur ve bu aracın amacı adaletle ilgili zararları olabildiğince azaltmaktır.

Kaynak: 5 Tools & Frameworks That Can Clear Bias From Various Datasets