Yapay zeka veri merkezlerindeki büyüme, disk piyasasını altüst ederek internet arşivciliğini zorlaştırıyor. 404 Media’daki haber, bu krizi Internet Archive, Wikimedia ve “data hoarder” topluluklarının gözünden anlatıyor.[1][2]
Haber, SSD ve HDD fiyatlarının son dönemde ciddi biçimde yükseldiğini, özellikle büyük kapasiteli disklerin bulunmasının zorlaştığını aktarıyor. Bunun ana nedeni, büyük yapay zeka şirketlerinin veri merkezleri için uzun vadeli ve devasa disk siparişleri geçmesi; sonuçta kamusal yarar için arşiv yapan kurumlar bile donanım bulmakta zorlanıyor.[1]
Internet Archive kurucusu Brewster Kahle, günde yaklaşık 100 TB yeni içerik topladıklarını ve mevcut 210 PB’lık arşivi ayakta tutmak için sürekli disk yenilemek zorunda olduklarını söylüyor. Tercih ettikleri 28–30 TB disklerin ya piyasada yok ya da eskisine göre çok daha pahalı olduğuna dikkat çekiyor.[1]

Wikimedia Vakfı da Wikipedia ve diğer projeler için depolama maliyetlerinin arttığını, bunun da bütçe planlamasını zorladığını belirtiyor. Kurum, donanım yatırımlarını erteleme, mevcut sistemlerin ömrünü uzatma gibi “idare etme” stratejilerine yönelmiş durumda. Reddit’teki r/DataHoarder kullanıcıları ise bireysel arşivcilik projelerini askıya aldıklarını, disk alımını minimuma indirdiklerini anlatıyor.[2][1]
Haberin bir diğer boyutu, yapay zeka şirketlerinin kontrolsüz veri kazımasına karşı verilen tepkilerin arşivciliğe yan etki yapması. Birçok site sahibi, LLM eğitimi için veri çeken botları engellemek için robots.txt dosyalarını sertleştiriyor ya da içerikleri kayıt/ücret duvarlarının arkasına alıyor. Electronic Frontier Foundation, Internet Archive gibi projeleri engellemenin yapay zekayı durdurmadığını, buna karşılık web’in tarihsel kaydını zayıflattığını vurguluyor.[1]
Bütün bunlar dijital hafızanın siyasetine dair kritik sorular açıyor: Hangi içerikler arşivlenecek, hangileri gözden çıkarılacak? Disk ucuzken seçicilik görece daha gevşek yapılabiliyordu; şimdi ise maliyet baskısı, arşivcileri daha sert önceliklendirmeye zorluyor. Özellikle marjinal toplulukların sesleri, küçük bloglar, yerel haber siteleri ve sosyal hareket arşivleri ilk kaybedenler arasında olabilir.[1]
Bir yandan da “AI slop” diye nitelenen yapay zeka üretimi içeriklerin hızla çoğalması, “neyi arşivlemeye değer bulduğumuz” sorusunu karmaşıklaştırıyor. Arşivciler, insan üretimi ve toplumsal açıdan kritik içeriklere öncelik vermenin teknik ve etik kriterlerini yeniden tanımlamak zorunda kalıyor. Bu tartışma, Türkiye’deki dijital arşivcilik, web kazıma ve alternatif medya projeleri açısından da çok önemli.[2]
Türkiye’de Internet Archive ölçeğinde bir yapı olmasa da, üniversite kütüphaneleri, kamu kurumları, bağımsız araştırmacılar ve sivil toplum örgütleri giderek daha fazla dijital arşiv oluşturuyor. Donanım maliyetlerindeki artış, zaten sınırlı bütçeleri zorlayarak tez arşivleri, yerel gazete koleksiyonları, aktivist medya arşivleri gibi alanlarda “minimum düzeyde” saklama riskini büyütüyor.[1]
Bundan çıkarılabilecek bazı dersler var: Depolama stratejilerini (bulut, yerel, bant vb.) daha baştan çeşitlendirmek; açık formatlar ve sıkıştırma politikalarıyla daha verimli arşivleme pratikleri geliştirmek; uluslararası arşiv projeleriyle işbirliğini artırmak; yapay zeka şirketlerinin veri iştahına karşı alınan önlemlerin, arşivciliği yanlışlıkla cezalandırmamasını sağlamak için ince ayarlı erişim politikaları tasarlamak.[1]
Sonuçta yapay zeka sadece “akıllı” yazılımlar meselesi değil; donanım, enerji, hammadde ve bilgi adaletiyle iç içe bir altyapı meselesi. Disk kıtlığı hikayesi, AI etiği tartışmalarının veri merkezlerinden arşiv odalarına, oradan da yerel dijital hafıza projelerine uzanan geniş bir hattı kapsaması gerektiğini gösteriyor.[1]
⁂
1. https://www.404media.co/the-ai-hard-drive-shortage-is-making-it-more-expensive-and-harder-to-archive-the-internet/
2. https://www.reddit.com/r/DataHoarder/comments/1t4irqt/the_ai_hard_drive_shortage_is_making_it_more/



