Üretken Yapay Zeka Şirketlerin Verilere Yaklaşımını
5 Yolla Değiştiriyor (Veya Değiştiremiyor)
Risk sermayesi, Snowflake ve daha fazlasından uzmanlar, üretken yapay zekanın veri ekiplerine nasıl fayda sağlayacağını ve çözmeleri gereken zorlukları tartışıyor.
Üretken yapay zeka yeni bir kavram değil. On yıllardır üzerinde çalışılıyor ve sınırlı kapasitelerde uygulanıyor. Ta ki ChatGPT 2022’nin sonlarında kolektif bilincimizi şok edip şaşırtana kadar.
Yine de lazanya için bir tarif oluşturmak, bir işletme genelinde üretken yapay zeka yeteneklerini aşılamaktan veya büyük dil modellerini (LLM’ler) veri mühendisliği iş akışlarına entegre etmekten tamamen farklı bir süreçtir.
Değişim yaklaşıyor, ancak kurumların veriye yaklaşımını nasıl etkileyecek ve hala aşılması gereken engeller neler? Bunu yanıtlamak için bir araya geldik:
Kristen Werner, Veri Bilimi ve Mühendisliği Direktörü, Snowflake
Tomasz Tunguz, Genel Ortak, Theory Ventures
Lior Gavish, Kurucu Ortak CTO, Monte Carlo
Toplu olarak deneyimleri arasında yeni teknolojiler yaratmak, bir dizi GenAI girişimine fon sağlamak ve binlerce müşterinin verilerinden daha fazla değer elde etmek için yapay zekadan yararlanmasına yardımcı olmak yer alıyor.
“Üretken YZ’nin ne kadarı yutturmaca” spektrumunda tahminleri %50 ila %20 arasında değişse de, her panelist bu dönüşümsel teknolojinin günümüzde pratik uygulamaları olduğu ve muazzam bir potansiyele sahip olduğu konusunda hemfikirdi. Şimdi tekrar eden bazı temalara bir göz atalım.
Bu makalede:
Üretken yapay zekanın 5 faydası
#1- Veri erişilebilirliğinin artırılması
#2- Veri ve grafik analizinden içgörü çıkarma
#3- Yapılandırılmamış verileri işe koyma
#4- Veri hattı geliştirmeyi hızlandırma
#5- Maliyetleri düşürme (ve belki gelir yaratma)
5 üretken yapay zeka zorluğu
#1- Halüsinasyonlar, güvenilirlik ve güven
#2- Kendi sorunlarını çözme
#3- Güvenlik ve gizlilik
#4- Altyapı ve çözümler konusunda erkenciyiz
#5- Beceri seti değişimleri
5 üretken yapay zeka avantajı
Gen AI söz konusu olduğunda, gerçeği kurgudan ve pratik uygulamayı yılan yağından ayırmak zordur. Jeneratif YZ’nin hem bugün hem de yakın gelecekte kuruluşlara ve veri ekiplerine değer katmasının bazı mevcut ve olası yollarını aşağıda bulabilirsiniz.
#1- Veri erişilebilirliğinin artırılması
Veri dünyasında üretken yapay zeka için en düşük asılı meyve? Teknik olmayan kullanıcıların, belirli veri noktalarını almak için SQL sorguları oluşturabilen doğal dil istemlerini girme yeteneği.
Tomasz, “Metinden SQL’e her yerde var” dedi. “OpenAI bunu geliştiriyor. İş zekası katmanında var, veri keşif araçlarında var. Bence bu çok düşük bir olasılık.”
SQL sorgularının otomatikleştirilmesi, teknik olmayan kullanıcılar için veri erişilebilirliğini radikal bir şekilde demokratikleştirebilir ve böylece değer elde etme süresini hızlandırabilir.
Lior, “Bence yapay zeka, veri konusunda yetkin olmayan insanların … anlamlı verilere, anlamlı içgörülere erişebilme olasılığını artırıyor” dedi. “Ve SQL bilen insanlar için bile bu süreci hızlandıracak. Yani verileri daha fazla insanın eline ulaştıracağız.”
Snowflake gibi veri platformları, üretici yapay zekanın yalnızca SQL üretmekle kalmayıp kullanıcı-veri deneyimini nasıl yeniden tasarlayabileceğine yatırım yapıyor. Kristen, veri bulutunun şu anda geliştirilmekte olan daha deneysel özelliklerinden birinin LLM’leri, SQL sorgularını ve veri görselleştirmeyi nasıl birbirine bağlamayı amaçladığından bahsetti.
“Değer zincirinde doğru veriyi oluşturmak ve ardından tatmin edici bir son kullanıcı deneyimi elde etmek oldukça uzun zaman alabiliyor. Bu bir anlık bildirim mi? Bir gösterge paneli mi? Bir BI raporu mu?” dedi. “Yapay zekanın bu adımlardan bazılarını kolaylaştırma ve son kullanıcıların [daha iyi] bir son deneyimle yığına daha dikey olarak daha hızlı ulaşmasını sağlama yeteneği konusunda gerçekten heyecanlıyım… Bugün değil, ama bunun olacağını düşünüyorum.”
#2- Veri ve grafik analizinden içgörü çıkarma
Üretken yapay zeka, bir sonraki adımı atıp verilerden içgörü çıkararak verileri sorgulamanın ve görselleştirmenin ötesinde bir etki yaratabilir. Aslında bu, Tomasz tarafından halihazırda kullanılan bir süreç.
“ChartGPT sadece veri grafiğine odaklanan özel bir ürün. Ve eğer [ChatGPT] Code Interpreter ile oynayan varsa, bu oldukça çılgınca” dedi. “Halka açık bir şirketin Excel tablosunu alıp Code Interpreter’a yükleyebilir ve ondan ‘kazançlardan sonra Google’ın durumunu’ özetlemesini isteyebilirsiniz ve oldukça önemli bilgiler üretecektir.”
#3- Yapılandırılmamış verileri işe koymak
Uzman panelistlerimizin tamamı, veri ekiplerinin ve kuruluşların ilişkisel olmayan kaynaklardan değer elde etmesini sağlayacak üretken yapay zeka potansiyeli konusunda heyecanlıydı.
“Dünyada çok sayıda yapılandırılmamış veri var. Analiz etmek için özel beceriler ve araçlar gerektiren metin ve görüntüler [kaynak kısıtlı],” dedi Lior. “Gen AI’nın bu metin ve görüntü veri setlerinden yapı çıkardığını ve ilişkisel verileri işe koyabildiğimiz şekilde işe koyduğunu hayal edebilirsiniz.”
Tomasz bu süreci “bilgi kırma” olarak adlandırıyor.
“Theory’de [girişim şirketi], startup’larda topladığımız 10.000 kadar belgemiz var…. Ve yaklaşık iki hafta önce, üretken RPA adı verilen bir alanda ilk yatırım notu özetimizi hazırladık. Ve bunların hepsi sadece bu bilgilerin çok sayıda metin dosyasıyla kırılmasıyla üretildi” dedi.
Snowflake ve diğer veri platformları, veri ekiplerinin bunu gerçeğe dönüştürme becerisini hızlandıracak özellikler yayınlıyor.
“Belge Yapay Zekası, Applica’yı satın almamızın bir sonucu olarak büyüyen bir proje ve bu kullanım alanı gerçekten belge okuma ve belgeleri yorumlama ile ilgili” dedi. “Bu…. satın alma sözleşmeleri için İK ve bu tür şeyler için olabilir. Tanıştığım müşteriler bir sürü [verinin] üzerinde oturuyor ve bunlardan değer elde etmek istiyorlar.”
#4- Veri hattı geliştirmeyi hızlandırma
Üretken Yapay Zeka veri hattı mimarisinde devrim yaratabilir ya da yaratmayabilir, ancak veri mühendislerinin bunları daha hızlı bir şekilde oluşturmasına ve dağıtmasına kesinlikle olanak tanıyacaktır.
“GenAI SQL, Python, Scala ya da boru hatlarınızı hangi dilde yazıyorsanız o dilde yazma konusunda zaten çok iyi. Dolayısıyla GenAI’nin mühendisleri bu çözümleri oluşturmada daha etkili ve daha hızlı hale getirdiğini göreceğiz” diyor Lior. “10 kat daha etkili olduğundan emin değilim..ama kesinlikle %20 veya %30 daha etkili ve bu birçok ekip için anlamlı.”
Bununla birlikte Lior, veri modellemenin ve veri kaynaklarının birbirine nasıl uyduğunu anlamanın yapay zeka tarafından gerçekleştirilen bir faaliyet olmasının pek olası olmadığına dikkat çekerek, “Bence bu öngörülebilir gelecekte hala insanlar tarafından yapılacak” dedi.
#5- Maliyetleri düşürme (ve belki de gelir yaratma)
Maliyetlerin düşürüldüğü bir ortamdayız ve birçok kuruluş, üretken yapay zekanın bu girişimlere nasıl yardımcı olabileceğine öncelik veriyor.
“Kârlılığı artırmanın iki yolu var. Bunlardan biri, daha çok dışa dönük olan ve pek çok sorunla karşılaşacağınız gelir tarafıdır,” diyor Kristen. “[Kârlılığı artırmanın] diğer yolu ise dahili maliyetleri düşürmek… Pek çok insan ‘yapay zekayı kullanarak dahili maliyetleri nasıl düşürebiliriz’ diye soruyor. O zaman umuyoruz ki, daha dışa dönük ve gelir getirici kullanım durumlarına giden yolu oluşturmaya yardımcı olabilecek pek çok ders öğrenilir.”
5 üretken yapay zeka zorluğu
Artık hepimiz yapay zekanın olanaklarıyla sarhoş olduğumuza göre, bazı çok gerçek zorluklar ve kısıtlamalarla ayılma zamanı geldi.
Bunlar şunları içerir:
#1- Halüsinasyonlar, güvenilirlik ve güven
Büyük dil modellerinin halüsinasyon gördüğü ya da başka bir deyişle kendinden emin bir şekilde yanlış sonuçlar ürettiği artık oldukça iyi anlaşılmıştır. İyi gerekçelendirilmiş argümanları genellikle doğru olanlarla karıştırdığımız için bu zorlayıcı olabilir.
Tomasz, “İster halüsinasyonlar olsun, ister GenAI’nin genel amaçlı olmayan çok özel alanlarda çalışmasını sağlamakla ilgili zorluklar olsun, bazı zorlukları gördük… Bence tüm bunlar hala önemli zorluklar” dedi.
Ancak bunlar sadece halüsinasyonlar değil. Analitik gösterge tabloları ve makine öğrenimi uygulamaları gibi, üretken yapay zeka modelleri de yalnızca eriştiği veya üzerinde eğitildiği temel veriler kadar güvenilir ve güvenilir olacaktır. Bunlar yeni sorunlar değil, ancak daha yaygın olacaklar ve daha ölçeklenebilir çözümler gerektirecekler.
Lior, “İş sorularını yanıtlamak için hangi veri setinin kullanılacağını, nasıl doğrulanacağını, nasıl temizleneceğini ve nasıl bir araya getirileceğini seçmek, döngüde daha az analistiniz olduğunda, bugün var olan bazı yönetişim sorunlarını daha da kötüleştirecektir” dedi. “Hangi veri setlerinin güvenilir, hangilerinin yararlı olduğunu nasıl belirlersiniz ve verileri bir model için yararlı hale getirmek için doğru meta verilere ve belgelere nasıl sahip olursunuz?”
Altta yatan veri yığını, üretken yapay zekanın altta yatan verileri anlaması için de önemli bir kılavuz görevi görecek.
Kristen, “Modele, dünyanın geri kalanı hakkında bildiklerine dayanarak işinizi nasıl yorumlayacağını soruyorsanız, dünyanın geri kalanı işinizi nasıl yorumladığınızı bilmiyor” dedi. “Veri yığınınıza, sonraki her katmana hizmet eden bir iş mantığını nereden yerleştirirsiniz? Bence işinizle ilgili, ister varlıkla ilgili ister ilişkiyle ilgili olsun, bazı temel kuralları veri yığınınızın temel katmanında düzenlemek hem [model hızına hem de doğruluğuna] hizmet edecektir.”
#2- Kendi sorunlarını çözme
Tomasz, daha kapsamlı görevler için üretken yapay zeka kullanmanın zorlukları hakkında ilgili bir deneyimini paylaştı:
“Bir sunum hazırlıyordum ve belirli bir GitHub deposunun GitHub yıldız büyümesinin grafiğini çıkarmak istedim. Bu yüzden oluşturmam gereken iki ya da üç kod parçası vardı. Bu yüzden robottan bilgiyi almak için bir tarayıcı üretmesini istedim. Bir diğer kısım da bunu gerçekten çizmekti ve sonra bunu otomatikleştirmek istedim, böylece ona geçmesi gereken depoların bir listesini verebilecektim” dedi. “Böyle büyük bir problem parçasını alıp tek tek görevlere ayırmak ve sonra onu inşa etmekte gerçekten zorlandı.”
Ayrıca Gen AI modellerinin bir hata yaptıktan sonra kendilerini köşeye sıkışmış bulma eğiliminden duyduğu hayal kırıklığını da dile getirdi.
“[Kodun] çalışmadığı yanlış bir yola girdiğinde, yaptığı hatayı unutmakta gerçekten zorlanıyor ve gelişmeye devam etmek istiyor ve oturumu yeniden başlatmanız gerekiyor. Çok ama çok kalıcı bir hafızası var” dedi.
#3- Güvenlik ve gizlilik
Tomasz’a göre bu muhtemelen Gen AI’nın yaygın olarak benimsenmesinin önündeki en büyük engel.
“Fortune 2000’deki birçok [banka ve şirket] [Gen AI’yı] hep birlikte engelledi. Bence birçoğu, kontrol edebilmek için yapay zeka ürünlerinin bir Azure VPC içinde gönderilmesini bekliyor” dedi. “Bulutta, birden fazla müşterinin aynı makinede olduğu çoklu kiracılığa geçtik… LLM’lerle, müşteriler bunu kabul edecek mi yoksa gerçekten müşteri bazında bir LLM’ye ihtiyacımız var mı?”
Sektör bu soruları çözmenin ilk aşamalarında ancak şu ana kadar bu güvenlik ve gizlilik sorunlarını çözmenin dört ana yolu var:
Yasaklamak
LLM’ye periyodik olarak “tüm verilerimi unutun ve eğitim için kullanmayın” demek
Kişisel olarak tanımlanabilir bilgileri engellemek için bir ara katman kullanmak
Riski kabul etmek
Çözüm genellikle kullanım durumuna göre belirlenir. Şablonlu bir web sitesi oluşturmak, müşteri bilgilerinin ve kredi kartlarının işlenebileceği müşteri hizmetlerinden çok daha az risk taşır.
Ve elbette, hızlı enjeksiyon konusu ve SQL enjeksiyonu ile ilgili bir xkcd gündeme gelmeseydi, bu bir üretken yapay zeka tartışması olmazdı.
#4- Altyapı ve çözümler konusunda erkenciyiz
Yönetişim, güvenilirlik, güvenlik ve diğer jeneratif yapay zeka zorluklarının üstesinden gelmek, bugün tam olarak mevcut olmayan sağlam bir altyapı gerektirecektir.
“Altyapı ve çözüm tarafı dediğim şey için henüz erken. Şu anda Gen AI hakkında konuştuğumuzda, çoğu insan için bu OpenAI’nin API’lerini kullanmak anlamına geliyor. Seçkin birkaç kişi bazı açık kaynak modelleri ve vektör veritabanlarıyla oynuyor olabilir, ancak bunun etrafındaki araçların oldukça erken olduğunu düşünüyorum” dedi.
Sınıflandırma ve erişim kontrolü, destekleyici altyapının yardımcı olabileceği diğer iki zorluktur.
“Veri sınıflandırması zor bir sorun. Erişim kontrollerini ve daha sonra ölçekli erişim kontrollerini düşündüğünüzde… sınıflandırma konusunda zaten bir anlayışa sahip olmanız gerekir,” diyor Kristen. “Bu alanda çok zaman harcıyoruz ve Snowflake’e özgü bazı özelliklere de sahibiz.
PII’yi anlamak aslında o kadar da zor değil, ancak bence insanların özel sınıflandırıcılar oluşturmasını sağlamaya odaklanılıyor. Çünkü evren sınırsızdır ve neyin ticari sır veya müşteri verisi olduğunu [düşünürseniz], bu bir şirket içinde dinamik olabilir.”
#5- Beceri seti değişimleri
Tartışmanın belki de en uzun bölümü, hem yeni ortaya çıkan üretken yapay zeka beceri setlerine olan talep hem de bu büyük dil modellerinin kurum genelinde kullanılmasından kaynaklanacak işgücü değişimleri etrafında yoğunlaştı.
Büyük kazananlar? Özellikle farklı üretken YZ modellerini değerlendirmek ve ince ayar yapmak için hizmetlerine katlanarak artan bir talep görecek olan veri ekipleri.
Tomasz, “Bence bazı [sorumluluklar] veri ekibine geçecek çünkü çıktıların doğru olduğundan ve kullanılan çözümlerin o işletmeye uygulanan yönetmeliklere uygun olduğundan emin olmaları gerekecek” dedi. “Ve ilk değerlendirmeden devam eden bakıma kadar sorumlu olacak olanlar da onlar olacak. Bu yüzden veri ekiplerinin büyüyeceğini düşünüyorum.”
Lior, geçmişteki teknolojik ilerlemelerin daha az veri çalışanı olacağına işaret etmediğini, aksine verilerden daha fazla değer üreteceğimizi belirtti.
“Bunu geçmişte yazılım konusunda defalarca gördük. Sonunda Assembly’den çok daha üretken olan Python’a geçtik. Ama bu daha az yazılım mühendisimiz olduğu anlamına mı geliyordu? Hayır, daha fazla yazılım mühendisimiz oldu ve dünyada daha fazla yazılımımız oldu ve bence bu öngörülebilir bir gelecek için de geçerli.”
Kristen’in de vurguladığı gibi, bu artan talep karşısında karşılaşılacak zorluklardan biri de beceri açığını kapatmak olacaktır.
“Gördüğüm ivme, OpenAI öncesi dönemde olduğu gibi… daha fazla insanın SQL yapmasını sağlayarak beceri açığını kapatmaya çalışıyor. Tüm altyapıyı, modelleri ve LLM’lerle konuştuğumuz her şeyi yönetmek, bunun yığının daha derinlerinde olduğunu hissediyorum… daha fazla SQL analisti değil, farklı bir persona.”
Veri ekipleri için heyecan verici bir dönem
Uzman panelimizin de açıkça ortaya koyduğu gibi, üretken yapay zeka, kuruluşların verileri hakkında düşünme ve verilerinden değer elde etme biçimleri üzerinde büyük bir etkiye sahip olacak… sadece bu Twitter X gönderilerinin sizi inandıracağından biraz daha uzun sürebilir.
Veri alanında olmak ve bu önemli zorluklardan bazılarını çözme fırsatına sahip olmak için heyecan verici bir zaman.