Yapay Zeka Çağında Veri Kooperatifleri

Veri kooperatifleri, sadece teknolojik gelişmelerin değil, aynı zamanda ekonomik ve sosyal adaletin de önemli bir parçası olabilir. Kooperatif ekonomileri; demokratik yönetişim, değer paylaşımı ve karşılıklı fayda ile uyumlu olan modelleri benimseyerek, yapay zeka çağının getirdiği sorunlara yenilikçi ve adil çözümler sunabilir.

Özgür KURTULUŞ

2023, yapay zeka (YZ) teknolojisinin öne çıktığı bir yıl oldu. Özellikle son birkaç yılda yaşanan baş döndürücü gelişmeler, YZ’nin her sektörde daha fazla kullanılacağı, diğer dijital teknolojilerle ve araçlarla bütünleşeceği, iş ve çalışma hayatının YZ merkezli olarak hızla dönüşeceği ve YZ’den kaynaklanan küresel ve toplumsal problemlerin tartışılacağı bir geleceğe işaret ediyor. Bu yazıda, birçok ekonomik ve sosyal boyutu olan YZ olgusunun veri ile olan ilişkisine ve bu ilişki çerçevesinde veri kooperatiflerine odaklanacağım.

YZ, insan gibi düşünme, öğrenme, karar verme ve problem çözme yeteneklerine sahip bilgisayar sistemleri anlamına geliyor. Ancak YZ bir başka teknolojik yenilik değil; 70 yıllık bir akademik çalışma alanı, tarihi Antik Yunan’a kadar uzanan bir insanlık ideali, bilgi ve iletişim teknolojilerinin kutsal kasesi. Bu çerçevede YZ diğer dijital teknolojilerle değil, matbaa, elektrik, internet gibi toplumda derin değişimlere sebep olan teknolojilerle karşılaştırılıyor.

YZ modellerinin temel iki bileşeni var: Algoritması ve eğitildiği “büyük veri”. Veriler, YZ modellerinin öğrendiği ve işlediği bilgiler, adeta YZ sistemlerinin besinleri. YZ sistemleri, büyük miktarda veriyi analiz ederek öğreniyor, tahminlerde bulunuyor ve örüntüleri taklit ederek karar-kullanalar alıyor. Dolayısıyla bir YZ sisteminin başarılı olması eğitildiği verinin niteliği ve miktarı ile doğrudan ilişkili. Bu büyük veriyi hacimsel olarak hayal edebilmek için 2022 yılının Haziran ayında sadece belirli bir araştırmacı grubunun kullanabildiği ChatGPT-3 üretken YZ modelinin 50 milyar kelime ile eğitildiğini söyleyelim. Bu sayı, 1000 yıl aralıksız okuyan bir insanın dahi erişemeyeceği kadar büyük.

Yapay Zeka, Telif Hakları ve Veri Güvenliği

Peki, bu veriler nereden geliyor? YZ modelleri ilk olarak internetteki kamuya açık tüm veriyi emiyor. İnternette her saniye yüklenen dokümanlar, konum verileri, video ve fotoğraflar, sosyal medya içerikleri ve daha birçok veri ile bu büyük veri hacimsel olarak sürekli artıyor. Apple şirketinin kurucularından Steve Wozniak’a göre, artık insanlığın 2000 yılına kadar ürettiği tüm verinin iki katını her gün üretiyoruz. Bu ise yaklaşık olarak günde 2,5 milyar megabyte demek. Dolayısıyla internetin büyümesi ve veri kazıma-işleme teknolojilerinin gelişimine paralel olarak giderek ekonomik önem kazanan verilerin pazarlanması, bugün Meta, Microsoft, Google, Amazon gibi büyük teknoloji şirketleri başta olmak üzere, büyük bir sektörün ana gelir modelini oluşturuyor. Örneğin Google ve Meta’nın ana gelir modeli veri toplamak, işlemek ve satmak üzerine kurulu. YZ ile birlikte daha da önem kazanan bu veriler, özellikle kullanıcı verileri günümüzün petrolü olarak kabul ediliyor.

Öte yandan, YZ modellerinin eğitildiği büyük veri ile ilgili önemli sorunlar var: Telif hakları ve veri güvenliği. Bugüne kadar YZ modelleri geliştiren OpenAI, Google, Mid-Journey gibi şirketler, modellerini geliştirdikleri veriler için hiç kimseye ödeme yapmadı. Web sitelerinde kamuya açık olarak sunulan tüm bilgileri hiçbir mali ve hukuksal yükümlülük altına girmeden sömürdü. Bunu da yasalarda bulunan gri alanları kullanarak yaptı, çünkü internetteki verilerin YZ modellerini eğitmek için kullanılmasını engelleyen açık bir yasa yok. Nitekim örneğin Aralık 2023’te New York Times gazetesi telif yasaları ile korunan içeriklerinin, YZ modellerinin eğitiminde izinsiz kullanıldığı gerekçesiyle hem OpenAI hem de Microsoft’u dava etti. ChatGPT4’ün veri setinde New York Times’ın 2907 bağlantısı bulunuyor. Yani tüm kaynakların %1,5’i bile değil. Bu ilk bakışta az gibi görünse de modelin eğitildiği büyük veri göz önüne alındığında, söz konusu edilen on binlerce makale demek. Gazete, ABD yasaları uyarınca kendi içerikleri ve telif haklarıyla kullanılan içeriklerle eğitilen GPT modeli başta olmak üzere, tüm büyük yapay zeka dil modellerinin kapatılmasını talep ediyor.

Bir diğer önemli konu ise kullanıcıların veri güvenliği ve sahipliği. YZ modelleriyle çalışırken bu sistemlere veri yüklüyoruz. Bu verilerin güvenliği, telif haklarıyla ilgili sorunlar gibi konular, YZ’nin kullanımında önemli bir mesele haline geliyor. Örneğin Microsoft, Copilot adını verdiği uygulaması ile dil modellerini ve Microsoft Graph’ı birleştirerek gelişmiş işlevsellik ve bağlamsal kullanım durumları sağlıyor. Bu entegrasyon, kullanıcılar için verimlilik avantajları sağlasa da, önemli veri güvenliği endişelerini beraberinde getiriyor. Bu endişelerden biri, kullanıcıların kişisel verilerinin Microsoft Graph içinde emilmesi olabilir. Yani Microsoft bu verilerin sahipliğini umursamadan onları kullanabilir. Ayrıca, kullanıcılar veri katkıları için hiçbir karşılık almazken, gelişmiş özellikler için ödeme yapmak zorunda kalabilirler. Bunun ötesinde, kullanıcı verilerinin, kullanıcının katılımı olmadan diğer YZ modellerinin eğitiminde potansiyel olarak kullanılması da söz konusu olabilir.

Veri Kooperatifleri, Ekonomik ve Sosyal Adalete Katkı Sağlayabilir mi?

Veri bu kadar önemli bir ekonomik değere erişmesine rağmen bundan para kazananlar bu verileri üretenler değil, işleyen teknoloji şirketleri oluyor. İşte bu noktada, veri sahiplerinin de veriden ekonomik fayda sağlamasına yönelik veri kooperatiflerinin kurulduğunu görüyoruz. Bir platform kooperatifçiliği türü olan veri kooperatifleri, veri sahipleri tarafından oluşturulan, sahiplenilen ve işletilen yenilikçi bir veri altyapısı türü. Veri kooperatifleri, veri sahiplerine verileri üzerinde kontrol hakkı vererek, veri komisyoncusu teknoloji şirketlerine karşı bir denge unsuru oluşturuyor. İngiltere merkezli TheGoodData, Danimarka merkezli Data Coop, Singapur merkezli Data Union, bu alanda başarılı öncü örnekler olarak görülebilir. Ayrıca MiData ve Salus Coop, üyelerinin sağlık verilerini bir araya getirmelerine ve paylaşmalarına olanak tanıyor. Swash, üyelerinden web gezinti verilerini toplarken Driver’s Seat, gig ekonomisi çalışanlarının akıllı telefonlarından işle ilgili verileri toplayan sürücülere ait bir kooperatif olarak işlev görüyor. Resonate ise müzisyenler, plak şirketleri ve hayranlar tarafından ortaklaşa sahip olunan bir veri kooperatifi.

Bu kooperatifler, kullanıcıların verilerini kontrol etmelerini ve değer üretimine aktif olarak katılmalarını sağlayarak, algoritmanın ve elde edilen modellerin kolektif olarak sahip olunmasına ve yönetilmesine imkan tanıyor. Bu yenilikçi yapılar, açık kaynak, Web3 DAO’ları, veri protokolleri, veri blok zincirleri ve veri pazarları gibi ekosistemlere aktif olarak katılarak, kooperatif değerlerini yeni ekonomilere taşıyabilir ve yeni gelir kaynakları geliştirebilir. Veri kooperatifleri, sadece teknolojik gelişmelerin değil, aynı zamanda ekonomik ve sosyal adaletin de önemli bir parçası olabilir. Kooperatif ekonomileri; demokratik yönetişim, değer paylaşımı ve karşılıklı fayda ile uyumlu olan modelleri benimseyerek, yapay zeka çağının getirdiği sorunlara yenilikçi ve adil çözümler sunabilir. Bu, sadece teknoloji dünyasında değil, genel olarak ekonomik ve sosyal yapılarımızda da önemli bir dönüşüm için bir başlangıç noktası olabilir.