Uptodai.com - Perkembangan teknologi kecerdasan buatan (AI) yang sangat masif telah menciptakan isu baru terkait hak cipta dan penggunaan data dalam skala besar. Akibatnya, terjadi pergeseran signifikan dalam praktik penggunaan konten dari sumber terbuka. Kini, perusahaan teknologi raksasa yang ingin melatih model mereka dengan data ensiklopedia daring tersebut harus menaati aturan baru: Wikipedia wajib bayar AI jika data mereka digunakan untuk pengembangan produk komersial.

Perubahan kebijakan ini menandai berakhirnya era web scraping gratis yang selama ini dinikmati oleh banyak pengembang AI. Praktik pengambilan data secara massal tanpa kesepakatan resmi kini digantikan dengan sistem kemitraan berbayar. Hal ini dilakukan untuk memastikan bahwa sumber pengetahuan yang dikurasi oleh manusia tersebut mendapatkan kompensasi yang layak.

Kemitraan Berbayar dengan Raksasa Teknologi

Wikimedia Foundation, organisasi di balik Wikipedia, telah menjalin kemitraan melalui entitas komersial mereka, Wikimedia Enterprises. Kesepakatan ini melibatkan beberapa pemain terbesar di industri teknologi global. Perusahaan yang kini terikat dalam perjanjian berbayar tersebut termasuk Amazon, Meta, Microsoft, Mistral AI, dan Perplexity.

Perusahaan-perusahaan ini bergabung dengan mitra yang sudah ada sebelumnya, seperti Ecosia, Pleias, ProRata, dan Google. Juru bicara Wikimedia Foundation menjelaskan bahwa semua organisasi ini memanfaatkan layanan Wikimedia Enterprises untuk mengintegrasikan pengetahuan yang disusun oleh manusia ke dalam platform mereka dalam skala yang masif. Hal ini menjadi langkah krusial dalam mendukung keberlanjutan proyek pengetahuan terbuka.

Selain itu, juru bicara tersebut juga menekankan bahwa pengetahuan yang bersumber dari Wikipedia sangat vital. Data ini memberdayakan berbagai alat canggih, mulai dari chatbot AI generatif, mesin pencari, hingga asisten suara yang digunakan oleh miliaran orang setiap hari.

Mengapa Data Wikipedia untuk Pelatihan AI Begitu Berharga?

Masa depan jangka panjang bagi pengembangan AI dan perusahaan teknologi sangat bergantung pada proyek-proyek yang menghasilkan pengetahuan yang andal. Wikipedia menawarkan data yang unik karena seluruh artikelnya dikurasi dan diedit oleh komunitas sukarelawan yang berjumlah sekitar 250 ribu orang di seluruh dunia.

Kualitas kurasi manusia ini menjadi pembeda utama dibandingkan data yang diambil dari sumber lain yang kurang terverifikasi. Wikipedia saat ini menampung lebih dari 65 juta artikel yang ditulis dalam 300 bahasa, menjadikannya salah satu gudang pengetahuan paling komprehensif dan terstruktur di internet.

Pendiri Wikipedia, Jimmy Wales, menyambut baik langkah pelatihan AI yang menggunakan data dari platformnya, di tengah maraknya masalah hukum terkait hak cipta. Ia secara pribadi merasa senang jika model AI dilatih menggunakan data Wikipedia karena aspek kurasi manusia yang sangat kuat.

Dampak Positif Data Wikipedia Wajib Bayar AI

Wales memberikan pandangan tajam mengenai perbedaan kualitas data. Ia mengungkapkan bahwa dirinya tidak ingin menggunakan model AI yang dilatih berdasarkan sumber data yang kurang terfilter, seperti media sosial X (sebelumnya Twitter) yang dimiliki oleh Elon Musk. Menurutnya, data yang berasal dari platform tersebut cenderung menghasilkan AI yang “sangat pemarah” atau tidak netral.

Keputusan untuk mengenakan biaya lisensi kepada raksasa teknologi ini juga memiliki dampak signifikan terhadap pendanaan Wikipedia. Sebagai informasi, pendanaan Wikipedia sebagian besar berasal dari donasi individu, dengan sekitar 8 juta donatur aktif.

Dengan adanya sumber pendapatan baru dari kemitraan komersial ini, Wikimedia Enterprises dapat membantu memastikan keberlanjutan operasional platform. Dana tersebut digunakan untuk menjaga infrastruktur, mendukung komunitas editor, dan melindungi integritas pengetahuan yang disajikan secara gratis kepada publik global.