Yapay zekanın telif hakkı sorununa dev çözüm: 8 terabaytlık yasal veri seti yayınlandı

‘The Common Pile v0.1’: Yapay Zeka Eğitiminde Yeni Bir Dönem

Yapay zeka modellerini eğitmek için EleutherAI tarafından yayınlanan 8 terabaytlık ‘The Common Pile v0.1’ adlı veri seti, lisanslı ve kamuya açık metinlerden oluşuyor. Bu veri seti, yapay zeka alanında önemli bir dönüm noktası olabilir.

EleutherAI, büyük yapay zeka şirketlerinin telif hakkı davalarıyla karşı karşıya kalmaması adına ‘The Common Pile v0.1’ veri setini geliştirdi. Bu veri seti, Hugging Face ve GitHub platformlarından indirilebilirken, içeriğinde 300.000 kamuya açık kitabın dijitalleştirilmiş verileri bulunuyor.

Yönetici direktör Stella Biderman, telif hakkı davalarının şirketlerin şeffaflığını azalttığını ve yapay zeka araştırmalarına zarar verdiğini belirtti. Bu nedenle EleutherAI, lisanslı verilerle geliştirilen Comma v0.1-1T ve Comma v0.1-2T adlı iki yeni yapay zeka modeli oluşturarak veri setinin etkinliğini kanıtladı.

EleutherAI’nin geliştirdiği bu modeller, telifli verilerle eğitilen popüler yapay zeka modelleriyle başarılı bir rekabet sergiliyor. Biderman, yasal kaynaklarla yüksek kaliteli yapay zeka modelleri geliştirilebileceğini vurgulayarak, lisanssız metinlerin performansı artırdığı yönündeki yaygın kanının haksız olduğunu belirtiyor.

Related Posts

Opera, Microsoft’un Edge dayatmasını mahkemeye taşıdı

Microsoft’un Edge tarayıcısını kullanıcılara benimsetme çabaları, Opera’yı yasal bir hamle yapmaya itti. Şirket, Redmond devinin uyguladığı “manipülatif tasarım taktiklerini” ve rekabete aykırı yöntemleri gerekçe göstererek Brezilya’da resmi bir şikayette bulundu.

Doktorlar yerine robotlar geliyor! Ameliyata girdiler, muayene bile yaptılar

Amerika’da doktor robot dönemi başladı! UC San Diego Üniversitesi, yoğun bakım krizine çözüm bulmak için insansı robotları devreye soktu. Fizik muayeneden entübasyona kadar 7 farklı tıbbi işlemi başarıyla gerçekleştiren robot, gelecekte hastanelerde doktorların yerini alabilir mi? Sağlıkta devrim kapıda…

WeTransfer’de yapay zeka krizi: Kullanıcı tepkileri geri adım attırdı

WeTransfer, yapay zeka için kullanıcı dosyalarını kullanabileceğini belirten Hizmet Şartları değişikliğiyle tepkileri üzerine çekti. Peki ne oldu, şirket neden geri adım attı?

Otomobiller 2. sıraya düştü! İşte motosikletin zirveye oturduğu iller

Türkiye’de haziran ayı itibarıyla 6 milyon 659 bin 418 ile rekor düzeye ulaşan trafiğe kayıtlı motosiklet sayısı Aydın, Kilis, Manisa, Muğla, Şanlıurfa ve Iğdır’da otomobil sayısını geçti.

FromSoftware, 2026’ya yepyeni bir oyunla giriş yapacak

Japon oyun stüdyosu FromSoftware, oyun dünyasını bir kez daha şaşırtmaya hazırlanıyor. MP1st adlı haber sitesine göre şirket, şu ana kadar duyurulmamış olan yeni bir oyunun geliştirme sürecinde. Kod adı “FMC” olarak geçen proje, firmanın bugüne dek …

FC 26’nın ilk fragmanı geldi

Dünyanın en popüler futbol oyun serisinin yeni halkası EA Sports FC 26’nın ilk oynanış fragmanı yayımlandı. Yayınlanan videoyla birlikte, oyunun kapak yıldızları da netlik kazandı. Futbol dünyasının önemli isimleri Zlatan Ibrahimovic, Jamal Musiala …