Yapay zekanın telif hakkı sorununa dev çözüm: 8 terabaytlık yasal veri seti yayınlandı

‘The Common Pile v0.1’: Yapay Zeka Eğitiminde Yeni Bir Dönem

Yapay zeka modellerini eğitmek için EleutherAI tarafından yayınlanan 8 terabaytlık ‘The Common Pile v0.1’ adlı veri seti, lisanslı ve kamuya açık metinlerden oluşuyor. Bu veri seti, yapay zeka alanında önemli bir dönüm noktası olabilir.

EleutherAI, büyük yapay zeka şirketlerinin telif hakkı davalarıyla karşı karşıya kalmaması adına ‘The Common Pile v0.1’ veri setini geliştirdi. Bu veri seti, Hugging Face ve GitHub platformlarından indirilebilirken, içeriğinde 300.000 kamuya açık kitabın dijitalleştirilmiş verileri bulunuyor.

Yönetici direktör Stella Biderman, telif hakkı davalarının şirketlerin şeffaflığını azalttığını ve yapay zeka araştırmalarına zarar verdiğini belirtti. Bu nedenle EleutherAI, lisanslı verilerle geliştirilen Comma v0.1-1T ve Comma v0.1-2T adlı iki yeni yapay zeka modeli oluşturarak veri setinin etkinliğini kanıtladı.

EleutherAI’nin geliştirdiği bu modeller, telifli verilerle eğitilen popüler yapay zeka modelleriyle başarılı bir rekabet sergiliyor. Biderman, yasal kaynaklarla yüksek kaliteli yapay zeka modelleri geliştirilebileceğini vurgulayarak, lisanssız metinlerin performansı artırdığı yönündeki yaygın kanının haksız olduğunu belirtiyor.

Related Posts

17 Yaş Altı Grekoromen Güreş Milli Takımı Kuzey Makedonya’ya gitti

Kuzey Makedonya’da yapılacak Avrupa Şampiyonası’nda madalya mücadelesi verecek olan 17 Yaş Altı Grekoromen Güreş Milli Takımı, ülkeye hareket etti.

Windows’ta bir devir kapanmak üzere: Denetim Masası’ndan bir kilit ayar daha taşınıyor!

Windows yaptığı değişiklikler ile birlikte kullanıcılara daha kolay bir işletim sistemi sunmayı hedefliyor.

NASA uyarısı: Ülkelerden biri “cehennem” sıcaklığından yok olacak

NASA’nın son iklim simülasyonları, küresel sıcaklık artışının mevcut hızını koruması durumunda yakın gelecekte en az bir ülkenin “cehennem sıcaklıkları” olarak tanımlanan insan yaşamını imkânsız kılacak aşırı ısılara maruz kalacağını ortaya koydu.

Maalesef kötü haber geldi: ‘GTA 6 tamamen oynanamaz halde’

GTA 6 hayranları, yayınlanan ikinci fragmanda fark ettikleri hata nedeniyle oyunu “Oynanamaz halde” olarak değerlendirdi.

FBI’ın açıklaması korkuttu, risk Türkiye için de geçerli: Biri bizi gözetliyor! ‘Yatak odasındaki televizyon bile bir tehdit’

Evimizde sessizce çalışan küçük cihazlar olan modemler, aslında dijital hayatımızın en kritik güvenlik zafiyetlerinden biri. Modemler, siber korsanlar için adeta açık bir kapıya dönüşüyor; sadece internetimiz değil, kişisel verilerimiz de tehdit altında. Üstelik çoğumuz bu tehlikenin ne kadar yaygın ve sinsi olduğunun farkında bile değiliz. FBI’ın uyarısıysa durumun ciddiyetini gözler önüne seriyor: Modemler siber saldırganların öncelikli hedefi haline geldi! Bu risk, Türkiye’de de geçerli… İşte dikkat etmeniz gereken işaretler…

Çin işlemci teknolojisini baştan mı yazıyor?

Çinli araştırmacılar, mikroişlemci teknolojisinde oyunun kurallarını değiştirebilecek nitelikte bir keşfe imza attı.