← Topluluk
AktifVeri (JSON/Parquet)

İnce-Ayar Veri Setleri

Modelleri belirli bir görev, dil veya kişiliğe uyarlamak için yüksek kaliteli TR/EN diyalog veri setlerini tek formatta toplayan topluluk projesi.

datasetsfine-tuningturkishhuggingfacecommunity

Vizyon

Türkçe dil modellerinin gerçekten işe yarar olması için gereken yüksek kaliteli, açık lisanslı ince-ayar veri setlerini toplulukla birlikte üretmek. Her katkıcı kendi HuggingFace profilinden yayınlar; bu repo standart ve dizin görevi görür.

Kategoriler

Identity (✅ tamamlandı), Tool Call, Conversation, Instruction, Structured Output, Math, Coding (📋 katkıya açık). Hedef: kategori başına 100+ TR + 100+ EN örnek.

Katkı alanları

  • Herhangi bir kategoride 100+ Türkçe + 100+ İngilizce örnek üretmek
  • Mevcut veri setlerini genişletmek veya kalite kontrolü yapmak
  • Fine-tune notebook ve script katkısı
  • Veri kalite doğrulama araçları geliştirmek

Teknik yığın: Python · HuggingFace Datasets · Parquet · Lisans: CC BY 4.0

Projeye katılmak istiyorum

Google hesabınızı doğrulayın, formu doldurun; ardından GitHub issue listesinden uygun bir görev seçerek başlayabilirsiniz.

Kurumsal pilot, API erişimi, yatırım ve iş birliği başvuruları doğrulanmış Google hesabı ile alınır.

Oturum kontrol ediliyor…