İnce-Ayar Veri Setleri

Modelleri belirli bir görev, dil veya kişiliğe uyarlamak için yüksek kaliteli TR/EN diyalog veri setlerini tek formatta toplayan topluluk projesi.

datasetsfine-tuningturkishhuggingfacecommunity

Vizyon

Türkçe dil modellerinin gerçekten işe yarar olması için gereken yüksek kaliteli, açık lisanslı ince-ayar veri setlerini toplulukla birlikte üretmek. Her katkıcı kendi HuggingFace profilinden yayınlar; bu repo standart ve dizin görevi görür.

Kategoriler

Identity (✅ tamamlandı), Tool Call, Conversation, Instruction, Structured Output, Math, Coding (📋 katkıya açık). Hedef: kategori başına 100+ TR + 100+ EN örnek.

Katkı alanları

Herhangi bir kategoride 100+ Türkçe + 100+ İngilizce örnek üretmek
Mevcut veri setlerini genişletmek veya kalite kontrolü yapmak
Fine-tune notebook ve script katkısı
Veri kalite doğrulama araçları geliştirmek

Teknik yığın: Python · HuggingFace Datasets · Parquet · Lisans: CC BY 4.0

Projeye katılmak istiyorum

Google hesabınızı doğrulayın, formu doldurun; ardından GitHub issue listesinden uygun bir görev seçerek başlayabilirsiniz.

İnce-Ayar Veri Setleri

Vizyon

Kategoriler

Katkı alanları

Kaynaklar ve bağlantılar

Projeye katılmak istiyorum