← Topluluk
AktifVeri (JSON/Parquet)
İnce-Ayar Veri Setleri
Modelleri belirli bir görev, dil veya kişiliğe uyarlamak için yüksek kaliteli TR/EN diyalog veri setlerini tek formatta toplayan topluluk projesi.
datasetsfine-tuningturkishhuggingfacecommunity
Vizyon
Türkçe dil modellerinin gerçekten işe yarar olması için gereken yüksek kaliteli, açık lisanslı ince-ayar veri setlerini toplulukla birlikte üretmek. Her katkıcı kendi HuggingFace profilinden yayınlar; bu repo standart ve dizin görevi görür.
Kategoriler
Identity (✅ tamamlandı), Tool Call, Conversation, Instruction, Structured Output, Math, Coding (📋 katkıya açık). Hedef: kategori başına 100+ TR + 100+ EN örnek.
Katkı alanları
- Herhangi bir kategoride 100+ Türkçe + 100+ İngilizce örnek üretmek
- Mevcut veri setlerini genişletmek veya kalite kontrolü yapmak
- Fine-tune notebook ve script katkısı
- Veri kalite doğrulama araçları geliştirmek
Teknik yığın: Python · HuggingFace Datasets · Parquet · Lisans: CC BY 4.0
Kaynaklar ve bağlantılar
Projeye katılmak istiyorum
Google hesabınızı doğrulayın, formu doldurun; ardından GitHub issue listesinden uygun bir görev seçerek başlayabilirsiniz.