Birbirini tamamlayan açık kaynak zinciri.
Büyük dil modelleri çoğu dilde verimsiz token üretir, alana özel sorularda yanılır. Magibu'da bu sorunu zincirin her halkasında açık kaynakla çözüyoruz: dilin morfolojisine saygılı tokenizasyondan, kendi dilinde embedding üretme metodolojisine; kaliteli ince-ayar verisinden, modeli dış dünyaya bağlayan araçlara kadar.
Morfolojik Tokenizer
Metni dilin morfolojisine saygılı parçalara böl ve geri birleştir.
Dile Özgü Embedding
Kendi dilinde tokenizer + embedding üretmenin açık yöntemi.
İnce-Ayar Verileri
Göreve ve kişiliğe özel, yüksek kaliteli açık veri setleri.
LLM Araçları
Modele doğru aracı doğru zamanda çağırma yeteneği.
Nasıl katkı sağlarım?
- 01GitHub'da ilgilendiğin repo'ya git, açık issue'ları incele
- 02Issue altına yorum yap veya yeni issue aç
- 03Repo'yu fork'la, yeni bir branch aç
- 04Değişikliği yap, test et, dokümante et
- 05Pull request gönder - ne ve neden yaptığını açıkla
- 06İnceleme sonrası merge - katkıcı olarak listeye gir
Türkiye odaklı açık kaynak AR-GE. GitHub'da issue'lara katkı verin; başvuru formu ile ekibe dahil olun. İlerideki işe alımlarda bu katkılar önceliklendirilir.
Yükleniyor…
Açık bilim, benchmark ve topluluk katkısı.
Magibu AI Weekly
Açık kaynak haftalık bülten: AI haberleri, makaleler, modeller, benchmarklar ve düşük kaynaklı dil gelişmeleri.
Arşivi gör →