Skip to content

Latest commit

 

History

History
16 lines (11 loc) · 967 Bytes

README.md

File metadata and controls

16 lines (11 loc) · 967 Bytes

Machine Learning ve Veri-Biliminde Yaygın Hatalar

Bu repoda veri bilimi ve makine öğrenmesinde yapılan hataları gösteren notebooklar paylaşılmaktadır.

İçindekiler

Data Leakage

  • Data Leakage, eğitim veri seti dışındaki bilginin modelin oluşturulması sırasında kullanılması durumunda ortaya çıkar. Bu, modele ek bir bilgi sağlayabilir ve aslında bu ek bilginin model tarafından bilinmemesi gerekir. Neticede model öğrenmemesi gerektiği bir özellik öğrendiğinde bu modelin performansını çok kolay bir şekilde geçersiz kılabilir."

  • Yani yapılan bu hata (Data Leakage), aşırı iyimser veya gerçek hayatta bir işe yaramayacak modeller oluşturmanıza neden olabilir.

Correlation ve Multicollinearity

  • Overfit ile ilişkisi

    • Var mı yok mu diye deneylerin yapılması
  • Modeli yorumlamak

    • Farklı senaryolarda farklı modeller nasıl sonuçlar gösterir, yorumlama yeteneği nasıl etkilenir?