3 yıldır makine öğrenmesi yarışmalarında rekabet eden, başarılı sonuçlar elde etmiş Machine Learning uzmanı.
BTK Datathon 2024 Kaggle yarışmasında Private Leaderboard 1.'si
Machine Learning alanında 3 yıldır aktif olarak yarışmalara katılıyorum. Bu süreçte edindiğim deneyimleri, öğrendiklerimi ve başarılı stratejileri paylaşmak için eğitim vermeye karar verdim.
Basit modellerden karmaşık ensemble metodlarına kadar, bir yarışmada nasıl adım adım skor arttırılacağını, hangi tekniklerin ne zaman kullanılacağını basit çalışmalaradan karmaşık, yüksek skorlu çalışmalara doğru version'lanmış notebook'lar üzerinden anlatıyorum.
Amacım, Machine Learning öğrenmek isteyen herkese pratik deneyimlerimi aktarmak ve bu alanda başarılı olmalarına yardımcı olmak.
GIZ (Deutsche Gesellschaft für Internationale Zusammenarbeit) ve Telangana Hükümeti tarafından organize edilen bu prestijli yarışmada 286 aktif katılımcı arasından 2. sırada yer aldım. Tarım uygulamaları verileri ve Sentinel-2 uydu görüntülerini kullanarak bitki sağlığını 4 farklı kategoride sınıflandıran ML modeli geliştirdim. Sürdürülebilir tarım için önemli bir katkı sağlayarak 2400€ ödül kazandım.
Leaderboard
Texas A&M Aggie Data Science tarafından organize edilen bu prestijli yarışmada Lucy Kamau ile beraber 2. sırayı paylaştım. Differential privacy teknikleri kullanarak veri gizliliğini koruyarak ekonomik göstergeleri tahmin eden ML modelleri geliştirdim. %88.85 doğruluk oranı elde ederek 1,000€ ödül kazandım.
Leaderboard
Kaggle community competition'da 1. sıra elde ettim. EUMETSAT'ın Meteosat Second Generation uydu verilerini kullanarak Madagascar'ın Nosy Be bölgesindeki fırtınaları 1 saatlik ve 3 saatlik pencereler ile tahmin eden ML modeli geliştirdim. Mevcut NFLICS sisteminden daha yüksek doğruluk oranı elde ederek en yüksek ROCSS skoru kazandım.
Leaderboard
University of Bristol tarafından organize edilen prestijli yarışmada 707 katılımcı arasından 3. sırada yer aldım. Diyabet hastalarının kan şekeri seviyelerini tahmin etmek için 3 farklı çözüm geliştirdim: test verisinden historical data üretimi, training verisinin genişletilmesi ve NaN değerlerin imputation yöntemi. Bu 3 çözümün ortalamasını alarak final submission'ımı oluşturdum.
Leaderboard
Kaggle community competition'da 1. sıra elde ettim. Hasta verileri ve ses kayıtlarını kullanarak solunum yolu hastalıklarını tespit etmek için audio processing ve machine learning tekniklerini birleştirdim. Stacked learning yaklaşımı ile base model tahminlerini yeni feature olarak kullandım. Küçük veri seti (~500 satır) için etkili cross-validation stratejileri ve class imbalance problemini çözdüm.
Leaderboard
Zindi Africa & ITU AI for Good tarafından organize edilen bu prestijli yarışmada 371 aktif katılımcı arasından 1. sırada yer aldım. Sentinel-5P TROPOMI NO2, CHIRPS precipitation ve NOAA surface temperature uydu verilerini kullanarak yer seviyesindeki NO2 konsantrasyonlarını tahmin eden model geliştirdim. Çevre koruma ve sürdürülebilir kalkınma hedeflerine önemli katkı sağladım.
Leaderboard
BTK Akademi, Türkiye Girişimcilik Vakfı ve Google iş birliğiyle düzenlenen bu prestijli yarışmada, 364 takım ve 575 katılımcı arasından birinci oldum. 11.049 başvuru sahibinin "Evaluation Score" değerini tahmin etmeye yönelik regresyon problemini başarıyla çözdüm. Üniversite, aile ve ikamet bilgileri gibi anonimleştirilmiş veriler üzerinde makine öğrenmesi teknikleri uyguladım. Bu süreçte, gerçek dünya veri bilimi uygulamaları konusunda önemli bir deneyim ve uzmanlık kazandım.
Leaderboard
Heart Failure Prediction Dataset kullanılarak kalp hastalıklarını tahmin etmeye yönelik bu classification yarışmasında 120 katılımcı arasından 5. sırada yer aldım. Differential privacy tekniklerini kullanarak hasta gizliliğini koruyarak makine öğrenmesi modellerini geliştirdim. Medikal veri analizi ve privacy-preserving machine learning konusunda önemli expertise kazandım. Sağlık alanında ML uygulamaları geliştirme konusunda deneyim elde ettim.
Leaderboard
Anadolu Hayat Emeklilik tarafından organize edilen bu prestijli yarışmada 185 katılımcı arasından 5. sırada yer aldım. Kasım ve Aralık 2023 döneminde müşterilerin hangi hayat sigortası ürününü tercih edeceğini tahmin etmeye yönelik multi-class classification problemi çözdüm. Sigorta sektöründe müşteri davranış analizi ve ürün tercihi tahmini konusunda önemli deneyim kazandım. Finansal hizmetler alanında makine öğrenmesi uygulamaları geliştirme expertise'i elde ettim.
Leaderboard
Iyzico tarafından organize edilen bu prestijli yarışmada 328 katılımcı arasından 4. sırada yer aldım. 2023 yılının son çeyreği (Ekim-Kasım-Aralık) için merchant başına işlem sayısı (net_payment_count) tahmin etmeye yönelik regression ve time series problemi çözdüm. Fintech sektöründe ödeme sistemleri ve işlem hacmi tahmini konusunda önemli deneyim kazandım. E-ticaret ve dijital ödeme alanında makine öğrenmesi uygulamaları geliştirme expertise'i elde ettim.
Leaderboard
Harvard OpenDP tarafından organize edilen bu prestijli yarışmada 28 katılımcı arasından 2. sırada yer aldım. COVID-19 salgını sırasında karantina gereken yolcuları tespit etmek için özel veri setleri kullanarak matching algorithm problemi çözdüm. Bir uçuştaki herhangi bir yolcu uçuştan sonraki iki hafta içinde COVID-19 pozitif çıktığında, o uçuştaki tüm yolcuları belirleme konusunda expertise kazandım. Privacy-preserving data matching ve epidemiyoloji alanında deneyim elde ettim.
Leaderboard
Invent Analytics tarafından organize edilen bu prestijli yarışmada 20 katılımcı arasından 2. sırada yer aldım. Gelecek ay hangi müşterinin hangi üründen kaç adet satın alacağını tahmin etmeye yönelik regression, time series ve demand prediction problemi çözdüm. Retail analytics ve talep tahmini konusunda önemli deneyim kazandım. Supply chain management ve stok optimizasyonu alanında makine öğrenmesi uygulamaları geliştirme expertise'i elde ettim.
Leaderboard
NASA Mars keşif misyonları için organize edilen bu prestijli yarışmada 713 katılımcı arasından 16. sırada yer aldım. Evolved gas analysis (EGA) mass spectrometry verilerini kullanarak Mars jeolojik materyallerindeki kimyasal bileşik ailelerinin varlığını tespit etmeye yönelik multilabel classification problemi çözdüm. Uzay bilimleri, astrobiyoloji ve spektroskopi alanında önemli deneyim kazandım. NASA projeleri ve uzay araştırmalarında makine öğrenmesi uygulamaları geliştirme expertise'i elde ettim.
Leaderboard
Kaggle Playground Series S3E19 yarışmasında 1212 katılımcı arasından 9. sırada yer aldım. Farklı ülkelerdeki çeşitli Kaggle marka mağazalarından kurgusal öğrenme modüllerinin bir yıllık satış verilerini tahmin etmeye yönelik regression ve time series problemi çözdüm. E-learning sektöründe satış tahmini ve seasonal forecasting konusunda önemli deneyim kazandım. Eğitim teknolojileri ve online kurs pazarında makine öğrenmesi uygulamaları geliştirme expertise'i elde ettim.
Leaderboard
Kaggle Playground Series S3E18 yarışmasında 1065 katılımcı arasından 11. sırada yer aldım. Enzim substratlarını tahmin etmeye yönelik multi-label classification problemi çözdüm. Biyoinformatik ve enzim biochemistry alanında önemli deneyim kazandım. Moleküler biyoloji ve protein-substrat etkileşimleri konusunda makine öğrenmesi uygulamaları geliştirme expertise'i elde ettim. Çoklu etiketleme problemlerinde advanced modeling teknikleri konusunda deneyim kazandım.
Leaderboard
Kaggle Playground Series S3E17 yarışmasında 1502 katılımcı arasından 16. sırada yer aldım. Makine arızalarını tahmin etmeye yönelik binary classification problemi çözdüm. Endüstriyel IoT ve predictive maintenance alanında önemli deneyim kazandım. Manufacturing ve sanayi 4.0 uygulamalarında makine öğrenmesi ile arıza tespiti konusunda expertise elde ettim. Anomaly detection ve failure prediction teknikleri konusunda deneyim kazandım.
Leaderboard
Hedef: Yılın her günü için yağış durumunu tahmin etmek
Metrik: ROC AUC (Area Under the ROC Curve)
Problem Tipi: Binary Classification
Seçtiğim Kaggle Playground yarışmasında, basit baseline'dan başlayarak cross validation, feature engineering, model selection, hyperparameter tuning ve ensemble methods ile nasıl yüksek skor elde edildiğini adım adım öğreneceksiniz.
Kaggle Discussion'larından ve topluluk kodlarından yararlanarak gerçek yarışma deneyimi. Her version için detaylı açıklama ve kod analizi.
15 version boyunca adım adım skor artırma teknikleri. Ensemble methods, feature engineering ve hyperparameter tuning.
Topluluk kaynaklarından ilham alarak tamamen özgün bir yaklaşım geliştirilmiştir. Farklı tekniklerin birleştirilmesi ve optimizasyon stratejileri ile nihai çözüm oluşturulmuştur.
Bu sayede birçok yeni teknik, model ve yaklaşım öğrenilecektir.
📂 Kurs Sonrası: Tüm notebook'lara kalıcı erişim
🚀 Hedef: Gelecek yarışmalarda kullanılabilir deneyim
Kaggle Playground Serisi, Veri Bilimi Bootcamp'i, Makine öğrenmesi algoritmaları kursu ve daha fazla konuda kurslar hazırlanıyor...
Sorularınız için benimle iletişime geçebilir, sosyal medya hesaplarımdan takip edebilirsiniz.