Machine Learning
Specialist

3 yıldır makine öğrenmesi yarışmalarında rekabet eden, başarılı sonuçlar elde etmiş Machine Learning uzmanı.
BTK Datathon 2024 Kaggle yarışmasında Private Leaderboard 1.'si

Kurslara Göz At
import numpy as np
from sklearn.model_selection import KFold
from sklearn.metrics import f1_score
from catboost import CatBoostClassifier
n_splits = 5
kf = KFold(n_splits=n_splits, shuffle=True, random_state=42)
model = CatBoostClassifier(iterations=100, verbose=False, random_state=42)
for fold, (train_idx, val_idx) in enumerate(kf.split(X)):
    X_train, X_val = X.iloc[train_idx], X.iloc[val_idx]
    y_train, y_val = y.iloc[train_idx], y.iloc[val_idx]
    model.fit(X_train, y_train)
    y_pred = model.predict(X_val)
    f1 = f1_score(y_val, y_pred, average='weighted')

Hakkımda

Machine Learning alanında 3 yıldır aktif olarak yarışmalara katılıyorum. Bu süreçte edindiğim deneyimleri, öğrendiklerimi ve başarılı stratejileri paylaşmak için eğitim vermeye karar verdim.

Basit modellerden karmaşık ensemble metodlarına kadar, bir yarışmada nasıl adım adım skor arttırılacağını, hangi tekniklerin ne zaman kullanılacağını basit çalışmalaradan karmaşık, yüksek skorlu çalışmalara doğru version'lanmış notebook'lar üzerinden anlatıyorum.

Amacım, Machine Learning öğrenmek isteyen herkese pratik deneyimlerimi aktarmak ve bu alanda başarılı olmalarına yardımcı olmak.

3+
Yıl Deneyim
35+
Machine Learning Yarışması
25+
Yarışma takım arkadaşı
Top 1%
Ortalama Sıralama

Yarışma Başarıları

Telangana Crop Health Classification Challenge (Zindi)

GIZ (Deutsche Gesellschaft für Internationale Zusammenarbeit) ve Telangana Hükümeti tarafından organize edilen bu prestijli yarışmada 286 aktif katılımcı arasından 2. sırada yer aldım. Tarım uygulamaları verileri ve Sentinel-2 uydu görüntülerini kullanarak bitki sağlığını 4 farklı kategoride sınıflandıran ML modeli geliştirdim. Sürdürülebilir tarım için önemli bir katkı sağlayarak 2400€ ödül kazandım.
Leaderboard

2nd Place

Global Economic Forecast Hackathon (Antigranular)

Texas A&M Aggie Data Science tarafından organize edilen bu prestijli yarışmada Lucy Kamau ile beraber 2. sırayı paylaştım. Differential privacy teknikleri kullanarak veri gizliliğini koruyarak ekonomik göstergeleri tahmin eden ML modelleri geliştirdim. %88.85 doğruluk oranı elde ederek 1,000€ ödül kazandım.
Leaderboard

2nd Place

Madagascar Storm Prediction Hackathon (Kaggle)

Kaggle community competition'da 1. sıra elde ettim. EUMETSAT'ın Meteosat Second Generation uydu verilerini kullanarak Madagascar'ın Nosy Be bölgesindeki fırtınaları 1 saatlik ve 3 saatlik pencereler ile tahmin eden ML modeli geliştirdim. Mevcut NFLICS sisteminden daha yüksek doğruluk oranı elde ederek en yüksek ROCSS skoru kazandım.
Leaderboard

1st Place

BrisT1D Blood Glucose Competition (Kaggle)

University of Bristol tarafından organize edilen prestijli yarışmada 707 katılımcı arasından 3. sırada yer aldım. Diyabet hastalarının kan şekeri seviyelerini tahmin etmek için 3 farklı çözüm geliştirdim: test verisinden historical data üretimi, training verisinin genişletilmesi ve NaN değerlerin imputation yöntemi. Bu 3 çözümün ortalamasını alarak final submission'ımı oluşturdum.
Leaderboard

3rd Place

Medical Sound Classification Challenge (Kaggle)

Kaggle community competition'da 1. sıra elde ettim. Hasta verileri ve ses kayıtlarını kullanarak solunum yolu hastalıklarını tespit etmek için audio processing ve machine learning tekniklerini birleştirdim. Stacked learning yaklaşımı ile base model tahminlerini yeni feature olarak kullandım. Küçük veri seti (~500 satır) için etkili cross-validation stratejileri ve class imbalance problemini çözdüm.
Leaderboard

1st Place

GeoAI NO2 Prediction Challenge (Zindi)

Zindi Africa & ITU AI for Good tarafından organize edilen bu prestijli yarışmada 371 aktif katılımcı arasından 1. sırada yer aldım. Sentinel-5P TROPOMI NO2, CHIRPS precipitation ve NOAA surface temperature uydu verilerini kullanarak yer seviyesindeki NO2 konsantrasyonlarını tahmin eden model geliştirdim. Çevre koruma ve sürdürülebilir kalkınma hedeflerine önemli katkı sağladım.
Leaderboard

1st Place

BTK Datathon 2024 (Kaggle)

BTK Akademi, Türkiye Girişimcilik Vakfı ve Google iş birliğiyle düzenlenen bu prestijli yarışmada, 364 takım ve 575 katılımcı arasından birinci oldum. 11.049 başvuru sahibinin "Evaluation Score" değerini tahmin etmeye yönelik regresyon problemini başarıyla çözdüm. Üniversite, aile ve ikamet bilgileri gibi anonimleştirilmiş veriler üzerinde makine öğrenmesi teknikleri uyguladım. Bu süreçte, gerçek dünya veri bilimi uygulamaları konusunda önemli bir deneyim ve uzmanlık kazandım.
Leaderboard

1st Place

Heart Disease Prediction Hackathon 2024 (Antigranular)

Heart Failure Prediction Dataset kullanılarak kalp hastalıklarını tahmin etmeye yönelik bu classification yarışmasında 120 katılımcı arasından 5. sırada yer aldım. Differential privacy tekniklerini kullanarak hasta gizliliğini koruyarak makine öğrenmesi modellerini geliştirdim. Medikal veri analizi ve privacy-preserving machine learning konusunda önemli expertise kazandım. Sağlık alanında ML uygulamaları geliştirme konusunda deneyim elde ettim.
Leaderboard

5th Place

Anadolu Hayat Emeklilik Datathon 2024 (Kaggle)

Anadolu Hayat Emeklilik tarafından organize edilen bu prestijli yarışmada 185 katılımcı arasından 5. sırada yer aldım. Kasım ve Aralık 2023 döneminde müşterilerin hangi hayat sigortası ürününü tercih edeceğini tahmin etmeye yönelik multi-class classification problemi çözdüm. Sigorta sektöründe müşteri davranış analizi ve ürün tercihi tahmini konusunda önemli deneyim kazandım. Finansal hizmetler alanında makine öğrenmesi uygulamaları geliştirme expertise'i elde ettim.
Leaderboard

5th Place

Iyzico Datathon 2024 (Kaggle)

Iyzico tarafından organize edilen bu prestijli yarışmada 328 katılımcı arasından 4. sırada yer aldım. 2023 yılının son çeyreği (Ekim-Kasım-Aralık) için merchant başına işlem sayısı (net_payment_count) tahmin etmeye yönelik regression ve time series problemi çözdüm. Fintech sektöründe ödeme sistemleri ve işlem hacmi tahmini konusunda önemli deneyim kazandım. E-ticaret ve dijital ödeme alanında makine öğrenmesi uygulamaları geliştirme expertise'i elde ettim.
Leaderboard

4th Place

Harvard OpenDP Hackathon (Antigranular)

Harvard OpenDP tarafından organize edilen bu prestijli yarışmada 28 katılımcı arasından 2. sırada yer aldım. COVID-19 salgını sırasında karantina gereken yolcuları tespit etmek için özel veri setleri kullanarak matching algorithm problemi çözdüm. Bir uçuştaki herhangi bir yolcu uçuştan sonraki iki hafta içinde COVID-19 pozitif çıktığında, o uçuştaki tüm yolcuları belirleme konusunda expertise kazandım. Privacy-preserving data matching ve epidemiyoloji alanında deneyim elde ettim.
Leaderboard

2nd Place

Invent Analytics - AlgoRun Hackathon

Invent Analytics tarafından organize edilen bu prestijli yarışmada 20 katılımcı arasından 2. sırada yer aldım. Gelecek ay hangi müşterinin hangi üründen kaç adet satın alacağını tahmin etmeye yönelik regression, time series ve demand prediction problemi çözdüm. Retail analytics ve talep tahmini konusunda önemli deneyim kazandım. Supply chain management ve stok optimizasyonu alanında makine öğrenmesi uygulamaları geliştirme expertise'i elde ettim.
Leaderboard

2nd Place

Mars Spectrometry: Detect Evidence for Past Habitability (DrivenData)

NASA Mars keşif misyonları için organize edilen bu prestijli yarışmada 713 katılımcı arasından 16. sırada yer aldım. Evolved gas analysis (EGA) mass spectrometry verilerini kullanarak Mars jeolojik materyallerindeki kimyasal bileşik ailelerinin varlığını tespit etmeye yönelik multilabel classification problemi çözdüm. Uzay bilimleri, astrobiyoloji ve spektroskopi alanında önemli deneyim kazandım. NASA projeleri ve uzay araştırmalarında makine öğrenmesi uygulamaları geliştirme expertise'i elde ettim.
Leaderboard

16th Place

Forecasting Mini-Course Sales (Kaggle)

Kaggle Playground Series S3E19 yarışmasında 1212 katılımcı arasından 9. sırada yer aldım. Farklı ülkelerdeki çeşitli Kaggle marka mağazalarından kurgusal öğrenme modüllerinin bir yıllık satış verilerini tahmin etmeye yönelik regression ve time series problemi çözdüm. E-learning sektöründe satış tahmini ve seasonal forecasting konusunda önemli deneyim kazandım. Eğitim teknolojileri ve online kurs pazarında makine öğrenmesi uygulamaları geliştirme expertise'i elde ettim.
Leaderboard

9th Place

Enzyme Substrate Multi-Label Classification (Kaggle)

Kaggle Playground Series S3E18 yarışmasında 1065 katılımcı arasından 11. sırada yer aldım. Enzim substratlarını tahmin etmeye yönelik multi-label classification problemi çözdüm. Biyoinformatik ve enzim biochemistry alanında önemli deneyim kazandım. Moleküler biyoloji ve protein-substrat etkileşimleri konusunda makine öğrenmesi uygulamaları geliştirme expertise'i elde ettim. Çoklu etiketleme problemlerinde advanced modeling teknikleri konusunda deneyim kazandım.
Leaderboard

11th Place

Binary Classification of Machine Failures (Kaggle)

Kaggle Playground Series S3E17 yarışmasında 1502 katılımcı arasından 16. sırada yer aldım. Makine arızalarını tahmin etmeye yönelik binary classification problemi çözdüm. Endüstriyel IoT ve predictive maintenance alanında önemli deneyim kazandım. Manufacturing ve sanayi 4.0 uygulamalarında makine öğrenmesi ile arıza tespiti konusunda expertise elde ettim. Anomaly detection ve failure prediction teknikleri konusunda deneyim kazandım.
Leaderboard

16th Place

Kurslar

Kaggle Playground - ML Yarışmasında Skor Arttırma ve Kod Analizi

200₺
📊
Sıfırdan hazırlanımş skoru artan sırada 15 farklı versiyonlu Notebook
🕐
Haftada 2 Ders (3'er Saat)
📈
Adım Adım Skor Artırma
🎯
Gerçek Yarışma Deneyimi

İncelenecek Yarışma: Kaggle Playground Series S5E3 - Rainfall Prediction

Hedef: Yılın her günü için yağış durumunu tahmin etmek
Metrik: ROC AUC (Area Under the ROC Curve)
Problem Tipi: Binary Classification

Yarışma Sayfası

Seçtiğim Kaggle Playground yarışmasında, basit baseline'dan başlayarak cross validation, feature engineering, model selection, hyperparameter tuning ve ensemble methods ile nasıl yüksek skor elde edildiğini adım adım öğreneceksiniz.

🎯 Kurs Metodolojisi & Yaklaşımı
📚 Öğrenme Süreci

Kaggle Discussion'larından ve topluluk kodlarından yararlanarak gerçek yarışma deneyimi. Her version için detaylı açıklama ve kod analizi.

🔧 Teknik Yaklaşım

15 version boyunca adım adım skor artırma teknikleri. Ensemble methods, feature engineering ve hyperparameter tuning.

💡 Özgün Çözüm Geliştirme

Topluluk kaynaklarından ilham alarak tamamen özgün bir yaklaşım geliştirilmiştir. Farklı tekniklerin birleştirilmesi ve optimizasyon stratejileri ile nihai çözüm oluşturulmuştur.

Bu sayede birçok yeni teknik, model ve yaklaşım öğrenilecektir.

📂 Kurs Sonrası: Tüm notebook'lara kalıcı erişim

🚀 Hedef: Gelecek yarışmalarda kullanılabilir deneyim

Kursa Kayıt Ol

Gelecek Kurslar

Yakında

Kaggle Playground Serisi, Veri Bilimi Bootcamp'i, Makine öğrenmesi algoritmaları kursu ve daha fazla konuda kurslar hazırlanıyor...

İletişim

Sorularınız için benimle iletişime geçebilir, sosyal medya hesaplarımdan takip edebilirsiniz.

Doğrudan İletişim