| Dersin Amacı | Bu ders, öğrencilere modern veri odaklı karar vermede kullanılan veri bilimi prensipleri, metodolojileri ve araçları hakkında temel bir anlayış kazandırmayı amaçlamaktadır. Öğrenciler, çeşitli veri türleri ve kaynaklarıyla çalışma, ham verileri temizleme ve ön işleme ve anlamlı içgörüler elde etmek için istatistiksel analiz tekniklerini uygulama konusunda pratik beceriler geliştireceklerdir.
Ders boyunca öğrenciler, NumPy, Pandas, Matplotlib, Scikit-Learn, SciPy ve TensorFlow dahil olmak üzere sektör standardı Python kütüphaneleriyle uygulamalı deneyim kazanacaklardır. Ham veri toplama aşamasından görselleştirme ve yorumlamaya kadar sağlam bir süreç oluşturmaya önem verilecektir.
Dersin ikinci yarısında öğrenciler, veri madenciliği, kümeleme, regresyon ve sınıflandırma dahil olmak üzere temel makine öğrenimi kavramlarıyla tanışacaklardır. Dersin sonunda öğrenciler, gerçek dünya veri kümelerini analiz etmek ve bulgularını son bir sunumla iletmek için gerekli temel bilgiye sahip olacak ve teorik kavramlar ile uygulamalı veri bilimi pratiği arasındaki boşluğu dolduracaklardır. |
| Dersin İçeriği | 1. Hafta – Veri Bilimine Giriş: Veri bilimine ve modern endüstrilerdeki rolüne genel bakış. Makine öğrenimi kavramlarına ve ders boyunca kullanılan Python ekosistemine giriş.
2. Hafta – Veri Türleri ve Kaynakları: Yapılandırılmış (tablo), yarı yapılandırılmış (JSON, XML) ve yapılandırılmamış (metin, resim, ses) veri formatlarının incelenmesi. Veritabanları, API'ler, sensörler, web kazıma, sosyal medya ve IoT cihazları dahil olmak üzere veri toplama yöntemlerinin yanı sıra Python veri türleri ele alınacaktır.
3. Hafta – Veri Temizleme ve Eksik Değer Tamamlama: Ham verileri analiz için hazırlama teknikleri, yinelenen kayıtları kaldırma, aykırı değerleri ele alma ve tutarsızlıkları giderme dahil. Ortalama, medyan, mod, regresyon, KNN ve MICE gibi gelişmiş yöntemler gibi eksik değer işleme stratejileri.
4. Hafta – Veri İstatistiksel Analizi: Tanımlayıcı istatistikler (ortalama, medyan, mod, standart sapma, varyans, çarpıklık, basıklık), çıkarımsal istatistikler (hipotez testi, t-testleri, ANOVA, ki-kare), korelasyon analizi (Pearson, Spearman), regresyon modellemesi, olasılık dağılımları ve zaman serisi analizi.
5. Hafta – Veri Görselleştirme: Veri içgörülerini grafikler (çubuk, çizgi, dağılım, pasta), çizimler (kutu, keman, histogram) ve gelişmiş görseller (ısı haritaları, ağaç haritaları, ağ grafikleri) aracılığıyla iletme.
6. Hafta – Veri Azaltma: Anlamlı bilgileri korurken yüksek boyutlu veri kümelerini basitleştirme yöntemleri. Konular arasında boyut indirgeme (PCA, t-SNE), özellik seçimi (RFE, LASSO), toplama, örnekleme ve ayrıştırma yer almaktadır.
7. Hafta – Veri Madenciliğine Giriş: Büyük veri kümelerinde gizli kalıpları ve ilişkileri keşfetmenin temelleri, özellikle İlişkilendirme Kuralı Madenciliği odaklı.
8. Hafta – Veri Kümelemeye Giriş: Benzer veri noktalarını gruplandırmak için denetimsiz öğrenme teknikleri. Ele alınan algoritmalar arasında K-Means, DBSCAN ve Gauss Karışım Modelleri yer almaktadır.
9. Hafta – Veri Regresyonuna Giriş: Tahmin ve trend analizi için değişkenler arasındaki ilişkilerin modellenmesi. Yöntemler arasında doğrusal, polinom, lojistik, ridge, lasso ve çok değişkenli regresyon yer almaktadır.
10. Hafta – Veri Sınıflandırmasına Giriş: Verileri önceden tanımlanmış sınıflara ayırmak için denetimli öğrenme teknikleri. Ele alınan algoritmalar arasında Karar Ağaçları, SVM, k-NN, Naive Bayes, Rastgele Orman ve Sinir Ağları yer almaktadır. |
| Ders Kitabı / Malzemesi / Önerilen Kaynaklar | - Data Science Lecture Notes, Prof. Dr. Selami Beyhan
- Grus, Joel. Data science from scratch: first principles with python. O'Reilly Media, 2019.
|
| Opsiyonel Program Bileşenleri | Ek Python Uygulamaları: Öğrenciler, Kaggle, Google Colab ve Jupyter Notebook gibi etkileşimli platformları kullanarak kendi kendilerine pratik yaparak programlama becerilerini pekiştirmeye teşvik edilirler. Herkese açık veri kümeleri üzerinde çalışmak, derslerde tanıtılan kavramların pekiştirilmesine yardımcı olacaktır.
Alan Odaklı Veri Kümesi Keşfi: Finans, tarım, endüstriyel otomasyon veya sağlık hizmetleri gibi belirli alanlarda geçmişi veya ilgisi olan öğrenciler, alanlarıyla ilgili veri kümelerini aramaya ve ders metodolojilerini uzmanlık alanlarındaki sorunlara uygulamaya teşvik edilirler. Bu, veri bilimi teorisini gerçek dünya profesyonel uygulamalarıyla birleştirir. |