Ders Adı | Kodu | Yerel Kredi | AKTS | Ders (saat/hafta) | Uygulama (saat/hafta) | Laboratuar (saat/hafta) |
---|---|---|---|---|---|---|
Pekiştirmeli Öğrenme Tabanlı Optimal Kontrol | KOM6115 | 3 | 7.5 | 3 | 0 | 0 |
Önkoşullar | Yok |
---|
Yarıyıl | Güz, Bahar |
---|
Dersin Dili | İngilizce, Türkçe |
---|---|
Dersin Seviyesi | Doktora |
Dersin Türü | Seçmeli @ Kont. ve Otom. Müh. ABD Kontrol ve Otomasyon Mühendisliği Doktora Programı Seçmeli @ Kont. ve Otom. Müh. ABD Kontrol ve Otomasyon Mühendisliği Yüksek Lisans Programı |
Ders Kategorisi | Uzmanlık/Alan Dersleri |
Dersin Veriliş Şekli | Yüz yüze |
Dersi Sunan Akademik Birim | Kontrol ve Otomasyon Mühendisliği Bölümü |
---|---|
Dersin Koordinatörü | Uğur Yıldıran |
Dersi Veren(ler) | Uğur Yıldıran |
Asistan(lar)ı |
Dersin Amacı | Pekiştirmeli öğrenme konusunu tanıtmak ve bu konuda kuramsal altyapı kazandırmak. Pekiştirmeli öğrenmeyi kontrol kuramıyla ilişkilendirmek. Doğrusal ve doğrusal olmayan sistemlerin kontrolüne uygulayabilmek. |
---|---|
Dersin İçeriği | Markov karar süreçlerinin optimal kontrolü, doğrusal rassal sistemlerin dinamik programlamaya dayalı optimal kontrolü, Markov karar süreçleri için pekiştirmeli öğrenme, doğrusal rassal sistemler için pekiştirmeli öğrenme, fonksiyon yaklaşıklıkları, doğrusal olmayan sistemler için (derin) pekiştirmeli öğrenme. |
Ders Kitabı / Malzemesi / Önerilen Kaynaklar |
|
Opsiyonel Program Bileşenleri | Yok |
Ders Öğrenim Çıktıları
Ders Öğrenim Çıktısı & Program Çıktısı Matrisi
PÇ-1 |
PÇ-2 |
PÇ-3 |
PÇ-4 |
PÇ-5 |
PÇ-6 |
PÇ-7 |
PÇ-8 |
PÇ-9 |
PÇ-10 |
PÇ-11 |
PÇ-12 |
Haftalık Konular ve İlgili Ön Hazırlık Çalışmaları
Hafta | Konular | Ön Hazırlık |
---|---|---|
1 | Markov Karar Süreçlerine (MDP) Giriş | |
2 | MDP’lerin Optimal Kontrolü: Yaklaşım değerlendirmesi, yaklaşım yinelemesi ve kontrol uygulamaları | |
3 | MDP’lerin Optimal Kontrolü: Değer yinelemesi ve kontrol uygulamaları | |
4 | MDP’lerin Optimal Kontrolü: Boyutsallığın laneti ve değer fonksiyonu yaklaşıklıkları | |
5 | MDP’lerin Optimal Kontrolü: Yaklaşım grandyanı yöntemi ve kontrol uygulamaları. | |
6 | MDP’lerin Optimal Kontrolü: Kontrol uygulamaları – örnek problemler | |
7 | Doğrusal Karesel Kontrol: Yaklaşım değerlendirmesi, yaklaşım yinelemesi, değer yinelemesi ve MDP’lerle ilişkileri | |
8 | Ara Sınav 1 | |
9 | MDP’ler için Pekiştirmeli Öğrenme: Monte Carlo yöntemleri, TD ve Q-öğrenme | |
10 | MDP’ler için Pekiştirmeli Öğrenme: Arama ve yararlanma, yaklaşım ve yaklaşım ötesi öğrenme | |
11 | Doğrusal Rassal Sistemler için Pekiştirmeli Öğrenme: Monte Carlo yöntemleri, TD, Q-öğrenme ve LQG kontrolcüler. | |
12 | Doğrusal Olmayan Sistemler için (Derin) Pekiştirmeli Öğrenme | |
13 | Örnek uygulamalar | |
14 | Dersin genel tekrarı, önemli noktaların gözden geçirilmesi, örnek problemler | |
15 | Final |
Değerlendirme Sistemi
Etkinlikler | Sayı | Katkı Payı |
---|---|---|
Devam/Katılım | ||
Laboratuar | ||
Uygulama | ||
Arazi Çalışması | ||
Derse Özgü Staj | ||
Küçük Sınavlar/Stüdyo Kritiği | ||
Ödev | 3 | 30 |
Sunum/Jüri | ||
Projeler | 1 | 40 |
Seminer/Workshop | ||
Ara Sınavlar | 1 | 30 |
Final | ||
Dönem İçi Çalışmaların Başarı Notuna Katkısı | ||
Final Sınavının Başarı Notuna Katkısı | ||
TOPLAM | 100 |
AKTS İşyükü Tablosu
Etkinlikler | Sayı | Süresi (Saat) | Toplam İşyükü |
---|---|---|---|
Ders Saati | 15 | 3 | |
Laboratuar | |||
Uygulama | |||
Arazi Çalışması | |||
Sınıf Dışı Ders Çalışması | 15 | 6 | |
Derse Özgü Staj | |||
Ödev | 3 | 12 | |
Küçük Sınavlar/Stüdyo Kritiği | |||
Projeler | 1 | 40 | |
Sunum / Seminer | |||
Ara Sınavlar (Sınav Süresi + Sınav Hazırlık Süresi) | 1 | 17 | |
Final (Sınav Süresi + Sınav Hazırlık Süresi) | |||
Toplam İşyükü : | |||
Toplam İşyükü / 30(s) : | |||
AKTS Kredisi : |
Diğer Notlar | Yok |
---|