با سلام
دانشجویان محترم درس یادگیری تقویتی جهت نمره میانترم یکی از مسائل مطرح شده در کتاب را انتخاب کرده و با استفاده از 3 روش یادگیری تقویتی مطرح شده پیاده سازی کنند و پیاده سازی خود را به همراه یک گزارش کامل مقایسه ای از نتایج تا 15 خردادماه تحویل دهند.
به عنوان جایگزین می توانند یکی از مقالات زیر را انتخاب نمایید:
- Human-Level Control through Deep Reinforcement Learning (2015-02)
- Deep Reinforcement Learning with Double Q-learning (2015-09)
- Continuous control with deep reinforcement learning (2015-09)
- Prioritized Experience Replay (2015-11)
- Dueling Network Architectures for Deep Reinforcement Learning (2015-11)
- Asynchronous Methods for Deep Reinforcement Learning (2016-02)
- Deep Reinforcement Learning from Self-Play in Imperfect-Information Games (2016-03)
- Mastering the game of Go with deep neural networks and tree search
پاینده باشید
درباره این سایت