با سلام
دانشجویان محترم درس یادگیری تقویتی جهت نمره میانترم یکی از مسائل مطرح شده در کتاب را انتخاب کرده و با استفاده از 3 روش یادگیری تقویتی مطرح شده پیاده سازی کنند و پیاده سازی خود را به همراه یک گزارش کامل مقایسه ای از نتایج تا 15 خردادماه تحویل دهند.
به عنوان جایگزین می توانند یکی از مقالات زیر را انتخاب نمایید:
- Human-Level Control through Deep Reinforcement Learning (2015-02)
- Deep Reinforcement Learning with Double Q-learning (2015-09)
- Continuous control with deep reinforcement learning (2015-09)
- Prioritized Experience Replay (2015-11)
- Dueling Network Architectures for Deep Reinforcement Learning (2015-11)
- Asynchronous Methods for Deep Reinforcement Learning (2016-02)
- Deep Reinforcement Learning from Self-Play in Imperfect-Information Games (2016-03)
- Mastering the game of Go with deep neural networks and tree search
پاینده باشید
میان ترم درس یادگیری تقویتی
learning ,deep ,reinforcement ,تقویتی ,with ,یادگیری ,deep reinforcement ,reinforcement learning ,learning 2015 ,یادگیری تقویتی ,2015 09 ,deep reinforcement learning
درباره این سایت