科目名 (英語名) |
__科目名__
(__科目名(英語)__) |
| 担当教員 |
西村 まどか |
| 開講時期 |
__開講時期__ |
| 科目ナンバー |
__科目ナンバー__ |
| 授業コード |
1476 |
| 単位 |
__単位__ |
| 授業概要 |
強化学習入門の手法の紹介とその課題 |
| 到達目標 |
人工知能で使われる強化学習の具体例を理解する基礎力を高める |
| スキルの育成方法 |
コーディングと理論を同時並行で考えることにより、読解力と論理的思考力、課題発見力を身につける |
| 授業計画 |
| 回 | 授業内容 | 事前事後学修内容・所要時間 |
| 1 | 強化学習の基礎 | [事後] 講義のまとめと課題 (2時間) |
| 2 | 価値ベース手法による深層強化学習 | [事後] 講義のまとめと課題 (2時間) |
| 3 | 方策勾配法による深層強化学習 | [事後] 講義のまとめと課題 (2時間) |
| 4 | モデルベース手法による深層強化学習 | [事後] 講義のまとめと課題 (2時間) |
| 5 | 汎化性 | [事後] 講義のまとめと課題 (2時間) |
| 6 | オンライン問題に特有の課題 | [事後] 講義のまとめと課題 (2時間) |
| 7 | まとめと解説 | [事後] 講義のまとめと課題 (2時間) |
| 8 | | |
| 9 | | |
| 10 | | |
| 11 | | |
| 12 | | |
| 13 | | |
| 14 | | |
受講者の事前知識と進度により適宜変更する。
|
| 成績評価基準 |
出席態度 (20%), レポート提出 (40%), ノート提出に関する口頭試問 (20%) |
| 前提科目 |
データサイエンス入門, 経営工学, 応用数学, データ分析手法 |
| 後継科目 |
専門演習I |
| 教科書 |
深層強化学習入門, V. Lavet 他, 共立出版, https://www.kyoritsu-pub.co.jp/bookdetail/9784320124721 |
| 参考書 |
強化学習を学びたい人が最初に読む本, 伊藤真, 日経 BP, https://www.nikkeibp.co.jp/atclpubmkt/book/21/284010/ |
| その他・注意事項 |
課題レポートの提出と最終回のノート提出は必須である。自力で PC 上の環境を整備できる能力を有していることを前提とする。
|