科目名 (英語名) |
__科目名__
(__科目名(英語)__) |
担当教員 |
西村 まどか |
開講時期 |
__開講時期__ |
科目ナンバー |
__科目ナンバー__ |
授業コード |
2312 |
単位 |
__単位__ |
授業概要 |
強化学習入門の手法の紹介とその課題 |
到達目標 |
人工知能で使われる強化学習の具体例を理解する基礎力を高める |
スキルの育成方法 |
コーディングと理論を同時並行で考えることにより、読解力と論理的思考力、課題発見力を身につける |
授業計画 |
回 | 授業内容 | 事前事後学修内容・所要時間 |
1 | 強化学習の基礎 | [事後] 講義のまとめと課題 (2時間) |
2 | 価値ベース手法による深層強化学習 | [事後] 講義のまとめと課題 (2時間) |
3 | 方策勾配法による深層強化学習 | [事後] 講義のまとめと課題 (2時間) |
4 | モデルベース手法による深層強化学習 | [事後] 講義のまとめと課題 (2時間) |
5 | 汎化性 | [事後] 講義のまとめと課題 (2時間) |
6 | オンライン問題に特有の課題 | [事後] 講義のまとめと課題 (2時間) |
7 | まとめと解説 | [事後] 講義のまとめと課題 (2時間) |
8 | | |
9 | | |
10 | | |
11 | | |
12 | | |
13 | | |
14 | | |
受講者の事前知識と進度により適宜変更する。
|
成績評価基準 |
出席態度 (20%), レポート提出 (40%), ノート提出に関する口頭試問 (20%) |
前提科目 |
データサイエンス入門, 経営工学, 応用数学, データ分析手法 |
後継科目 |
専門演習I |
教科書 |
深層強化学習入門, V. Lavet 他, 共立出版, https://www.kyoritsu-pub.co.jp/bookdetail/9784320124721 |
参考書 |
強化学習を学びたい人が最初に読む本, 伊藤真, 日経 BP, https://www.nikkeibp.co.jp/atclpubmkt/book/21/284010/ |
その他・注意事項 |
課題レポートの提出と最終回のノート提出は必須である。自力で PC 上の環境を整備できる能力を有していることを前提とする。
|