科目名 (英語名) |
__科目名__
(__科目名(英語)__) |
担当教員 |
西村 まどか |
開講時期 |
__開講時期__ |
科目ナンバー |
__科目ナンバー__ |
授業コード |
1470 |
単位 |
__単位__ |
授業概要 |
強化学習の初歩に触れる |
到達目標 |
簡単な技術かのように説明される技術革新の一つである深層強化学習に用いられる理論の一つ、強化学習の理論とコードに触れることにより、学部レベルの理解度がどこまでなのかがわかるようになる |
スキルの育成方法 |
毎回の講義に関連したレポートをまとめることで批判的思考力, 論理的思考力, 情報収集力, 課題発見力, 問題解決力を育成する。 |
授業計画 |
回 | 授業内容 | 事前事後学修内容・所要時間 |
1 | 強化学習理論 | [事後] 今回のテーマのまとめ(2時間) |
2 | 動的計画法 | [事後] 今回のテーマのまとめ(2時間) |
3 | テーブル形式におけるプランニングと学習の紹介 | [事後] 今回のテーマのまとめ(2時間) |
4 | 方策オン型手法 | [事後] 今回のテーマのまとめ(2時間) |
5 | 方策オフ型手法 | [事後] 今回のテーマのまとめ(2時間) |
6 | 方策勾配法 | [事後] 今回のテーマのまとめ(2時間) |
7 | 深層学習へのつながり | [事後] 今回のテーマのまとめ(2時間) |
8 | | |
9 | | |
10 | | |
11 | | |
12 | | |
13 | | |
14 | | |
受講者の事前知識と進度により適宜変更する。
|
成績評価基準 |
出席態度 2 割, レポート提出 4 割, 課題の理解度 4 割 |
前提科目 |
データサイエンス入門a, データサイエンス入門b, データ分析入門a, データ分析入門b, 機械学習入門a, 応用数学a, 応用数学b, 応用数学c, 応用数学d |
後継科目 |
機械学習理論a, 機械学習理論b, 機械学習理論c, 機械学習理論d |
教科書 |
強化学習アルゴリズム入門「平均」からはじめる基礎と応用, 曽我部 東馬, オーム社, 978-4-274-22371-6, [https://www.ohmsha.co.jp/book/9784274223716/]. |
参考書 |
強化学習, 森村哲郎, 講談社, https://www.kspub.co.jp/book/detail/5155912.html, ISBN: 978-4-06-515591-2.\n強化学習(第2版), R. Sutton, 森北出版, ISBN-978-4-627-82662-5, https://www.morikita.co.jp/books/mid/082662.\nあたらしい人工知能の教科書, 多田 智史, 翔泳社, ISBN-9784798145600, https://www.shoeisha.co.jp/book/detail/9784798145600. |
その他・注意事項 |
感染症等のリモート受講対策として自宅からスライドと音声による講義の提供は全ての回において提供できるが、補足で用いる板書等には対応しない。毎回レポートの提出及び出席管理は電子的な手法で行う。操作方法は提供する URL にアクセスし設定を自分で行うこと。このため、板書を取るノート, 筆記用具および学内からアクセスできる携帯電話, PC, 手書きでレポートを提出する際に用いる USB メモリ等の環境整備が必要である。初回受講時に準備しておくこと。Orange Data Mining は各自の計算機に準備する。インストール方法については。初回受講時には Anaconda をインストールした PC を持参すること。
|