Self Reference Ngin

アウトプットの練習・テクノロジーについて

Gunosyデータマイニング研究会で発表したよ

発表資料

課題図書

これからの強化学習

これからの強化学習

  • 作者: 牧野貴樹,澁谷長史,白川真一,浅田稔,麻生英樹,荒井幸代,飯間等,伊藤真,大倉和博,黒江康明,杉本徳和,坪井祐太,銅谷賢治,前田新一,松井藤五郎,南泰浩,宮崎和光,目黒豊美,森村哲郎,森本淳,保田俊行,吉本潤一郎
  • 出版社/メーカー: 森北出版
  • 発売日: 2016/10/27
  • メディア: 単行本(ソフトカバー)
  • この商品を含むブログ (2件) を見る

発表までに読んだ本

参照した論文

Playing Atari with Deep Reinforcement Learning

Human-level control through deep reinforcement learning

Mastering the Game of Go with Deep Neural Networks and Tree Search

感想

該当箇所を読んで資料にまとめるまでの一連の流れで、超真剣に勉強するので力になる。発表でgdってしまったけど、主催者や参加者のみなさんに大いに助けをいただいて、最後まで完走できた。詰まったら怒られるかなと思っていたら、みんな優しくてよかった。でも、詰まるのはよくないね。

反省と今後

主に数式やアルゴリズムで理解が不十分だったところは解説できなくて詰んでしまい、自分がそれらに対していい加減な理解しかしていないという事実に気づいた。

数学書を読み、手を動かして演習するなどして、ちゃんと数学に向き合ってこなかったことは、統計学機械学習を始め様々な技術を学ぶ上でボトルネックになると思った。

アルゴリズムに対しても同様に、手を動かして実装することをしていかないとといった気持ち。全体的にアウトプット不足なのを解消しないといかん。

そういった基礎部分に重きを置いて修行します。
今年中にまた発表にチャレンジしたいです。