SIer/データサイエンティストを目指す修士blog

勉強したことを徒然とぼやきます

勉強したもの置き場

強化学習

研究のメインが強化学習. 制御寄りの研究室ということもあり, 強化学習で制御する, って考え方が好き.

初学
  • 強化学習Reinforcement Learning : An Introduction"の邦訳. 深層学習以前の強化学習の基礎がすべて詰まっている.

  • これからの強化学習 1章は初学者向き, 2章以降は研究者向き?比較的新しい内容. この本だけで強化学習の理解は無理だと思う(笑)

動的計画法
  • Formal Synthesis of Control Strategies for Dynamical Systems
  • Optimal Control of Markov Decision Processes With Linear Temporal Logic Constraints
  • An Approximate Dynamic Programming Approach to Multi-Agent Persistent Monitoring in Stochastic Environments with Temporal Logic Constraints
スーパバイザ制御 + 強化学習
Temporal Logic + 強化学習
DQN
CNN + 強化学習
RNN + 強化学習
階層的強化学習
A3C
マルチエージェント
読む予定

深層学習

強化学習 + 深層学習という感じで, ツールとして使いたいので多少勉強している.

統計的学習手法

参加している勉強会の中心がこの分野なので, こっちも結構やってる.

勉強中
勉強したいもの

まだ(勉強会で)手を出していないが手を出す予定のもの

  • 数理計画法
  • 異常検知

プログラミング/ツール

  • 言語
    • python
    • R
    • pyTorch
    • TensorBoard(TensorFlow)
  • アプリケーション
    • Docker
    • Git