A3Cを勉強したときに参考にしたもの

基本的にQ-learningによる強化学習しか勉強してませんでしたが, Actor-Criticはやっておかなきゃなあ…ということで, A3Cを勉強した時の資料を置いておきます. 元論文正直読みにくかった.Gorilaの前提知識がない人は厳しいかも. https://arxiv.org/pdf/1602.…

2017-07-22

夏休みでやりたいこと

技術系のブログとして最低限1週間に1回は更新したいと思っているけど難しいなぁ…と思いながら. 夏休みの目標として, とりあえず大学の図書館でいろんな本を借りることに. 統計学基礎編やっぱりこの3冊は欠かせないかなって. 統計の基礎をしっかりと磨きたい…

2017-07-16

勉強したもの置き場

勉強したものまとめ

強化学習研究のメインが強化学習. 制御寄りの研究室ということもあり, 強化学習で制御する, って考え方が好き. 初学強化学習 “Reinforcement Learning : An Introduction"の邦訳. 深層学習以前の強化学習の基礎がすべて詰まっている. これからの強化学習 1…

SIer/データサイエンティストを目指す修士blog

勉強したことを徒然とぼやきます

A3Cを勉強したときに参考にしたもの

夏休みでやりたいこと

勉強したもの置き場