SIer/データサイエンティストを目指す修士blog

勉強したことを徒然とぼやきます

A3Cを勉強したときに参考にしたもの

基本的にQ-learningによる強化学習しか勉強してませんでしたが, Actor-Criticはやっておかなきゃなあ…ということで, A3Cを勉強した時の資料を置いておきます. 元論文 正直読みにくかった.Gorilaの前提知識がない人は厳しいかも. https://arxiv.org/pdf/1602.…

夏休みでやりたいこと

技術系のブログとして最低限1週間に1回は更新したいと思っているけど難しいなぁ…と思いながら. 夏休みの目標として, とりあえず大学の図書館でいろんな本を借りることに. 統計学基礎編 やっぱりこの3冊は欠かせないかなって. 統計の基礎をしっかりと磨きたい…

勉強したもの置き場

強化学習 研究のメインが強化学習. 制御寄りの研究室ということもあり, 強化学習で制御する, って考え方が好き. 初学 強化学習 “Reinforcement Learning : An Introduction"の邦訳. 深層学習以前の強化学習の基礎がすべて詰まっている. これからの強化学習 1…