2020-08-01から1ヶ月間の記事一覧

PFRLを試してみる - self play

はじめに 前回 、 PFRLを用いてslime volleyballを学習した。 今回は同じ slime volleyballl環境に対して, 複数のagent を用いたself playを試してみる。 self play 対戦型ゲームにおける強化学習は対戦相手となるエージェントに依存する。 前回の学習では、…

PFRLを試してみる - slime volleyball

はじめに 前回はPFRLでatari SpaceInvadorの学習を行ったが、 計算時間が足りず、うまく学習できなかった。 今回はもう少し簡単な、Slime Volleyball1に対して学習を行う。 slime volleyball slime volleyballは2人のプレイヤーがボールを相手のコートに 落…

PFRLを試してみる - atari

はじめに [前回] までPFRLの簡単な使い方を学び、 openai-gymの pendulum問題の検証を行った。 今回はatari環境においての検証を行う。 検証 PFRLのexampleを参考にした。 https://github.com/pfnet/pfrl/blob/master/examples/atari/reproduction/rainbow/t…

PFRLを試してみる - アルゴリズム比較

はじめに 前回、 PFRLのSAC1でPendulum問題について強化学習を行った。 今回は別のアルゴリズムでも学習を行い比較を行う。 前回の訂正 前回 policyネットワークの出力をtorch.distributions.Normalにすると そのままではSACが動かず修正が必要だとしていた…

PFRLを試してみる

はじめに 最近Preferred Networksが公開したpytorchによる強化学習ライブラリ PFRLの内容を確かめて、openai-gymに実装されている Pendulum問題を学習させてみた。 PFRL PFRLはchainerによる強化学習ライブラリchainerrl1の後継ライブラリである。 強化学習…