PFRLを試してみる - self play

はじめに前回、 PFRLを用いてslime volleyballを学習した。今回は同じ slime volleyballl環境に対して, 複数のagent を用いたself playを試してみる。 self play 対戦型ゲームにおける強化学習は対戦相手となるエージェントに依存する。前回の学習では、…

2020-08-10

PFRLを試してみる - slime volleyball

はじめに前回はPFRLでatari SpaceInvadorの学習を行ったが、計算時間が足りず、うまく学習できなかった。今回はもう少し簡単な、Slime Volleyball1に対して学習を行う。 slime volleyball slime volleyballは2人のプレイヤーがボールを相手のコートに落…

2020-08-06

PFRLを試してみる - atari

はじめに [前回] までPFRLの簡単な使い方を学び、 openai-gymの pendulum問題の検証を行った。今回はatari環境においての検証を行う。検証 PFRLのexampleを参考にした。 https://github.com/pfnet/pfrl/blob/master/examples/atari/reproduction/rainbow/t…

2020-08-04

PFRLを試してみる - アルゴリズム比較

はじめに前回、 PFRLのSAC1でPendulum問題について強化学習を行った。今回は別のアルゴリズムでも学習を行い比較を行う。前回の訂正前回 policyネットワークの出力をtorch.distributions.NormalにするとそのままではSACが動かず修正が必要だとしていた…

2020-08-03

PFRLを試してみる

はじめに最近Preferred Networksが公開したpytorchによる強化学習ライブラリ PFRLの内容を確かめて、openai-gymに実装されている Pendulum問題を学習させてみた。 PFRL PFRLはchainerによる強化学習ライブラリchainerrl1の後継ライブラリである。強化学習…

ML Over the Horizon

2020-08-01から1ヶ月間の記事一覧

PFRLを試してみる - self play

PFRLを試してみる - slime volleyball

PFRLを試してみる - atari

PFRLを試してみる - アルゴリズム比較

PFRLを試してみる