深層強化学習

Pytorchを使って深層強化学習のモデルDQNを構築する 〜Deep Reinforcement Learning〜

囲碁や将棋のコンピュータって強いですね。初期レベルでも全然勝てなくて、何度待ったをしたことか。 このようなゲームでは、ある手段を選択すると、状態が変化し、次の状態に移り、再び手段の選択をするということを繰り返し、最終的な勝ち負けが決まります…