2022-06-30から1日間の記事一覧

PyTorchを使って連続値制御の深層強化学習のSoft Actor Criticを構築する

前回、深層強化学習における連続値制御のモデル構築について書きました。今回は、その時に構築したモデルを改良し、精度向上に取り組みます。前回の記事をまだ見ていない方は、ぜひご覧ください。 www.dskomei.com 連続値制御の深層強化学習を改良するために…