強化学習の一端に触れるために
強化学習ってなんだろー?
ってことで、その一端を垣間見るために、OpenAIが提供している、CartPoleを一度動かしてみましょう。
所要時間
約5~10分
ばっくり手順
1. Pythonダウンロード・インストール 2. コマンドプロンプトで `pip install gym` 3. サンプルファイルコピペ 4. `python .\cartpole.py`を実行
Pythonのインストール
ダウンロード
ここで最新版のPythonをダウンロード。
このとき、基本は『Windows x86-64 excecutable installer』を選ぶこと。
x86や、トップのは32bitのものなので・・・
インストール
『Add Python 3.7 to PATH』は必ずチェックを入れておくこと。
じゃないと、後で手作業でする羽目に・・・面倒なのでチェック忘れない。
『Disable path length limit』って書かれてる、PATHの長さ制限の解除はお好みで。
流石に私はそんな長いPATHにしてないので何もしませんでした。
Pythonの動作確認
Windowsの検索とかで『コマンドプロンプト』を起動。以下のようにコマンド打ってみる。
バージョンが表示されたので、大丈夫ですね。
OpenAIのCartPoleの環境構築
こちらのドキュメント参考にしながら環境構築。
gymのインストール
コマンドプロンプトで、 pip install gym
でインストール完了です。
もし pip
コマンドがうまく動かない場合は、先程のPATHが通せてない可能性があります。
試しに動かしてみる
pythonのファイル作ってみましょう。
cartpole.py
import gym env = gym.make('CartPole-v0') env.reset() for _ in range(1000): env.render() env.step(env.action_space.sample()) # take a random action env.close()
このファイルを作成したら、実際に実行してみる。
python cartpole.py
あ。とりあえず動きましたね。めっちゃ棒荒ぶってますが。
最後に
一旦動くものが作れました。
これからどんな手順を踏んで体験していくかは、また別の記事で。
お疲れ様でした。