ゼロからDeepまで学ぶ強化学習
http://qiita.com/icoxfog417/items/242439ecd1a477ece312
Tech-Circle #18 Pythonではじめる強化学習 OpenAI Gym 体験ハンズオン
http://www.slideshare.net/takahirokubo7792/techcircle-18-python-openai-gym
icoxfog417/techcircle_openai_handson
Tech-Circle #18 「Pythonではじめる強化学習 OpenAI Gym 体験ハンズオン」のハンズオン資料
https://github.com/icoxfog417/techcircle_openai_handson
方策勾配法(Policy Gradient Method)
http://qiita.com/skitaoka/items/a86a35a35f51a99608be