強化学習とはAI(人工知能)アルゴリズムの一つで、良い結果が得られる出力(ゲームの一手や操作)を試行錯誤で見つける手法のことです。教育用プログラミング言語のScratch(スクラッチ)を使って、強化学習の基本を4回にわたって説明します。 「ちょうどよい値」をいかに設定するか、Scratchゲームで強化学習の勘所を体感 Scratchのゲームプログラム「砂漠でダイヤ集めゲーム」を使い、強化学習のアルゴリズムであるQ学習の中身を紹介する。今回はL1-Q学習にかかわるコードのうち行動選択と学習について説明しよう。 2020.10.29 Scratchゲームで学ぶ強化学習、プログラムの中身を見てみよう Scratchのゲームプログラム「砂漠でダイヤ集めゲーム」を使い、強化学習のアルゴリズムであるL1-Q学習の中身を紹介しよう。L1-Q学習にかかわるコードは、強化学習の初期化、行動選択、学習の三つあ