[B! Qiita][アルゴリズム] yuki_2021のブックマーク

yuki_2021 id:yuki_2021

Qiitaとアルゴリズムに関するyuki_2021のブックマーク (3)

ぼくのかんがえたさいきょうの強化学習アルゴリズム（古典強化学習編） - Qiita
この記事は自作している強化学習フレームワークの解説記事です。はじめに今までフレームワークを通じて様々な強化学習アルゴリズムを実装してきました。今回その知識を生かしてオリジナルなアルゴリズムを考えてみたので記事にまとめてみます。このアルゴリズムは以下の状況でかなりの精度を誇ります。マルコフ決定過程なモデル状態が離散で現実的な数行動が離散で現実的な数 ※"現実的な数"というのは数に上限があり、その上限がそれほど大きくない場合を指します基本アイデア基本的なアイデアは探索（Exploration）と活用（Exploitation）の分離です。強化学習では一般的に「探索と活用のトレードオフの問題」1があり、探索を優先すると報酬が少なくなり、活用を優先すると局所解に陥る可能性が高くなる問題があります。私が過去に記事で取り上げた手法では、どれも探索と活用のバランスをとり学習を進めて
yuki_2021 2024/02/13
アルゴリズム

qiita

機械学習
リンク
世界四連覇AIエンジニアがゼロから教えるゲーム木探索入門 - Qiita
はじめに書籍化本記事を元にゲームで学ぶ探索アルゴリズム実践入門～木探索とメタヒューリスティクスという書籍を出版することになりました！本記事を読んで気になっていただけたらご購入をご検討いただけるとうれしいです！この記事で得られる技術ゲームルールに適した探索アルゴリズムを選択するゲーム木探索をするのに適したクラス設計主要なゲーム木探索アルゴリズムの実装この記事の特徴汎用アルゴリズムの実装例による他ゲームへの応用力と、実際に動作可能なサンプルコードによる具体的実装イメージの両視点でわかりやすくした（片方しか記載のない記事が多い）サンプルコード付き日本語記事がほぼないDUCTを解説しているサンプルコードは印のついたメソッドを実装したクラスさえ書けば、アルゴリズム部分を変更せずそのまま他のゲームで動作可能になっているこの記事で扱わない関連技術探索の高速化多様性の確保
yuki_2021 2022/01/26
qiita

アルゴリズム
リンク
アルゴリズムの世界地図 - Qiita
0. アルゴリズムとは？まず、アルゴリズムとは何かを説明します。（0 節の説明はスライド「50 分で学ぶアルゴリズム」の説明を参考にして書きました）さて、次の問題を考えてみましょう。問題： 1 + 2 + 3 + … + 100 の値を計算してください。単純な方法として、式の通りに 1 つずつ足していく方法が考えられます。すると、以下の図のように答えが計算されることになります。これで答え 5050 が正しく求まりました。これはれっきとしたアルゴリズムであり、この問題を 99 回の足し算で解いています。しかし、計算回数が多く、計算に時間がかかるのではないかと思った方もいると思います。ここで、方法を変えて、「1 + 100」「2 + 99」「3 + 98」…「50 + 51」の合計を求めることで、1 + 2 + 3 + … + 100 の値を計算してみましょう。 50 個の
yuki_2021 2021/12/24
後でじっくり読む。

qiita

アルゴリズム

programming
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx