[B! アルゴリズム] masudaKのブックマーク

[初心者向け] プログラムの計算量を求める方法 - Qiita

はじめにこの記事では、プログラムの計算量を求める方法を説明します。プログラミングの初心者向けに、厳密さよりも分かりやすさを優先して説明していきます。サンプルコードについてこの記事のサンプルコードは、C言語（C99）で記述しています。計算量とは？計算量とは、「そのプログラムがどれくらい速いかを大雑把に表す指標」です。もう少し正確に言うと、「入力サイズの増加に対して、実行時間がどれくらいの割合で増加するかを表す指標」です。グラフによる計算量の表現計算量をグラフで表すと、以下のようになります。これは、「入力サイズ $n$ が増加するにつれて、実行時間が $n$ に比例して増加する」ということを表しています。別のグラフも見てみましょう。これは、「入力サイズ $n$ が増加するにつれて、実行時間が $n^2$ に比例して増加する」ということを表しています。計算量を求め

masudaK 2018/04/11

リンク

ソートアルゴリズムを極める！〜なぜソートを学ぶのか〜 - Qiita

NTT データ数理システムでリサーチャーをしている大槻 (通称、けんちょん) です。今回はソートについて記します。 0. はじめにデータ構造とアルゴリズムを学ぶと一番最初に「線形探索」や「ソート」が出て来ます。これらのテーマは応用情報技術者試験などでも頻出のテーマであり、アルゴリズムの Hello World とも呼ぶべきものです。特にソートは、計算量の改善 ($O(n^2)$ から $O(n\log{n})$ へ) 分割統治法ヒープ、バケットなどのデータ構造乱択アルゴリズムの思想といった様々なアルゴリズム技法を学ぶことができるため、大学の授業でも、アルゴリズム関連の入門書籍でも、何種類ものソートアルゴリズムが詳細に解説される傾向にあります。本記事でも、様々なソートアルゴリズムを一通り解説してみました。しかしながら様々な種類のソートを勉強するのもよいが、「ソートの使い方」や

masudaK 2018/04/11

内容めちゃ濃い。ここまで書かれた記事ってなかなかない。

リンク

Yahoo!の異常検知フレームワーク"EGADS"

Yahoo!がOSSとして開発している異常検知フレームワーク "EGADS" (Extensible Generic Anomaly Detection System) について書いた次の論文を読んだ： Generic and Scala ble Framework for Automated Time-series Anomaly Detection (KDD 2015) リアルタイムなデータをモデリングする種のアルゴリズムの実装とはどうあるべきなのか、という話は難しい。僕も異常検知や情報推薦のためのアルゴリズムをパッケージ化してみてはいるものの、時系列データの入力、モデリング、予測、出力といったコンポーネントをいかに切り分けて実装するかバッチとオンラインアルゴリズムのバランスをいかに取るかどこまで自動化して、どこにヒューリスティクスを取り入れる余地を残すかといった点は本当に悩ま

masudaK 2017/09/12

リンク

Knuth multiplicative hash が最小完全ハッシュ関数であることの証明 | メルカリエンジニアリング

こんにちは！サーチチームの @metal_unk です。普段はサーバーサイドエンジニアとして、メルカリの検索を改善する仕事をしています。メルカリには Be Professional Day という「普段できないことをやろう」をテーマとする日があり、その日は業務に直接関係のないことや、普段は手をつけられないリファクタリングなどがされます。Be Professional Day の様子はこちらで紹介されています。 tech.mercari.com わたしは今回の Be Professional Day で、Knuth multiplicative hash が最小完全ハッシュであることを証明しました。このブログはその証明についての記事です。「普段できないことをやろう」という Be Professional Day では、証明もアリです。 Knuth multiplicative hash

masudaK 2017/08/29

証明やばい

リンク

A/Bテストよりすごい？バンディットアルゴリズムとは一体何者か - Qiita

オバマ大統領の再選に大きく寄与したことで大きな注目を集めているA/Bテスト。A/Bテストを導入した、することを検討している、という開発現場も多いのではないだろうか。そんな中、Web上で次のような議論を見つけた。 20 lines of code that will beat A/B testing every time Why multi-armed bandit algorithm is not “better” than A/B testing 一言でまとめると「A/Bテストよりバンディットアルゴリズムの方がすごいよ」「いやいやA/Bテストの方がすごいし」ということだ。で、バンディットアルゴリズムとは一体何者なのか？そこでBandit Algorithms for Website Optimization (O'REILLY)を読んでみた。その結果分かったことを踏まえてざっくりと

masudaK 2016/04/22

リンク

PHP の壊れた mt_rand の品質を統計的に検証した - iwiwiの日記

メルセンヌ・ツイスターと似て非なるアルゴリズムが実装されていたことが発覚して話題の PHP の mt_rand 関数の品質を統計的に検証しました．果たして，PHP の「壊れた」mt_rand は安心して使うことができるのでしょうか……？ちなみに，結論から言うと，PHP の壊れた mt_rand は，（少なくともこのテストの範囲では）本家メルセンヌ・ツイスターと遜色ない品質を持っているようです．ただし，最後に PHP の乱数の別の懸念点についても紹介します．壊れた mt_rand とは PHP の mt_rand は，ドキュメントによると，有名な乱数生成アルゴリズム「メルセンヌ・ツイスター」を利用して高品質の乱数を生成する関数です．ところが，どうやら一部では知られていたこととして，PHP の mt_rand の実装にはバグがあり，本家メルセンヌ・ツイスターと挙動が一致していませんでした．

masudaK 2016/02/23

リンク

How can I use a Linked List in Python?

masudaK 2016/01/31

リンク

プログラマならみんな知ってるよね!データ構造と計算量について | SONICMOOV LAB

9日目らくさんの記事を読んで計算量を意識することがいかに重要かということを学んだ、ムックです。というわけで、ソニックムーブ Advent Calendar 2013 14日目はプログラマならみんな知っているであろう、データ構造と計算量について改めて調べてみました。まず、データ構造とはデータ構造（データこうぞう、英: data structure）は、計算機科学において、データの集まりをコンピュータの中で効果的に扱うため、一定の形式に系統立てて格納するときの形式のことである。 — wikipedia抜粋データ構造には、いくもの種類があるが良し悪しがなくどういったデータをどう処理するかによって効率が大きく変わっていきます。データ構造の主な種類配列(Array) プログラムをかじったことがある人は誰しも知っているであろうArray。同じサイズの要素を並べただけのデータ構造です。

masudaK 2016/01/30

リンク

Cuckoo Hashing - Radium Software

ハッシュテーブルからエントリーを検索する処理は，一般に定数時間で済むとされている。つまり，どんなにエントリーが増えても検索の速さは変わらない，ということ。データ構造の教科書には必ず載っていることだね。でも実際には，ハッシュの衝突が起こった場合に，速度の低下が発生する可能性がある。例えば，一般的なチェイン法（オープンハッシュ）だと，衝突したエントリーに関して線形検索を行うことになるから，衝突が多ければ多いほど，定数時間からは遠のいてしまう。この速度低下を防ぐ方法はいろいろある。なかでも cuckoo hashing （カッコウ・ハッシング）は仕組みが面白い。こいつは，エントリーの検索を必ず定数時間で済ませてくれるという優れものなんだ。 Cuckoo hashing では，２つのハッシュ関数と，２つのテーブルを用いる。ここでは，２つのハッシュ関数をそれぞれ h1, h2 として，２つのテー

masudaK 2016/01/20

リンク

重み付きのランダム抽選関数を作る（PHP）

新生FF14のチョコボ（バディー）は、何も設定しなければフリースタイルで戦うって知ってましたか？頑張ってバディーのディフェンススキルを上げているのに、どうもチョコボの戦い方がディフェンサーぽくないな〜。おいっチョコボ！ちゃんと仕事しろよ！！っと思っていたら、メニューのバディー画面でフリースタイルのアイコンに小さいチェックマークがあるではないですか！？ディフェンススタイルにチェックするようにしたら、ちゃんと仕事するようになりました♪ …ごめんよチョコボ、筆者が無知なだけでした。重み付きの抽選ロジックは既に色々なところで紹介されていますが、ちょっと必要になったので作ってみました。配列要素の値に重み(確率)となる整数値を入れて渡すと抽選された要素のキーを返します。サンプルでは、hash配列を渡していますが、array配列でも同様に要素のキーを返します。 /* * 配列から１つの要素キーを抽選す

masudaK 2016/01/11

リンク

リストから重みをつけてランダムに要素を取り出す

同僚がそのような処理を実装していた。問題設定はこうだ。リストのなかに複数の要素がふくまれている。それぞれの要素は重みづけされている。重みの大きいものがより高い確率になるように、ランダムに要素をひとつ抽出したい。例えば要素の重みがすべておなじならば、たんなるランダムピックアップになる。ではどうするか。すべての重みの総和の範囲で乱数を生成する。リストを前かみていき、乱数から要素の重みをひとつづつひいていく。はじめて乱数が 0 以下になったら、そのときの要素をピックアップすれば良い。たとえば次のリストを考える。要素の数値は重みをあらわす。 [10, 3, 1] 重みの総和の範囲の乱数をだす。今回の場合は 1 - 14 の範囲の乱数がほしい。bash ならばこんなかんじだ。 $ echo $(($RANDOM % 14 + 1)) この結果が 11 だとする。リストを先頭から見ていく。乱数か

masudaK 2016/01/11

アルゴリズム

リンク

Algorithm - 連想配列の実装としてのハッシュはオワコン? : 404 Blog Not Found

2012年01月17日11:45 カテゴリアルゴリズム百選Tips Algorithm - 連想配列の実装としてのハッシュはオワコン? 珠玉のプログラミング Jon Bentley / 小林健一郎訳つまり「終わったコンテナ」。以前からうすぼんやりと考えて来た危惧が、すこしはっきりと見えてきた。徳丸浩の日記: Webアプリケーションに対する広範なDoS攻撃手法(hashdos)の影響と対策もうそろそろハッシュ(テーブル)以外の手段の連想配列の実装手段を本格的に模索するべきではないか、と。そのデータ構造は、君の魂を差し出すに足るものかい? 連想配列(Associative array)がコレクション(Collection)、すなわち数多のデータ構造をまとめるデータ構造としての覇者となったのはもはや疑いようがない事実でしょう「配列で実装されるデータ構造ではなくて、配列を実装するデータ構

masudaK 2015/12/14

リンク

物理サーバを選定する際のポイント – Eureka Engineering – Medium

Eureka EngineeringLearn about Eureka’s engineering efforts, product developments and more.

masudaK 2015/12/09

リンク

B木 - naoyaのはてなダイアリー

昨年から続いているアルゴリズムイントロダクション輪講も、早いもので次は18章です。18章のテーマはB木(B Tree, Bツリー) です。B木はマルチウェイ平衡木(多分木による平衡木)で、データベースやファイルシステムなどでも良く使われる重要なデータ構造です。B木は一つの木の頂点にぶら下がる枝の本数の下限と上限を設けた上、常に平衡木であることを制約としたデータ構造になります。輪講の予習がてら、B木を Python で実装してみました。ソースコードを最後に掲載します。以下は B木に関する考察です。 B木がなぜ重要なのか B木が重要なのは、B木(の変種であるB+木*1など)が二次記憶装置上で効率良く操作できるように設計されたデータ構造だからです。データベースを利用するウェブアプリケーションなど、二次記憶(ハードディスク)上の大量のデータを扱うソフトウェアを運用した経験がある方なら、いかにディ

masudaK 2015/11/24

リンク

AtCoderでの勉強の仕方（コンテスト編） - chokudaiのブログ

AtCoder (アットコーダー) 毎週アルゴリズム系のプログラミングコンテストを開催しているAtCoderですが、それを使って、どのように勉強すれば良いのか？というのは、結構困っている人がいるようです。そこで、社長お勧めの、誰でも簡単に続けられる勉強方法を伝授します。１、コンテストに参加するとりあえず、AtCoderで勉強をしたいなら、過去問を解くより、リアルタイムのコンテストに参加することがお勧めです。自分ではなかなか勉強する気が起こらない・・・。という人でも、時間が決まったコンテストであれば参加できる、という人は多くいるようです。たまに開催出来ないことがありますが、毎週土曜日、午後9時から10時半、または11時まで、コンテストが開催されています。ある程度コンテストに慣れた人向けのAtCoder Regular Contestと、初心者～中級者向けのAtCoder Begi

masudaK 2015/11/22

リンク

クイックソート

ピボットは (0 + 1) / 2 = 0 0番目の要素15がピボットになります。では左側から捜査します。 15 14 15 14 14 15 ピボットが交換対象となり、14は15以下なので、14と15を交換します。つぎは、交差するのでここで捜査終了です。また、ピボットの左側の要素が1となったので、右側のソートも終了します。ということで、以下のようなデータ数列になります。 5 12 10 7 2 4 13 14 15 19 右側のソートが終了しています。次は、左側に関して同じようにソートしていけば、昇順にソートされることがわかります。今回は、ピボットを真ん中の値としましたが、先頭の値をピボットとしてもいいですし、ソートに関して、効率のよい値をピボットにするのがベストです。では、最後にc++のソースコートを載せます。 /* array = ソートしたいデータ begin =

masudaK 2015/11/22

リンク

バイナリーサーチ／二分探索 : アルゴリズム

バイナリーサーチ(二分探索とも呼ばれる)はソート済みの配列において、検索する間隔を半分に分割しながらデータを探し出すアルゴリズムです。ソート済みの配列を分割するということはバイナリーサーチツリーを生成することになります。検索範囲の分割はデータの大小関係をもとに行われます。アルゴリズム分析配列をソートする(ここでは昇順でソートされたとする) 配列の中央にある要素を調べる探索中央の要素が目的の値ではなく、目的のデータが中央の値より大きい場合、中央より後半の部分を調べる中央の要素が目的の値ではなく、目的のデータが中央の値より小さい場合、中央より前半の部分を調べる 2.に戻る図解注意バイナリーサーチは値の比較によって検索範囲を絞りこむので、探索対象の配列がソートされていなければなりません。サンプルコード配列から目的の値を検索するバイナリーサーチのサンプルコードです。 C言語

masudaK 2015/11/12

リンク

共通部分文字列をカウント | アルゴリズム [AOJ 528][Ruby/Python][文字列操作]

引き続きプログラミングの基礎体力づくりと、Pythonの勉強を兼ねてアルゴリズムを勉強中です。今回は『共通部分文字列をカウントする方法』について勉強しました。AIZU Online Judgeで対応している問題は、『Common Sub-String』です。アルゴリズムというよりは頭の体操的なパズル問題ですが、ある程度速度の早いプログラムを書くのには工夫が必要だなと痛感しています。 🏈 AOJ問題Common Sub-String Aizu Online Judge。2個の文字列が与えられたとき、両方の文字列に含まれる文字列のうちもっとも長いものを探し、その長さを答えるプログラム。 🍄 Rubyコードloop do s, t = gets.chomp, gets.chomp rescue break s, t = t, s if s.length > t.length max_l

masudaK 2014/05/08

アルゴリズム

リンク

幅優先探索 | アルゴリズム[Ruby/Python][AOJ 0129]

『幅優先探索』をRuby/Pythonで解いてみました。AIZU Online Judgeで対応している問題は『Seven Puzzle』です。 🏀 概要深さ優先探査の説明は『通勤・通学中に理解する深さ優先探索と幅優先探索』、『アルゴリズム図鑑：iOS & Androidアプリ』が分かりやすかったです。要点は次のとおり。根ノードで始まり隣接した全てのノードを探索。階層(根ノードからの距離が近い順)にルートを調べる 🐯 サンプル問題(AOJ)Seven Puzzle Aizu Online Judge。1-7までの数字と、1つ空白のあるパズルをとく問題。 😀 Rubyコード 01234567がそろった状態(ゴール)からスタートして、0を移動させる幅優先探索で過去に到達していない状態になったら、手数(移動数)を記録すでに到達済の状態であれば、スキップ(幅優先探索なら手数が同等か

masudaK 2014/05/07

アルゴリズム

リンク

数あるソートアルゴリズムをビジュアル化し堪能できるサービス「SORTING」

大小の関係が決められたデータを小さい順や大きい順に並び替える作業はソートと呼ばれ、コンピュータには欠かせないプログラムです。そのため、ソートをより早く・確実に・効率良く実行できるように、さまざまなアルゴリズムが考案されてきました。そんなコンピュータの発展にかかせない役割を果たしてきたソートアルゴリズムをビジュアル化することで直感的に理解できるのが「SORTING」です。 SORTING http://sorting.at/ これがSORTINGのサイトページです。ソートアルゴリズムを選択してページ下の「PLAY」ボタンをクリックすると、そのソートアルゴリズムを使ってボールが並び替えられます。たとえばアルゴリズム「クイックソート」でランダムに並んだ状態の大きさの異なるボールを左から小さいもの順に並び替えるとこんな感じです。選べるソートアルゴリズムは、クイックソート・ヒープソート・スムース

masudaK 2014/05/02

アルゴリズム

リンク

はてなブックマーク

タグ

関連タグで絞り込む (22)

アルゴリズムに関するmasudaKのブックマーク (32)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第2週）

今週のはてなブックマーク数ランキング（2024年5月第1週）

月間はてなブックマーク数ランキング（2024年4月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス