[B! database] deeekiのブックマーク

シンプルで移行しやすいデータベースシャーディング - クックパッド開発者ブログ

技術部の小野(taiki45)です。クックパッドではこれまで様々なデータベースの負荷対策を行ってきましたが、シャーディングは行われていませんでした。しかし先日クックパッドの認可サーバーが利用している MySQL サーバーの負荷分散のためにクックパッドで初めてのシャーディングを行ったので、Rails アプリケーションでのシャーディングの事例のひとつとしてその際の手法をご紹介したいとおもいます。構成 Before データベースは1マスター、1ホットスタンバイ、バッチ用の1リードレプリカで構成されています。Read オペレーションのほとんどはキャッシュ層に逃しています。 After データベースの各ロールにつきそれぞれ1台ずつマシンが増えています。シャーディングが必要になった背景認可サーバーのアクセストークンの作成・削除時の Write オペレーションが急増し、レコード数自体も急増していて

deeeki 2015/06/22

リンク

production db の内容を staging db に import する雑なスクリプト - Qiita

開発環境のデータをできるだけ本番に近づける - クックパッド開発者ブログみたいなことをやりたかったが、レプリケーション組むとなると大変なので、雑な mysqldump ベースのデータ移行スクリプトを書いてみた。仕組み mysqldump で mysqldump -uroot -T /tmp/ --fields-terminated-by="\t" --fields-optionally-enclosed-by="\"" --lines-terminated-by="\n" --fields-escaped-by="" #{database} #{table} のようにして production db のデータを TSV として吐き出して、LOAD DATA LOCAL INFILE #{tsv_file} INTO TABLE #{table} で TSV ファイルを読み込んで stag

deeeki 2015/06/20

リンク

Railsプロジェクトの初期開発フェーズでのDBスキーマ管理を見直す | Webシステム開発／教育ソリューションのタイムインターメディア

DBのスキーマ、皆様どのように管理されているでしょうか。 Railsを利用されている方の多くは、ActiveRecordのマイグレーションを利用して管理をされているかと思います。私もいままでいくつかのRails プロジェクトに関わってきましたが、ほぼ全てのプロジェクトでActiveRecordのDBマイグレーションを利用してきました。 (一部のプロジェクトはActiveRecordを使っていないため、マイグレーションも独自のものを利用しています) ActiveRecordのマイグレーションでは、DBスキーマ変更の差分情報をマイグレーションスクリプトとして保存しておきます。例えば、新しいテーブル「users」を作成する場合は、下記のようなマイグレーションスクリプトを作成します。 class AddUsers < ActiveRecord::Migration def up # ここにマイグ

deeeki 2014/10/24

リンク

The annotated table of contents

前書き - インデックスの作成はなぜ開発者のタスクなのかインデックスの内部構造 - インデックスは何に似ているかインデックスリーフノード - 二重連結リスト検索ツリー(Bツリー) - バランス木遅いインデックスパートI - インデックスを遅くする2つの原因 where 句 - 検索のパフォーマンスを改善するためにインデックスを作成等価演算子 - 一致するキーの検索プライマリキー - インデックスの使い方を確認複合インデックス - 複数列に対するインデックス遅いインデックスパートII - 前の問題点が再び関数 - where句の中での関数大文字・小文字を区別する検索 - UPPERと LOWER ユーザ定義関数 - 関数インデックスの制限インデックスの作り過ぎ - 冗長性の排除法パラメータ化クエリ - セキュリティとパフォーマンスのために範囲検

deeeki 2014/10/20

database

リンク

SQLデータベースに正しインデックスを作るのは誰の役割？

SQLのパフォーマンス問題は、SQLそのものと同じぐらいの歴史がある―― ある人は、SQLはそもそも遅いものだとすら言うかもしれません。これは、SQLの歴史が始まった頃は正しかったかもしれませんが、今となっては全く当てはまらないでしょう。にもかかわらず、SQLのパフォーマンス問題は今も一般的でよくあることです。どうしてそうなってしまうのでしょうか？ SQL言語は、恐らく最も成功した第4世代言語(4GL)でしょう。その最大の利点は、「何を」と「どのように」を分離できることです。SQL文は、どのようにそれを実行するかを記述せずに、単純に何を必要としているかのみの記述になっています。以下のような例を考えてみましょう。 SELECT date_of_birth FROM employees WHERE last_name = 'WINAND'SQLのクエリは、データを要求する英語の文として読

deeeki 2014/10/18

database

リンク

Database Encryption - r7kamura per second

データベースの暗号化界隈の話を調べたのでQ&A形式でまとめた。なぜ暗号化を行うのか？一般的には、以下の様な情報の漏洩を防ぐため。個人が識別できる情報個人の行動履歴財務情報知的財産財産その他開示されていない情報最近日本で大きな情報漏洩被害にあった企業例は？ Sony (PlayStation Network) Yahoo! Japan LINE 2ch @PAGES データベースの暗号化におけるベストプラクティスは？ StackOverflow等の意見を集めた限り、この辺を全部やるというのがベストプラクティスという雰囲気。通信データの暗号化: SSL 格納データの暗号化: FDE + TDE (後述) 格納データの暗号化機能を提供しているサービスの例は？ Amazon RDS for Oracle Amazon RDS for SQL Server Amazon S3 G

deeeki 2014/03/12

リンク

PDOの真の力を開放する - PHPでデータベースを扱う(3)

ちょっと遅れましたが、シリーズの第３回です。前回までに論じた内容をふまえて、簡単な実装を示します。↓前回までの内容はこちら。 DAOの悪夢 - PHPでデータベースを扱う(1) - 泥のようにドメイン駆動設計という救世主 - PHPでデータベースを扱う(2) - 泥のように題材「記事にタグを設定できるブログ」みたいなシステムを考えてみます。ブログ記事を示すEntryテーブル、タグを表すTagテーブルの二つを用意しました。MySQL WorkbenchによるER図(鳥足記法)は以下になります。 1つのEntryに対して複数のTagがある、１対多の関係です。同じTagが複数のEntryに関連するため、多対多の関係と見なすこともできそうですが、タグ程度だとあまり意味がないので、これ以上のテーブル分割はやめておきます。 Entryテーブルの主キーがentryIdと冗長な名前をしているのは、自

deeeki 2013/08/22

PHP
database

リンク

作るプログラムの機能や性能で勝負したい。そうだ、データベースを勉強しよう - きしだのはてな

さて、アルゴリズムの勉強のしかたと、ラムダ計算の勉強のしかたの目星をつけました。アルゴリズムの勉強のしかた - きしだのはてなラムダ計算の勉強のしかた、プログラム意味論 - きしだのはてなこれでここで書いたプログラムの理論の基礎は勉強できたことになるんじゃないかと思います。プログラムの理論とはなにか - きしだのはてなところで、プログラムの勉強地図としてこういう図を書きました。で、ハードウェアまわりについても、プロセッサを支える技術やネットワークはなぜつながるのかでひととおり勉強したとしましょう。じゃあ次は、アジャイルか？テストか？UIデザインか？となるわけですが、やはりプログラマなら、プログラムの作り方や使いやすさの前に、作るプログラムの機能や性能で勝負したいじゃないですか。いい感じに関数が分割できるよとか、読みやすい名前がつけれるよとか、効率よく仕事して定時に帰れるよと

deeeki 2011/10/02

リンク

Railsじゃなくてもマイグレーションを使えるStandaloneMigration - ひげろぐ

Rails等のフレームワークを使っていないプロジェクトでマイグレーションを使いたい時にはStandaloneMigrationが使える。（Ruby以外のプロジェクトでも使える。動かすにはもちろん要Rubyだけど） thuss/standalone-migrations – GitHub これを使わなくてもActiveRecordを使って自前でいろいろ書けばできるが、そういういろいろの面倒を見てくれるので楽ができる。インストール gem install standalone-migrations 又はbundlerを使ってもいい。というか環境を移すことを考えるとbundlerを使ったほうがいいですよね。 Rakefileの修正以下のコードを追記。 begin require 'tasks/standalone_migrations' rescue LoadError => e puts

deeeki 2011/09/23

リンク

複合主キーを避けるべき理由 - 虎塚

データベース設計の話をしていて、「連番の主キーは業務上意味のないデータだから、テーブルに持たせるのはムダだ。複合主キーにするべき」という意見を聞く機会がありました。脊髄反射で「ないわー」と思ったものの、理由を上手く説明できなかったので、改めて考えてみました。その結果、次のような結論に至りました。単一の連番カラムによる主キーと、複合カラムによる主キーとで迷ったら実装をシンプルにし、業務変更の影響範囲を小さくするために、複合主キーを避けるというわけで、調べたことや考えたことをメモしておきます。# 間違っている部分があれば、教えていただけると嬉しいです。（2011/07/25 追記）複合主キーとサロゲートキーについては、要件やシステムに依存して多様な判断がありうると思います。にもかかわらず、「避けるべき」というタイトルにしたのは極端でした。申し訳ありません。ご指摘下さった皆さん、あり

deeeki 2011/07/14

database

リンク

データやログのバックアップを楽に実現するために活用すべきライブラリ〜Backup〜 - よかろうもん！

サービスを提供する上で欠かせないのがデータやログ等のバックアップの設定です。構築/運用するサービスが増えると、その時に必ずバックアップの設定などを行なわなければなりませんね。ですがこのバックアップを仕込む作業、実に面倒ですよね。面倒な理由として以下があります。環境構築の度にアプリケーションの仕組みに合わせたスクリプトを作成しなければならないアプリケーションエンジニアにバックアップ対象を確認しないといけないバックアップしておくデータの世代管理をしないといけないバックアップしたデータからリストアのテストをしないといけないバックアップ失敗時にエラー検出するようにしないといけないバックアップ失敗時にエラー通知のテストをしないといけない ... etc. バックアップの仕組みを整備するのもひと苦労です。さらに、サービスが増えるごとに上記の作業をくり返しているとホント嫌になりますよ

deeeki 2011/07/09

リンク

データベースの内部動作を知る

SQLのプログラミングは奥が深い。特にパフォーマンスの観点から、そう言えるだろう。みなさんご承知の通り、同じ結果を出すプログラムでも、SQLの書き方次第で処理時間に何倍もの差が生じ得る。効率の悪いSQLを書いてしまう原因は、多くの場合、リレーショナルデータベースの内部動作やアプリケーションに関する理解不足である。両者をよく知った上で最適なSQLを書けるようになることは、システムエンジニアとしての重要なスキルの一つである。特集『基礎から理解するデータベースのしくみ』では、リレーショナルデータベースの内部動作について、基本的な部分を分かりやすく解説している。SQLプログラミングに役立つことはもちろん、SQLチューニングやデータベース設計のための基礎知識としても不可欠だ。イントロダクションブラックボックスのままでいいの？ Part 1：SQL文はどのように実行されるのか SQL実行までの

deeeki 2011/07/02

database
sql

リンク

「優れたMySQL DBAを見分ける27+3の質問」に対する回答例

随分と更新が空いてしまったが、「優れたMySQL DBAを見分ける27+3の質問」に対する回答例（漢バージョン）を紹介しよう。実は質問を掲載した際「難しい！」というコメントが非常に多く、もう少し易しい質問にするべきだったかと思って次のように呟いてみたのだが・・・非常に心強くて安心した。さすがに日本を代表するMySQLのエキスパートである。出題のレベルは間違ってはいなかった！！そんなわけで、回答の方に移ろう。 MySQLのサーバープロセスはいくつある？ひとつ。mysqldはシングルプロセス・マルチスレッドモデルを採用しているので、"サーバー"プロセスはひとつである。多くの場合、Linuxなどでmysqldを動かす場合には、お供にmysqld_safeも常に動いていることが多いが、mysqld_safeはサーバーではなく、mysqldのためのラッパーであるので数には含めない。 rootユー

deeeki 2011/04/08

リンク

ランキングのつくりかた:Kenn's Clairvoyance

遅ればせながら、あけましておめでとうございます。先週には、ベイエリアの友人たちがやっているEchofonがPostUpに買収されるなど、幸先のよい新年のスタートとなりました。さて、最近ホットなマーケットといえばソーシャルゲームですが、ゲームといえばリーダーボード。ハイスコアのランキングで友人や見知らぬ人たちと競うのは、ビデオゲームが誕生した1970年代から欠かせない要素でした。ところが、インターネット経由で100万人規模のプレイヤーがつながるようになってきた現在、その全体をランキングづけするのは、技術的にも大きなチャレンジとなってきました。今回は、そのリーダーボードのつくりかたについて、ぼくらの作っているソーシャルゲーム・プラットフォームであるPankiaの運用で得られた知見を共有したいと思います。自分の順位を知る方法リーダーボードの基本的な考え方はシンプルで、それはつまり「ユ

deeeki 2011/01/17

database
sql

リンク

MongoDBにおける関連（Relation）のスキーマ設計 - masa_wの日記

前回、Mongo DBでSNSつくるぞという記事を書いてから随分時間がたってしまいました。単に私がだらけていたということもあるのですが、一番ひっかかって時間を取られていたのが、Mongo DBにおけるスキーマ設計の考え方です。いまだに試行錯誤中ではありますが、現時点において私がこうあるべきと理解しているところをアウトプットしてみたいと思います。１．One to Many のケースたとえば注文と注文明細のケースを考えてみます。RDBで1対多のリレーションを設計する場合、というように、注文明細を別テーブルにするのが普通かと思います。しかし、ドキュメント指向のMongo DBにおいては、RDBと違ってオブジェクト内に柔軟なデータ構造を実現できるため、というように一つのCollection内にデータを埋め込んでしまうのが、パフォーマンスの点からも良しとされています。ただし、以下の2点について

deeeki 2010/12/12

リンク

リアルタイム・ランキングを考える | GREE Engineering

はじめにこんにちは。プラットフォーム開発部のsp1rytusと申します。先日、私もついに30歳のおっさんになってしまいました。加齢臭が出ないようにがんばります！ランキングって？ランキングは誰でもわかる、何らかの得点をソートして順位位置を決定する凄く簡単でシンプルなものです。しかし、ゲームを扱うコンテンツ・サービスにおいては、得点を通算/日別に順位付けされたものが直ぐに目に入るように、他人と自分を比較する非常に重要な役割を果たしています。そこで、この記事では次の３つ要件を満たすようなランキング・システムの難しさと、それを解決するための一例を簡単に説明させて頂きます。順位付けはリアルタイムに行い、集計時間を必要としない。 100万件以上の得点データが扱える。すべてのデータが正しい順位付けで取得できる(線形補完などで順位を概算しない）。リアルタイムによる正確な順位付けは、データ件数

deeeki 2010/07/22

リンク

MySQLでサービス停止のないALTER TABLEの検討 - SH2の日記

MySQLでテーブルへのカラム追加、インデックス追加やテーブルの再編成などを行うと、その間テーブルに共有ロックがかかってしまいます。そのためこれらのメンテナンス処理は、通常利用者の少ない深夜早朝帯にサービスを止めて実施する必要があります。本日はそれを無停止、オンラインのままでできないかという話題です。基本的なアイデアメンテナンス対象の元テーブルをコピーして、作業用の仮テーブルを作ります仮テーブルに対して、カラム追加などの変更を加えますその間、元テーブルに対して行われる更新処理について差分を記録しておきます仮テーブルの変更が終わったら、記録しておいた差分データを仮テーブルに反映します差分データの反映が終わったら、元テーブルと仮テーブルを入れ替えますこれと似たようなことを考えた方は結構いらっしゃるのではないでしょうか。ただ、言うは易し、行うは難しです。整合性がきちんと取れるかどう

deeeki 2010/07/05

リンク

インデックスについて - SQLer 生島勘富のブログ

インデックスが分かってない人が非常に多い。現実にあった例で、60カラムあるテーブルに、前から3つずつの複合インデックスを20個作るとか、30カラムを1つの複合インデックスにするとか、意味が分かっていない人が非常に多くいます。 ※ 詳しい人へ。ここでは、インデックス = B-Treeインデックスと考えてください。インデックスとはインデックスとは、そのままズバリ「索引」のことです。身近な例ではカラオケがあります。いわゆるカラオケ本がインデックス。リモコンで押す番号が主キー、流れる音楽・映像が実レコードと考えてみてください。カラオケ本は「歌手名順」と「曲名順」の2つは最低限あると思います。これらは、歌手名順は、「歌手名・曲名」の組み合わせの複合インデックス。曲名順は、「曲名・歌手名」の組み合わせの複合インデックス。と考えることができます。想像してみてください。小学生でも「アン

deeeki 2010/06/27

database
sql

リンク

MySQL 5.1のmysqldumpslowで快速チューニング - SH2の日記

MySQL 5.1のmysqldumpslowを使うとチューニングが楽になる！という話題です。 mysqldumpslowはもともとMySQLに付属しているツールで、スロークエリログを集計してくれるものです。これ自体はMySQL 5.1で特に変わったところはありませんが、スロークエリログ本体の方が機能強化されているため、組み合わせるとなかなか便利になっています。MySQL 5.1におけるスロークエリログの主な機能強化は以下の三点です。 long_query_timeに1秒未満の値を設定できるようになった。出力先を設定できるようになった。これらの設定をオンラインで変更できるようになった。これでどうなるかというと、MySQLの性能分析をしたいと思ったときに、サーバを止めずにその場で mysql> set global slow_query_log = 1; mysql> set glob

deeeki 2010/05/14

リンク

CakePHP RailsのようなMigrationを行う方法

CakePHP標準だとRailsのような差分情報を含めたスキーマの管理ができず、不特定多数に配布するアプリケーションでの更新が困難だったり、開発現場でも人によってスキーマが異なってしまったり、といった問題が起こりやすかった。このような問題を解決するのがCakePHP Migrations Pluginだ。 CakePHP Migrations Pluginは、CakeDCがMITライセンスで配布するオープンソースのCakePHPのプラグインで、これを利用するとRailsのMigrationと同じことが出来る！詳細については http://cakedc.com/downloads/view/cakephp_migrations_plugin 入手は最新版をgithubから。 http://github.com/CakeDC/Migrations なお、動作検証はCakePHP1.3で行っ

deeeki 2010/05/13

リンク

はてなブックマーク

タグ

関連タグで絞り込む (21)

databaseに関するdeeekiのブックマーク (61)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第3週）

今週のはてなブックマーク数ランキング（2024年5月第2週）

今週のはてなブックマーク数ランキング（2024年5月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス