[B! mysql] lunasteraのブックマーク

Bulk insertでも20時間以上かかっていたMySQLへのインサート処理を1時間以内にする - エムスリーテックブログ

この記事はエムスリー Advent Calendar 2022の30日目の記事です。前日は id:kijuky によるチームメンバーのGoogleカレンダーの休暇予定一覧をスプレッドシート+GASで作ったでした。 AI・機械学習チームの北川(@kitagry)です。今回はMySQLへのインサートを20倍以上高速化した話について書きます。仕事をちゃんとしてるか見張る猫 TL; DR はじめに今回のテーブルバイナリログを無効化する追試 LOAD DATA INFILE 追試テーブルの正規化インデックスを一時的に剥がすまとめ We are hiring!! TL; DR バイナリログをオフにする LOAD DATA INFILEを使うインデックスを一時的に消すはじめに AI・機械学習チームではサイトトップからアプリに至るまで多くの推薦システムがあります。そこでは推薦ロ

lunastera 2022/12/31

リンク

MySQLのmasterとslaveの手動切り替え - Qiita

半年間、MySQLを基礎からやり直すことにしたので、その間に勉強したことをQiitaに投稿していきます。設定自体は、前回の続きになるので下記のリンクを参考にして下さい CentOS6.5にMySQL5.5.38をインストールする手順 MySQLでレプリケーションを組んでみるスレーブ側の設定レプリケーション用のユーザ作成スレーブ側で実行する許可するネットワーク：XXX.XXX.XXX.XXX ユーザ名：repli パスワード：repli # ユーザの作成 mysql> GRANT REPLICATION SLAVE ON *.* TO 'repli'@'XXX.XXX.XXX.XXX' IDENTIFIED BY 'repli'; Query OK, 0 rows affected (0.00 # ユーザの確認 mysql> select user, host from mysql

lunastera 2022/08/05

mysql
db

リンク

MySQL/Postgres におけるトランザクション分離レベルと発生するアノマリーを整理する

読者対象 ANSI 定義の古典的なトランザクション分離レベルとアノマリーは概ね理解している MySQL/Postgres では理論的な部分がどうなっているのかを知りたい理論面の前提知識 2022-08-19 追記: 社内勉強会向けのスライドを作成しました。先にスライドを見てから，引用文献およびこの記事を読むと理解が深まると思います。まず ANSI 定義の古典的な定義を聞いたことが無い方は，以下のリンクを参照されたい。 ANSI 定義に対応する解説はこれらのサイト以外にもたくさんあるため，自分にとって読みやすいと感じる情報をあたってほしい。（既に熟知されている方は十分）次点で読んでいただきたいのが， @kumagi さんの以下の記事。古典的には 4 つの分離レベルと 3 つのアノマリーだけで説明されていたものの，不十分であることが学術的に指摘され，解像度を上げようとする流れが後になって

lunastera 2022/08/04

リンク

MySQLでIN句の中に大量の値の入ったクエリがフルスキャンを起こす話 - freee Developers Hub

こんにちは、freee Developers Advent Calendar 2021、19日目のid:shallow1729です。昨日はtdtdsさんで【マジで】サイバー演習シナリオの作り方【怖い】でした！障害訓練後に攻撃方法を解説された時はリアリティの高さに驚きました。僕はMySQLを使っていて発生した不思議な挙動の調査の話をしようと思います。今回問題となったクエリ今回話題にするクエリは以下のようなシンプルなものです。 SELECT * FROM hoge WHERE id IN (...) MySQLのパラメーター次第ですが、デフォルトの設定だとこのIN句の中の値の数が数万になると適切なインデックスが用意されていてもフルスキャンが発生する事がありました。このクエリがテーブルのほとんどのレコードを網羅するような場合や高速でレコードを大量にinsertして統計情報が追いつかないケー

lunastera 2022/06/10

リンク

PlanetScaleというサーバレスDBが凄く勢いのあるサービスらしいのでQuick Startやってみた - Qiita

PlanetScaleというサーバレスDBが凄く勢いのあるサービスと聞いて、公式にクイックスタートがあったのでやってみました。環境 PC: MacBook Pro (Intel Core 2016) OS: macOS Montery12.2.1 では概要から確認していきます。サーバーレスDBとはサーバがない、のではなく、サーバ管理や検討が不要 AWS Lambda(NoSQL)など PlanetScaleとは PlanetScale年表 2010年頃 YouTubeが急激に成長し、データベースが爆発しそうになっていたので、Sugu氏ともう一人のYouTubeのエンジニアがオープンソースプロジェクト「Vitess.io」（ヴィテス）を立ち上げる 2016年頃 MySQLでバイナリプロトコルを扱えるようにしたことで、VitessはYouTube以外の企業にとっても魅力的なシステムになり

lunastera 2022/02/28

リンク

ASCやDESC修飾語はクエリのパフォーマンスに影響あり

データベースは、どちらの方向に向かってもインデックスを読むことができます。つまり、パイプライン化されたorder byは、スキャンされるインデックスの範囲がorder by句と全く反対の時にも可能になるということです。order by句の ASCやDESC修飾語がパイプライン化された処理の邪魔をしそうに思うかもしれませんが、多くのデータベースではインデックスの順序を変える方法を用意しており、パイプライン化されたorder byにインデックスを使えるようにできます。次の例では、インデックスを逆順で使用し、日付の逆順および PRODUCT_IDの逆順に並べて、昨日までの売上を取り出します。 SELECT sale_date, product_id, quantity FROM sales WHERE sale_date >= TRUNC(sysdate) - INTERVAL '1' DA

lunastera 2021/12/23

リンク

MySQL :: MySQL 8.0 リファレンスマニュアル :: 17.2.3 レプリケーションスレッド

バイナリログダンプスレッド. ソースは、レプリカの接続時にバイナリログの内容をレプリカに送信するスレッドを作成します。このスレッドは、ソース上の SHOW PROCESSLIST の出力で Binlog Dump スレッドとして識別できます。バイナリログダンプスレッドは、レプリカに送信される各イベントを読み取るために、ソースバイナリログのロックを取得します。イベントが読み取られるとすぐに、イベントがレプリカに送信される前でもロックが解除されます。レプリケーション I/O スレッド. レプリカサーバーで START REPLICA | SLAVE ステートメントが発行されると、レプリカは I/O スレッドを作成します。このスレッドはソースに接続し、バイナリログに記録された更新を送信するように要求します。レプリケーション I/O スレッドは、ソース Binlog Dump スレッドが

lunastera 2021/07/13

リンク

MySQLレプリケーション再入門 - Qiita

はじめに日々何となく使っているMySQLのレプリケーション機能ですが、レプリケーションの概念について、自分自身の再確認とこれから学ぶ方の少しでも参考になればと思い書くことにしました。実際の設定などについては既にたくさんの良記事がありますので割愛します。レプリケーションって何？一言で「データの複製を別のサーバーに持てる機能です。」「複製」を直訳するとreplica(レプリカ)とかreplication(レプリケーション)になります。これがMySQLにおいてデータの複製機能であるレプリケーションと呼ばれる所以です。複製元となるサーバーを「マスター」(Master) 複製先となるサーバー「スレーブ」(Slave) と呼びます。イメージマスターで変更(INSERT,UPDATE,DELETEなど)があった場合に同じ情報をスレーブにも保持します。マルチスレーブ構成上記の例では

lunastera 2021/07/13

リンク

ISUCON Cheat Sheet · GitHub

00_timeline.md 集合 9:00にオフィス(Sticky Fingers) 食料品は事前に用意しておく。食べ過ぎない。胃に負担をかけないようにする。運営の櫛井さんからのメールに従って、サポートチャットと予選ポータルサイトにログインする。 ISUCON6 予選レギュレーションメール: ISUCON6 オンライン予選当日の流れについて今までに寄せられた質問についてまとめたFAQ ISUCON6 予選 9月18日(日) 参加者サポート用チャット ISUCON6 予選ポータルサイト http://isucon6q.songmu.org/ 10:00〜11:00 最初の1時間 11:00〜12:00 まず基本的なことをやる。 12:00〜17:00 この辺りからRedis移行に取り組む。 17:00〜18:00 最後の1時間 01_first_hour.md Why 課題の理解、

lunastera 2021/04/13

リンク

MySQL入門　レプリケーション編 - Qiita

#経緯とある勉強会の内容の復習＆整理 #タイトルインストール・アーキテクチャ基礎編レプリケーション編　←今回はこちらバックアップ編チューニング基礎編 #レプリケーション編アジェンダレプリケーションとはレプリケーションの仕組みレプリケーションの種類レプリケーションの設定方法バイナリログの管理方法その他の考慮事項参考情報 #1. レプリケーションとは ##1.1. 基礎知識データの複製（レプリカ）を別のサーバにモテる機能 MySQLの標準機能で、多数のWebサイト等で利用されている－　シンプルな設定で利用可能－　マスター → スレーブ構成 ##1.2. マスタースレーブ構成サーバはマスター、スレーブまたは両方になれるマスターサーバ－　データを変更－　変更内容をスレーブに転送－　マスターは複数のスレーブを持てるスレーブサーバ－　マスターでの変更内容を

lunastera 2021/03/25

リンク

複合インデックスの正しい列の順序

データベースは、プライマリキーに対して自動的にインデックスを作成しますが、キーが複数の列からなる時は、さらに手動で調整をする余地があります。この場合、データベースはプライマリキーの全ての列にいわゆる連結インデックス(あるいはマルチカラムインデックス、複合インデックス)を作成します。複合インデックスの列の順番は、インデックスの使い勝手に大きな影響を及ぼすので、注意して決定する必要があります。例として、企業が合併した場合を考えてみましょう。他の会社の社員が加わったので、EMPLOYEESテーブルが10倍の大きさになったとしましょう。ここで問題が発生します。EMPLOYEE_IDが、それぞれの会社で一意になっていなかったのです。子会社IDのような追加の識別子で、プライマリキーを拡張する必要があります。このため、プライマリキーは、以前からのEMPLOYEE_IDに加えて、一意性を

lunastera 2021/03/25

リンク

はてなブックマーク

タグ

関連タグで絞り込む (9)

mysqlに関するlunasteraのブックマーク (11)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第4週）

今週のはてなブックマーク数ランキング（2024年5月第3週）

今週のはてなブックマーク数ランキング（2024年5月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス