atsuizoのブックマーク - はてなブックマーク

index->lock の競合について〜ベンチマークはちゃんとチューニングして〜

他に忘れないうちに書きたいこともあったのですが、世に出るまで書けないので、ソースと関係ない一般的なこと（バージョン5.7以降）を書きます。（書かない方のことは書けるようになる頃には忘れてしまうかも…） index->lockの競合を直して欲しい。という人がいまだに居たりするのです。色々試しましたが、多分殆どの場合は理解不足・チューニング不足です。私自身はindex->lockの競合が不可避なベンチマークに結局会っていません。特にMySQLとその他のRDBMSを比べる場合にはちゃんと最適化した負荷をかけないとMySQLが悪く見えるのでベンチマークをする際には気をつけて欲しいものです。 5.7で更新・参照並列性を高めるために導入された、index->lockのSXロック（Sロックは可能・SX/Xロックは不可）は、基本的にそのindexにpageを追加・削除するような処理をする際に保持されます

atsuizo 2020/09/25

mysql

リンク

ISUCON10予選で12位になり本選進出を決めました - Gマイナー志向

TL;DR ISUCON10の本選出場が決定しました。わいわい。予選12位、最終スコアは2837でした。毎年素晴らしいコンテストを開催してくださる運営様には、本当に頭が下がります。いつもありがとうございます。本選もがんばるぞ！体制チーム名ウー馬場ーイーツあいこんなまえやくわり matsuu バリバリ実装する前衛 netmarkjp 司令塔 ishikawa84g SELinuxAppArmorとレギュレーションやコードやDiscordを見るセキュリティ＆情報官今回は3人が同じ場所に集まらずすべてリモート体制としました。 3人だけのDiscordサーバを用意し、Discord上で画面共有と音声チャットで進めています。方針毎年同じですが sshで接続してtmux上でvimで直接編集 isuumo配下でgit initを実行するが履歴保存用でbranchは作成しない毎年

atsuizo 2020/09/14

ISUCONでMySQL8.0固有のノウハウやGIS系のチューニングが効くような問題が出てくるとは恐ろしい。

mysql
index

リンク

Linux Networking Tools: 101

Representation Learning for Scale-free Networks: スケールフリーネットワークに対する表現学習

atsuizo 2020/09/05

リンク

Percona Playback で本番 MySQLに流れているクエリを試験環境でリプレイする - mita2 database life

データベースのバージョンアップの際、アプリケーションの網羅的なテストが可能であれば良いのですが、どうしても難しいケースがあります。そのような場合、リプレイツールで本番環境に流れているクエリを、試験環境でリプレイ（再現）し、動作確認を取る方法もあります。リプレイツールを探す MySQL のクエリリプレイができるツールを探してみました。 Percona Tookit に pt-log-player というツールが含まれていたのですが、いつのまにか、なくなってました。。。 2013年にリリースされた、percona tookit 2.2 で削除されてしまったようです。 We removed pt-query-advisor, pt-tcp-model, pt-trend, and pt-log-player. Granted, no tool is ever really gone: i

atsuizo 2020/08/30

これは便利そう。リプレイ元がgeneral_logかslow_query_logでいいっていうのがいい。

mysql

リンク

PostgreSQLの概念図（データベースクラスタ/データベース/スキーマ/テーブル） - Qiita

Register as a new user and use Qiita more conveniently You get articles that match your needsYou can efficiently read back useful informationYou can use dark themeWhat you can do with signing up

atsuizo 2020/08/20

postgresql

リンク

100万件ぐらいのレコードを扱ったらOOMEが出た話。 - 谷本心 in せろ部屋

要約技術的な話だけ教えて、という方のために先に結論だけ書いておきますと、PostgreSQLはクエリを実行した時点で全レコードの情報を一気に読んできてヒープを埋めてしまう場合がある、ということ話です。たとえば、ResultSet#nextメソッドを使いながら処理を回すようなコードを書いて、少ないヒープでも処理できるようにするのは常套手段だと思いますが、そういうコードを書いていても一気にヒープを消費してしまうことがあるのです。詳しくはこのドキュメントを見てください。 https://jdbc.postgresql.org/documentation/head/query.html#query-with-cursor ことの発端ちょっと仕事でJava + jOOQ + PostgreSQLで、DBのデータを集計するようなバッチ処理を書いてまして、もちろん俺様の書いたコードにバグなんてある

atsuizo 2020/08/13

リンク

データベースのドキュメント管理を自動化した話 - estie inside blog

こんにちは、今回はデータ基盤構築を担当しているmarushoがお送りします。今日はestieで実践しているデータベースのドキュメント管理方法をご紹介します。はじめに独自成長していくデータベースたち失われたドキュメントどうすれば低コストなドキュメント管理ができるのかそして生まれた、schema collectorという自動化ツール SchemaSpy Mysql diff Priv Page ECS タスクスケジューラドキュメントを腐らせないおわりにはじめに estieはオフィスを中心とした不動産データを取り扱うスタートアップ企業です。 estie（オフィス探しサービス）とestie pro（不動産事業者向けデータプラットフォーム）の2つのサービスを運営しています。詳しくは、こちらの記事をご覧ください。 inside.estie.co.jp estieでは、不動産に関する

atsuizo 2020/08/11

リンク

Amazon Aurora レプリカでは metadata lock 待ちが発生しない - mita2 database life

Amazon Aurora のレプリカは Vanilla MySQL のレプリケーションとは違った仕組みで実現されている。マスターとレプリカは同じディスクボリュームを参照しており、マスターでの更新はほぼ即時レプリカに反映される。 DB クラスターボリュームは DB クラスターのデータの複数のコピーで構成されます。ただし、クラスターボリュームのデータは、DB クラスターのプライマリインスタンスおよび Aurora レプリカの 1 つの論理ボリュームとして表されます。この結果、すべての Aurora レプリカは、最短のレプリカラグでクエリの結果として同じデータを返します。レプリカラグは、通常はプライマリインスタンスが更新を書き込んだ後、100 ミリ秒未満です。https://docs.aws.amazon.com/ja_jp/AmazonRDS/latest/AuroraUserGuide

atsuizo 2020/07/20

これは試したことがなかった！

MySQL
aurora

リンク

Innodb Deep Talk #2 でお話したスライド

PostgreSQL 12はここがスゴイ！～性能改善やpluggable storage engineなどの新機能を徹底解説～（NTTデータテクノ...NTT DATA Techno logy & Innovation

atsuizo 2020/07/17

mysql
innodb

リンク

performance_schema.events_statements_historyを使って直近に実行されたクエリを見る - kenken0807_DBメモ

さくっと、直近で実行されたクエリの情報がみたいです。それにはperformance_schema.events_statements_historyテーブルを使います。 performance_schema.events_statements_historyはスレッドごとにperformance_schema_events_statements_history_size(default 10)で指定した個数分のステートメントを格納します。 MySQL5.7以降であればデフォルトONです。以下のようなSQLを実行すればいい感じみれる。 SELECT * FROM ( SELECT THREAD_ID,EVENT_ID, BaseDate - interval (BaseUptime-ROUND(TIMER_START/1000000000000)) second as QUERY_STA

atsuizo 2020/07/04

mysql

リンク

HammerDB with PostgreSQLにおけるTPC-Cベンチマークの一部不具合について - 三流エンジニアの落書き帳

ようやくプロ野球が開幕して1プロ野球ファンとしてはうれしい限りです。無観客試合や過密スケジュールで選手にとってはやりにくいところもあると思いますが、怪我しないよう頑張っていただきたいものです。そして、今年こそ優勝したい！！さて、本題へ… 長いのでさっさと結論が知りたい場合は下記目次から「解決策」へジャンプしてください。 TL;DR(3行で) 概要問題が発生した関数現状の把握関数にメッセージを埋め込みデバッグ（もどき）する原因の把握解決策修正の効果の確認まとめ TL;DR(3行で) ベンチマークツールHammerDBにおいてPostgreSQLのTPC-Cベンチマークを行うと一部関数で無限ループが生じ正確なベンチマークスコアが出ない対象の関数はnewordで特定の条件下でのみ問題が生じる簡単な修正で問題を解決できる(解決策は目次の「解決策」を参照) 概要 Hammer

atsuizo 2020/06/21

他のDBだと、どうなんだろう＆PostgreSQL単体であってもGithubにIssue登録なりプルリクなりするとよいと思います。

postgresql

リンク

LambdaからRDS/RDBを利用する際に意識したいポイント5選 | DevelopersIO

こちらの記事はRDS ProxyがGAされる前に執筆した記事です。現在はLambdaからRDSを利用する場合、間にRDS Proxyを挟むという選択肢が増えているので、まずはRDS Proxyを使う/使わないの検討をお願いします。以後で紹介しているトピックの一部はRDS Proxy利用時は考え方が変わってきます。 CX事業本部@大阪の岩田です。私が現在関わっているプロジェクトではLambda × RDSというアーキテクチャを採用して開発を進めています。開発を進める中でLambda × RDS(RDB)という構成についてある程度ノウハウが貯まってきたので、注意したいポイントやオススメの設定をTIPS的に紹介していきます。環境以後の説明では以下の環境の一部もしくは組み合わせを利用しています。具体的なコードやSQLの例はプログラミング言語やDBエンジンに依存しますが、根底の考え方はどの言語、

atsuizo 2020/06/07

DBユーザーはFunction単位じゃなくても、どのアプリの接続・処理なのか解る粒度では分離しておきたいもの。たとえ権限が全く一緒でもね。Lambdaじゃない現場でもまずソレで提案してる。

rds
lambda

リンク

AWS LambdaとDynamoDBがこんなにツライ時代ではない - めもおきば

ありがたいことに、3年前に#ssmjp 2017/06で話したスライド AWS LambdaとDynamoDBがこんなにツライはずがない #ssmjp をTwitterで紹介して頂いた*1 ようで、当時から大幅に改善しているところを振り返りたいと思います。あと、ついでに最近やっているAzureに関しても少し触れていきます。サーバーレスアーキテクチャ #とは当時はこう説明したのですが、今でもそんなに悪くない表現かなと思います。書籍は現在「Serverlessを支える技術第3版」まで出ていますので、BOOTHからどうぞ（隙あらばダイマしていく方針）。サーバーレス三種の神器今このスライドを作るなら、認証認可の話を入れるかなと思います。システム内のAWS IAMとクライアント側のCognitoどちらも重要です。ちなみにAzureを含めておさらいすると、こんな感じの対応になります。勝

atsuizo 2020/06/07

リンク

MySQL max_connections は雑に設定しておけば良い - mita2 database life

MySQL 誕生25周年らしいです。めでたい！ 25年、１つのソフトウェアが継続しているってすごい！ max_connections についてデータベースを使っている開発者から「最大までどれぐらいコネクション数を増やせるのか」という質問を良くもらいます。最大コネクション数（max_connections) の設定値を超えてしまい、too many connections エラーが出る。 max_connections を見直すとして、「じゃあどこまで大きくしていいのか？」と不安になるのはわかる。以下の話は、コネクションプールを使っている前提のお話。単にコネクション数が増えるだけでは、負荷は増加しない単にコネクション数が増えるだけでは、DBサーバの負荷はあまり変化しない。特にMySQLはスレッドモデルで実装されており、（プロセスモデルのデータベースと比較して）大量にコネクション

atsuizo 2020/05/31

接続してくる側が最大接続数をキャップしてないと、MySQLへの同時処理要求数が爆発してCPU食いすぎて他のサービスまで機能しなくなることがあるのが怖い。

mysql

リンク

FILLFACTORによる性能改善 - 夜は寝る

めっちゃ寒くてマジ冬かってかんじ。今日はポスグレアンカンファレンスというイベント当日、行けなくて悲しい。行けてたら発表しようかなと思っていた内容をブログに書く。微妙に前回分の発展版となっているので、ご興味がある方は、合わせてどうぞ。 TL;DR FILLFACTORの値を設定するとブロック内に空き領域を持つ HOTの効果により更新系の性能が改善するクラスタの維持により参照系の性能が改善するテーブルサイズとのトレードオフを考慮して設定するべき FILLFACTORとは以前にブログにも書いたように、Postgresにおいてテーブルのデータはブロックという単位に区切られて格納される。ブロックはデフォルトで8KBであり、例えば一行が1KBのレコードなら8行が入る。 FILLFACTORの値を設定すると、このブロックに空きスペースを設ける。デフォルトでは「100」になっていて、前述のようにレ

atsuizo 2020/05/26

postgresql

リンク

1日で基本が身につく! Python超入門

私が技術評論社から出版したPythonの入門書をベースとしたトレーニング資料です。出版元の承諾をえたうえで400P近いスライドにして公開します。企業の自社研修や大学/社会人の勉強会などに利用してもらって構いませんが、再販などの営利利用はお控えください。後半にはおまけ資料としてプログラミングのレベルマップとレベル向上法および、駆け出しエンジニア向けにインフラエンジニアの世界をまとめています。

atsuizo 2020/05/21

python

リンク

勝手に学習 OSS-DB GOLD

atsuizo 2020/05/19

postgresql

リンク

PostgreSQLのデータベース容量見積

テーブルサイズが64590という大きなテーブルがあります。上記はtext形式が存在するテーブルで、流石に1Gで試算するわけにもいかないと思い、30000バイトとして試算しようと考えています。そこで、テーブルの計算式に当てはめると、行数:10000、fillfactor:100、行データ長:64590 [テーブルデータ量式] 8KB × ceil(行数 / floor(floor(8KB × fillfactor - 24) / (28 + 行データ長))) =>8192 x ceil (10000 / floor( floor(8192 x 100 / 100 -24) / (28+64590))) となりますが、行データ長が大きすぎるため、行数の前のfloorによって0となってしまいます。 8192 x ceil ( 10000 / 0 ) で0除算でエラーとなり、計算出来ません

atsuizo 2020/05/19

postgresql

リンク

PostgreSQLの見積もりについて調べてみた - Qiita

はじめに PostgreSQLの見積もりは、テーブル、インデックスの他にも、WALファイル、アーカイブログ等の様々なファイルを含めて実施する必要があります。とは言え、容量の大部分を占めるのはテーブルとインデックスであることは他のRDBと変わりはありません。今回はテーブル・インデックスの見積もりについて調べてみました。（間違いがあったら教えてください) PostgreSQLの見積もりの基本（だと思うこと） PostgreSQLの見積もりについて基本と思われることを書いてみます。ページ PostgreSQLでは、実ファイル中のデータはページという単位で分かれています。 1ページは8192bytesでその中にテーブル・インデックスのデータが格納されます。ページに含まれるデータは下表のアイテムで構成されます。（引用：- PostgreSQL 11.5文書　68.6. データベースページ

atsuizo 2020/05/19

postgresql

リンク

PostgreSQL は更新処理を ROLLBACK してもテーブルファイルに追記される - ぱと隊長日誌

概要 PostgreSQL はテーブルに対する更新処理 (INSERT / UPDATE / DELETE) を行うと、テーブルファイルに追記されます（追記型アーキテクチャ）。これは最終的に COMMIT した場合に限らず、ROLLBACK された場合でも同様となります。本エントリではこの挙動を検証します。なお、追記型アーキテクチャについて知りたい方は下記の記事を参照ください。 PostgreSQL Deep Dive: PostgreSQLのストレージアーキテクチャ（基本編）検証検証環境 PostgreSQL 12.1 contrib モジュールをインストールしました。 postgresql.conf で "autovacuum = off" に設定しました。 ROLLBACK とテーブルファイルサイズ各ステップでテーブルファイルサイズがどのように変化するかを確認します。テス

atsuizo 2020/05/11

postgresql

リンク

はてなブックマーク

タグ

atsuizoのブックマーク (3,721)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第2週）

今週のはてなブックマーク数ランキング（2024年5月第1週）

月間はてなブックマーク数ランキング（2024年4月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス