[B! データベース] ardarimのブックマーク

「SQL」の読み方論争に決着？「しーくぇる」vs「えすきゅーえる」にPostgreSQLがケリ／冠詞にはくれぐれも注意【やじうまの杜】

ardarim 2024/04/11

ポスグレは未だに読み方分からんのでポスグレで濁してる派

リンク

開発者が知るべきキャッシュ設計でよく遭遇する問題

はじめに分散システムの設計および開発において、キャッシュはパフォーマンス向上のための非常に重要な要素です。頻繁にアクセスされるデータをキャッシュすることで、アクセス速度が遅いデータベースへのアクセスを削減し、データへの迅速なアクセスを可能にします。これにより、システムの全体的な効率とパフォーマンスが向上します。しかし、キャッシュは慎重に設計しないとむしろパフォーマンス上のデメリットになるケースが存在します。この記事ではよく遭遇するキャッシュ設計の問題とその回避策について解説します。 Cache penetration DBに存在しない値を検索したときに、DBから返された空の結果をキャッシュしない場合に発生するシナリオです。このシナリオではDBに存在しない値を繰り返し検索することにより、その値がキャッシュされていないため検索ごとにDBへのアクセスが必要になってしまいます。存在しない

ardarim 2023/12/22

リンク

MySQLのインデックスですが、B-treeではなくB+treeを使用するのはどうしてなのでしょうか？ | mond

MySQLのインデックスですが、B-treeではなくB+treeを使用するのはどうしてなのでしょうか？端的に言うと性能が良いからです。これを理解するにはバッファプールへの理解が必要です。ディスク指向のデータベースの上では有限のメモリを最大限活用することでメモリに入り切らない巨大なデータ群に対して良好な参照性能を出す必要があります。バッファプールとはディスク上のデータの羅列を固定サイズのページ（InnoDBの場合16KB）の羅列であるとして読み書きに必要な分だけをメモリに移し取り複数の書き込みをできる限りメモリ内で受け止めて後でまとめてディスクに書き戻すという、ライトバック型のキャッシュのような機構です。この中においてバッファプールは有限のサイズしか無いので適宜プール内のデータを書き戻して入れ替えながら上手くやっていく必要があります。さてB+treeとB-treeの最大の違いは木のリ

ardarim 2023/10/02

リンク

リレーショナルデータベースシステムを趣味で開発している者です。現在、開発中のシステムを並行トランザクションへ対応させることを検討しており、どのような手法があるのか調べたところ、SS2PLもしくはS2PLという手法が私と同じように自作をされている方々の中では多く採用されているようだと分かりました。一方で、PostgreSQLやMySQLなどのプロダクションレベルで利用されているシステムではMVCCと呼ばれる手法が採用されているということも分かりました。きっと後者の方が多くの場合で高いスループットが得ら

リレーショナルデータベースシステムを趣味で開発している者です。現在、開発中のシステムを並行トランザクションへ対応させることを検討しており、どのような手法があるのか調べたところ、SS2PLもしくはS2PLという手法が私と同じように自作をされている方々の中では多く採用されているようだと分かりました。一方で、PostgreSQLやMySQLなどのプロダクションレベルで利用されているシステムではMVCCと呼ばれる手法が採用されているということも分かりました。きっと後者の方が多くの場合で高いスループットが得られるということなのだと思うので、可能であればMVCCを採用したいのですが、あまり初学者向けの実装例も見当たらず、どうしたものかと悩んでおります。 SS2PL/S2PLとMVCCの実装の難易度・工数はどの程度違うものなのでしょうか？また、初めてリレーショナルデータベースシステムを開発する者

ardarim 2023/04/13

自作クラスタの会話やべえな…

リンク

リレーションとリレーションシップの誤用に注意 - 設計者の発言

RDBやデータモデリングに関する説明の中で「リレーションシップ」と言うべきところで「リレーション」と表現する誤用が目立つ。どうでもいいような違いに思われるかもしれないが、これらは明確に区別されるべきだ。そうでないと、RDBの用語の意味がわからなくなるからだ。 IBMのフェローであったE.F.コッド(1923-2003)による1970年のの歴史的論文 "A Relational Model of Data for Large Shared Data Banks" （大規模共有データバンク向けデータのリレーショナル・モデル。杉本さんによる対訳）によって、世界で初めてRDBの理論的枠組みが示された。この論文で使われている用語"relation"が、RDB（relational database)の呼称の由来である。 relationとは何か。その論文でコッド博士は、１個のテーブルに格納された行(

ardarim 2023/02/02

「relationとrelationshipを区別できる熟した日本語」関係と関係性とかじゃだめなんかね

データベース

リンク

世界中の伝統音楽のデータベース、慶應大が公開　1026民族、5776件の音声記録を掲載

世界地図上にマッピングされたポイントをクリックすることで、その地域の民族にゆかりのある音楽を再生できる。例えば日本の東北地方なら、安全を願うために歌われてきた「津軽山唄」、東京都なら作業時に歌われてきた「木遣節」がある。他にもヨーロッパやアフリカ、米国など世界各国の伝統音楽が聞ける。 2017年に暫定版としてデータベースを一度リリースしていた。研究チームは、改めて楽曲の種別や特徴などを見直し、呼吸方法や楽器情報など、より詳細な情報や会話などの音楽ではない音源も加え、データの正確性を上げて再度リリースしたという。データベース中の全ての楽曲は、個人や研究での利用など非営利での使用を推奨しており、著作権とその文化継承者が許す範囲内のみで利用できる。今後も継続的に新しいデータも追加していくという。研究チームは「Global Jukeboxが他の研究者に刺激を与え、音楽の伝統や文化の進化に関する多

ardarim 2022/11/11

リンク

3値論理

なぜ「= NULL」ではなく「IS NULL」と書かなくてはならないのか？これは、気になっている人も多いはずです。まだ SQL に不慣れな頃、ある列が NULL である行を選択しようとして、 SELECT * FROM table_A WHERE　col_1 = NULL; というクエリを書いてしまい、エラーになったり思い通りの結果が得られなかった、という経験は、ほぼ全ての人が持っているでしょう。ちょうど C言語や JAVA を習い始めのころに「if (a = 5)」と書いてしまう間違いとよく似ています。最初は、言語仕様の汚さにぶつぶつ文句をいいながらも、そのうち「IS NULL」という書き方に慣れてしまって、疑問を持たなくなります。でもどう考えても奇妙な書き方ですよね。こんな素直でない書き方をしなくてはならないということには、やはりそれなりの理由があるのです。今からその理由を説明しま

ardarim 2022/05/21

リンク

Cloudflare D1 がヤバい

まだ検証足りないけど、マジで想像通りのブツなら魂震えるかもしれん…。 Announcing D1: our first SQL database Cloudflare D1 = Edge SQLite Cloudflare D1 は Cloudflare Worker で、つまり CDN Network 上で sqlite が動きます。これだけなら普通の sqlite ホスティングなんですが、もちろん Cloudflare が出すからにはそれだけではなく、CDN Edge 上に Read Replica がバラ撒かれた sqlite になります。ヤバくないですか？僕はヤバいと思いました。このヤバさを知るために、Cloudflare が開発した基盤についていくつか抑えておく必要があります。 Durable Objects は CDN 上の Actor モデルを構築できます。この Acto

ardarim 2022/05/12

リンク

利用者は数十億人！？ SQLiteはどこが凄いデータベース管理システムなのか調べてみた - Qiita

はじめに SQLite は世界で一番使われている　だから世界で一番凄いものに決まってるだろ SQLite は世界で最も使われている RDBMS です。名前に反して（？）おもちゃの RDBMS ではありません。元ネタと同じで一番普及しているからと言って必ずしも一番凄いものであるとは限りませんが、普及しているのであればそこには何かしらの理由があるはずです。その理由を調べないことには、凄いか凄くないかの結論は出せないので SQLite のなにがそんなに凄いのかを調査しました。 2022/04/01 続編記事↓を書きました。注意この記事は「なぜシェルスクリプトで高度なデータ管理にSQLiteを使うべきなのか？～ UNIX/POSIXコマンドの欠点をSQLで解決する」の補足記事して書いたものです。ところどころ不自然にシェルスクリプトや Unix コマンドの話が登場するのはそのためです。基本的

ardarim 2022/03/10

リンク

UTF-8のテーブル(MySQL5.6)に竈門禰󠄀豆子が格納できない問題を調べてみた - Qiita

竈門禰󠄀豆子をMySQL5.6のテーブルにinsertしようとすると正しく格納できず、竈門禰となってしまうケースがあるという話を聞き、調べてみました。実践まずは試しにやってみます。 mysql> show create table verification\G *************************** 1. row *************************** Table: verification Create Table: CREATE TABLE `verification` ( `name` varchar(100) COLLATE utf8_bin DEFAULT NULL ) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_bin 1 row in set (0.01 sec) mysql> inse

ardarim 2022/02/02

UTF-8の問題ではなくてMySQLが異体字セレクタに対応してないだけ、という話。Unicodeの規格が鬼畜という話でもあるけど…

リンク

日本のアニメ総合データベース「アニメ大全」、'22年3月一般公開へ

ardarim 2021/10/22

しょぼいカレンダーとどっちが網羅度高いんだろう

リンク

データベースを遅くするための８つの方法

はじめに Twitterのタイムラインを見ていたらバッチ系のプログラムで逐次コミットをやめて一括コミットにしたら爆速になったというのを見ました。当たり前でしょ、と思ったけど確かに知らなければ分からないよね、と思って主に初心者向けにRDBを扱うときの注意点をまとめてみました。プログラミングテクニック的なところからテーブル設計くらいの範疇でDBチューニングとかは入ってないです。自分の経験的にOracleをベースに書いていますが、他のRDBでも特に変わらないレベルの粒度だと思います。大量の逐次コミットをするバッチアプリケーションでDBにデータをインサートすると言うのはかなり一般的な処理です。しかしデータ量が少ない時はともかく大量のインサートを逐次コミットで処理するとめちゃくちゃ遅くなります。数倍から十数倍遅くなることもあるので、10分程度のバッチが１時間越えに化けることもザラにあるので原

ardarim 2020/11/16

リンク

SQL記述者全員が理解すべきSELECT文の論理的な処理順序のお話 - Qiita

2020/9/30追記本記事は元々、「SQL記述者全員が理解すべきSELECT文の実行順序のお話」というタイトルで投稿しておりました。しかし、知見のある方からのコメントと自分でも調べてみた結果、今回紹介している順序はあくまで論理的な処理順序であり、実行順序とは別物ということがわかりました。誤った知識を布教してしまい申し訳ございません。 2020/9/30のタイミングで、本記事のタイトルを「SQL記述者全員が理解すべきSELECT文の論理的な処理順序のお話」に変更させていただきました。はじめに「SQLといえば、エンジニアが扱うスキル」と思われがちですが、最近はマーケターや営業など、非エンジニアの方もSQLを使って、自らデータを抽出し分析する方が増えてきています。またエンジニアの方でも、ORM任せでなんとなく理解している状態の方もいるのではないでしょうか？今回は、そんな方々にこそ

ardarim 2020/09/23

リンク

本当にあったやらかしDB設計シリーズ一覧 - Qiita

本当にあったやらかしDB設計シリーズをまとめてみました SQLアンチパターンで書かれているほど高尚な問題ではなく、もっと初歩的な、でもありがちな問題を取り上げています初心者を脱出したと思っている人に是非読んでもらい、正しく設計してもらうことを目的としていますもしここに載っていないパターンを経験したことのある方がいたら是非教えてください本当にあったやらかしDB設計①【R無しRDB】本当にあったやらかしDB設計②【囚人番号テーブル】本当にあったやらかしDB設計③【ロジカルクエリー】本当にあったやらかしDB設計④【テストチューニング】本当にあったやらかしDB設計⑤【第三正規化病】本当にあったやらかしDB設計⑥【見えない削除フラグ】本当にあったやらかしDB設計⑦【ステートフルDB】本当にあったやらかしDB設計⑧【ファンクションDB】本当にあったやらかしDB設計⑨【文字列日付】

ardarim 2020/08/10

リンク

DBの寿命はアプリより長い！長生きするDBに必要な設計とリファクタリングを実践から学ぶ - エンジニアHub｜若手Webエンジニアのキャリアを考える！

DBの寿命はアプリより長い！長生きするDBに必要な設計とリファクタリングを実践から学ぶアプリケーションの寿命よりも長く、データの追加やテーブルの変更で成長し続ける「データベース」と、どのように付き合っていけばよいのでしょうか？曽根壮大（soudai）さんによる寄稿です。こんにちは。そーだい（@soudai1025）です。新しいサービスを始めるとき、必ずと言っていいほどデータベースは利用されています。また今稼働しているサービスの多くでも、RDBMSをはじめ、いろいろなデータベースが利用されています。そんなに広く利用されているデータベースだからこそ、多くの問題の元になるのもまた事実です。そこで今回は、Webサービスを中心にデータベースの選び方、設計についてお話していきたいと思います。そして私もまさに今、2011年から続くWebサービス「オミカレ」のRDBMSのリファクタリングに携わ

ardarim 2019/09/27

期待を裏切らないブコメたちに実家のような安心感

リンク

なぜRDBからCSV + COBOLに変更する事でコスト削減と高速化を同時に実現出来たかの考察 - ブログなんだよもん

そもそも既存はどんなロジック？ RDBなんだからWhere句使ったら？なぜファイルにすると速くなるのか？並列化と分散処理による高速化の可能性 COBOL使う必要あったの？ Javaとかじゃダメだったの？まとめ TLを見てると以下の記事が少し話題になってました。 tech.nikkeibp.co.jp tech.nikkeibp.co.jp 対象の記事は有料会員じゃないと見れないのだけど事例としては以下みたい。リソース - ユーザー事例 - COBOL製品ユーザー事例 : マイクロフォーカスさて、この記事の驚きポイントは「１億レコードくらいのDB処理をRDBからCOBOL + CSVに変更してUnixサーバからWindowsサーバに変える事で性能を維持しつつコストを1/5くらいにした」という事でしょう。「せっかく7割もあったSQLを全部COBOLに変えるとか時代に逆行しすぎ！」

ardarim 2019/06/18

COBOLだとISAMの索引編成とかなのかな…。懐かしい。固定長だったら確かに枯れてて早いのかも

リンク

「SQLite」データベースに脆弱性--「Chromium」ベースのブラウザにも影響 - ZDNet Japan

印刷するメールで送るテキスト HTML 電子書籍 PDF ダウンロードテキスト電子書籍 PDF クリップした記事をMyページから読むことができます広く普及している「SQLite」データベースエンジンにセキュリティ上の脆弱性が発見された。この脆弱性により、膨大な数のデスクトップアプリやモバイルアプリがリスクにさらされているという。 TencentのBladeセキュリティチームによって発見されたこの脆弱性が悪用された場合、被害者のコンピュータ上において悪意のあるコードの実行が可能になるとともに、それほど深刻ではないケースでもプログラムメモリのリークやプログラムのクラッシュが引き起こされる可能性がある。 SQLiteは膨大な数のアプリに組み込まれているため、この脆弱性はIoTデバイスからデスクトップソフトウェア、ウェブブラウザ、「Android」アプリ、「iOS」アプリに至るまでの広範

ardarim 2018/12/17

リンク

ユーザ情報を保存する時のテーブル設計 - そーだいなるらくがき帳

はじめに ※この発言は個人の見解であり、所属する組織の公式見解ではありません用法用量を守り、個人の責任で業務に投入してください要件 User情報を保存するときにどのようなテーブル設計を行うか今北産業で頼むテーブルに状態を持たせず状態毎のテーブルを作る状態が変わればレコードを消して別のtableに作る tableの普遍的な情報は別に持たせる僕の考えた最強のDB設計 PostgreSQLをベースの雑なER図を作った。これを元に話を進める。 table構成 users 親tableであり、すべてのユーザはここに属する。基本はINSERTのみでUPDATE、DELETEを考慮しない。 user_detail userに付随する詳細の情報がここに登録される。一般的にusersにカラムを増やしたいような内容はここに登録する。なぜusersにカラムを増やさないのか？それはusers

ardarim 2018/05/02

user_activeとuser_leaveが排他用途でDB最適化の観点からはイマイチだし、そもそもここで結局トランザクションを意識しなければならないのでは。退会ユーザを残すこと自体はなりすましとかを考慮すると必要かな

データベース

リンク

日本郵便が公開する郵便番号データをそのまま利用するのがなぜ難しいか。そして、住所から郵便番号を求めるのがなぜ難しいか［PR］

日本郵便が公開する郵便番号データをそのまま利用するのがなぜ難しいか。そして、住所から郵便番号を求めるのがなぜ難しいか［PR］郵便番号はコンピュータで扱う数字データとしてもっとも身近なもののひとつです。例えば、ユーザーが入力した郵便番号から住所を補完する処理は、一般的なWebアプリケーションでよく行われています。また、ダイレクトメールの到達率の向上や返送率の低下のため、あるいは住所データをつねに最新のものにするため、住所から適正な郵便番号を付番する処理なども行われています。その郵便番号は、実は毎月アップデートされています。というのも、市町村の合併や土地の区画整理、新しいビルやマンションの建築など、郵便番号にかかわるさまざまな現実が変化しているためです。最新の郵便番号データはつねに日本郵便のWebサイトで公開されています。

ardarim 2017/11/15

リンク

働くママが終止符を打った霞が関の“伝統芸能”

2017/07/20 17:59 エリート様は揃いも揃って何やらされてるのやら。これでは国が傾いても当然です。 2017/07/20 10:55 一般企業にも多く共通する話です。まさに業務改革の取り組みを担当していますが、改革の壁は管理職層の「苦労してこそ仕事だ」とか「自分もやって来たことだから」と言う古き良き仕事観からくる抵抗もあります。 2017/07/20 08:39 非効率的な作業は、組織の規模が大きく、歴史が長いほど多いと思ったほうがいいでしょう。理由は霞ヶ関の例と同じです。また、狭い領域ではシステム化できて効率化できていたとしても、それだけで完結する会社など多くはなく、必ずインプットとアウトプットが繋がるはずですが、これを人が繋いでいると最悪です。そこに人が入って創造性を発揮することなどゼロに等しく、出てきた帳票を見て入力し直すとか、画面に表示されたデータをコピペするだけ

ardarim 2017/07/19

リンク

はてなブックマーク

タグ

関連タグで絞り込む (23)

データベースに関するardarimのブックマーク (51)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第1週）

月間はてなブックマーク数ランキング（2024年4月）

今週のはてなブックマーク数ランキング（2024年4月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス