タグ

Cassandraに関するInoHiroのブックマーク (12)

  • 持続的なプラットフォームのための難しい決断

    先日フォーラムでお知らせいたしましたが、今まで提供してきたツイートボタンとフォローボタンのデザインを一新すると同時に、今後はツイートボタンにツイート数を表示しなくなります。変更は2015年11月20日までに完了する予定です。Twitterでは、開発上のトレードオフが生じることが度々あります。今回の変更もそのような事情によるもので、ここではその背景を説明いたします。 Twitterの目標の一つは、皆様のウェブサイト、アプリケーション、ビジネスにとって、信頼のおけるプラットフォームを作ることです。また、このプラットフォームがTwitterエンジニアリングチームに確実にサポートされていることも重要です。その結果、APIを廃止することによって生じる問題を抑えるために、永続的なデザインを選択することにしました。多くの皆様と同様にTwitterの開発リソースにも限りがあり、どのプロダクトやパブリックA

    持続的なプラットフォームのための難しい決断
  • 分散DB「Cassandra」の人気が加速、AppleとNetflixがブームを牽引

    オープンソースソフトウエア(OSS)の分散データベース(DB)である「Apache Cassandra」の人気が米国で急速に高まっている。データセンター(DC)に障害が発生しても処理を継続できる可用性の高さがユーザーの支持を集めている。 Cassandraは最大で数千台のサーバーを連携して、数ペタバイトもの巨大なDBを運用できるという分散DBだ。サーバーは地理的に異なるDCに分散配置できるため、DC障害が発生した場合でも他のDCで処理を継続できる。 もっとも従来は、大企業でもなければ複数DCを運用するのは困難だったため、Cassandraの人気は限定的だった。最近は「Amazon Web Services(AWS)」や「Microsoft Azure」といった世界中のDCが利用できるクラウドが登場したことから、スタートアップでもCassandraのメリットを享受できるようになり、人気が高ま

    分散DB「Cassandra」の人気が加速、AppleとNetflixがブームを牽引
  • これがCassandra

    Apache Sparkに手を出してヤケドしないための基 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)NTT DATA OSS Professional Services

    これがCassandra
  • cassandraを運用していて困っていること - oranie's blog

    ※2013/03/05に追記 Yuki Morishita(@yukim)さんより以下のエントリについてアンサーを貰いました!!! https://gist.github.com/yukim/5086476 - なんか呟いたら「m9(^Д^)プギャー」な意味なのかRTとかがついたので、まとめておこう。きっと「これやれば解決するのに・・・プークスクス!」って教えて貰えるに違いない。半分くらい僕の技術力の低さから来ているのが多いので、Cassandra特有の問題から外れている気がするけど気にしない。 前提条件として HW:CPU12core メモリ64GB Disk:SSDやHDD(RAID10)を使用(詳細な構成は割愛) Cassandra 1.1.5 JDK 1.6.0_33-1 Simple Strategyを使用 1ノード辺り100〜200GB程度のデータを想定 クラスタの数とかは

    cassandraを運用していて困っていること - oranie's blog
  • Cassandraデータモデル入門 - Arin Sarkissian - Digital Romanticism

    この記事は、Arin Sarkissian氏のブログ記事「http://arin.me/blog/wtf-is-a-supercolumn-cassandra-data-model」を氏の許可を得て翻訳したものです。(原文公開日:2009年9月1日) ここ1、2ヶ月というもの、DiggのエンジニアリングチームはCassandraについて調べ、遊び、最終的にはプロダクションにデプロイするためにかなりの時間を費やしてきました。これは実に楽しいプロジェクトでしたが、楽しくなる前にCassandraのデータモデルについて理解するために相当の時間を費やしたのです。「'super column'って何だよ」というフレーズが何度も口にされました。 もしあなたのバックグラウンドがRDBMSならば(ほとんどみんながそうでしょうが)、Cassandraのデータモデルについて学ぶ際に、いくつかのネーミング規約で

  • 1台だけ読み書きすると2.2倍に

    読み込みの場合、ONEではコピーを持つ全ノードに一斉に読み出し要求を出し、最初に返ってきたデータをアプリケーションに渡す。QUORUMは過半数のノードから返答が来た時点で、最も新しいタイムスタンプを持つデータを渡す。ALLは全ノードの返答から最新データを選ぶ。 制御方式の組み合わせで性能高まる 検証の結果、最も性能が高かったのがONEで、最低のALLと比較した結果が2.2倍だった。データの一貫性の高さよりも、性能向上を優先する場合は、ONEを選ぶのが有効だ。 ただし実際に性能向上を重視し、読み出しと書き込みの両方でONEを選ぶと、アプリケーションは想定した動作をしない恐れがある。検証用アプリケーションで、ショッピングサイトの商品閲覧履歴をONEで書き込むと、まず1台のサーバーにデータが書き込まれ、コピーが残りの2台に書き込まれるのはその後になる。ONEを使った読み出し要求が書き込みの直後に

    1台だけ読み書きすると2.2倍に
  • CassandraSF2011:進歩と将来

    Rustが再評価される:エコシステムの現状と落とし穴 In this article, we share findings and insights about the Rust community and ecosystem and elaborate on the peculiarities and pitfalls of starting new projects with Rust or migrating to Rust from othe...

    CassandraSF2011:進歩と将来
    InoHiro
    InoHiro 2011/07/29
    Secondary Indexes
  • MyCassandraコトハジメ

    10/11/01にNoSQL Afternoon@楽天タワーで飛び入りで発表させていただきました。今後ともよろしくお願いします。

    MyCassandraコトハジメ
  • Cassandraが0.8にバージョンアップ。SQLに似たCQLを搭載し、分散カウンターも実装

    RackspaceのEric Evans氏がCassandraのメーリングリストに投稿した内容によると、Cassandra 0.8の最大の特徴は、SQLに似た問い合わせ言語のCQL(Cassandra Query Language)をはじめて搭載したこと。 また、これまで要望の多かった分散カウンターを実装し、ノード間の暗号化通信を実装したことでパブリッククラウドなどの環境でのセキュリティが高まったとしています。 CQL 1.0では、USE、SELECT、UPDATE、DELETE、TRUNCATE、DROP、BATCHなどのキーワードを備えており、SQL文のようにデータベースの内容を操作できるとのこと。PythonJava、Node.js用のドライバーが提供されています。 CQLについては、第16回Cassandra勉強会での@yukim氏の資料「CQL」が公開されています。分かりやすく

    Cassandraが0.8にバージョンアップ。SQLに似たCQLを搭載し、分散カウンターも実装
  • 開発者向けブログ・イベント | GMO Developers

    GMO Developers」は、GMOインターネットグループが開発者向けの技術情報やイベント情報をお届けするテックブログです。 NEW GMO Developers Night#40 / 新BNPLサービス「アトカラ」開発の裏側~入社5年未満のメンバーが活躍する「アトカラ」チーム~

    開発者向けブログ・イベント | GMO Developers
  • 「GMOとくとくショップ」で利用する分散データストア-Cassandra-後編 - GMOインターネットグループ株式会社

    GMOとくとくショップ」で利用する分散データストア-Cassandra-後編 Cassandraとリレーショナルデータベースの比較と利用方法 GMOインターネット株式会社 次世代システム研究室 室長 堀内敏明。前編ではCassandraの概要とGMOとくとくショップでの利用ついて説明しました。後編ではCassandraとリレーショナルデータベースの比較と利用方法についてレポートしていきます。 画像のデータストアから一歩踏み込んでリレーショナルデータベースとの使い分けについて考えてみます。前述したEventually Consistencyの特徴をどう扱うかが、リレーショナルデータベースとの使い分けのポイントになります。MySQL(InnoDB)、PostgreSQLOracleなどの主要なリレーショナルデータベースでは、トランザクション機能によりデータの一貫性が保証され、マスターノード

    「GMOとくとくショップ」で利用する分散データストア-Cassandra-後編 - GMOインターネットグループ株式会社
  • partake.in

    This domain may be for sale!

  • 1