タグ

ブックマーク / futurismo.biz (1)

  • 分散システムにおける異常検出とスゲぇ HeartBeat についてのまとめ

    はじめに# coursera でとっている Cloud Computing Concepts で Gossip-Style HeartBeat というものが出てきたので詳しく調べてみた. Cloud Computing Concepts 以前の仕事について# 以前の仕事は異常監視。 信頼性を確保するために, 部品は冗長化されている. 最大で, 8 ノードの部品が互いを監視しあうような構成. あるの部品が故障した場合に, 別の部品で異常を検出して, その部品を部分的に停止するような機能. 監視のロジックは単純で, 定期的に相手と通信して, 通信タイムアウトが多発したら異常と判断する. 異常検出はそれがすべてと思っていた. しかし, 実際はずっと奥が深かったのだった. ということ. 以下, 詳しく. Failure Detector# 分散システムのノードの中で, 異常検出を担うものを Fai

    分散システムにおける異常検出とスゲぇ HeartBeat についてのまとめ
  • 1