Register as a new user and use Qiita more conveniently You get articles that match your needsYou can efficiently read back useful informationYou can use dark themeWhat you can do with signing up
メール・電話・チャット・ターミナル(SSH)、 監視・チケット・クラウドサービス・・・ これらを作図感覚で自在につないで操作できる。 「できる」が拡がる新しい道具
これはきかんしゃトーマスアドベントカレンダー20日目の記事です. サービスやシステムが運用・運営フェイズに入るとほぼ間違いなく事故が起きる.理想的には事故が起きないことがベストだがそうした状況はほぼ間違いなく存在しない,つまり事故はいずれ起こるので,我々はそうした不慮の事故に備える必要がある.上の動画は今,社内の一部で流行っている歌で,非常に示唆に富んでいて,良い. さてスタンスを予め明らかにしておくと,事故やオペミスは起こるものだし,その点については仕方がない事だと思っているが,その事故からは学習すべきだと思っている. 事故が起きた時はそれをいち早く終息・復旧させることが再優先だと感じていて,それを遂行するためには手段を選り好みせず,かつ冷静に行うことが重要だと思う. よく「犯人探しをするな」みたいなことを言われるけど (まあ犯人という言い方は悪いんだが) 実際に事故を起こした人から話を
自社のバックオフィスの方が、外注先に対してどんな立ち居振る舞いをしているのかご存じですか? 自社と外注先との間の契約がどのようになっているのかご存じですか? それを目の当たりにしても同じことを言い続けられる自信はありますか? そういうことはスーツの仕事とレッテルを貼って見て見ぬ振りをしてませんか? それでいて業界を変えたいなどといいますか? 業界を変えたいっていってるところから、おいらのことを言ってるとして話を進めるよ。 バックオフィス(この文脈では調達のことかな)の方が、外注先に対してどんな立ち居振る舞いをしているのかは、正直良くわかりません。転職したことがないので、他の会社のことは良くわからないけど、弊社の場合は、調達と外注先が価格や条件の交渉する場に、案件側の人間は立ち入ることはないためです。必要だといわれたらもちろん同席するけどね。 新規取引をさせていただくときの最初の顔合わせに同
以前に使っていたBigBrotherだとデフォルトの設定でmessagesとかsyslogに怪しい出力があると、すぐに赤点滅になって教えてくましたが、zabbixだと自分でちゃんと設定しなきゃいけないみたい。 まずアイテムを作成する [設定]→[ホスト]から該当ホスト列の[アイテム]をクリック。表示されるアイテムの設定画面で[アイテムの作成]をクリックする。 設定項目は次のとおり。 項目 設定値 説明 messages タイプ Zabbixエージェント(アクティブ) キー log[/var/adm/messages] データ型 ログ 更新間隔(秒) 30 アプリケーション Log files 次にトリガーを作成する 上記でアイテムを作成したときと同様に[設定]→[ホスト]から該当ホスト列の[トリガー]をクリック。表示さえるトリガーの設定画面で[トリガーの作成]をクリックする。 設定項目は次
最近CentOSが不安定なので、Oops発生で自動再起動するように設定しておく。 原因は、平行して調査中。 【過去のOops内容】 ・Memory不足のようだが、特定できない。 ・Unable to handle kernel paging request at virtual address xxxxxxxxx が、ダウンした時は共通してログされている。 ※xxxxxxは任意のアドレスで不定 ・EIP is at write_inode+0xf/0x37 または、 EIP is at iput+0x25/0x61 ※前者は、2009.05.27 06:20、2008.04.18、2007.06.15 05:30 ※後者は、2009.05.08 05:13 ・症状としては、pingで応答はするが、sshでログイン出来ず、Power Off/Onせざる を得ない。 【Oopsを検出し
本連載においても、上記の5つの機能に関して比較を行っていきます。今回は1つ目の機能である「情報収集機能」について比較を行ないます。 情報収集機能の比較 情報収集機能については、監視対象の状態を収集する機能に加え、情報収集の設定や収集したデータの保存形式を対象として比較を行ないました。各比較項目の説明を以下に示します。 情報収集機能 リソース監視:専用エージェントを用いたCPU/メモリ/ディスク/ネットワークなどの内部リソース監視が可能かどうか ネットワーク監視:ping監視、ポート監視などのネットワーク越しの状態監視が可能かどうか SNMP監視:SNMPを利用したポーリング/トラップ監視を行なえるかどうか 情報収集設定 設定方法:情報収集の設定変更を行なう方法/ツール 保存形式:情報収集の設定が保存される形式 設定変更後の再起動:情報収集の設定を行なった後にサービスを再起動する必要があるか
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く