タグ

運用に関するcaesiumのブックマーク (8)

  • DMM inside

    アニメ初の快挙!海外アニメ賞を受賞した『スキップとローファー海外ライセンス部長&プロデューサーが語る、奮闘の舞台裏

    DMM inside
  • 入社して3ヶ月 - インフラエンジニアの道は始まったばかり

    斎藤です。こんにちは。 2012年6月中旬にハートビーツに来て、3ヶ月半が経ちました。最近、雇用契約の契約書にサインをして、「よし、がんばろう!」と気持ちを新たにしたところです。 これまで、プログラマからインフラエンジニアに転向して様々な思いが去来していました。今日は、そのお話を書いてみたいと思います。 これまでの私について 私は、これまでプログラマをしながらインフラを守る仕事を同時にこなしていました。というのも、以前勤めていた会社では、自社プロダクトとして、Webサービスやソーシャルゲームの開発を行っていたからです。 従って、開発が終わることが仕事の終わりではありません。いい事も、悪い事も、全て因果応報であることを、常に、そして直に体感しながら仕事に携わっていました。運用に入り、しっかり作り込んで安定している部分がある一方、どこかで詰めが甘くトラブルを起こしてしまう部分もあります。 そ

  • サービス障害を起こさないために、障害を起こし続ける。逆転の発想のツールChaos Monkeyを、Netflixがオープンソースで公開

    サービス障害を起こさないために、障害を起こし続ける。逆転の発想のツールChaos Monkeyを、Netflixがオープンソースで公開 米国でビデオオンデマンドサービスを提供しているNetflixは、Amazonクラウド上でわざとシステム障害を起こすためのツール、Chaos Monkeyをオープンソースで公開しました。 Chaos MonkeyはAmazonクラウド上で使うツール。Amazonクラウド上のインスタンスをランダムに落としまくることで、サービスに対して仮想的な障害を引き起こしてくれます。 NetflixはこのChaos Monkeyを実環境で使うことで、物の障害が起きたとしてもサービスが継続できることをテストし続けてきました。Netflixのブログ「Chaos Monkey released into the wild」から引用します。 There are many fail

    サービス障害を起こさないために、障害を起こし続ける。逆転の発想のツールChaos Monkeyを、Netflixがオープンソースで公開
  • 【酷杉】ヤフー子会社「ファーストサーバ」のデータ消失、担当者がマニュアルを無視したのが原因 : 暇人\(^o^)/速報

    【酷杉】ヤフー子会社「ファーストサーバ」のデータ消失、担当者がマニュアルを無視したのが原因 Tweet 1: ◆SCHearTCPU @胸のときめきφ ★:2012/07/31(火) 22:56:10.05 ID:???0 前スレ : ファーストサーバ「復旧作業したら、他人のデーターが他のお客の領域に復元されたお」(´;ω;`) ヤフーの子会社「ファーストサーバ」(大阪市)のレンタルサーバーで6月、システム障害が 発生し、5千件を超す顧客データが消失した問題で、同社が設置した第三者調査委員会が31日、 調査報告書をまとめた。 報告書によると、担当者がマニュアルに従わず自分で作った更新プログラムを利用し、 システム変更をしたことが不具合の原因。担当者は以前からマニュアルを故意に無視して 独自の方法で変更しており、上司も黙認していた。 *+*+ 47NEWS +*+* http://www.4

    【酷杉】ヤフー子会社「ファーストサーバ」のデータ消失、担当者がマニュアルを無視したのが原因 : 暇人\(^o^)/速報
  • 第1回 運用業務の効率化に効く

    情報システムのために働いてはいないだろうか。ITILの「青」に書かれているサービスサポートの概念を基に、より高い目標を持ったITサービスを実現していこう。 日々の運用業務は、企業の情報システム部門の組織内業務として非常に重要な仕事だ。要員のシフト管理や帳票業務・バッチジョブ管理・ヘルプデスクなど、一見すると管理対象である情報システムそのもののために、業務を行っている錯覚に陥ってしまう。しかし、来、運用業務は企業の事業やその事業を利用するユーザーの観点なしには存在できない。 サービスサポートは、この事業とユーザーとの接点を体系化・プロセス化することで、高次の目標(事業の成功や高い顧客満足など)を達成していくための日々の活動を示している。ITIL(Information Technology Infrastructure Library)では、ITのサービスマネジメントのベストプラクティス

    第1回 運用業務の効率化に効く
  • ITIL:運用漬けから抜け出せ!攻めのシステム運用管理

    ITILを究める! サービスデリバリ編: 限りなくゼロに近いダウンタイムを目指す [国内記事] 24時間×365日のシステムを運用していく上で、落ちないシステムを作ることは大きな課題だ。サーバのダウンタイムを可能な限りゼロに近づけるため、可用性管理は欠かせない。 [2005/9/29] 必ず起こり得るもの、「災害」「ウイルス」「人的エラー」 上手なキャパシティ管理 過剰なIT投資に陥らないコツ サービスレベルを高める「発想の転換」 第1回 ビジネスとITを結びつける ITILを深める! サービスサポート編: ソフト・ハードのリリースに失敗しないために [国内記事] ITインフラの運用のトラブルの原因は変更や新規導入によるものがほとんどだ。ITILの変更管理プロセスと同様、リリース管理は非常に重要になってくる(攻めのシステム運用管理)。 [2005/9/22] そのシステム変更、大丈夫? 「

  • 第5回 Webサーバーのトラブルを突き止める

    今回は、クライアントパソコンからWebブラウザーでWebサーバーにアクセスできないトラブルを紹介する。Webサーバーを社内ネットワークに設置したケースとして取り上げるが、実際にはクラウドサービスやレンタルサーバーを利用したWebサーバーでも起こり得るトラブルである。パケット・キャプチャー・ツールのWiresharkを使って原因を探り、解決の糸口を見つけていこう。 サーバーにアクセスするとForbiddenと表示される 最初のトラブルは、社内ネットワークに接続したWebサーバー(seminar.tripodworks.co.jp)にクライアントパソコンから「http://seminar.tripodworks.co.jp」というURLでアクセスするとエラーが発生するというものだ(図1)。このとき、画面上には「Forbidden」(禁止という意味)と表示される。この原因を探ってみよう。

    第5回 Webサーバーのトラブルを突き止める
  • ヒューマンエラー 理論と対策

  • 1