タグ

障害と運用に関するhiroomiのブックマーク (8)

  • 「障害の復旧」と「問題解決」を勘違いする人たち

    「障害の復旧」と「問題解決」を勘違いする人たち:失敗しない「外資系」パッケージソフトとの付き合い方(1/3 ページ) 外資系パッケージソフトの導入で失敗しないための方法を解説する連載。今回からは、ソフトウェア利用の長き道のりである「運用」についてのお話をします。あなたは障害が起こったとき、メーカーへの問い合わせで苦労したことはありませんか? IT運用の業務を経験したことがある人なら、誰もが一度は、運用で使用するソフトウェアについてメーカーに問い合わせたことがあると思います。問い合わせの種類はさまざまかと思いますが、特に障害が発生したときの連絡はトラブルになりやすいものです。 今回の記事では、ソフトウェアの保守窓口とやりとりするケースを例に、運用が始まってから生じる、よくある誤解や失敗例を紹介したいと思います。 失敗事例13:原因の調査を優先して、障害の復旧が進まない ソフトウェアのサポー

    「障害の復旧」と「問題解決」を勘違いする人たち
    hiroomi
    hiroomi 2017/03/06
  • 株式会社ビーエスピーソリューションズ - ビジネスに貢献するITサービスマネジメントを実現する

  • HPが運用監視製品の最新版、障害原因の切り分けまで自動化 - @IT

    2011/10/25 日ヒューレット・パッカード(HP)は10月25日、統合運用管理ソリューションの最新版「HP Business Service Management 9」(HP BSM 9)を発表した。ITシステムを構成するコンポーネントの関連性や稼働情報を集約するデータベース「ランタイム・サービスモデル」を活用することで、運用管理や障害時の原因切り分けに要する時間を短縮するという。 HP BSMは、ITシステムの統合運用監視を支援する製品群だ。ネットワークの監視/性能管理を行う「HP Network Node Manager i software」、システムの可用性やパフォーマンスに関するデータを収集、監視する「HP System Availability Management software 9」やアプリケーションパフォーマンス管理製品群などから構成されている。 今回新たに、収

  • CTCがリモート運用サービスを刷新、独自システムで障害を自動復旧

    伊藤忠テクノソリューションズは2011年1月18日、従来よりも安価なリモート運用サービスを開始した。システム自動運用システムをプログラミング言語「Ruby」を使って自社開発し、運用保守に必要な人手を減らすことでサービスの低料金化を実現した。 料金は月額30万円から。同社の運用サービスはこれまで、「月額100万円以上していた」(CTCテクノロジーの五十嵐公厚取締役)という。 新サービス開始に当たって同社は、顧客のシステムを遠隔運用する「リモートオペレーションセンター」(ROC、写真)やROCで使用するシステムを一新した。新システムでは、「Run Book Automation」という自動運用技術を導入。商用のシステム管理ソフトなどで収集した監視情報と同社が独自に構築した障害データベースとを照合し、既知の障害に関してはシステムが自動的に復旧作業を実行する。また、顧客自身が自社システムの稼働状況

    CTCがリモート運用サービスを刷新、独自システムで障害を自動復旧
    hiroomi
    hiroomi 2011/01/18
    「Run Book Automation」という自動運用技術を導入。
  • Twitterの大規模システム運用技術、あるいはクジラの腹の中(前編)~ログの科学的な分析と、Twitterの「ダークモード」

    Twitterの大規模システム運用技術、あるいはクジラの腹の中(前編)~ログの科学的な分析と、Twitterの「ダークモード」 先週の6月22日から、米サンタクララで行われていたWebサイトのパフォーマンスと運用に関するオライリーのイベント「Velocity 2010」が開催されていました。 その中で、TwitterのJohn Adams氏がTwitterのシステム運用について説明するセッション「In the Belly of the Whale: Operations at Twitter」(クジラの腹の中:Twitterでの運用)が行われています。Twitterのような大規模かつリアルタイムなWebサイトの運用とはどういうものなのでしょうか? 公開されているセッションの内容を基に概要を記事で紹介しましょう。システム管理者の新たな役割、Railsの性能の評価、Bittorrentを使った

    Twitterの大規模システム運用技術、あるいはクジラの腹の中(前編)~ログの科学的な分析と、Twitterの「ダークモード」
    hiroomi
    hiroomi 2010/07/01
    障害が起きているときのログを分析することはとても大事だ。そこでFacebookのオープンソースのScribeとHDFSへと移行した。大規模な分析はHadoopで行っている
  • 運用管理の効率と耐障害性がアップ

    小川 大地 日ヒューレット・パッカード サーバー仮想化ソフトのVMware vSphere 4は、ハイパーバイザー「VMware ESX」と各種の拡張ツール群で構成される。今回は、拡張ツール群の「VMware vCenter Server」を中心に、VMware vSphere 4の運用管理面における新機能を解説しよう。 前回はVMware vSphere 4のパフォーマンスとストレージ関連の新機能を紹介したが、今回は、拡張ツール群の「VMware vCenter Server」を中心に、VMware vSphere 4の運用管理面における新機能を解説しよう。VMwareの仮想環境にVMware VMotionやVMware HA(High Availability)などの付加価値を実現するものだ。 ホストプロファイルでホストを効率展開 ESXホストの台数が多くなると、それに合わせて管理

    運用管理の効率と耐障害性がアップ
  • asahi.com(朝日新聞社):羽田の管制統合システム障害 羽田・成田便に遅れも - 社会

    国土交通省は14日から、羽田と成田の両空港の周辺空域を一つにまとめ、管制業務を羽田空港で一括して行う運用を始めたが、午前10時半過ぎ、情報を処理するシステムに障害が発生した。空域内の航空機の位置や便名などを一括して示すコンピューターが正しく作動せず、管制指示に支障が出ている。両空港の発着便に遅れや引き返しなどの影響が出る見通しだ。  国交省によると、成田と羽田の空域統合により、扱う航空機の数が増え、情報を処理するコンピューターが対応仕切れなくなったとみられる。「パソコンがフリーズしたような状態」という。航空機の位置を示すレーダーの生データを表示する画面は機能しており、それをもとに、便名などを確認しながら管制指示をしている状態という。  今回の管制業務の統合は、今秋に羽田に4目の滑走路がオープンすることなどで、首都圏上空の交通量が増えることに備え、効率的な管制を実施するための措置。空港で離

    hiroomi
    hiroomi 2010/01/14
    作り:両空港の周辺空域を一つにまとめ、管制業務を羽田空港で一括して行う運用を始めたが、扱う航空機の数が増え、情報を処理するコンピューターが対応仕切れなくなったとみられる。
  • さくらインターネット、運用管理込みで安価な専用サーバホスティング開始--CPUにはAtomを採用

    印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます さくらインターネットは、サーバホスティングサービスの新プラン「さくらのマネージドサーバ Atom プラン」の提供を2009年12月10日より開始すると発表した。 同社では従来より、共用ホスティングサービスである「さくらのレンタルサーバ」や、専用ホスティングサービスの「専用サーバ」を提供している。今回新たに加わった「さくらのマネージドサーバ Atom プラン」では、サーバ1台のCPU、メモリ、ハードディスクといったリソースを占有しつつ、セキュリティアップデートや機器障害などへの対応は、さくらインターネット側の運用管理者が行い、ユーザーはより使いやすいブラウザベースの管理ツールを利用してアプリケーションの設定などを行える。 価格は初期費用2

    さくらインターネット、運用管理込みで安価な専用サーバホスティング開始--CPUにはAtomを採用
    hiroomi
    hiroomi 2009/12/02
    「1台のCPU、メモリ、ハードディスクといったリソースを占有、アップデートや機器障害などへの対応は運用管理者が行い、ブラウザベースの管理ツールを利用して設定などを行える。初期費用2万5000円月額料金7800円」
  • 1