タグ

performanceに関するwushiのブックマーク (188)

  • メモリいっぱい空いてるのにswapがどんどん増える怪現象?! - クラウドインテグレーションサービス「雲斗」のブログ

    クラウドインテグレーションサービス「雲斗」のブログ 芝公園にある創研情報株式会社がAWS を 中心にクラウドの基から便利な使いかたまでをお伝えしていきます。 とあるCentOS7のサーバにおいて、メインメモリがあまり使われず、Swap領域がどんどん増えてくる事象を確認。 DBとしてMySQLは起動してるものの、Swapにデータが展開されるほど大きなプロセスは動いてないはずなんだけど・・・ よくよく調べてみると、最近のCentOS(おそらくRed Hat Linuxも同じ)ではOSレベルでSwapの利用頻度を制御できるようで、今回のサーバはこの設定をデフォルトのまま変更していなかったため、この事象が発生したようです。 ここでは、その対策として行ったことを展開してみます。 ------------------------------------------------------------

  • 【画像解説】RHELのcgroups-v2でCPU使用率を下げる方法

    cgroups-v1」で、CPU負荷が高いプロセスのCPU利用率を一時的に下げる方法を解説しました。 今回、「cgroups-v2」の場合でCPU負荷を下げる方法を解説します。 「cgroups-v1」と「cgroups-v2」どちらを利用しているか見分け方 ■見分け方 mount -l |grep cgroup cgroup2が表示されていれば「cgroups-v2」が利用できることを意味します。 ※cgroup2と表示されていなければ、「cgroups-v1」でありこちらを参照してください cgroupsには、以下の2つバージョンがあります。 Control groups version 1 (cgroups-v1) ->RHEL8.1以前で利用可能※RHEL7もOK Control groups version 2 (cgroups-v2) ->RHEL8.2以降で利用可能※RHE

    【画像解説】RHELのcgroups-v2でCPU使用率を下げる方法
    wushi
    wushi 2024/02/01
    cgroupsのポリシー設定方法。libcgroup-tools (cgconfig+cgexec)とは別。
  • 【画像解説】RHELのCPU負荷を下げる設定方法(cgroups-v1)

    RHELサーバにおいて、プロセスのCPU使用率がアクセス集中、処理中などで上昇し負荷が高くなることがあると思います。 CPUの負荷が上がるとサーバログイン後のレスポンスが遅かったり、他のプロセスにも影響を及ぼし悪循環を起こす原因にもなります。 このようにCPU負荷が高いプロセスのCPU使用率を一時的に下げる方法を解説します。 これは、cgroups(コントロールグループ)を使用してCPUを制限する方法になります。 サーバを再起動できなかったり、障害切り分けなどで活用できる便利な方法です。 この方法は、一時的に特定のプロセスに対してCPU使用率を制限するので設定を簡単に戻すこともできます。 また、サーバ再起動で容易にCPU利用率の制限を解除(設定を元に戻す事が)できます。 cgroups(コントロールグループ)について 細かい話は省略しますが、Linuxのカーネルを利用して、プロセスのリソー

    【画像解説】RHELのCPU負荷を下げる設定方法(cgroups-v1)
    wushi
    wushi 2024/02/01
    cgroupsのポリシー設定方法。libcgroup-tools (cgconfig+cgexec)とは別。
  • Androidスマホ ベンチマーク結果まとめ。CPU・メモリ・ストレージ性能・タッチレイテンシー一覧 - AndroPlus

    広告あり AnTuTuベンチマークがGoogle Play プロテクトでブロック対象になり、偽物も現れるなどきな臭くなってきたので、ベンチマークアプリを変えることにしました。自分用に各SoC・デバイス毎のベンチマーク結果をまとめておきます。 実機ベンチマーク結果一覧 AndroidのベンチマークアプリではAnTuTu Benchmarkが人気でしたが、 2020年3月頃にGoogle Playストアから削除されてしまいました。 当初は「広告詐欺に関する一斉BANの巻き添えをらっただけ」という見方もありましたが、Playストアからの削除だけでなくAPKインストール時にも警告が出るなどGoogleからの締め付けが強くなっており、単なる誤BANではなく当に個人情報を盗んでいる可能性も出てきています。

    Androidスマホ ベンチマーク結果まとめ。CPU・メモリ・ストレージ性能・タッチレイテンシー一覧 - AndroPlus
  • ZabbixのMemory高負荷の原因になるphp-fpmの設定について - Qiita

    はじめに ZabbixServerを構築して、長期運用をする際に最も注意すべきポイントは何でしょうか。 私は『Memory使用率』だと思っています。 よくあるのが、vm.memory.size[pavailable]の使用率が70%以上になり、 Memory空き容量が枯渇、Swapが発生してしまう事例です。 何度再起動しようと、このように右肩上がりでMemory使用率は上がっていきます。 これを放置して、Memory空き容量やSwap領域が枯渇した場合は、 そのままOSがハングしてしまうこともしばしばです。 こうなってしまうと、ハングする前にZabbixServerの再起動が必要でした。 私は個人的にAWSにZabbixServer(5.0系)を立てていますが インスタンスタイプはt3a.smallであり、Memory容量は1.74GBしかありません。 小さなMemoryですが、これ以上大

    ZabbixのMemory高負荷の原因になるphp-fpmの設定について - Qiita
  • SystemTapで真犯人を捕まえろ!

    SystemTapで真犯人を捕まえろ!:Linuxトラブルシューティング探偵団 番外編(3)(1/4 ページ) NTTグループの各社で鳴らした俺たちLinuxトラブルシューティング探偵団は、各社で培ったOSS関連技術を手に、NTT OSSセンタに集められた。普段は基的にNTTグループのみを相手に活動しているが、それだけで終わる俺たちじゃあない。 ソースコードさえあればどんなトラブルでも解決する命知らず、不可能を可能にし、多くのバグを粉砕する、俺たちLinuxトラブルシューティング探偵団! 助けを借りたいときは、いつでもいってくれ! OS:高田哲生 俺はリーダー、高田哲生。Linuxの達人。俺のようにソースコードレベルでOSを理解している人間でなければ、百戦錬磨のLinuxトラブルシューティング探偵団のリーダーは務まらん。 Web:福山義仁 俺は、福山義仁。Web技術の達人さ。Apache

    SystemTapで真犯人を捕まえろ!
  • プロセスにもslabにも記録されないメモリ使用領域を調べてたら、zfsのarcサイズ設定が原因だった話

    概要 自分で構築したProxmox VE(PVE)のwebコンソールを眺めていたら、 4GBメモリのVMを4台しか起動していないのに仮想ホストでは48GB中37GBもメモリが使用されていた。 それの原因を突き止めるために調べていたらzfsが原因ということが判明した。 何も知らず、何も気にせず、zfsでPVEを構築していたら気付かない事象だと感じたのと、 メモリについて知ったことが多いため記事にした。 調査1(ホスト再起動) 困った時はホスト再起動するのが一番ということで、まずは再起動。 再起動後はメモリをほとんど使用されていなく、VM起動してもVMのメモリ領域くらいしか使われていない。 これで解決したと思い放置していたら、いつの間にかメモリ使用量が増えている。 なので変なプロセスがいるとかではなく、何かが起きていることがわかった。 調査2(プロセス確認) まずはメモリ使用量を確認する。 /

    プロセスにもslabにも記録されないメモリ使用領域を調べてたら、zfsのarcサイズ設定が原因だった話
  • プロセスのVSZ,RSSとfree,meminfo挙動を実機で確認 - のぴぴのメモ

    1.はじめに 1-1.この記事の要旨 1-2.(予習)メモリに関する指標とlinuxのメモリ挙動について 2.検証環境と検証方法 2-1.検証環境 2-2.検証方法 2-3.測定方法 (1)psコマンドによるVSZ,RSS情報の取得 (2)freeコマンドとmeminfo情報の取得 3.結果 3-1.全体の結果 3-2.プロセスのVSZ/RSS挙動 ポイント① malloc()した時の挙動→VSZのみ増加 ポイント② 1回目のデータread時→RSSは増えない ポイント③ データwrite→RSSが増加する 3-3.システムワイドな挙動(freeコマンド/meminfo) ポイント① malloc()した時の挙動→usedもAnonymousPageも増えない ポイント②1回目のデータread時→変化しない。 ポイント③ データwrite→used上昇、AnonymousPage上昇 4.

    プロセスのVSZ,RSSとfree,meminfo挙動を実機で確認 - のぴぴのメモ
  • delays=a/b/c/d | 田舎に住みたいエンジニアの日記

    以下のエラーログがあります。 [html] Sep 11 05:24:09 host1 postfix/smtp[23693]: xxxxxxxxxxxx: to=<a@domain.com>, relay=xxxx.domain.com[xxx.xxx.xxx.xxx]:25, delay=3417, delays=2025/0.02/696/696, dsn=xxxxxx, status=deferred (conversation with xxxxx.xxx.ne.jp[xxx.xxx.xxx.xxx] timed out while sending end of data — message may be sent more than once) [/html] 今回注目は「delay=3417, delays=2025/0.02/696/696,」の箇所です。 delays=a

  • ワクチン接種予約システムの負荷対策指針と事例

    こんにちは。株式会社X-Tech5 取締役CTOです。 先日株式会社Topotalと共同で、 新型コロナウィルス感染症のワクチン接種予約システムのアクセス集中の、不具合の調査支援及び改善提案を無償提供するプレスリリースをしました。 新型コロナウィルス感染症のワクチン接種予約システムのアクセス集中による不具合の多発を踏まえ、不具合の調査支援及び改善提案を無償提供 このエントリでは、実際に行った負荷対策の要点を公開し共有します (というわけで、宣伝半分・事例紹介半分です)。 この考え方・やりかたが正しいのだ、という意図はありません。 新型コロナウィルス感染症のワクチン接種予約システム(以下接種予約システム)のアクセス集中対策の参考にしていただき、世の中から接種予約システムの負荷トラブルが減ると嬉しいです。 ポイント1:価値基準の確定・すりあわせ まずは関係者で価値基準を確認し合意します。 接種

  • 特定の端末のみで起こる WebView プチフリーズを Tracing を利用して追った話 - SmartNews Engineering Blog

    こんにちは、スマートニュース株式会社の紀平です。 SmartNews のアプリ内では、最近 WebView を使った機能を多数公開しております。そのうちの一つにショッピングチャンネルという機能があるのですが、今日はそのショッピングチャンネルのタイムセール枠で以前発生した、謎のプチフリーズ問題の調査手法をご紹介します。 tl;dr 特定の Android 端末でプチフリーズが発生した 再描画領域を減らすことで現象は改善した Chrome の Tracing 機能を利用し、ブラウザのソースコードまで参照して、ついに根原因まで突き止めた タイムセールで起こった問題 タイムセールは、SmartNews のショッピングチャンネル内において WebView で提供されている、期間限定のお得な商品をアグリゲーションした機能です。EC サイト各社のご協力の上にご提供しております。内部は HTML5 で開

    特定の端末のみで起こる WebView プチフリーズを Tracing を利用して追った話 - SmartNews Engineering Blog
  • ソケット通信 possible SYN flooding on port 443. Sending cookies. がログに出てきた - Qiita

    ソケット通信 possible SYN flooding on port 443. Sending cookies. がログに出てきたLinux はじめに インターネットに公開しているホームページが突然閲覧できなくなりました。サーバではロードアベレージも低く、負荷はかかっていないようでした。今回の記事ではこの状況下でのボトルネックの確認&対応方法について簡単にまとめてみました。 環境 CentOS6 Apache 参考 https://qastack.jp/server/294209/possible-syn-flooding-in-log-despite-low-number-of-syn-recv-connections https://github.com/hiboma/hiboma/blob/master/kernel/net/net-backlog.md https://qiit

    ソケット通信 possible SYN flooding on port 443. Sending cookies. がログに出てきた - Qiita
  • taka's趣味の部屋 » apacheの同時接続数(MaxClients)を検証する

    最近は、サーバネタで押してきます(^^; 先日、httpdのエラーログで不正なアクセスなどないか確認していたときに見慣れないログをapacheが吐いていた。 vi /var/log/httpd/error_log [Tue Dec 16 16:53:09 2014] [error] server reached MaxClients setting, consider raising the MaxClients setting こちらのサイト同時接続数(MaxClients)をいくつに設定すべきか?によるとMAXClientsの数値が低い場合にこのメッセージが出力されるらしい。 ということで参考にしていろいろと調べてみた。 するとhttpd.confの設定でapacheのホームページでは、”MaxClients は、リクエストに応答するために起動される 子プロセスの最大数となります。 デ

    taka's趣味の部屋 » apacheの同時接続数(MaxClients)を検証する
    wushi
    wushi 2021/03/30
    server reached MaxClients setting, consider raising the MaxClients setting はapacheのサービス起動後最初に超えた時しか出力されないため、障害検知には使えない。https://software.fujitsu.com/jp/manual/manualfiles/M100014/B1WS0857/01Z200/B0857-00-07-02-00.html
  • ファイルを開いているプログラム(プロセス)を特定するリソースモニター [Windows10]

    エクスプローラーでフォルダーやファイルを移動しようとした時に「別のプログラムがこのフォルダーまたはファイルを開いているので、操作を完了できません。」というメッセージが表示され、移動ができない場合があります。 記事では特定のフォルダーやファイルを開いているプログラム(プロセス)を調べる方法についてご紹介します。 リソースモニターで特定する 現在フォルダーやファイルを開いているプログラム(プロセス)はリソース モニターで特定することができます。 リソース モニターを起動する リソース モニターは主に以下の3つの方法で起動できます。 タスク マネージャーから起動 ファイル名を指定して実行から起動 コマンド プロンプトから起動 タスクマネージャーはWindowsのタスクバーを右クリックしてコンテキストメニューを表示して「タスク マネージャー」を選択するか、CtrlキーとAltキーとDeleteキ

    ファイルを開いているプログラム(プロセス)を特定するリソースモニター [Windows10]
  • Windowsの「タスクマネージャー」を開発した本人が直々に使い方や知られざる機能を伝授

    by Christiaan Colen Windowsで現在起動しているプログラムやCPUの使用状況などを確かめたい時に、真っ先に思いつくのが「タスクマネージャーを使う」ことです。そのタスクマネージャーを約25年前に開発したMicrosoftの元エンジニアであるデビッド・プラマー氏が、直々に使い方や知られざる機能を説明しています。 I wrote Task Manager and I just remembered something... : techsupport https://old.reddit.com/r/techsupport/comments/gqb915/i_wrote_task_manager_and_i_just_remembered/ プラマー氏は1993年からMicrosoftに勤務していたそうで、1994年頃、タスクマネージャーのプログラムである「TaskMgr

    Windowsの「タスクマネージャー」を開発した本人が直々に使い方や知られざる機能を伝授
  • Startup is really slow for all Cygwin applications

  • IO待ちメモ - Qiita

    概要 IO待ちについて自分で調べた自分めも。 vmstat wa列 絵で見てわかるシステムパフォーマンスの仕組み より ディスクIO待ちのwaはCPU使用率が上がると自然と減ってしまうものです。I/O待ちについてはb列を活用しましょう。 waはあくまでもCPUアイドルであり、そのCPUに紐付くI/O待ちスレッドがあるときにカウントされる wa列は要注意です。一般にI/O待ちの指標と思われていますが、I/O待ちが増えるとwa列が上がる傾向があるものの、必ずしも上がるとは限らない情報だからです 絵で見てわかるOS/ストレージ/ネットワーク~データベースはこう使っている (DB Magazine Selection) より スリープしているプロセスの中には、I/O待ちをしているものもある。その場合、「wa(waitI/O)」として現れることが多い。多くのOSでは、CPUアイドル(id)であり

    IO待ちメモ - Qiita
  • IO Accounting 機能で I/O 負荷の高いプロセスを特定

    随分久々の Linux ネタです。以前にロードアベレージに関する考察などの記事も書きましたが、多くのサーバーサイドエンジニアはサーバ負荷と日々戦っていることかと思います。過去多くの場合、負荷の原因特定はおおよそ下記のような手順で分析をしていたことかと思います。※詳しい手順は別エントリとして記載予定。 top をみて上位に張り付いているプロセスを確認しつつ CPU or I/O のどちらが原因か判別 ps を使ってプロセスの状態を確認して(T),(D)の状態から CPU or I/O のどちらが原因か判別 vmstat で procs の r, b の数、swap の si, so の状態、I/O の bi, bo の状態を確認 iostat を使って disk の read/write の状態をさらに詳しく確認 sar を使って os の状態をさらに詳しく確認 おおよその原因特定から設定を

  • 【 pidstat 】コマンド――プロセスのリソース使用量を表示する

    LinuxコマンドTips一覧 連載は、Linuxのコマンドについて、基書式からオプション、具体的な実行例までを紹介してきます。今回は、プロセスごとCPUの使用率やI/Oデバイスの使用状況を表示する「pidstat」コマンドです。 pidstatコマンドとは? 「pidstat」はプロセスごとのCPUの使用率やI/Oデバイスの使用状況を表示するコマンドです。 pidstatはmpstatコマンド(第127回)やiostatコマンド(第128回)と同じsysstatパッケージに収録されています。いずれも、主に/var/log/sysstatを参照するコマンド群です。 sysstatパッケージがインストールされていない場合、「sudo yum install sysstat」あるいは「sudo apt-get install sysstat」などでインストールできます ※。

    【 pidstat 】コマンド――プロセスのリソース使用量を表示する
  • rmでファイル削除後にdf -hで容量が減らない時の対処(Linux) | EasyRamble

    df -h コマンドでディスク使用状況を確認 管理している Ruby 製のウェブアプリケーションが動いているサーバーで、ログローテーションの設定が行われておらず、ログファイルの容量が大変なことになっているサーバーがありました。最終的に、RubyLogger が吐き出していた、1つのログファイルが約50GBになってることを確認してちょっと驚いた。そのでかいログファイルを削除した時に起こった事象です。 ということで、そのログファイルを削除する前の段階。まずは、df -h でディスクの使用状況を確認しました。

    rmでファイル削除後にdf -hで容量が減らない時の対処(Linux) | EasyRamble