[B! performance] HHRのブックマーク

AWS、高速起動にこだわった軽量なJavaScriptランタイム「LLRT」（Low Latency Runtime）をオープンソースで公開。AWS Lambdaでの利用にフォーカス

AWS、高速起動にこだわった軽量なJavaScriptランタイム「LLRT」（Low Latency Runtime）をオープンソースで公開。AWS Lambdaでの利用にフォーカス Amazon Web Services（AWS）は、実験的な実装としてサーバレス環境のAWS Lambdaで使うことにフォーカスした軽量なJavaScriptランタイム「LLRT」（Low Latency Runtime）をオープンソースで公開しました。 LLRTはRustで開発され、JavaScriptエンジンにはQuickJSを採用しています。 LLRTの最大の特徴は、現在のJavaScriptランタイムにおいて性能向上のために搭載されているJITコンパイラをあえて搭載せず、よりシンプルで軽量なランタイムとして実装することで高速に起動することにこだわっている点です。これにより（Node.jsやDenoや

HHR 2024/02/15

考えてみれば軽量ランタイム＋過去資産の活用（ライブラリが豊富）って矛盾しがちなのかな。ライブラリが豊富なほど人気ならランタイムもそれなりに複雑で大きくなりがち？

リンク

レイテンシ(遅延)とスループット(帯域幅)と帯域幅遅延積 - Qiita

マルチクラウド展開にまつわる既成概念を覆すよりデータ転送では、特に長距離の場合にレイテンシ（遅延）が問題になることがありますが、現在はすべてのクラウド・プロバイダーがそれぞれの物理インフラストラクチャを互いの近くに配置（専門用語では「コロケーション」）しているため、これはさほど問題となりません。この近接性（場合によっては同一コロケーション施設内の別の部屋）は、クラウド間のレイテンシがミリ秒単位であることを意味します。それに加え、クラウド・データセンター・リージョンは世界中で増加しており、クラウド・リージョン間の距離は縮まっています。という事で、レイテンシ(遅延)について、まとめてみてみます。 ■ Agenda レイテンシ(遅延)とスループット(帯域幅) レイテンシと TCP の動作帯域幅遅延積(Bandwidth-Delay Product) TCP Window Size の調整と

HHR 2024/02/07

理論からカーネルパラメータやftp,curlなどの実アプリの設定まで広範囲で学びが深い

リンク

Select first row in each GROUP BY group?

I'd like to select the first row of each set of rows grouped with a GROUP BY. Specifically, if I've got a purchases table that looks like this: SELECT * FROM purchases; My Output: id customer total 1 Joe 5 2 Sally 3 3 Joe 2 4 Sally 1 I'd like to query for the id of the largest purchase (total) made by each customer. Something like this: SELECT FIRST(id), customer, FIRST(total) FROM purchases GROUP

HHR 2023/12/01

ROW_NUMBER

リンク

徐々に高度になるリングバッファの話 - Software Transactional Memo

リングバッファのイメージ図 1. リングバッファとは何か機能的にはFirst In First Out (FIFO)とも呼ばれるキューの一種であるが、リング状にバッファを置いてそれの中でReadとWriteのインデックスがグルグルと回る構造をとる事によって容量に上限ができることと引き換えに高速な読み書き速度を得たものである。キューを単に実装するだけなら山ほど方法があって線形リストを使ってもいいしスタックを2つ使っても原理的には可能だ。その中でもリングバッファを用いた方法の利点はひとえに性能の高さでありメモリ確保などを行わないお陰でシステム系の様々な場所で使われている。これの実装自体は情報系の大学生の演習レベルの難度であるが少し奥が深い。まずリングバッファのスタンダードなインタフェースと実装は以下のようなものである。 class RingBuffer { public: explicit

HHR 2023/07/30

リンク

Firing on All Engines

Traditional Java profilers use either byte code instrumentation or sampling (taking stack traces at short intervals) to determine where time was spent. Both approaches add their own skews and oddities. Understanding the output of those profilers is an art of its own and requires quite some experience. Fortunately, Brendan Gregg, a performance engineer at Netflix, came up with flame graphs (see htt

HHR 2020/01/04

flame graph

リンク

6万ミリ秒でできるLinuxパフォーマンス分析 | Yakst

NetflixのシニアパフォーマンスアーキテクトであるBrendan Gregg氏による、Linuxサーバにログインして60秒でまず調べることのまとめ。パフォーマンス問題でLinuxサーバーにログインしたとして、最初の1分で何を調べますか？ Netflixには、多数のEC2 Linuxからなるクラウドがあり、そのパフォーマンスを監視したり調査したりするための数々のパフォーマンス分析ツールがあります。その中には、クラウド全体にわたる監視を行うAtlasや、オンデマンドにインスタンスの分析を行うVectorがあります。これらのツールは多くの問題を解決する手助けをしてくれますが、各インスタンスにログインし、標準的なLinuxパフォーマンスツールを実行する必要がある場合もあります。この記事では、すぐ使えるはずの標準的Linuxツールを使いコマンドラインにおいて、最適化されたパフォーマンス調査を

HHR 2019/07/10

良記事。ロードアベレージが上がったらまずこの記事を参考にすれば良い。

performance

リンク

hatebu.me

This domain may be for sale!

HHR 2019/07/09

performance

リンク

高負荷システムでNVMeデバイス使用時のfstrimとdiscard mount optionの話 - たごもりすメモ

先にまとめるとディスクI/Oに高い負荷をかけるシステムでNVMeデバイスを使うときweekly cron jobでfstrimが走る状況になってたら停止しろじゃないとfstrimが走った瞬間にI/Oパフォーマンスが刺さって死ぬ fstrimを停止するならdiscard mount optionを有効化しろ、ただしその状態でのI/O性能で問題ないかどうか測っておけ discard mount optionを有効化しても大きいファイルの削除には気をつけろ、プチfstrimみたいになるぞ追記されるばかりで大きくなるファイル(そして削除されるファイル)はNVMeじゃないデバイスに置いとけ高I/Oスループットを期待するシステムでのNVMeとfstrim 社内で小さめのインスタンスを多く並べてトラフィックを捌いてたのを色々要件があって大きめのインスタンスにまとめるようなシステムアップデートをや

HHR 2019/06/24

リンク

Linux ネットワークパフォーマンスの機能強化 - Qiita

ソフトウェア割り込みが偏る？ Linuxを利用していて、ネットワーク負荷が高いサーバを運用していると、特定のCPU負荷が高くなっている事があるのですが、そのようなケースを経験されたことはないでしょうか？ topでみると特定CPU(topを起動して1を押すとCPU単位で確認できる)の%si(software interrupt)がやたら高くなっている場合、それはネットワークの負荷が原因かも知れません。(実際のtopを貼り付けたかったのですが、持ち合わせがなかった・・・。)何も設定していない場合はネットワークの割り込みは特定のCPUで行われるため、ネットワークの割り込みに関連づいたCPUの%siが高くなります。ソフトウェア割り込みを確認するには、/proc/interruptsを確認しましょう。 # cat /proc/interrupts CPU0 CPU1 CPU2 CPU3 0: 129

HHR 2019/04/12

cat /proc/interrupts

リンク

How to 速度改善ーWebパフォーマンスについて知っておきたいこと7選ー - Qiita

今回のテーマ Webパフォーマンスを改善する上で知っておきたい知識をまとめてみました。前回の記事では使わなかった（使えなかった）技術や方法なども含めて記載します。また、ブラウザのレンダリングなどについても書きたいと思います。 (2019年5月23日追記) 過去の記事はこちら How to 速度改善ー計測・知識編ー How to 速度改善ー原因調査編ー How to 速度改善ー実装&技術調査編1ー 1. ブラウザレンダリングの仕組み推測するな、計測せよという言葉にあるように、闇雲にチューニングを初めても良い結果は出ません。まずはブラウザレンダリングの仕組みからみていきましょう。ブラウザレンダリングの流れレンダリングの大まかな流れは Loading→Scripting→Rendering→Painting（これでページが表示される）となっています。この処理の内容をフレーム

HHR 2019/03/28

リンク

8コア/16スレッドのRyzen 7 2700Xは第9世代i7より動画編集が高速！ (1/5)

メニーコアCPUの中ではコスパの高いRyzenシリーズに注目！ CPUのメインストリーム向けは、長らく4コア8スレッドが主流だったが、AMD「Ryzen」シリーズはその壁を打ち破り8コア16スレッドを3万9000円前後という高コスパでで実現した。そうした、従来の2倍となる物理、論理コアによる処理能力の恩恵は大きい。処理速度にコア数が大きく関わるのはいろいろあるが、映像編集もそのひとつ。最近では、スマホで手軽に高解像度動画を撮影できたり、PC ゲームもグラフィックスドライバー付属のソフトやWindows 10標準機能で簡単に録画できるようになっていたりする。そのため、CPUコア/スレッド数が大ければ、高解像度で重い動画処理がより速く行なうことが期待できる。そこで、今回は複数の映像編集ソフトを使い、実際にCPUコア/スレッドをどれぐらい使っているのかを確認してみた。 AMD Socket

HHR 2018/12/27

リンク

Webパフォーマンス虎の巻

Webパフォーマンス向上施策のために、今更ながら超速本1を読んだので、今までの自分の知見と合わせてまとめてみます。なるべく柔らかく、改善施策ってまず何をどうすればいいの？という疑問を持った人に向けて書いています。 ▪️格言そもそもWebは速い。遅くしているのは我々です。大抵は技術の問題ではなくて、人の問題。引用元：テクニックではなく、今、本気で取り組むべきWebパフォーマンス（html5jパフォーマンス部部長竹洞さん）心得パフォーマンス向上に対する施策は大別すると以下の２通り軽量化（単純にやりとりするデータ容量を小さくすること）圧縮削除最適化（その時に最も適している実装・実行をとること）経路・順番の変更非同期もっとも遅くしている原因を探して、それを対策するのが原則。「対効果」が絶対的正義である。手段から入るのは愚策。まず先に原因を知ることが重要。 ▪️1

HHR 2018/10/26

リンク

https://www.ospn.jp/osc2017.enterprise/pdf/OSC2017.enterprise_Hitachi_Kafka.pdf

HHR 2018/06/22

各設定値を絵的に表現

リンク

Firefox 60の性能は1年前とは別物 Chromeを視界に捉える - Mozilla Flux

当ブログでは、Firefoxの延長サポート版（ESR）のメジャーアップデート時期を開発の区切りとみて、Web上で実行可能なベンチマークの測定結果を公開している。今回は、Firefox 60のパフォーマンスをFirefox 52およびChrome 66と比較する。検証を行った具体的なバージョンを挙げると、32bit版Firefox 52.7.4（ビルドID：20180427222832）、64bit版Firefox 60.0 RC2（ビルドID：20180503143129）、それに64bit版Chrome 66（バージョン：66.0.3359.139）である。Firefox Quantumのリリースに伴ってマルチプロセス機能（e10s-multi）が全面的に有効化され、その前に64bit版への移行も開始された。今回のテストではそれらの点が反映されている。動作環境についてだが、OSは64

HHR 2018/05/14

良く測定したなー

リンク

軽い気持ちでLinkedListを使ったら休出する羽目になった話 - Qiita

ざっくり言うとリスト構造のデータに対してランダムアクセスはしちゃだめだぞ。お兄さんとの約束だ！発端数年前に他部署の支援で作ったJavaのシステムに、ちょっとデカめのデータを突っ込んだらありえないほど遅いので助けてくれ、と連絡が入った。まぁクエリとかインデックスをちょっと見れば直るっしょ・・・と鼻をほじりながら支援に向かった。処理内容遅い部分の処理は以下のようなものであった。処理対象のデータをListで受け取る。それをforループで1件ずつ前処理する。処理結果をオブジェクトに格納し、ORマッパーでDBにINSERTする。これだけ？そう、これだけだ。並列処理なんて高級なことはもちろんやってない。インフラ調査処理中のサーバのようすを調査する。今回のインフラは典型的な3層3サーバ構成。 WEBサーバはなにもかもが余裕。 APサーバではCPUを1つ使い切っている。 14コア

HHR 2018/02/19

あるある。知識としては知っているのに踏むんだよなー

リンク

CPUの脆弱性対策パッチでSSDのランダムアクセスが大幅減速？影響をチェックしてみた - AKIBA PC Hotline!

HHR 2018/01/17

リンク

負荷試験のためのノウハウと Webフレームワークの負荷試験 (Python,Node,Go,PHP) - Qiita

この記事はRetty Advent Calendar 2017 における 22日目の記事です。昨日は @saku さんの swiftで丸画像をパフォーマンス高く表示する方法でした。はじめに趣味のBot開発から気づけばWebフレームワークの負荷試験を行なっていました。 Software Engineerの@tkngueです。普段業務としては、Data Engineer/Web Service開発/データ分析やってます「速さは正義」とは皆の共通の認識で、言うまでもないことだと思うのですが本記事では、速さってなんだろうって考えてみます。 TL;DR 負荷試験における速さは面で捉えよう: 品質を50%'ile - 90%'ile - 99%'ile ... で定義する品質を評価する手段にも気をつかおう: Coordinated Omission　は大きな測定誤差を生みます Goも

HHR 2017/12/23

performance

リンク

I/O負荷の正確な状況はiowaitでは分かりません - Qiita

さくらインターネットのアドベントカレンダー9日目として、サーバ屋らしく、運用に関するコマンドの使い方を紹介します。サーバの負荷が高まってきたときに、vmstatやtopなどのコマンドで調査する事が出来ますが、I/O負荷をwa(iowait)によって判断する人も多いと思います。ただ、結論から言うと、iowaitは正確にI/Oの負荷を表しているわけではありません。これらを、実際に演習をしながら見ていきたいと思います。 iowaitとidle iowaitとはあくまでも、CPUが空いているのにI/Oがボトルネックになっているプロセスを示しているだけで、CPUの利用率が高いときにはI/Oがボトルネックになっていてもiowaitが上がりません。同様に勘違いされがちなのが、id(idle)はCPUの空きを示しているというものですが、idleは必ずしもCPUの空き時間を示しているものではありませ

HHR 2017/12/11

例があってわかりやすい。vmstat iostat

performance

リンク

JVMアプリケーションを運用する際のメジャーどころチューニングポイントメモ - yoskhdia’s diary

JVMにチューニング項目は多々あれど、プロダクションで運用する際に予めおさえておきたい項目をまとめてみるエントリです。*1 勿論、OSもJVMもデフォルトである程度のパフォーマンスは発揮でき、計測を伴わないチューニングは悪手であることはよく知られています。しかし、設定しておかないとパフォーマンスにそのまま影響すると分かるものを調べないのは裸で戦場に赴くようなものです。*2 どんな項目をどう変更すれば良いのか知っていることは重要な武器なのです。なぜ調べるのか今回、チューニングポイントを調べるにあたって、私のモチベーションはどこにあるのかを考えると、以下の要件を満たしたいということがあげられます。アプリケーションとして求められる品質水準として動作する → 性能目標異常時に事象を追うことができるここでいう品質水準・異常とは、パフォーマンスが明らかに低い、アプリケーションがクラッシュす

HHR 2017/11/07

Java

リンク

ミドルウェア性能検証の手引き | 外道父の匠

インフラエンジニアの多分、華形のお仕事の１つであるミドルウェアの性能検証を久々にガッツリやる機会がありましたので、検証作業の基本的な項目について初心から振り返っておきたいと思います。読みやすさ度外視の詰め込み記事注意警報です。世の中、雑な検証結果もちょいちょい散乱していて、私自身もそうならないよう注意を払っているわけですが、ガチでやると気をつける項目が多くて、自分で忘れたりしないようにと、誰かにやってもらいたい時に基本を抑えてから取り掛かってもらうために、形にして残しておこうと思った次第であります。目次なぜ性能検証をするのか環境の準備インスタンスの用意クライアントの用意サーバーの用意ボトルネックになりうる項目 CPU Utilization Memory Network Bandwidth Disk Bandwidth Disk IOPS Disk Latency Disk

HHR 2017/10/18

performance

リンク

はてなブックマーク

タグ

関連タグで絞り込む (61)

performanceに関するHHRのブックマーク (129)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第1週）

月間はてなブックマーク数ランキング（2024年4月）

今週のはてなブックマーク数ランキング（2024年4月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス