並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 31 件 / 31件

新着順 人気順

simdの検索結果1 - 31 件 / 31件

タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。

simdに関するエントリは31件あります。 SIMDprogrammingperformance などが関連タグです。 人気エントリには 『WebAssemblyがSIMDをサポート、「WebAssembly SIMD」がChromeやFirefoxで標準実装。画像処理や物理演算など高速実行 - Publickey』などがあります。
  • WebAssemblyがSIMDをサポート、「WebAssembly SIMD」がChromeやFirefoxで標準実装。画像処理や物理演算など高速実行 - Publickey

    WebAssemblyがSIMDをサポート、「WebAssembly SIMD」がChromeやFirefoxで標準実装。画像処理や物理演算など高速実行 ChromeなどのWebブラウザに搭載されているJavaScriptエンジン「V8」の開発チームは、WebAssemblyでSIMD命令をサポートする「WebAssembly SIMD」を来月、2021年5月にリリース予定のChrome 91からデフォルトで利用可能にすることを明らかにしました。 Firefoxでもx86版、x86-46版においてはすでにフラグを設定することでWebAssembly SIMDが利用可能になっており、Node.jsでもフラグの設定で利用可能になっています。 これによりWebAssemblyで画像処理などが高速に実行できるようになることが期待されます。 WebAssembly SIMD will be ship

      WebAssemblyがSIMDをサポート、「WebAssembly SIMD」がChromeやFirefoxで標準実装。画像処理や物理演算など高速実行 - Publickey
    • Fast CSV processing with SIMD

      This article was discussed on Hacker News. I recently learned of csvquote, a tool that encodes troublesome CSV characters such that unix tools can correctly process them. It reverses the encoding at the end of the pipeline, recovering the original input. The original implementation handles CSV quotes using the straightforward, naive method. However, there’s a better approach that is not only simpl

      • 「ZigはCよりも速いです。」をVector/SIMD最適化で検証する

        「パフォーマンスについて言えば、ZigはCよりも速いです。」 この一文は Zig 言語の公式サイトの詳細な概要に実際に書いてある文章です。 その理由としていくつか挙げた上で最後にちらっと「Zig は SIMD ベクトル型を直接公開しており、移植性の高いベクトル化コードを簡単に記述することができます。」と書いてあります。今回の記事では画像処理っぽいお題を使って実際に SIMD 最適化される様子を検証してみます。 ベンチマーク環境 OS: Ubuntu20.04 on WSL2 on Windows11 CPU: AMD Ryzen 9 5900X 12-Core Processor お題 一般的な画像データ構造の表現である、幅×高さ×4(RGBA)の長さを持つ8bit整数の配列を受け取り、in-placeでRGBの値を 10 加算して明るくするという関数を考えます。Aの値は元のままとします。

          「ZigはCよりも速いです。」をVector/SIMD最適化で検証する
        • SIMD化とは何か / Basics of SIMD

          SIMD化の簡単な説明

            SIMD化とは何か / Basics of SIMD
          • 飽くなき高速化への挑戦! 「EmEditor」はマルチスレッド・SIMD命令・仮想メモリをフルに使って進化/最強テキストエディター「EmEditor」開発者 江村豊氏インタビュー【特集・集中企画】

              飽くなき高速化への挑戦! 「EmEditor」はマルチスレッド・SIMD命令・仮想メモリをフルに使って進化/最強テキストエディター「EmEditor」開発者 江村豊氏インタビュー【特集・集中企画】
            • SIMDの基礎と関数の実装例

              配信講義 計算科学技術特論A(2023)(2023年4月13日~7月27日・オンライン) 第11回 6月29日 SIMDの基礎と関数の実装例 https://www.r-ccs.riken.jp/outreach/schools/20230413-1/

                SIMDの基礎と関数の実装例
              • SIMDによる将棋Bitboard計算の高速化 - すぎゃーんメモ

                自作Rust製将棋合法手生成ライブラリ、計算の高速化のためBitboardの128bit計算をSIMDで行うようx86_64のAVX2、AArch64のNEON、wasm32のsimd128で動くようにそれぞれ実装して 各環境で多少速く探索できるようになった。https://t.co/h7Dz3X6BhT— すぎゃーん💯 (@sugyan) July 2, 2022 ということでSIMDでの高速化のメモ。 SIMDとは 実装 x86_64 基本演算 飛び利き計算 AArch64 同値判定、ゼロ値判定 飛び利き計算 Iterator WebAssembly Benchmark x86_64 AArch64 WebAssembly 感想 SIMDとは ja.wikipedia.org の通り、複数のデータを1命令で同時に演算する、というもの。 将棋Bitboardは81マスのデータを表現する

                  SIMDによる将棋Bitboard計算の高速化 - すぎゃーんメモ
                • ARM CPUにおけるSIMDを用いた高速計算入門

                  2021/4/28 に東京大学で開催された<AIセミナーシリーズ> 「Arm CPUにおけるSIMDを用いた高速計算入門」講演会で使用した資料になります。Read less

                    ARM CPUにおけるSIMDを用いた高速計算入門
                  • Sorting with SIMD - Blog - Tweede golf

                    Google recently published a blog article and paper introducing their SIMD-accelerated sorting algorithm. SIMD stands for single instruction, multiple data. A single instruction is used to apply the same operation to multiple pieces of data. The prototypical example is addition, where one instruction can do e.g. 4 32-bit additions. A single SIMD addition should be roughly 4 times faster than perfor

                      Sorting with SIMD - Blog - Tweede golf
                    • スタンドアロンなWebAssemblyランタイム「Wasmer 2.0」正式リリース、Win/Mac/Linux対応。SIMDに対応、実行速度が約50%改善、参照型対応など

                      スタンドアロンなWebAssemblyランタイム「Wasmer 2.0」正式リリース、Win/Mac/Linux対応。SIMDに対応、実行速度が約50%改善、参照型対応など 米Wasmer社はオープンソースのWebAssemblyランタイム「Wasmer 2.0」の正式リリースを発表しました。 Wasmer 2.0, Its a big deal!https://t.co/RHIdeOiRBJ — Wasmer (@wasmerio) June 16, 2021 WebAssemblyはもともとWebブラウザ上で高速に実行できるバイナリフォーマットとして開発されましたが、現在ではWebブラウザだけでなくOSやコンテナ、ブロックチェーンなどさまざまな環境で実行可能になっており、多様なランタイムが開発されています。 参考:KubernetesのノードとしてWebAssemblyランタイムを用い

                        スタンドアロンなWebAssemblyランタイム「Wasmer 2.0」正式リリース、Win/Mac/Linux対応。SIMDに対応、実行速度が約50%改善、参照型対応など
                      • Python/C/C++向けライブラリ「StringZilla」が登場、SIMD命令を利用して文字列操作を高速化

                        アルメニア出身で米サンフランシスコ在住の開発者であるAsh Vardanian氏は、Python/C/C++向けライブラリ「StringZilla」のバージョン1.1.3を8月31日(現地時間)に公開した。StringZillaはApache 2.0ライセンスと3条項BSDライセンスで公開しているオープンソース・ソフトウェア。ユーザーはどちらかのライセンスを選んで利用できる。 StringZillaは、大規模な文字列データを単語ごとに区切ったり、区切った単語をソートするなどの機能を提供している。StringZillaの最初のバージョンであるバージョン1.0.0が公開されたのは2023年7月13日。それに先立ってVardanian氏が公開したブログポストでは、StringZillaの基本的な考え方を解説している。 StringZillaは、長い文字列が対象であっても最初の4文字が合致していれ

                          Python/C/C++向けライブラリ「StringZilla」が登場、SIMD命令を利用して文字列操作を高速化
                        • SIMD およびマルチスレッド処理で TensorFlow.js WebAssembly バックエンドを高速化する

                          .app 1 .dev 1 #11WeeksOfAndroid 13 #11WeeksOfAndroid Android TV 1 #Android11 3 #DevFest16 1 #DevFest17 1 #DevFest18 1 #DevFest19 1 #DevFest20 1 #DevFest21 1 #DevFest22 1 #DevFest23 1 #hack4jp 3 11 weeks of Android 2 A MESSAGE FROM OUR CEO 1 A/B Testing 1 A4A 4 Accelerator 6 Accessibility 1 accuracy 1 Actions on Google 16 Activation Atlas 1 address validation API 1 Addy Osmani 1 ADK 2 AdMob 32 Ads

                            SIMD およびマルチスレッド処理で TensorFlow.js WebAssembly バックエンドを高速化する
                          • Parsing time stamps faster with SIMD instructions – Daniel Lemire's blog

                            In software, it is common to represent time as a time-stamp string. It is usually specified by a time format string. Some standards use the format %Y%m%d%H%M%S meaning that we print the year, the month, the day, the hours, the minutes and the seconds. The current time as I write this blog post would be 20230701205436 as a time stamp in this format. It is convenient because it is short, easy to rea

                              Parsing time stamps faster with SIMD instructions – Daniel Lemire's blog
                            • GitHub - ashvardanian/StringZilla: Up to 10x faster strings for C, C++, Python, Rust, and Swift, leveraging SWAR and SIMD on Arm Neon and x86 AVX2 & AVX-512-capable chips to accelerate search, sort, edit distances, alignment scores, etc 🦖

                              The world wastes a minimum of $100M annually due to inefficient string operations. A typical codebase processes strings character by character, resulting in too many branches and data-dependencies, neglecting 90% of modern CPU's potential. LibC is different. It attempts to leverage SIMD instructions to boost some operations, and is often used by higher-level languages, runtimes, and databases. But

                                GitHub - ashvardanian/StringZilla: Up to 10x faster strings for C, C++, Python, Rust, and Swift, leveraging SWAR and SIMD on Arm Neon and x86 AVX2 & AVX-512-capable chips to accelerate search, sort, edit distances, alignment scores, etc 🦖
                              • GoでSIMDを駆使して高速な内積演算を行う - Gunosy Tech Blog

                                本記事は、Gunosy Advent Calendar 2020 14日目の記事です。 昨日はeastさんの「RedisでEVALを使うとこんなにお得!GunosyでのEVAL活用例 - Gunosy Tech Blog」でした。 最近、確率統計のことを考えながらパチンコを打つと面白いことに気づきました。 @gumigumi4f です。 この記事はグノシーでのパーソナライズにおいて必要な内積演算の高速化をGo上でSIMDを駆使して行うという内容になっています。 はじめに SIMD とは なぜ、SIMDがパーソナライズの高速化につながるのか Go で SIMD 使い方 ベンチマーク まとめ はじめに ニュースアプリであるグノシーでは、ユーザーからのリクエストに対してリアルタイムに最適なリスト面を生成しています (いわゆるパーソナライズ)。 しかしながら、ユーザーからのリクエストは膨大で、時に

                                  GoでSIMDを駆使して高速な内積演算を行う - Gunosy Tech Blog
                                • neue cc - SimdLinq - LINQをそのままSIMD対応して超高速化するライブラリ

                                  ついこないだのStructureOfArraysGenerator - C#でSoAを簡単に利用するためのSource Generatorは、SoAになってるとSIMDを適用しやすいよ、という話だったのですが、そもそもSIMD手書きはカジュアルにやらないし、気合い入れてSIMD書くシチュエーションなら構造も気合い入れて専用に設計するよなぁ。と、なると、カジュアルにSIMD使えるライブラリが必要で、まぁLINQですね、と。 Cysharp/SimdLinq これを入れると別にSoA関係なく、SIMDが適用できる状態(例えばint[]にSum)だと、自動的にSIMDが適用されるようになります。そして、実際めちゃくちゃ速い。 SIMDとLINQの組み合わせが威力を発揮するというのは、別に新しいことではなく、そもそも .NET 7でもPerformance Improvements in .NET

                                  • GitHub - google/highway: Performance-portable, length-agnostic SIMD with runtime dispatch

                                    CPUs provide SIMD/vector instructions that apply the same operation to multiple data items. This can reduce energy usage e.g. fivefold because fewer instructions are executed. We also often see 5-10x speedups. Highway makes SIMD/vector programming practical and workable according to these guiding principles: Does what you expect: Highway is a C++ library with carefully-chosen functions that map we

                                      GitHub - google/highway: Performance-portable, length-agnostic SIMD with runtime dispatch
                                    • SIMD in Pure Python | Blog

                                      Welcome to my ::'########::'##::::::::'#######:::'######::: :: ##.... ##: ##:::::::'##.... ##:'##... ##:: :: ##:::: ##: ##::::::: ##:::: ##: ##:::..::: :: ########:: ##::::::: ##:::: ##: ##::'####: :: ##.... ##: ##::::::: ##:::: ##: ##::: ##:: :: ##:::: ##: ##::::::: ##:::: ##: ##::: ##:: :: ########:: ########:. #######::. ######::: ::........:::........:::.......::::......:::: CTF writeups, prog

                                      • Fast, parallel applications with WebAssembly SIMD · V8

                                        Show navigation SIMD stands for Single Instruction, Multiple Data. SIMD instructions are a special class of instructions that exploit data parallelism in applications by simultaneously performing the same operation on multiple data elements. Compute intensive applications like audio/video codecs, image processors, are all examples of applications that take advantage of SIMD instructions to acceler

                                        • Intent to Ship: WebAssembly SIMD

                                          Either email addresses are anonymous for this group or you need the view member email addresses permission to view the original message Contact emailsgde...@chromium.org, natt...@chromium.org, zh...@chromium.org Explainerhttps://github.com/WebAssembly/simd/blob/master/proposals/simd/SIMD.md https://github.com/WebAssembly/simd/blob/master/proposals/simd/W3CTAG-SIMDExplainer.md Specificationhttps://

                                          • Supercharging the TensorFlow.js WebAssembly backend with SIMD and multi-threading

                                            https://blog.tensorflow.org/2020/09/supercharging-tensorflowjs-webassembly.html https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj124OoLW469DhvyugpJkaL3YgvWO2lXUMpyY5fN_Tr6H7AzgpHSOVJGDkoAkaKq59sXdSwau4cvmMM-M06Jton1Ost721G3DF5enoHt31l9BdpeK2URcx5KoAVBSVZykp1OsJv9H-0bSk/s1600/table1.png September 02, 2020 — Posted by Ann Yuan and Marat Dukhan, Software Engineers at Google In March we int

                                              Supercharging the TensorFlow.js WebAssembly backend with SIMD and multi-threading
                                            • WebAssembly SIMD を pixelmatch に適用した

                                              WebAssembly SIMD を pixelmatch に適用した #ついに Safari にWebAssembly SIMDが来るとのことで試してみた。 対象はpixelmatchあたりが手頃そうなのでこれを対象とする。 Safari as the last browser finally supports WebAssembly SIMD 🎉 pic.twitter.com/HVX3gZTrRi — CryZe (@CryZe107) December 23, 2022目次モチベーション #RustからWebAssembly SIMDをどう使うのか学びたいWebAssembly SIMDによるパフォーマンスの変化を観測したいまたreg-viz/reg-cliがpixelmatchに依存しており、reg-viz/reg-cliをRust,wasm製にしたいという活動の一環でもある。

                                                WebAssembly SIMD を pixelmatch に適用した
                                              • GitHub - expr-fi/fastlwc: SIMD-enhanced word counter

                                                You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session.

                                                  GitHub - expr-fi/fastlwc: SIMD-enhanced word counter
                                                • 謎の3Dアドレス機能付きVLIW/SIMDを出荷するRoviero AIプロセッサーの昨今 (1/3)

                                                  前回までの流れで言えば、今回はNVIDIAのロードマップになりそうなものだが、一切情報がない。GeForce RTX 3050のレビューは上がっているが、GeForce RTX 3090 Tiは「1月末にまた説明する」という話だったのが、すでに2月に突入している有様。 そしてAmpere世代の後継となるHopper/Ada Lovelace世代については、断片的にいくつかの話はあるものの、記事にできるほどの内容がない。3月にはGTCがあるので、あるいはここでHopperに関してはなにか情報が出てくるかもしれないので、もう少々お待ちいただきたい。 インド色の強いスタートアップ企業Roviero 幹部が皆インテル・AMDと深い関係にある ということで久々にAIプロセッサーの話に戻る。今回取り上げるのは、2019年に創業したばかりのスタートアップ企業であるRovieroである。創業者はCEOのD

                                                    謎の3Dアドレス機能付きVLIW/SIMDを出荷するRoviero AIプロセッサーの昨今 (1/3)
                                                  • V8がWebAssembly SIMDをサポート

                                                    Spring BootによるAPIバックエンド構築実践ガイド 第2版 何千人もの開発者が、InfoQのミニブック「Practical Guide to Building an API Back End with Spring Boot」から、Spring Bootを使ったREST API構築の基礎を学んだ。この本では、出版時に新しくリリースされたバージョンである Spring Boot 2 を使用している。しかし、Spring Boot3が最近リリースされ、重要な変...

                                                      V8がWebAssembly SIMDをサポート
                                                    • WebAssembly and SIMD

                                                      Helping WebAssembly reach close to native speeds will be a great step forward to wide adoption. The current WebAssembly SIMD proposal is closing the performance gap, by allowing numeric-intensive WebAssembly programs to leverage SIMD to improve their runtime performance. Over the past couple of months at Wasmer, we’ve been hard at work adopting SIMD into our server-side WebAssembly runtime, and fo

                                                        WebAssembly and SIMD
                                                      • Aggregating billions of rows per second with SIMD

                                                        SIMD instructions are specific CPU instruction sets for arithmetic calculations that use synthetic parallelization. This approach allows us to perform the same calculations and operations on numerous data points simultaneously. This post describes how SIMD works with typical operation performance and describes additional optimizations we managed to achieve. What are SIMD operations?​ Instead of sp

                                                          Aggregating billions of rows per second with SIMD
                                                        • Verifying Rust Zeroize with Assembly...including portable SIMD

                                                            Verifying Rust Zeroize with Assembly...including portable SIMD
                                                          • SIMD accelerated sorting in Java - how it works and why it was 3x faster · James Baker

                                                            SIMD accelerated sorting in Java - how it works and why it was 3x faster 09 Jun 2022 In this post I explain a little about how to use Java’s Vector APIs, attempt to explain how they turn out fast, and then use them to implement a sorting algorithm 3x faster than Arrays.sort. I then explain some problems I found, and how I resolved them. Supporting code is published here. I’m an occasional reader o

                                                            • Using SIMD acceleration in rust to create the world’s fastest tac

                                                              NeoSmart Technologies’ open source (MIT-licensed), cross-platform tac (written in rust) has been updated to version 2.0 (GitHub link). This is a major release with enormous performance improvements under-the-hood, primarily featuring handwritten SIMD acceleration of the core logic that allows it to process input up to three times faster than its GNU Coreutils counterpart. (For those that aren’t fa

                                                                Using SIMD acceleration in rust to create the world’s fastest tac
                                                              • Rustの画像処理でSIMDを使ってみる

                                                                JAWS DAYS 2024 E-3 ランチにまつわるちょっといい話 〜給食がない町の小中学生に温かい昼食を〜 / School lunch for anywhere

                                                                  Rustの画像処理でSIMDを使ってみる
                                                                1

                                                                新着記事