タグ

CPUに関するwata88のブックマーク (47)

  • ARMはx86より効率がいいというのは過去の神話

    従来から、「ARMはx86より(電力的に)効率的だ」という言説があります。これは単純に「ARMは省電力なスマホ向けで、x86は電力をPC向け」程度のアバウトなイメージのこともありますし、前世紀のRISC vs CISC論争のころからある「ARMはx86 (x64を含む)に比べ命令セットがシンプルなので、命令デコードにかかる電力が少なくて済んで効率的」という議論の形をとることもあります。 この議論については、半導体エンジニアの多くは「ARMがx86 より効率が良いというのは、もはや過去の神話」(in today’s age it is a very dead argument)という認識を共有していると言っていいでしょう。有名なところではApple CPU (ARM)とZen (x86)の両方を開発したジム・ケラー氏のインタビューでも言われていますし、Chips and Cheeseとい

    ARMはx86より効率がいいというのは過去の神話
    wata88
    wata88 2024/04/05
  • Putting the "You" in CPU

    From the beginning… Edit on GitHub I’ve done a lot of things with computers, but I’ve always had a gap in my knowledge: what exactly happens when you run a program on your computer? I thought about this gap — I had most of the requisite low-level knowledge, but I was struggling to piece everything together. Are programs really executing directly on the CPU, or is something else going on? I’ve used

    Putting the "You" in CPU
    wata88
    wata88 2024/01/28
  • CPUを自作したりコンピューターアーキテクチャを理解するためにおすすめの本の一覧 - /var/log/hikalium

    hikaliumの独断と偏見で、積読は除いている。最近も結構新しいが色々出ているので、それもいいかもしれないが、ある程度評価の定まったを探したい場合に参考になれば。 ちなみに、hikaliumがセキュキャンでCPU自作を教えていたときのコードはここにある。参考にならないかもしれないが、おまけにどうぞ。 github.com ディジタル回路設計とコンピュータアーキテクチャ 無印(MIPS版) ARM版 RISC-V版 ハードウエア記述言語で実際にCPUをつくりながら、各アーキテクチャについても学べる良書。 MIPS版が広く知られているが、ARM版、RISC-V版も登場している。無印版はよくある技術書サイズだが、ARMとRISC-V版は大型なので、そこらへんの好みとかも勘案するとよいかもしれない。 CPUの創り方 Amazon 表紙がメイドさんだが、侮ることなかれ。(と私は中学生の時にク

    CPUを自作したりコンピューターアーキテクチャを理解するためにおすすめの本の一覧 - /var/log/hikalium
    wata88
    wata88 2023/09/21
    手を動かすと読むしか無い
  • 学習が何で律速してるか、把握してますか? - arutema47's blog

    (最新SSD IOはPCIe x4でした。ご指摘ありがとうございます。) はじめに どの処理で律速しているか調べる 各処理の速度改善方法 データ読み込み速度の改善 データ前処理速度の改善 GPU処理速度の改善 コンピューティングについての他記事 はじめに Kaggle Advent Calendar 2022 8日目です。 突然ですが、あなたはDNN学習時にどの処理で学習速度が律速しているか把握してますか? DNN学習には図に示すように大きく3つの要素があります: (SSDからの)データ読み込み (CPUによる)データ前処理 (GPUによる)DNN計算 学習時のデータの流れとしては SSDからデータが読み込まれ、CPUに送られる(SATA or PCIe) CPUにてaugmentationや正規化などの前処理が行われ、GPUにデータが送られる(PCIe x16) GPUにてDNNの計算・

    学習が何で律速してるか、把握してますか? - arutema47's blog
    wata88
    wata88 2022/12/08
  • WiiでClassic MacOSがそのまま動くHack | inajobのいろいろレビュー

    It’s MacOS. On An Unmodified Wii!から発見。画像もここから転載。 もはや懐かしいClassic Mac OSですが、純正ハードウェアでなくても動くように様々なソフトウェアが開発されています。 この記事で紹介しているのはニンテンドーのWiiでClassic Mac OSを動かす方法です。 Classic Mac OSはPowerPCというCPUで動作するように設計されており、偶然にもWiiも同じPowerPCが搭載されています。 CPUが同じおかげで、何とWiiでもClassic Mac OSが動かせるようです。 実際にはWiiで動作するLinuxの上で、Mac-on-Linuxというアプリケーションを起動してClassic Mac OSを動作させているようです。 Mac-on-LinuxはPowerPC上のLinuxで動作するエミュレータとは違い、Power

    wata88
    wata88 2022/12/06
  • 半導体設計について何も知らない素人が1ヶ月で8bitCPUをテープアウトした話 - 抹茶うまい

    この記事は HDL Advent Calendar 2021 25日目の記事です。 すいません、11日ほど遅れての投稿です。 この記事では、以下のツイートに至るまでの裏話について話させていただきます。 HDLに関係があるかというとかなーり微妙ですが、許していただきたいです🙏 Our first tapeout project of 8bit CPU with @Cra2yPierr0t has just finished. We still don't have enough knowledge about making LSI ...https://t.co/J99bRlMTY3#mpw3 #efabless #openmpw pic.twitter.com/6MmGvlDMCZ— Δyuk! (@heppoko_yuki) 2021年11月12日 遂に@heppoko_yuki と共

    半導体設計について何も知らない素人が1ヶ月で8bitCPUをテープアウトした話 - 抹茶うまい
    wata88
    wata88 2022/01/07
  • How To Make A CPU - A Simple Picture Based Explanation

    2021-11-09 - By Robert Elder The purpose of this article is to explain how to make a CPU out of rocks and sand as fast as possible without using too many words.  As the world of proprietary hardware and software crushes in around us, we risk losing the ability to make things for ourselves as individuals.  It is for this reason that I felt compelled to learn how one could hypothetically make their

    wata88
    wata88 2021/11/11
  • 冗談ではなく目の前が真っ暗になる恐怖……ピンを曲げてしまったRyzen 9 5950Xの修復を試みる (1/3)

    某月某日、ジサトラハッチから電話があった。 「ウチの若いのが、ソケットの向きを間違えてCPUを装着したようで、ピンが曲がっちゃってるんですけど……直せたりします? Ryzen 9 5950Xなので、さすがになんとかしたくて」 この話を聞いただけだと、多少曲がったピンがあるくらいかなと思っていたのだが、後日、実物をみて驚いた。大きく曲がったピンが6、傾いたピンはそれ以上という、なかなか悲惨なことになっていたからだ。 自作PCファンであれば、程度の違いこそあれ、このようなCPUのピンを曲げてしまうという失敗を経験したことがあるだろう。手を滑らせて落とす、ソケットに挿す向きを間違える、ソケットから外すときに片側だけ持ち上げる、ドライバーなどの小物をぶつける、グリスでCPUクーラーに貼り付き一緒に抜ける(通称スッポン)など、不幸な事故から過失まで、その原因は様々だ。 CPUといえば、古くは裏面に

    冗談ではなく目の前が真っ暗になる恐怖……ピンを曲げてしまったRyzen 9 5950Xの修復を試みる (1/3)
    wata88
    wata88 2021/06/11
    昔は直すの楽だったが今のピン数は地獄
  • AWS Graviton2 新CPUの性能検証 | 外道父の匠

    C5が一歩抜けた強さの割に全部 ECU=10 な時点でアレですが、さらに6g系は該当なしです。で、費用的には c5/m5 の比率と c6g/m6g の比率は同じ 86% です。 第5世代では、C5 はメモリが少ない分、安くCPUが高速だったので強い選択肢でしたが、第6世代ではメモリが少ない分、安い。だけになるので、C系を選ぶメリットがだいぶ弱くなりそうです。 単純に、14%安くしてc6gにするって考えよりも、14%高くしてメモリ倍の方がよくねっていう。そういうパターンのほうが多いんじゃないかと、いうだけで全然絶対じゃないですけど。 考えようによっては、AutoscalingGroupに複数のインスタンスタイプを指定するとき、c6g, m6g, r6g と混ぜてもCPU使用率の格差がAZ以外で起きづらくなるだろうから、扱いやすくなると言えなくもない。 vs C5 あまりに差が付きすぎて、自分

    AWS Graviton2 新CPUの性能検証 | 外道父の匠
    wata88
    wata88 2021/03/09
  • フルスクラッチから作って理解するQEMU (Rust編) - FPGA開発日記

    モチベーション なぜRustを選んだか? 私はQEMUは「アーキテクチャエミュレーション界のLLVM」だと思っている QEMUが高速な理由:TCG Binary Translation ゲスト命令(RISC-V) → TCGホスト命令(x86)の処理をRustで作ろう RISC-Vの命令をフェッチしてデコードする RISC-Vの命令をTCGに変換する TCGをx86に変換する 実装結果 Binary Translation実行を高速化するための様々なテクニック BasicBlock分まで複数命令をまとめて変換 TCG Block Chainingの実装 評価結果 TB Lookup and Jumpの実装 評価結果 まだ完成していないところ 一部の最適化はまだ未実装となっている ゲストアーキテクチャがx86のみとなっている。TCGによる複数プラットフォーム対応として、まずは環境のそろ

    フルスクラッチから作って理解するQEMU (Rust編) - FPGA開発日記
  • Nand2Tetris(コンピュータシステムの理論と実装)でCPUからOSまで一気通貫で作るのが最高に楽しかった話 - ( ꒪⌓꒪) ゆるよろ日記

    どうも、しいたけです。 去年あたりからローレイヤー周りの知識を充実させようと思い、 低レイヤを知りたい人のためのCコンパイラ作成入門 を読んでCコンパイラを書いてみたりx86_64の勉強をしたりしていました。 今年に入ってから、よりローなレイヤー、具体的にはハードウェアやOSについてもう少し知りたいと思い始め、手頃な書籍を探していました。 CPUなどのハードウェア周りについては概要しか知らなくて手を動かしたことがないので、実際に何か作りながら学べるものとして、 O'Reilly Japan - コンピュータシステムの理論と実装 に挑戦することにしました。 O'Reilly Japan - コンピュータシステムの理論と実装 成果物は以下のリポジトリに置いてあります。 yuroyoro/nand2tetris 結論から言うと、やってみて大変楽しめました! 特にハードウェア周りは今まで挑戦したこ

    Nand2Tetris(コンピュータシステムの理論と実装)でCPUからOSまで一気通貫で作るのが最高に楽しかった話 - ( ꒪⌓꒪) ゆるよろ日記
    wata88
    wata88 2020/12/11
  • 2で割ることと3で割ること - Qiita

    この記事でお題にするのはCPUレジスタ上の整数除算です。以下、単に除算とも書きます。 除算は非常に高コストな演算なため、コンパイラは最適化によって、できるだけ整数除算を別の計算に置き換えようとします。 最適化ができる場合の一つとして、割る数が定数である場合があります。頭のいいコンパイラは、除算を乗算とビットシフト等を駆使した演算に置き換えます。この記事では、そういった最適化の背景にある理屈を部分的に解説します。 計算機環境としてはモダンなx86 CPUを仮定します。したがってレジスタは32/64ビットであり、負数は2の補数表現になっています。ある程度は他の命令セットでも通用する話になっているかもしれません。 そもそも整数の除算とは プログラミングにおける整数の除算の定義について確認します。整数$n$を整数$d$で割るとき $$ n = q \times d + r $$ が成り立つように除

    2で割ることと3で割ること - Qiita
    wata88
    wata88 2020/12/09
  • 最終回:Apple Siliconがやってきた そのさらに先、「Apple ISA」への遠い道のり

    ご存じの通り、Apple Silicon「M1」を搭載したMacが発売された。この連載の担当編集である松尾氏も早速入手されたそうで何よりである。現状のM1は、ある意味「拡張性を犠牲にして性能を優先した」構成であり、今後拡張性が求められるようになっていくと、いろいろ厳しいシーンも出てくるとは思うが、それをどう(CPUコアのアーキテクチャだけでなく、SoCのアーキテクチャも含めて)解決しながら性能を上げていくかが楽しみである。 さてこの連載の最後に、そういうApple Siliconの先にあるものを少し考察してみたい。結論からいえば、Appleは既にApple ISA(Instruction Set Architecture)の策定作業にかかっていると思う。それが世の中に登場するのはまだだいぶ先だと思うし、動向次第では世に出ずに終わる可能性も多少はあるが、そうした作業をやってないというのは、ま

    最終回:Apple Siliconがやってきた そのさらに先、「Apple ISA」への遠い道のり
    wata88
    wata88 2020/11/25
    > Appleというのは、現状では唯一「垂直統合」を成し遂げたコンピュータベンダーになった
  • RISCの生い立ちからRISC-Vまでの遠い道のり

    IBM Power、MIPS、PA-RISC、SPARC、Alpha、Arm、そしてRISC-VIT史に詳しい大原雄介さんが、現代のプロセッサにおいて重要なRISCプロセッサの歴史を追っていきます。

    RISCの生い立ちからRISC-Vまでの遠い道のり
    wata88
    wata88 2020/11/22
  • M1とRosetta 2が速い理由の考察という名目の妄想

    Apple SiliconのM1が速いと話題だ。単に速いというだけでなくRosetta 2を用いてx86_64バイナリをARMに変換して実行した時にIntel CPUで直接実行した時より速くなる場合があるというのだから驚きだ。その要因を考察するにつれ一つの仮説に思い至ったのでここに記しておく。 その要因とはRISCとCISCの違いだ。殴り書きなので詳細は省くが、CISCのほうがやってることが複雑で単純な実行速度という意味ではRISCに敵わない。特にRISCの固定長命令という特徴がカギを握る。 CISCの代表がIntelのx86である。しかし2000年ごろにはCISCはもう駄目だ的なことが声高に叫ばれていたが、気が付けばx86はそのまま栄華を極め2020年にまで至ってしまった。そこまで持ちこたえた理由の1つがRISCとCISCの境目がなくなる Pentium Proの逆襲に書かれているのだが

    M1とRosetta 2が速い理由の考察という名目の妄想
    wata88
    wata88 2020/11/22
    Rosetta2で遅くならないのは、おそらくそうだろうと思う。もとからM1が速すぎるのが意外なんだよな、メモリが大きいんかな
  • MIPS、RISC-Vのサポートを表明

    MIPS Technologyを買収し、MIPSアーキテクチャのIPライセンス供給を行っていた米Wave Computingは、事業不振に伴い複雑な経緯を経てMIPSのビジネスを事実上中国のCIP Unitedに売却したという話は、吉川明日論先生の2020年9月17日の記事に詳しいが、そのMIPSというかWave Computingは11月9日から12日にオンライン開催となった「electronica 2020」の中のEmbedded Forumの基調講演にて、MIPSコアにRISC-Vの対応を追加することを明らかにした。 この発表を行ったのは、少なくとも直前までの肩書はWave Computingのイスラエルオフィスに在籍するItai Yarom氏であるが、electronicaにおける肩書は“Director Sales & Solutions, MIPS”で、ひょっとするとMIPS部

    MIPS、RISC-Vのサポートを表明
    wata88
    wata88 2020/11/15
    そりゃ近しいとはわかるけど、そんなんペイするんか
  • Apple Announces The Apple Silicon M1: Ditching x86 - What to Expect, Based on A14

    This year’s A14 chip includes the 8th generation in Apple’s 64-bit microarchitecture family that had been started off with the A7 and the Cyclone design. Over the years, Apple’s design cadence seems to have settled down around major bi-generation microarchitecture updates starting with the A7 chipset, with the A9, A11, A13 all showcasing major increases of their design complexity and microarchitec

    Apple Announces The Apple Silicon M1: Ditching x86 - What to Expect, Based on A14
    wata88
    wata88 2020/11/14
    面白い
  • ARM入門/arm introduction

    2020/08/08 ARM入門勉強会の発表資料です。 https://connpass.com/event/180812/

    ARM入門/arm introduction
    wata88
    wata88 2020/08/08
  • ポスト「京」のプロセッサ「A64FX」はArmベースながら異彩放つ重厚系

    ポスト「京」のプロセッサ「A64FX」はArmベースながら異彩放つ重厚系:Arm最新動向報告(5)(1/3 ページ) 「Arm TechCon 2018」では、Armのアーキテクチャライセンスを基に開発が進められている、次世代スーパーコンピュータのポスト「京」(Post-K)向けのプロセッサ「A64FX」に関する講演が行われた。 ⇒連載「Arm最新動向」バックナンバー これまで4回に渡り「Arm最新動向」として、2018年10月に米国で開催されたArmの年次イベント「Arm TechCon 2018」であったさまざまな話題をご紹介してきた。今回の5回目では、締めくくりとして、富士通というか、東京工業大学 教授 兼 理化学研究所 計算科学研究センター長である松岡聡氏による、次世代スーパーコンピュータのポスト「京」(Post-K)に向けたプロセッサ「A64FX」の話を取り上げようと思う。 「C

    ポスト「京」のプロセッサ「A64FX」はArmベースながら異彩放つ重厚系
  • Appleが、PowerPCとインテルを見捨てた理由

    Tediumより。 AppleがPowerPCからIntel CPUに移行した時を振り返り、なぜ今、インテルが15年前のPowerPCと同じ立場にあるのかを考えてみよう。 アーニー・スミス Today in Tedium: おそらく、今日私が状況を説明しようとしている待望の瞬間は、ある意味で完全に避けられないでしょう。何年もの間、AppleはARMプロセッサ・アーキテクチャの知識を利用してデスクトップやノートパソコンにARMを持ち込むという噂がありました。来週の仮想ワールドワイド・デベロッパーズ・カンファレンスで、iPhoneの巨人がまさにそれを行うことを期待されています。もちろん、多くの人は失敗したパートナー、つまりAppleの垂直統合への動きにつながったビジネスの失恋相手であるインテルに焦点を当てることでしょう。しかし、私は、インテルがAppleを買収する途中で打ち負かしたプラットフォ

    Appleが、PowerPCとインテルを見捨てた理由
    wata88
    wata88 2020/06/22
    プロセッサ愛憎劇