smiharaのブックマーク - はてなブックマーク

大規模言語モデルを使って組織内の全データを検索する時にはどのような前処理を行うと効率的なのか？

組織には構造化されたデータベースやきれいにフォーマットされたCSVのほか、何気なく書いたメールから複雑な技術マニュアルまでさまざまな形式のデータが大量に保存されています。検索拡張生成(RAG)は大規模言語モデル(LLM)を使用して全てのデータから適切な情報を引き出すための技術ですが、RAGを使用する際にデータの取り込みと前処理をどのように行うと効率的なのかを、RAG向けデータ前処理サービスを展開するUnstructuredが解説しました。 Understanding What Matters for LLM Ingestion and Preprocessing – Unstructured https://unstructured.io/blog/understanding-what-matters-for-llm-ingestion-and-preprocessing LLMを最大限に

smihara 2024/05/06

リンク

AWSを使わないだけでサーバー代を500億円以上節約できた実例

Amazonが展開するクラウドコンピューティングサービス「Amazon Web Services(AWS)」は企業の規模に関係なく利用可能で、使い方によっては業務の効率化やコストの大幅削減が可能です。一方で、環境によってはAWSを使うとコストが増加してしまう場合もあります。アクセス解析システムを開発する「Ahrefs」は、AWSを使わないことで3年間で4億ドル(約527億円)以上の節約に成功しているとのことです。 How Ahrefs Saved US$400M in 3 Years by NOT Going to the Cloud | by Efim Mirochnik | Mar, 2023 | Ahrefs https://tech.ahrefs.com/how-ahrefs-saved-us-400m-in-3-years-by-not-going-to-the-cloud-89

smihara 2023/03/19

リンク

パーソナルコンピュータの父アラン・ケイが選ぶ「プログラマー必読の古典本」とは？

by Alan Levine かつてのコンピューターは壁一面を占有するような巨大なもので、複数人で使用するのが当たり前でした。アラン・ケイ氏が提唱した「パーソナルコンピューター」の概念は、巨大なコンピューターを個人で使えるサイズにまで落とし込べきだという発想で、現代の「パソコン」を形作るものでした。そんなアラン・ケイ氏が「プログラマー全員が読むべき古典」を挙げていました。 Alan Kay's answer to Experienced programmers and computer scientists, what are some really old (or even nearly forgotten) books you think every new programmer should read? - Quora https://www.quora.com/Experience

smihara 2019/08/14

リンク

ディスクアレイ装置に向かって大声で叫ぶと何が起こるのか？

ディスクアレイ装置は、複数のハードディスクを大容量のストレージと見立てて使用することができます。ディスクアレイに搭載されるハードディスクはモーターなどを使って物理的に動作し、内蔵されている部品も極めてデリケートな動作をすることから、振動に弱いという弱点があります。OracleのFishworksチームは、ディスクアレイ装置に向かって大声で叫ぶ実験を行っており、振動に弱いハードディスクをたくさん搭載した装置がどのような挙動をするのか、その様子をYouTubeで公開しています。 Shouting in the Datacenter - YouTube 「私はFishworksの研究チームに所属しているブレンダンです。これから面白いものをお見せできると思います」と語るのが、今回ディスクアレイ装置に大声で叫ぶ実験を行うブレンダン・グレッグ氏。グレッグ氏はSolarisの画面を指さし「ここでは、デ

smihara 2018/06/25

リンク

Microsoftが秘密裏に独自命令セットのCPU「E2」を開発、Windows 10とLinuxの動作をテスト中

Microsoftがx86とはまったく異なる設計の命令セットを採用するプロセッサー「E2」を開発中だとRegisterが報じました。E2の開発には半導体メーカーのQualcommが協力しており、すでにWindows 10やLinuxを動かすテストも行われているとのことです。 Now Microsoft ports Windows 10, Linux to homegrown CPU design • The Register https://www.theregister.co.uk/2018/06/18/microsoft_e2_edge_windows_10/ Windows OSを動かす命令セットはx86(IA-32)やARMが一般的ですが、整数演算ユニットや浮動小数点演算ユニット、メモリのデータへのアクセスなど処理がレーンごとに分かれる設計で、他のレーンの演算処理の動向次第で別のレ

smihara 2018/06/22

リンク

750円のマイクロコントローラーでスーパーコンピューターを作る方法 - GIGAZINE

低性能のコンピューターでもクラスタとして連ねることで、高い性能を持たせることが可能です。「非力なRaspberry Piを組み合わせてスーパーコンピューターを作る」という試みはよく行われていますが、Raspberry Piよりもさらに安い7ドル(約750円)のマイクロコントローラー「ESP32」をクラスタにする試みがGitHubで公開されています。 Broccoli/Broccoli_readme_en.md at master · Wei1234c/Broccoli · GitHub https://github.com/Wei1234c/Broccoli/blob/master/notebooks/demo/Broccoli_readme_en.md How to Build a Mini Supercomputer for Under $100 - Motherboard https

smihara 2018/04/20

リンク

数学の広大な分野の広がりを収めた一枚の図「The Map of Mathematics」

「読み書きそろばん」と言うように、昔から数学は学校で教育されてきました。しかし、学校で習う数学は数学の分野のほんの一部分でしかありません。その幅広い分野を一枚の図にまとめたものが公開されています。 Science Infographics Breakdown STEM Subjects as Visual Maps https://mymodernmet.com/science-infographics-dominic-walliman/ The Map of Mathematics - YouTube 私たちは学校で数学を学びますが、それは数学のほんの一部分でしかありません。数学の分野は非常に多様なものです。数学は最初「ものを数える」ところから始まりました。そして長さを測るようになり、紀元前3000年にはエジプトで方程式が誕生。その後も負の数やゼロなどの発明が続きます。現在の数学は「

smihara 2018/03/31

リンク

人間の給与計算部門をまるごとクビにして入れ替えたIBMのシステムが820億円の損失を生み出す

By Ken Teegardin カナダ政府は2008年、部門の人員コストを削減するために給与計算部門を廃止し、IBMから給与計算システム「Phoenix Pay System」を導入しました。しかし稼働したシステムは正常に職員たちの給与を計算せず問題となり、事態を終息させるために現カナダ政府が約10億カナダドル(約820億円)を投入する事態にまで発展しています。 Canada to Scrap IBM Payroll Plan Gone Awry Costing C$1 Billion - Bloomberg https://www.bloomberg.com/news/articles/2018-03-01/canada-to-scrap-ibm-payroll-plan-gone-awry-costing-c-1-billion IBMからPhoenix(フェニックス)を導入する事業

smihara 2018/03/05

リンク

Googleが人間以上の能力を持つ画像認識AI「PlaNet」を開発していることが明らかに

By CHRISTOPHER DOMBRES Googleは画像の説明文章を自動生成する技術を開発したりと、機械学習やディープラーニングなどを用いて、人間レベルの高度な認識能力を持つコンピューターや人工知能の開発に取り組んできました。そんな中、人間を超える精度で「写真の『映像情報』のみで撮影場所を特定する」ことが可能な人工知能の開発にも成功していることが明らかになっています。 Google Unveils Neural Network with “Superhuman” Ability to Determine the Location of Almost Any Image https://www.techno logyreview.com/s/600889/google-unveils-neural-network-with-superhuman-ability-to-determine

smihara 2016/02/27

リンク

ハードディスク約5万6000台の運用実績から壊れやすいメーカーが明らかに

By nsr1986 オンラインストレージサービスのBackblazeが2013年第2四半期から2015年第4四半期までに運用していた約5万6000台のハードディスクの故障率に関するデータを公開しました。過去のデータでは圧倒的に壊れやすかったSeagate製品に徐々に改善の兆しが見えており、今回の調査では果たしてどうなったか、詳細が明らかになっています。 Hard Drive Reviews: Update on 2015 Hard Drive Reliability https://www.backblaze.com/blog/hard-drive-reliability-q4-2015/ 以下のグラフは、Backblazeが2013年第2四半期から2015年第4四半期までに運用していたHGST・Seagate・Toshiba・Western Digital製ハードディスク(HDD)の故

smihara 2016/02/17

リンク

A5ランクの最高級牛肉をお一人様でも立ち食いスタイルで楽しめる「治郎丸」に行ってきました

東京・新宿にA5ランクの高級肉を150円から一切れずつ、なんと「立食い」スタイルで食べられる焼き肉店「治郎丸」があると聞き、さっそく行ってみました。治郎丸は、一人で黙々と焼き肉をむしゃむしゃするのも大歓迎とのことです。午後9時ころ、新宿・歌舞伎町にある「立食い焼き肉治郎丸」に到着。看板には「一切れずつ注文」「A5ランク」と書かれています。「立食い焼き肉」という斬新なスタイルに、道行く人々も興味津々。店内の様子をのぞきこんで確認する人多数。お店に入ると、まるでお寿司屋さんのようなガラスのショーケースが前に置かれたカウンターテーブルのみ。もちろん椅子などなく、立食いスタイルです。カウンターに置かれたガス式の鉄板。一人でガツガツ食べるも良し。二人で仲良く鉄板をつつくのも良し。カウンター奥の壁には値段別に肉の部位がずらり。治郎丸は、肉一切れから注文できるスタイルなので、色々な部位の肉

smihara 2014/11/18

リンク

これがNASA流の仕事術、「プロジェクトマネージャーが守るべきルール100」が公開される

by MATEUS_27:24&25 プロジェクトの計画と実行において総合的な責任を持つ職務をプロジェクトマネージャーと呼びますが、NASAのゴダード宇宙飛行センターの副監督者であるJerry Maddenさんが何年にもわたって出典不詳のソースから集めた「プロジェクトマネージャーとしての心得」とも言える100のルールがPDFファイルで公開されました。プロジェクトマネージャーとしてだけでなはく、仕事やグループを統括する人にとって非常に役立ちそうなルールとなっています。 One Hundred Rules for NASA Project Managers - 100-rules-for-nasa-project-managers.pdf (PDFファイル) https://www.projectsmart.co.uk/white-papers/100-rules-for-nasa-proje

smihara 2014/09/09

リンク

Googleがビッグデータを解析してW杯を予測すると全試合的中、準々決勝も当ててしまうのか？

2014年6月12日にブラジルで開幕し、世界中の人をくぎ付けにしている2014 FIFAワールドカップは、日本時間の7月5日と6日に渡って、ベスト4を決める準々決勝が行われます。2010年に南アフリカで開催されたワールドカップでは、ドイツの水族館で飼育されていたマダコのパウルくんが、予想した全8試合を全て的中させ話題を呼びましたが、2014年はGoogleが世界中から集められたビッグデータを使って勝敗予測をぶち上げ、なんと決勝トーナメント1回戦の勝敗全てを的中させ、次に行われる準々決勝の勝敗予測を公開しています。 Google Cloud Platform Blog: Google Cloud Platform goes 8 for 8 in World Cup predictions http://googlecloudplatform.blogspot.ch/2014/07/googl

smihara 2014/07/05

リンク

はてなブックマーク

タグ

ブックマーク / gigazine.net (13)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第3週）

今週のはてなブックマーク数ランキング（2024年5月第2週）

今週のはてなブックマーク数ランキング（2024年5月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス