並び順

ブックマーク数

期間指定

  • から
  • まで

41 - 80 件 / 15550件

新着順 人気順

HotEntryの検索結果41 - 80 件 / 15550件

  • 大規模モデルを単一GPUで効率的に学習する方法|npaka

    以下の記事が面白かったので、かるくまとめました。 ・Methods and tools for efficient training on a single GPU 1. LLMを単一GPUで効率的に学習する方法大規模モデルの学習では、次の2つを考慮する必要があります。 ・スループット・学習時間 ・モデルのパフォーマンス 「スループット」 (サンプル / 秒) を最大化すると、学習コストの削減につながります。これは通常、GPUメモリを限界まで利用することで実現されます。必要なバッチサイズがメモリオーバーする場合は、「Gradient Accumulation」などの「メモリの最適化」が必要になります。 ただし、「推奨バッチサイズ」がメモリに収まる場合は、学習が遅くなる可能性があるため、「メモリの最適化」を適用する必要はありません。どのバッチサイズが最良の結果をもたらすかを決定し、それに応じ

      大規模モデルを単一GPUで効率的に学習する方法|npaka
    • ガストで厨房の方から悲鳴?が聞こえると思ったら、「充電が切れそうだニャ〜ン!!!!」ってベラちゃん(ネコ型配膳ロボット)が叫んでた。

      安心院バク @bakunojob ガストで厨房の方から悲鳴?が聞こえると思ったら、 「充電が切れそうだニャ〜ン!!!!」 ってベラちゃん(ネコ型配膳ロボット)が叫んでた。 自分がピンチなときに声を出して周囲の人に助けを求められるなんて偉すぎる。 不安や心配を1人で抱え込んで自滅してしまう人は見習おう、ベラちゃんを。 pic.twitter.com/snOZvjLUkW 2023-10-02 09:16:38

        ガストで厨房の方から悲鳴?が聞こえると思ったら、「充電が切れそうだニャ〜ン!!!!」ってベラちゃん(ネコ型配膳ロボット)が叫んでた。
      • 【ライブ配信告知】ふつーのノートPCでゲームがバリバリ動くように!超小型GPUボックス「GPD G1」

          【ライブ配信告知】ふつーのノートPCでゲームがバリバリ動くように!超小型GPUボックス「GPD G1」
        • Uber Eatsの食品配達ロボットがカメラ映像を警察に送信していることが内部メールで判明

          食品や日用品などの配達を手がけるUber Eatsは、自動配送ロボット企業・Serve Roboticsと提携し、最大2000台の自律型配達ロボットを導入しています。そんな自律型配達ロボットが、稼働中常に撮影を行っていることや、撮影した映像を警察に提供していることが報告されています。 Food Delivery Robots Are Feeding Camera Footage to the LAPD, Internal Emails Show https://www.404media.co/serve-food-delivery-robots-are-feeding-camera-footage-to-the-lapd-internal-emails-show/ 自動配達に積極的に取り組んでいるUber Eatsは、Serve Roboticsと提携し、2022年から自律型配達ロボットの

            Uber Eatsの食品配達ロボットがカメラ映像を警察に送信していることが内部メールで判明
          • Meteor Lakeで省電力なのはSoCタイルのEコアのみ インテル CPUロードマップ (1/3)

            前回に引き続き、Intel Innovation 2023からMeteor Lakeの話を解説したい。まず基調講演における説明からスタートしたい。 Meteor Lakeが12月14日に発売 今回Meteor Lakeの発売に先立ち、AIPCと呼ばれる概念(?)が公開された。概念なのか、それともキャンペーンの名称なのか、そのあたりは今ひとつはっきりしないのだが、かつてWi-Fiの搭載を必須にしたことで、Wi-Fiの普及が急速に進んだCentrinoを引き合いに出して説明したあたりは、あるいはキャンペーンの名称にするつもりなのかもしれない。 なんとなくQualcommのACPC(Always Connected PC)に似ていることもあって、キャンペーンタイトルとするには弱い気がする。もっと思い切った名前の方が良いのでは? ただ現時点ではそういう明確なキャンペーンが打たれるかどうかははっきり

              Meteor Lakeで省電力なのはSoCタイルのEコアのみ インテル CPUロードマップ (1/3)
            • Intel、EUV採用「Intel 4」プロセスの量産開始

              Intel、EUV採用「Intel 4」プロセスの量産開始:「Intel 3以降も順調」とコメント Intelは2023年9月29日(アイルランド時間)、アイルランドの新工場を正式に開設し、同社として初めてEUV(極端紫外線)リソグラフィー技術を使用する最先端プロセス「Intel 4」での半導体の量産を開始したと発表した。

                Intel、EUV採用「Intel 4」プロセスの量産開始
              • Appleは極小バーコードを使用してディスプレイガラス製造の失敗を追跡し数百億円規模のコスト削減に成功

                AppleはiPhoneのディスプレイをカバーするガラスに極小のバーコードをエッチングすることで、サプライヤーから廃棄された欠陥のあるディスプレイガラスの数を正確に追跡できるようにしているとThe Informationが報じています。 How a Hidden Bar Code in iPhone Screens Saved Apple Hundreds of Millions of Dollars — The Information https://www.theinformation.com/articles/how-a-hidden-bar-code-in-iphone-screens-saved-apple-hundreds-of-millions-of-dollars Apple hides barcodes in every iPhone screen https://app

                  Appleは極小バーコードを使用してディスプレイガラス製造の失敗を追跡し数百億円規模のコスト削減に成功
                • GeForce RTX 4090も乗っかる!Ryzen 7 7745HX搭載マザーがMINISFORUMから

                    GeForce RTX 4090も乗っかる!Ryzen 7 7745HX搭載マザーがMINISFORUMから
                  • 続・AWS ECS Fargate のCPU性能と特徴 2023年版 | 外道父の匠

                    2年半近く前に書いた AWS ECS Fargate のCPU性能と特徴 | 外道父の匠 の続編になります。 そんなに楽しくはないけど、知っておいて損はない、くらいの調査と考察になります:-) 前口上 ちょうど1年前に FARGATE のリソース天井が上がりました。今回は、ほぼそれを区切りにした結果になっていると思います。 AWS Fargate でコンピューティングとメモリのリソース構成が 4 倍に増加 vCPU 条件と Availability Zone を変え、3タスクずつ起動し、出現したCPUモデルをメモっていきました。ついでに軽量ベンチマークとして前回同様 OpenSSL speed をカマしておきました。 関係ないけどコンテナイメージは amazonlinux:2 です。では結果をどうぞ。 出現CPUモデル CPUアーキテクチャを選べるので、それぞれについて。 ECS Farg

                      続・AWS ECS Fargate のCPU性能と特徴 2023年版 | 外道父の匠
                    • 熟練技を完コピ 「大阪王将」が「炒め調理ロボット」導入

                        熟練技を完コピ 「大阪王将」が「炒め調理ロボット」導入
                      • 初めてでもできる! 自宅PCのGPUを「Google Colab」から使い、生成AIをカンタンに動かす方法【イニシャルB】

                          初めてでもできる! 自宅PCのGPUを「Google Colab」から使い、生成AIをカンタンに動かす方法【イニシャルB】
                        • 10倍高速に3Dモデル生成可能な「DreamGaussian」、ネット記事量産できる生成AI「InternLM-XComposer」など重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge

                          2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第14回目は、3Dモデル生成のための高速化手法、画像を含むネット記事を量産できる生成AIなど、5つの論文をまとめました。 生成AI論文ピックアップ画像1枚から高速で3Dモデルを生成「DreamGaussian」 バイドゥ含む研究者らが開発 OpenAI「CLIP」を真似て超えた、文章と画像を理解するオープンな手法「MetaCLIP」 Meta含む研究者らが開発 ネット記事を量産する生成AI「InternLM-XComposer」 一文入力だけで画像とテキストが混じった記事を自動生成 テキストから動画を効率よく高品質に生成する新モデル「Show-1」 シンガポールの研究

                            10倍高速に3Dモデル生成可能な「DreamGaussian」、ネット記事量産できる生成AI「InternLM-XComposer」など重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge
                          • 【開発者向け】Open Interpreterの使い方をコード付きで説明する(ターミナル編)|ニケちゃん

                            今回も導入方法などは説明しないので、まだ環境が用意できていない方は本家リポジトリのREADMEを参考にしてください。 オプション下記のコードを実行することで設定ファイルを開きます。これから説明するオプションは、このファイルかpythonコードに記載してください。 interpreter --config# config.yaml system_message: | You are Open Interpreter, a world-class programmer that can complete any goal by executing code. First, write a plan. **Always recap the plan between each code block** (you have extreme short-term memory loss, so you

                              【開発者向け】Open Interpreterの使い方をコード付きで説明する(ターミナル編)|ニケちゃん
                            • Pythonの麻雀ライブラリを作る - TadaoYamaokaの開発日記

                              以前より不完全情報のボードゲームで強化学習のアルゴリズムを試したいと思ってる。 簡単すぎるゲームやマイナーなゲームでは、開発のモチベーションが続かない気がするので、日本で人気のある麻雀AIを開発したいと考えている。 麻雀は、「Lucky J」や「Suphx 」で強化学習が試されており、人間の高段者くらいの強さになっている。 それらのAIで使われている手法を自分で実装してみて理解したいと思っている。 また、MuZeroのようなモデルベースの手法を麻雀AIで試してみたいと思っている。 Pythonライブラリ まず、Pythonで使える麻雀ライブラリを探したが、点数計算用のライブラリが見つかったが、1局通して対局できるライブラリが見つからなかったので、自分で作ることにした。 Python以外の言語向けのオープンソースのライブラリでは、対局までできるものが見つかったので、参考にして実装した。 以下

                                Pythonの麻雀ライブラリを作る - TadaoYamaokaの開発日記
                              • ロボットで稲作の働き方改革、作業時間わずか6%に | Forbes JAPAN 公式サイト(フォーブス ジャパン)

                                「雷鳥1号」という可愛らしい鳥型除草ロボットが印象的なスマート水田で稲刈りが行われた。1反あたりの収穫量は400キログラム。従来農法での全国平均は1反あたり530キログラムなのでやや少なめだが、当初から7割程度(370キログラム)を目標にしていたので大成功と言える。なにより驚きなのは、全部で29時間という労働時間だ。 ロボット開発企業テムザックは、耕作放棄地を活用し、ドローンやロボットを使って人手に頼らない「WORKROID(ワークロイド)農業」を提唱している。今年は宮崎県延岡市内の田んぼで稲作実験が行われ、初めての稲刈りが行われた。 5月、に水に浮かないよう鉄をコーティングした稲の種をドローンで水田に撒いたあと(田植えを行わない直まき方式)、田んぼの水位と水温はセンサーで監視して遠隔調整、雑草が生える季節には雷鳥1号が田んぼを泳いで除草を行った。これにより、従来農法では529時間にもなる

                                  ロボットで稲作の働き方改革、作業時間わずか6%に | Forbes JAPAN 公式サイト(フォーブス ジャパン)
                                • https://open_contents_datasets.gitlab.io/project_home/

                                  • GitHub - mckinsey/vizro: Vizro is a toolkit for creating modular data visualization applications.

                                    Rapidly self-serve the assembly of customized dashboards in minutes - without the need for advanced coding or design experience - to create flexible and scalable, Python enabled data visualization applications Use a few lines of simple configuration to create complex dashboards, which are automatically assembled utilizing libraries such as Plotly and Dash, with inbuilt coding and design best pract

                                      GitHub - mckinsey/vizro: Vizro is a toolkit for creating modular data visualization applications.
                                    • パトレイバー機体製作企画に対してゆうきまさみ氏が驚きの反応をしてファンがざわついた話…本人が報告「いいよと返事していた」

                                      ROBOT BASE @MOVeLOT Another experience company / 2023年2月設立/世界のロボットエンターテイメントをリードする /1000万人のロボットパイロットを生み出す! /機動警察パトレイバー製作中… ▽東京でアニメのような搭乗型ロボット体験ができる場所 / 搭乗型ロボットASTROへの試乗はこちらから▽ movelot.co.jp MOVeLOT.Inc @MOVeLOT 【重大発表】 新作アニメーション『パトレイバーEZY』の機体を製作します! ロボットアニメの機体を操縦する夢をカタチにします。 詳しくはこちらをご覧ください! prtimes.jp/main/html/rd/p… @PRTIMES_JPより 2023-09-30 18:08:06 リンク プレスリリース・ニュースリリース配信シェアNo.1|PR TIMES 【機動警察パトレイバ

                                        パトレイバー機体製作企画に対してゆうきまさみ氏が驚きの反応をしてファンがざわついた話…本人が報告「いいよと返事していた」
                                      • MySQLのインデックスですが、B-treeではなくB+treeを使用するのはどうしてなのでしょうか? | mond

                                        MySQLのインデックスですが、B-treeではなくB+treeを使用するのはどうしてなのでしょうか? 端的に言うと性能が良いからです。 これを理解するにはバッファプールへの理解が必要です。ディスク指向のデータベースの上では有限のメモリを最大限活用することでメモリに入り切らない巨大なデータ群に対して良好な参照性能を出す必要があります。バッファプールとはディスク上のデータの羅列を固定サイズのページ(InnoDBの場合16KB)の羅列であるとして読み書きに必要な分だけをメモリに移し取り複数の書き込みをできる限りメモリ内で受け止めて後でまとめてディスクに書き戻すという、ライトバック型のキャッシュのような機構です。 この中においてバッファプールは有限のサイズしか無いので適宜プール内のデータを書き戻して入れ替えながら上手くやっていく必要があります。 さてB+treeとB-treeの最大の違いは木のリ

                                          MySQLのインデックスですが、B-treeではなくB+treeを使用するのはどうしてなのでしょうか? | mond
                                        • Haskell は Rust になれるのか?──2023年の Linear Haskell 体験記

                                          追記:いくらなんでもあまりにも長いので、配列演算に焦点を絞ってより「Rustっぽさ」の気持ちを強調した姉妹編を書きました。手っ取り早く雰囲気を掴みたい方はこちらもどうぞ。 TL;DR GHC 9.0 から Haskell に入った線型型(Linear Types)の機能を一部割とガッツリ使ってみたので、Linear Haskell の現在の使い心地と将来の展望を報告するよ。 使おうと思えば使える段階にあるけれど、一部バグもあるし、まだ言語機能面で実装が追い付いていない部分もあって、快適に書けるようになるにはもうちょっと掛かるよ。それでも実用しようと思えばできるレベルにあるよ。 RustのようになるにはLinear Constraintsに期待。 更新履歴 2023/12/15 11:45 姉妹編へのリンク追加。 2023/10/01 12:30 線型性を納得してくれない場合の \eta-展

                                            Haskell は Rust になれるのか?──2023年の Linear Haskell 体験記
                                          • ニューヨーク・タイムズの訴訟でChatGPTが立往生の可能性(野口 悠紀雄) @gendai_biz

                                            ChatGPTの事前学習データの使用料をめぐって、ニューヨーク・タイムズがOpenAIを訴えました。これは、情報の価値がどのようにして生じるかという問題の基本に関わるものであり、生成AIの将来に大きな影響を与えます。しかし、簡単に答えが出るものではありません。 裁判の結果次第ではChatGPTが成り立たない 米紙ニューヨーク・タイムズは、ChatGPTの開発者であるOpenAIに対して、事前学習のデータの利用に関して支払いを求める訴訟を起こしました。 この問題は、「情報や知識に関する社会的制度をどう構築するか?」という問題の本質に関わっており、大変重要です。 最初にこれまでの経緯を見ると、ニューヨーク・タイムズはその記事を無断でAIの訓練に用いることを禁止しています。したがって、OpenAIが事前学習でニューヨーク・タイムスの記事を使っていないと証明できない限り、罰金を言い渡されることにな

                                              ニューヨーク・タイムズの訴訟でChatGPTが立往生の可能性(野口 悠紀雄) @gendai_biz
                                            • 「銀河漂流バイファム」オープニングの謎が解けた!

                                              「銀河漂流バイファム」のオープニングに、演出と思われるプログラムコードが描かれていますが その起源について調べてみたことをまとめます

                                                「銀河漂流バイファム」オープニングの謎が解けた!
                                              • 人が乗って操縦する「パトレイバー」開発へ ロボットベンチャーが発表

                                                ロボットベンチャーのMOVeLOT(東京都墨田区)は9月30日、アニメ「機動警察パトレイバー EZY(イジー)」に登場するロボット「イングラム」の開発を始めると発表した。人が搭乗し、操縦できる機体になるという。 公開時期など詳細は明らかにしていないが、開発の状況はX(旧Twitter)やInstagramの自社アカウントで随時公表する考え。2024年1月からは隔週で配信も行う。 開発中の機体を見学するツアーも計画。参加者はXやInstagramのフォロワーから抽選で選ぶという。「フォワードになれる体験を提供する」としている。 MOVeLOTは、エンターテインメントとして搭乗型ロボットを開発しているスタートアップ。8月に油圧式ロボット「EXA」の操縦を体験できる“パイロット証”(チケット)のクラウドファンディングを始めた他、イベントなどに向けて巨大ロボットを動かせる操縦席型のアトラクション設

                                                  人が乗って操縦する「パトレイバー」開発へ ロボットベンチャーが発表
                                                • コンピュータサイエンスで1冊ずつ本を上げるとしたら何になりますか?就職前にバイブル的な本を勉強したいと思いました。 -コンピュータアーキテクチャ -データベース -os -アルゴリズムとデータ構造 -セキュリティ -ネットワーク -プログラミング -仮想化技術 | mond

                                                  mondでこの質問への回答を読んでみましょう

                                                    コンピュータサイエンスで1冊ずつ本を上げるとしたら何になりますか?就職前にバイブル的な本を勉強したいと思いました。 -コンピュータアーキテクチャ -データベース -os -アルゴリズムとデータ構造 -セキュリティ -ネットワーク -プログラミング -仮想化技術 | mond
                                                  • 機動戦士ガンダムのミノフスキー粒子とベトナム戦争

                                                    機動戦士ガンダムのミノフスキー粒子とは、アニメ内に登場する設定だ。 ミノフスキー粒子は、レーダーなどを無効化する。 ゆえに戦争は遠距離攻撃ではなく、接近戦により行わなければならない。 これがその設定の骨子だ。 なぜ、このような設定が生まれたか? それは繰り返し様々な人により解説されている。 本来、レーダーや兵器が発展した未来では近接戦闘など行われるわけがない。 なぜなら遠距離からの攻撃で敵を破壊できるからだ。 機動戦士ガンダムが放映開始されたのは1979年だ。 当時はステルスの「ス」の字もなかった時代。 そのような状況ではレーダーに映らないという現実は存在しない。 しかし、それではロボットアニメに不可欠なロボット同士の接近戦が描けない。 従来のアニメとは一線を画すリアル志向を追求したガンダムにおいてそれはおざなりに出来る問題ではなかった。 そのことからミノフスキー粒子という疑似科学は発案さ

                                                      機動戦士ガンダムのミノフスキー粒子とベトナム戦争
                                                    • 【機動警察パトレイバー】_イングラム_を現実で搭乗/操縦できる機体の開発をスタートしたことをお知らせします。

                                                      世界一の搭乗型ロボット企業を目指すMOVeLOT.Inc(本社所在地:東京都墨田区 代表取締役:廣井 健人) は、現実世界でイングラムに搭乗/操縦できる機体の開発をスタートします。 機動警察パトレイバーEZYよりイングラム_モデル 1988年にプロジェクトを開始し、今年35周年を迎えた​「機動警察パトレイバー」シリーズ。 新作アニメ「機動警察パトレイバー EZY」の公開を控える中、現実で搭乗/操縦できるイングラムを開発し、『フォワードになれる体験』を提供します。 ※一般公開予定:2024年夏頃 イングラムの開発状況をお届け MOVeLOTのX(旧Twitter)及びInstagramのフォロワー(フォワード候補)の皆様に下記の特典をお渡しします。 ・開発状況の限定画像及び動画視聴 ・隔週に開発状況のオンライン配信(2024年1月から実施予定) ・開発見学ツアー参加権(抽選) X(旧Twit

                                                        【機動警察パトレイバー】_イングラム_を現実で搭乗/操縦できる機体の開発をスタートしたことをお知らせします。
                                                      • コンピュータサイエンスで1冊ずつ本を上げるとしたら何になりますか?就職前にバイブル的な本を勉強したいと思いました。 -コンピュータアーキテクチャ -データベース -os -アルゴリズムとデータ構造 -セキュリティ -ネットワーク -プログラミング -仮想化技術 | mond

                                                        大学の情報工学科に入学時に教科書として指定されたいわゆるパタへネを推します。 コンピュータの構成と設計 第5版 CPUの構造と基本は現代ではかなり複雑になりましたがこの本に書かれている基本を知っているかどうかで込み入った問題にぶち当たった場合の解像度が違います。 由緒正しいDBの読本というとオンラインで読めるRedbookとなりそうですがここは敢えて データ指向アプリケーションデザイン いわゆるイノシシ本を推します。名前からしてアプリケーションの話のように見えますし、分散システムに関する話が多いのですが最終章まで通して読むと「アプリケーションとデータベースの境界とは本来存在せず、入力されたデータを『いつ』『いかに』『安全に』加工・保存・出力するかがアプリケーションであり、その目的に対する最善手をフラットに考えるとある意味でアプリケーション全体が既にひとつのデータベースであってその仕事の一部

                                                          コンピュータサイエンスで1冊ずつ本を上げるとしたら何になりますか?就職前にバイブル的な本を勉強したいと思いました。 -コンピュータアーキテクチャ -データベース -os -アルゴリズムとデータ構造 -セキュリティ -ネットワーク -プログラミング -仮想化技術 | mond
                                                        • 天才プログラマだと言われる人が書くコードは、どんな観点が天才的なんでしょうか? | mond

                                                          天才プログラマと言われて頭に思い描く人物が複数いて、共通点が実はそんなに無いので共通点を洗い出すのはやめて「自分だったらできないだろうなぁ」という事例を思い出した順に列挙してみます。 しょぼそうな高速化がめちゃくちゃ刺さる凡人に理解できないような天才的なアルゴリズムを用いてめちゃくちゃ計算量を減らしている、なんてことは実はほぼ見かけなくて実際によくあるのがこのパターンです。賢いアルゴリズムというだけなら素養のある秀才ならなんだかんだ思いつくので個人的には天才とまでは感じません。 天才は「Aを受け取って計算してBを返す」みたいな一見平凡な処理に対し「Aの配列を受け取って結果をBの配列にして返す」みたいな誰でも思いつくようなしょぼそうな効率化を行って途方もない効率化を果たします。もちろん凡人が任意の場所でそういう細かい最適化を入れて同様の効率化が再現されるわけではないのですが、天才はただのバッ

                                                            天才プログラマだと言われる人が書くコードは、どんな観点が天才的なんでしょうか? | mond
                                                          • 入門 B-link tree

                                                            概要 DBMS で広く利用されている B+ tree には様々な variant が存在するが、B-link tree もその1つ。 シンプルなラッチプロトコルで並行アクセスをさばけるよう、リーフノード以外のノードにも右の隣接ノードへのポインタを持たせた構造となっており、PostgreSQL で使われていることでも有名。 この記事では主にこの B-link tree に焦点を当てる。 B+ tree 全般やその他インデックス技術自体に興味がある場合は「最強DB講義 #10 いまどきのデータベース索引技術(石川佳治 教授)」の講義資料を読むのがおすすめ。 B-link tree 理解する上で必須な知識「ラッチ」 「ラッチ」というのはいわゆるロックのことだが、DB においては「ロック」というとトランザクション分離のための高価な(数千CPUサイクルを要する)処理を指すことが多く、「ラッチ」という

                                                              入門 B-link tree
                                                            • ChatGPTの10ヶ月と開発トレンドの現在地

                                                              9/28の #日本CTO協会 さんのイベントで登壇した資料を公開しました。 「ChatGPTの10ヶ月と開発トレンドの現在地」 開発のトレンドの最新情報をざっくり纏めています。 ・Prompt Engineering開発の現在地 ・RAG開発の現在地 ・Plugin開発の現在地 ・GPT-Vの登場と生成AI時代のこれからについて やや開発者寄りな内容なので、基礎を知りたい場合はAzure OpenAI大全も併せてご確認を。 (こっちも近々最新化します…) https://speakerdeck.com/hirosatogamo/chatgpt-azure-openai-da-quan

                                                                ChatGPTの10ヶ月と開発トレンドの現在地
                                                              • Two-Towerモデルと近似最近傍探索による候補生成ロジックの導入

                                                                はじめに こんにちは。Kagglerの 中間 と 若月 です。業務では主に人材領域でのレコメンドシステムの改善に取り組んでいます。 この記事では、レコメンドシステムにTwo-Towerモデルと近似最近傍探索による候補生成ロジックを導入することで、精度とコストを改善することに成功したので、その取り組みについて紹介します。 背景 導入したロジックについて説明する前に、まず既存のレコメンドシステムについて簡単に説明します。 既存のレコメンドシステムでは、ユーザとアイテムについてルールベースによる候補生成を行った後、機械学習モデルを用いてスコアを付与し、スコア順にユーザに推薦するアイテムを選択していました。 しかし、ルールベースによる候補生成はベースラインとしてはよいものの、性能改善には限界があり、ルールベースが複雑になればなるほど計算コストもかかるようになっていきます。 そこで、性能改善がしやす

                                                                  Two-Towerモデルと近似最近傍探索による候補生成ロジックの導入
                                                                • GPT-4などのLLMに「自らの論理的な整合性をチェック」させるフレームワーク『LogiCoT』と実行プロンプト | AIDB

                                                                  関連研究 LLMの出力から誤り(ハルシネーション)を減らす新手法『CoVe(Chain-of-Verification)』と実行プロンプト 推論能力をさらに強める戦略『AoT』で、LLMが「直感」に似た能力を示すようになった メタ認知をさせてLLMの能力を上げる手法「メタ認知プロンプティング」 従来の課題と背景 LLMの推論能力の限界 大規模言語モデル(LLM)は、短い質問や単純なタスクに対してはゼロショットで高い性能を発揮しますが、ステップバイステップの推論が必要な長い質問や複雑なタスクに対しては、通常はその性能に限界があります。複数の前提条件や仮定に基づいて論理的に推論する必要がある場合、LLMはしばしば不正確な結論に至ることがあります。 CoTフレームワークの限界と利点 Chain-of-Thought(CoT)フレームワークは、このような複雑な問題に対する一つの解決策として提案され

                                                                    GPT-4などのLLMに「自らの論理的な整合性をチェック」させるフレームワーク『LogiCoT』と実行プロンプト | AIDB
                                                                  • AMDの最優先事項は「ROCm(Radeon Open Compute platform)」の発展だとAMD幹部が明言、オープンソースのプログラミング言語「Triton」の採用でNVIDIAに反撃へ

                                                                    アメリカの半導体メーカー「AMD」はCPUシリーズの「Ryzen」やGPUシリーズ「Radeon」の開発や製造を行っています。そんなAMDは自社の最優先事項について、「機械学習向けGPU環境やプラットフォームのROCmがAMDにおける最も優先度が高い事業です」と述べています。 ROCm Is AMD’s No. 1 Priority, Exec Says - EE Times https://www.eetimes.com/rocm-is-amds-no-1-priority-exec-says/ これまでAMDのROCmは、競合企業であるNVIDIAのGPU向けソフトウェア「CUDA」に大きな遅れを取っていたとのこと。そこで、AMDでは2022年からROCmの開発をAMD内における最優先事項に設定し、AMDがこれまで培ってきたソフトウェア開発などのノウハウを詰め込んだ新しい組織を立ち上げ

                                                                      AMDの最優先事項は「ROCm(Radeon Open Compute platform)」の発展だとAMD幹部が明言、オープンソースのプログラミング言語「Triton」の採用でNVIDIAに反撃へ
                                                                    • 【AIアニメ】ComfyUIでAnimateDiffをはじめよう!|Baku

                                                                      ※当noteで掲載しているワークフローについては各記事公開時点のComfyUI環境で動作を確認しています。その後のComfyUI/カスタムノードのアップデートにより最新の環境では不具合が生じる可能性があるので、あらかじめご了承ください。 このnoteは、いま注目されているAI動画生成ツール「AnimateDiff」のハウツーをまとめた初心者ガイドです。 「AnimateDiff」は2023年7月に公開されたオープンソースの技術で、誰でも無償で利用することができます。AnimateDiffについては以下の記事が参考になります。 導入編1. ComfyUI のすすめ「AnimateDiff」は、単体では細かなコントロールが難しいため、現時点では以下のパッケージのどれかを選んで使うことが多いです。 AnimateDiff-CLI-Prompt-Travel コマンドラインでAnimateDiff

                                                                        【AIアニメ】ComfyUIでAnimateDiffをはじめよう!|Baku
                                                                      • SSH keys stolen by stream of malicious PyPI and npm packages

                                                                        A stream of malicious npm and PyPi packages have been found stealing a wide range of sensitive data from software developers on the platforms. The campaign started on September 12, 2023, and was first discovered by Sonatype, whose analysts unearthed 14 malicious packages on npm. Phylum reports that after a brief operational hiatus on September 16 and 17, the attack has resumed and expanded to the

                                                                          SSH keys stolen by stream of malicious PyPI and npm packages
                                                                        • ついに音声対話できるようになった ChatGPT が引くほど自然でなんか凄いし怖い「もうこれ人間じゃん!」

                                                                          チキン@ライター @HeroofChickens フリーランスのライター4年目。リストラがきっかけ。Kindle出版1位、Kindleプロデュースで1位・ベストセラー取得。商業出版のブックライティング中(2024年の5月ごろ出版かな?) webwhiter-skill.com/job/

                                                                            ついに音声対話できるようになった ChatGPT が引くほど自然でなんか凄いし怖い「もうこれ人間じゃん!」
                                                                          • AIを語りたいなら最低限Pythonをやるべき。足し算より簡単なんだから|shi3z

                                                                            昨日は新潟県長岡市に行って、市役所の職員向けと、一般向けに二回の講演を行った。 市役所の職員からの質問事項をよく読むと、ChatGPTを闇雲に何にでも使おうとして苦戦している姿が見てとれた。 たとえばこんな感じだ。 ⚪︎時に東京駅につく新幹線を予約したいとChatGPTに言ったが、公式サイトをチェックしろと言われた 我々からすればその回答は当たり前なのだが、闇雲になんでもChatGPTでやろうとするとこうなってしまうという典型的な例だった。当たり前だが、その目的ならえきねっと一択だ。 ChatGPTには限界がある。しかも低い。 だから通常はPluginと組み合わせたり、プログラムから呼び出したりするという「工夫」が必要になる。 GPTを使うプログラムを書くのはものすごく簡単だ。 たぶんプログラムの世界でも最も簡単な部類だろう。 たとえば僕がプログラムでGPTを使おうかなと思った時、こんなふ

                                                                              AIを語りたいなら最低限Pythonをやるべき。足し算より簡単なんだから|shi3z
                                                                            • 「ChatGPT」がインターネットから直接知識を得るように ~近日中に全ユーザーに解放/まずはPlus/Enterpriseを対象に正式提供開始

                                                                                「ChatGPT」がインターネットから直接知識を得るように ~近日中に全ユーザーに解放/まずはPlus/Enterpriseを対象に正式提供開始
                                                                              • CSSはこんなにも進化していたのか! CSSのかなり高度なテクニック -Expert CSS: The CPU Hack

                                                                                当ブログの記事でも、JavaScriptで実装していたのがCSSで実装できるようになりました、と今までにいくつか紹介してきましたが、今回紹介するのはそれらとはかなり異なるCSSのかなり高度なテクニックです。 CSSでCPUのようにデータを継続的に解析し、状態を再評価します。簡単に言うと、スクリーンの高さや幅を取得したり、マウスの座標を取得したり、さらにはブロック崩しなどのゲームもCSSのみで実装できます。 もう私が知っているCSSをはるかに超えたCSSです。 Expert CSS: The CPU Hack br Jane Ori (@Jane0ri) 下記は各ポイントを意訳したものです。 ※当ブログでの翻訳記事は、元サイト様にライセンスを得て翻訳しています。 CSSのエキスパート: The CPU Hack 5つの観測可能性 The CPU Hackの始まり The CPU Hack 終

                                                                                  CSSはこんなにも進化していたのか! CSSのかなり高度なテクニック -Expert CSS: The CPU Hack
                                                                                • 日英2言語対応の大規模言語モデルPLaMo-13Bを研究・商用利用可能なオープンソースソフトウェアライセンスで公開 - 株式会社Preferred Networks

                                                                                  株式会社Preferred Networks(本社:東京都千代田区、代表取締役 最高経営責任者:西川徹、以下、PFN)は、開発した130億パラメータの事前学習済み大規模言語モデル PLaMo™-13B(Preferred Language Model、プラモ)を、研究・商用で利用可能なオープンソースソフトウェア(OSS)ライセンスで本日公開(https://huggingface.co/pfnet/plamo-13b)しました。本モデルは、現在公開されている同規模のパラメータ数の事前学習済み言語モデルと比べ、大規模言語モデルのベンチマーク評価(lm-evaluation-harness)において、日英2言語をあわせた能力で世界トップレベルの高い性能を示しています。 日英2言語での性能比較 (ベンチマークスコアの偏差値の平均を各言語のスコアとしてプロット) (*) より正しい比較のため、公開

                                                                                    日英2言語対応の大規模言語モデルPLaMo-13Bを研究・商用利用可能なオープンソースソフトウェアライセンスで公開 - 株式会社Preferred Networks