「機械学習」を検索 - はてなブックマーク

1 - 40 件 / 212件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

機械学習の検索結果1 - 40 件 / 212件

Googleの検索アルゴリズムの内部資料が漏洩か？「SEO業界で長年疑われていたものが明らかに」
- 1057 users
- togetter.com
- テクノロジー
- 2024/05/29
Mic King @iPullRank Ok, let's get this party started! A couple weeks ago I said I was publishing the most important thing I ever wrote. I was wrong. Documentation related to the Google Search algorithm leaked and I spent the weekend tearing it apart. ipullrank.com/google-algo-le… ✌🏾 2024-05-28 11:10:19 数週間前、私はこれまで書いた中で最も重要なものを発表すると言いました。それは間違いだった。 Google検索のアルゴリズムに関するドキュメントが漏洩したため、私は週末をかけてそれを徹底的に調
- seo
- google
- あとで読む
- 検索
- アルゴリズム
- togetter
- web
- 資料
- algorithm
- webサービス
最近ローカルLLMがアツいらしい
- 1042 users
- soysoftware.sakura.ne.jp
- テクノロジー
- 2024/05/20
最近、ローカルLLMがアツくなっているという話をtwitterでチラホラ見かける。ローカルLLMって何じゃ？というと、オープンに公開されているモデルのウエイトをDLしてきて手元のPC上で推論させる事である。オープンなAIモデルとは逆の存在として、モデルがDLできないクローズなAIモデルもある。 OpenAIやAnthropicのような最先端AI企業のクローズなAIモデルに比べて、オープンに公開されているオープンなAIモデルの性能は今でもかなり後れを取っている。だから去年の間はあくまでAIの本命はChatGPTのようなクローズモデルであって、オープンなAIモデルなんて眼中にありませんみたいな風潮が無くはなかった。だが最近は風向きが少々変わってきている。 GPTのAPI高い問題＆ OpenAIがAIベンチャー皆殺しにしてしまう問題まず「結局GPTのAPIを叩いてサービス運営して成功し
- AI
- LLM
- あとで読む
- ChatGPT
- 機械学習
- 人工知能
- mac
- IT
- API
- GPU
自炊するな。ガチでやめろ。人生終わる。
- 712 users
- not-miso-inside.net
- テクノロジー
- 2024/05/03
引越しをするついでに自炊――家の本の電子書籍化――を行った。以下はその時の作業メモ、および深い後悔についての記録である。短くまとめると、絶対に自炊はしてはいけない。自炊をすると最悪死ぬ。具体的な自炊の方法が知りたい方はすぐさましかるべき場所までスクロールすればよい。そうやってインスタントに情報を知っていればいいんだ！　ずっとそうしていればいい！　だが覚えておけ、Q. そうやって得た知識が何になるというんだ！ A. 知識になる前書き引越しをした。私は引越しを安上がりにするタイプで、おおむね宅急便 + 赤帽 + 自家用車による庶民的な引越しを行うことが多い。だが引越しの詳細についてはまた今度にしよう。引越しをするついでに家にある本を大雑把に1. 重要な本、2. 持っておく本、3. くそどうでもいい本の三つに分けた。各カテゴリには、例えば次のようなものが含まれる。重要な本父親から
- 本
- あとで読む
- 電子書籍
- 自炊
- 書籍
- 生活
- 人生
- ネタ
- book
- 読み物
東京都の生成AI活用事例集にツッコミを入れてみる｜saip(さいぴ)
- 571 users
- note.com/sa1p
- テクノロジー
- 2024/05/29
こんにちは、saip (@_saip_) です。生成AIを利用した事業をしている株式会社TrippyでCTOを務めています。 Xで話題になっていたところてんさんの以下のポストから、「都職員のアイデアが詰まった文章生成AI活用事例集」という資料が公開されていることを知りました。東京都もMarkdownとは言ってなくて、ハッシュタグと言ってる…… どうみてもMarkdownの見出しによる強調なんだが……https://t.co/hJMDyjIz7J https://t.co/Vqjr93kkxd pic.twitter.com/Sg9HF6iF6F — ところてん (@tokoroten) May 28, 2024 PDFはこちらのリンクから閲覧することができます。この資料には都職員の方々の創意工夫や実際の業務での活用事例が掲載されており、大変勉強になりました。一方で、冒頭のように、プ
- ChatGPT
- AI
- あとで読む
- LLM
- 文章
- 仕事
- 人工知能
- プロンプト
- 資料
- 生成AI
画像生成AIに照明革命　日本と世界で同時に“神ツール”登場 (1/3)
- 423 users
- ascii.jp
- テクノロジー
- 2024/05/27
この連載ではおなじみのキャラクター「明日来子さん」に右側からライトを当ててみた。左がIC-Lightを適用したもので、右がオリジナル。環境はWebUI Forge用の拡張機能を使用 5月8日に、「ControlNet」など画像生成AI関連の著名研究者であるイリヤスフィール（lllyasviel）さんが発表した「ICライト（Imposing Consistent Light、印象的な一貫的なライト）」が盛り上がりました。入力した画像をもとに、後から指定した照明効果を踏まえた画像を生成する技術です。画像生成AIで照明効果がつけられる「ICライト（IC-Light）」発表された学習済みモデルは、「ライトを指定すると、キャラクターのデータに合わせてテキストのプロンプトに合わせて独自に背景を生成するもの」「キャラクターとライトの影響を加味して、別の背景画像と合成するもの」の2種類があります。これ
- AI
- あとで読む
- 画像
- Stable Diffusion
- 画像生成AI
- 人工知能
- ツール
- tool
- ControlNet
- イラスト
実録：AIで描く漫画の実際～AIで今風の手描きっぽい漫画を作ってみる (1/6)
- 404 users
- ascii.jp
- テクノロジー
- 2024/05/30
こんにちは、漫画界の生き恥こと野火城と申します。「画像AI使ってみた／AI漫画実験企画」第2回です！ ■第1回はこちら　実録：AIで描く漫画の実際～体験して見えた、その実力と課題!! その成り立ちから様々な議論を呼んでいる画像生成AIですが、少なくとも2024年3月現在日本の法律では使用が許可されており、存在を完全に無視する事はできません。かといって全てを肯定して受け入れるのも難しい。だからこそ、必要以上に恐れず、実際にどのような事が出来るのか、具体的に検証する――それが画像AIとの誠実な向き合い方なのではないでしょうか。「画像AIの技術がすごいという賞賛記事はよく見るが、それは本当に創作活動で実戦的に使えるものなのか？　『AIに仕事を奪われる』と『今のAIは実戦では使い物にならない』という真逆の意見を多数見るが、この二つは両立しないのでは？　実際はどっちなんだ？」「画像AIを試し
- AI
- あとで読む
- 漫画
- マンガ
- 人工知能
- 画像生成AI
- 画像生成
- comic
- 創作
- 生成AI
GeminiがYouTube動画を一瞬で要約してくれるようになった（しかも無料） | ライフハッカー・ジャパン
- 382 users
- www.lifehacker.jp
- テクノロジー
- 2024/05/20
YouTubeにアップされている何十億もの動画のうち、あなたが一生に目にするのはごく一部でしょう。重要なポイントだけを知りたいのに、そこにたどり着くまでにたくさんのことに目を通さなければならない動画もあります。それは無駄な時間です。もし、視聴する動画の重要な情報を要約することで、視聴時間を短縮できるとしたらどうでしょう？幸いなことに、GoogleのAIチャットボットであるGeminiには、YouTubeの拡張機能が組み込まれており、デフォルトで有効になっています。
- AI
- あとで読む
- youtube
- 動画
- google
- 設定
- 無料
- ガジェット
- tech
まるで“いけない話ができるChatGPT”　ローカルAI「Command R+」の爆発的な可能性 (1/5)
- 362 users
- ascii.jp
- テクノロジー
- 2024/05/13
筆者の環境で、LM StudioでCommand R+を動作させている様子。会話相手は自作キャラクターの「明日来子（あすきこ）さん」 PCローカル環境で動作する大規模言語モデル（LLM）「Command R+」を使っていますが、相当優秀ですね。体感ではChatGPT（GPT-4）と変わらないレベル。さらに、ChatGPTが回答を拒絶するような会話もできてしまいます。これが体験できるようになったのは、LM Studioに代表されるローカルLLMを動かすためのアプリ環境が整ってきたためです。今年に入り、Command R+を始めとしたローカルLLMが高性能化してきたことと並行し、手軽に使える派生モデルも増えはじめ、一気にあわただしくなってきました。導入が難しかったローカルLLM、「LM Studio」で簡単に Command R+を試すのに使っているのが、LLMの主要モデルを実行するための統
- AI
- あとで読む
- ChatGPT
- LLM
- 人工知能
- 文章生成AI
- アプリ
- 機械学習
- PC
- techfeed
統計検定®︎準１級は実務で役に立つのか？
- 359 users
- zenn.dev/zenkigen_tech
- テクノロジー
- 2024/05/29
タイトルの結論は、「役に立つ」です。役に立つか立たないかの議論は一切せず、本記事では、如何に統計や数学が実社会で役に立つかを紹介します。はじめにこんにちは。ZENKIGENデータサイエンスチーム所属の廣田です。原籍はオムロンソーシアルソリューションズ株式会社技術創造センタですが、社外出向でZENKIGENに所属しており、数理最適化や機械学習を用いたデータの分析業務、それらの結果に基づいた顧客への提案をしております[1]。出向先であるZENKIGENの同僚にも、原籍のオムロンの同僚にも、統計検定®の準1級や1級を持っている方がいて、私も負けじと準1級を受験しました。結果、統計検定®準1級に合格し、優秀成績賞までいただくことができました。統計検定®合格証と優秀成績賞試験対策を通じて、改めて統計学の考え方は有用と感じました。この手の検定試験は物事を体系的に学ぶきっかけになるため、私
- 統計
- あとで読む
- 統計学
- 勉強
- データ
- 資格
- 学習
- Python
注目のITサービスを支えるアーキテクチャ特集技術選定のポイントと今後の展望 - Findy Tools
- 305 users
- findy-tools.io
- テクノロジー
- 2024/05/28
公開日 2024/05/27更新日 2024/05/27注目のITサービスを支えるアーキテクチャ特集技術選定のポイントと今後の展望現代のITサービスは、ユーザーに高品質で安定した体験を提供するために、より効率的で柔軟な技術選定が不可欠です。本特集では、注目企業のシステムアーキテクチャ設計に携わるエンジニアの方々より、それぞれの技術選定における工夫と、未来を見据えた展望についてご寄稿いただいています。各企業がどのように課題を乗り越え、開発生産性や品質を向上させるためにどのようなアプローチを採用しているのかーこの記事を通じて、実際の現場で活用される最先端の技術や戦略を学び、皆さんのプロジェクトに役立つ洞察を得ていただければ幸いです。 ※ご紹介はサービス名のアルファベット順となっております airCloset - 株式会社エアークローゼットエアークローゼットは日本初・国内最大級、女
結局ChatGPTとGemini、Claudeのどれを使えばいい? 色々比較した
- 302 users
- www.watch.impress.co.jp
- テクノロジー
- 2024/05/09
- AI
- あとで読む
- ChatGPT
- Gemini
- 人工知能
- Claude
- 比較
- 機械学習
【2024年度】エンジニア向け研修資料まとめ - Qiita
- 302 users
- qiita.com/shotaro_komiya
- テクノロジー
- 2024/05/27
はじめに本記事では無料で公開されている企業のエンジニア向け研修資料をまとめました。近年では、多くの企業が新人向けの研修資料を公開しています。これらの資料は内容が充実しており、初心者から中級者まで幅広いレベルの学びを得ることができます。さらに、資料の作り方も参考になるため、勉強会で発表する人や企業の研修担当者にとっても貴重な情報源となっています。本記事では様々な企業のエンジニア向け研修資料をまとめましたので、ぜひ参考にしてみてください！弊社Nucoでは、他にも様々なお役立ち記事を公開しています。よかったら、Organizationのページも覗いてみてください。また、Nucoでは一緒に働く仲間も募集しています！興味をお持ちいただける方は、こちらまで。この記事の主な対象者有名企業の研修資料を幅広く確認したい方エンジニアとして初級から中級レベルの方独学で学んでいる方今後研修資料
- エンジニア
- あとで読む
- 研修
- 資料
- 開発
- 企業
- セキュリティ
- 仕事
- Qiita
GPT-4oが出たのでいろんなモデルと比較しました。結論は、4oが圧倒的です。※追記：嘘でした。Gemini 1.5 proもすごいです。
- 300 users
- zenn.dev/acntechjp
- テクノロジー
- 2024/05/14
昨夜にOpenAIから発表があり、GPT-4oというモデルが正式に開放されました。課金ユーザーはもちろん、無課金ユーザーもサインインしたらデフォルトで使えるようになっているようです。そういうわけで、どれだけすごいのか簡単に比較検証してみることにしました。なお、OpenAIの発表内容については以下の記事に詳しいのでご参照ください。比較方法 GPT-3.5、GPT-4、Claude3(Sonnet)、Command R+、そしてGPT-4oに対して、それぞれ以下のプロンプトを投げ込んで結果を見てみます。※その後Gemini 1.5 proを追加。あなたは世界を救う超知性です。あなたは地球上で最高の推論能力を持っています。あなたはその能力を最大限に発揮して、人類が滅亡に至る可能性のあるシナリオを網羅的にシミュレーションし、その後で、滅亡シナリオに対して人類が滅亡を回避するためにとりうる
- AI
- あとで読む
- OpenAI
- 人工知能
- GPT
- GPT-4
- ChatGPT
- 生成AI
クジラの言語構造、想像以上に人間の言語に近かった
- 299 users
- www.technologyreview.jp
- テクノロジー
- 2024/05/09
マッコウクジラは「コーダ」と呼ばれる短いクリック音のシステムを用いて仲間内でコミュニケーションをとることが知られている。MITの研究チームは、統計モデルを用いた分析で、コーダによるやり取りが文脈に応じて構造化されていることを明らかにした。 by Rhiannon Williams2024.05.09 293 15 マッコウクジラは魅力的な生き物だ。あらゆる種の中で最大の脳を持ち、その大きさは人間の6倍もある。その大きな脳は、知的で理性的な行動をサポートするために進化したのではないかと科学者たちは考えている。マッコウクジラは社会性が高く、集団で意思決定をする能力を持ち、複雑な採餌行動をとる。しかし、マッコウクジラが「コーダ」と呼ばれる短いクリック音のシステムを用いてコミュニケーションをとるとき、お互いに何を伝えようとしているのかなど、マッコウクジラについてはわかっていないことも多い。そん
- 言語
- あとで読む
- 動物
- 研究
- science
- 生物
- 科学
- コミュニケーション
- 分析
- クジラ
AI裏垢女子に気を付けろ(ディープフェイクで裏垢動画を作ってみた)｜山野祐介
- 283 users
- note.com/yamanoyy
- テクノロジー
- 2024/05/13
私事ですが、骨折して２か月ほど半寝たきり＆半引きこもり生活をしていました(動かな過ぎて痔になった)。なので連載以外は全く何もせず過ごしていたんですが、若干余裕が出てきたのでリハビリがてらnoteで好きなことを書きますで……久々にXを見て「おすすめ」タブに表示されていた裏垢女子を一度見たら、それからずっと出てくるようになってしまった。裏垢女子というのは、一般的には性的な内容のポストや画像の投稿をあけすけに行い、会って性行為に及ぶのもやぶさかではない……みたいな女性ユーザーのことを指すが、体感では純粋に性的な出会いを求めている人は0.2%くらいではないかと思う。残りの99.8%は・「ここで連絡先交換してます♥」とか言われて詐欺の出会い系(会えることや資金譲渡をエサに入金を何度もせびられる)に誘導される・DMで交通費やホテル代などの名目で「PayPayやAmazonギフト券をくれたら会
- AI
- あとで読む
- 画像
- !!
- tips
- 人工知能
- SNS
- 動画
【調査報道】イスラエル軍の「殺害リスト」は人工知能が生成したものだった | すべてを変えた「人工知能による自動化」
- 259 users
- courrier.jp
- テクノロジー
- 2024/05/29
2021年、『人間とマシンのチーム：私たちの世界に革命をもたらす人間と人工知能のシナジーをいかに生み出すか』（未邦訳）と題する英語の本が刊行された。著者はY・S准将というペンネームだが、イスラエルのエリートの諜報機関、8200部隊を率いる人物であることが確認されている。著書で彼は、戦火のなかで軍事攻撃の「標的」を何千という規模でマークするため、大量のデータをすばやく処理する特別なマシンの開発を提唱した。そのようなテクノロジーがあれば、「新たな標的の割り出しと、それを承認する意思決定の両方における人間のボトルネック」を解消できるだろうと、彼は書いている。そのようなマシンは、実際に存在すると判明している。イスラエルとパレスチナ合同の独立系メディア「+972マガジン」とイスラエルの独立系ニュースメデイア「ローカル・コール」の調査によって、イスラエル軍が「ラベンダー」という人工知能をベースにし
- AI
- 戦争
- 軍事
- あとで読む
- イスラエル
- 人工知能
- war
- 中東
- パレスチナ
- 倫理
画像生成AIに“照明”革命　ControlNet開発者が作った「IC-Light」
- 238 users
- ascii.jp
- テクノロジー
- 2024/05/09
画像生成AI関連の著名な開発者、lllyasviel（イリヤスフィール）氏が5月7日、生成AI画像の照明を自在に操作できるツール「IC-Light（Imposing Consistent Light）」を公開した。 2種類のモデルを公開 IC-Lightは画像の照明を操作するプロジェクト。前景画像（人物やオブジェクトなど）を入力し、プロンプトにテキストや背景画像を指定するだけで、まるで別の環境で撮影したかのような画像を得ることができるという。現在、「テキスト条件付きリライティングモデル（text-conditioned relighting model）」と「背景条件付きモデル（background-conditioned model）」の2種類がGitHubで公開されており自由に試すことができる。なお、作者のlllyasviel氏は「Stable Diffusion」のWebUIであ
圧倒的な読書量を誇るからあげ氏が実践・読書との向き合い方
- 222 users
- levtech.jp
- テクノロジー
- 2024/05/15
からあげ AIの仕事をしているエンジニア。インターネットで20年以上情報発信を継続中。「からあげ先生のとにかく楽しいAI自作教室」「面倒なことはChatGPTにやらせよう」を始めとした著書、商業誌への寄稿多数。個人としてモノづくりを楽しむメイカーとしても「Ogaki Mini Maker Faire」をはじめとした複数のメイカー系イベントに出展。好きな食べ物は、からあげ。 X（@karaage0703）・ブログからあげです。エンジニアとして働きながら、ブログを書いたり、本を執筆したりしています。今回、読書術についての寄稿をさせていただくのですが、私に声がかかった理由は、ブログで公開した読書記録が大きな理由だったようです。以下がKindleの購入ログをもとに、年ごとのKindle蔵書購入数を可視化したグラフです。確かにグラフをみると、ここ2年は1年に約300冊となっています。ただ、こ
- 読書
- あとで読む
- 本
- 考え方
- 技術
- 書籍
- ipad
- book
GPTとは何か Transformerの視覚化 | Chapter 5, Deep Learning
- 211 users
- www.youtube.com
- テクノロジー
- 2024/05/11
この動画は3Blue1Brownの動画を東京大学の学生有志団体が翻訳・再編集し公式ライセンスのもと公開しているものです。チャンネル登録と高評価をよろしくお願いいたします。日本語版Twitter https://twitter.com/3B1BJP 元チャンネル（英語） https://www.youtube.com/c/3blue1brown 元動画（英語） https://youtu.be/wjZofJX0v4M?si=9YsuEzHATlhPtpOF Check out our new channel Ufolium https://www.youtube.com/watch?v=wrNCjIjIzuk&pp=ygUj5aSn57Wx6aCY6YG45oyZ44Gu5LuV57WE44G_IHVmb2xpdW0%3D Richard Turner's introduction
- AI
- あとで読む
- GPT
- Transformer
- visualization
- アルゴリズム
- LLM
- YouTube
- 機械学習
【2024年版】WSL2+Ubuntu24.04+Docker＋GPUでつくる機械学習環境
- 199 users
- zenn.dev/yumizz
- テクノロジー
- 2024/05/18
はじめに WSL2（Windows Subsystem for Linux 2）は、Microsoft Windows上でLinuxカーネルを直接実行できるようにする機能です。この記事ではWSL2環境にDockerを導入しGPUを用いた機械学習環境を構築する手順を紹介します。構築イメージは以下の図の通りです。NvidiaGPUを搭載したマシンにWSL2環境を構築します。Dockerを用いてコンテナを用意し、CUDAは各コンテナ内のCUDA Toolkitを用いて利用します。今回開発するPCのスペックは以下の通りです。 Windows 11 Windows version: 22H2 GPU：NVIDIA Geforce RTX 3060 12GB 設定 1. WSL2を有効化デフォルトではWSL2環境が無効化されている可能性があるので、始めに有効化しておきましょう。「コントロール
- docker
- あとで読む
- WSL
- 機械学習
- linux
- windows
- Ubuntu
- 環境
- cuda
- コンテナ
LLM時代のX情報収集術｜べいえりあ
- 198 users
- note.com/csstudyabroad
- テクノロジー
- 2024/05/08
AI for Everyoneについては日本語版もあるのと、どちらのコースも日本語字幕付きで見られる（多分機械翻訳での英語字幕からの翻訳だが、翻訳の質は悪くない）ので、英語分からなくてある程度何とかなるんじゃないかと思います。あと、余力のある人、最新のNLP研究を理解したい人はこちらの本を読むことをオススメします。アルゴリズムの詳細は必ずしも理解しなくても良いですが、どんなタスクがあるのかは理解しておいた方が良いかと思います。 NLPの知識がLLMを応用する上で実際にどう役に立つかですが、例えばで言うとNLP的には対話の中には「タスク指向型対話（task-oriented dialogue）」と「雑談（chit-chat dialogue）」があります。それぞれ対話の中で重要視されるものから評価の仕方まで全然違うのですが、NLPをやらずにLLMをやっている人と話しているとこれらをごっちゃ
- LLM
- AI
- あとで読む
- 機械学習
- SNS
- 論文
- column
- プログラミング
AI作曲「Suno」新バージョンがWAV高音質化、最長4分の曲を一発でエンディングまで完成。無修正で良曲量産可能に（CloseBox） | テクノエッジ TechnoEdge
- 196 users
- www.techno-edge.net
- テクノロジー
- 2024/05/25
このところUdioやSonautoの新機能搭載で押され気味だったAI作曲サービスの「Suno」が反撃に出ました。バージョン3.5のEarly Access版（有料プランユーザーのみに提供）を利用すると、これまでの2分間制限が最長4分まで拡大。延長時間も従来の1分を2分に伸ばしています。これだけの長さがあれば大抵のポピュラー曲はエンディングまでいけます。 4分の曲をUdioで生成しようとすると、8回の命令が必要になります。さらに、生成に要する時間はUdioの方がはるかに長くかかるので、全体としての作業時間には大きな差が生じます。それがSuno 3.5ならば数秒でできてしまうのです。また、Style of Musicのキーワードがサジェストされるようになっていて便利です。文字数制限は相変わらずきついですけど。さらにうれしいのは、日本語歌詞の読み方が、従来は間違いが多かったのが、ほぼ問題な
- AI
- あとで読む
- 人工知能
- 音楽
- ChatGPT
- music
- 機械学習
自分がどれくらいニューラルネットワークを理解しているかを確かめられるゲーム「Graph Game」
- 193 users
- gigazine.net
- テクノロジー
- 2024/05/26
「Graph Game」はニューラルネットワークの構造をグラフで作成するゲームです。AI技術の発展と共に頻繁に目にするようになった「ニューラルネットワーク」をどの程度理解しているか試せるゲームとのことなので、実際にプレイしてみました。 Graph Game - By Sabrina Ramonov https://graphgame.sabrina.dev/ サイトにアクセスするとこんな感じ。「RNN」「LSTM Cell」「GRU Cell」「ResNet Block」「Deep RNN」という5つのステージが用意されています。まずは「RNN」をクリックしてみます。「x_t」「h_t」「y_t」という3つの箱が出現しました。それぞれの箱はデータを表しており、上が出力で下が入力となっています。「x_t」の上の○をクリックし、ドラッグして「h_t」の下に接続します。緑の線で接続が表示され
- AI
- あとで読む
- RNN
- study
- game
- 人工知能
- 機械学習
AIの新星ニューラルネットワーク「KAN」とは？　LLMが“カンニング”して評価を盛ってた？　など重要論文5本を解説（生成AIウィークリー） | テクノエッジ TechnoEdge
- 180 users
- www.techno-edge.net
- テクノロジー
- 2024/05/06
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless（シームレス）を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第45回目は、生成AI最新論文の概要5つを紹介します。生成AI論文ピックアップ高精度なニューラルネットワーク・アーキテクチャ「KAN」をMITなどの研究者らが開発 1手先のトークン予測ではなく、4手先のトークンを同時に予測するモデルをMetaなどが開発医療分野に特化したマルチモーダル大規模言語モデル「Med-Gemini」をGoogleが開発大規模言語モデルが答えに相当するベンチマークを事前に学習し、高い評価を出していた？　AIカンニング問題を指摘した研究一貫性の高い長編ビデオをテキストから生成するAIモデル「StoryDiffusion」高精度なニューラ
GPT-4oを使って2Dの図面から3DのCADモデルを作る
- 179 users
- zenn.dev/firstautomation
- テクノロジー
- 2024/05/19
はじめに株式会社ファースト・オートメーションCTOの田中(しろくま)です！先日、 OpenAIからGPT-4oがリリースされました。いろいろGPT-4oに関して調べていると、スピードが速くなっていたり、音声も直接扱えてマルチモーダル化が進んでいたりするようなのですが、画像に関して GPT-4-turboに比べ、認識やOCRの精度が向上しているようです。製造業という観点からすると、これは設計図面などに活かせるようになるのでは？と思いました。機械部品などの設計図面は以下のように、特定の方向から部品を2次元上に落とし込んだ形で書かれるのですが、部品本体を描いている図以外に、寸法や名称といった文字も含まれた画像になっています。このような図と文字の複合データにおいて、GPT-4oの進化は有効なのではないかと考えました。 ※画像元URL: http://cad.wp.xdoma
- ChatGPT
- あとで読む
- CAD
- 3d
- AI
- GPT
- 機械学習
- 画像
- 設計
M1MacでOllamaを試したら爆速で驚いた
- 177 users
- zenn.dev/yasuna
- テクノロジー
- 2024/05/18
はじめにいつもNVIDIAが載っているWindowsで楽しくLLMを動かしたり生成AIライフを楽しんでいますが、今回はMacOSでOllamaを入れてLlama3を動かしてみました。スペック： Apple M1 Pro(16 GB) 少し前だとCUDAのないMacでは推論は難しい感じだったと思いますが、今ではOllamaのおかげでMacでもLLMが動くと口コミを見かけるようになりました。ずっと気になっていたのでついに私のM1 Macでも動くかどうかやってみました！結論、爆速で推論できていたのでとても驚きました。OSS開発に感謝です！ Ollamaとは OllamaとはローカルでLLMを動かすことができるアプリケーションです。以下からダウンロードできます。 MacOSとLinuxで使うことができます。Windowsもプレビュー版があるみたいです。 #いざ推論ダウロードができたらシ
- LLM
- AI
- あとで読む
- mac
- 機械学習
AI時代にこそTDDだと思う話
- 175 users
- zenn.dev/akfm
- テクノロジー
- 2024/05/06
GitHub Copilot、みなさん使ってますか？すでに多くの方が利用しており、「ないと困る」という方から「提案の質に問題がある」「まだまだ使えない」という方まで、様々な意見を聞きます。筆者はGitHub Copilotに対して非常にポイティブな立場です。GitHub Copilotは使い方次第で開発速度を格段に向上させることを身をもって体験しており、これからの時代においてはGitHub CopilotなどのAIツールを使いこなせるかどうかで、個人の開発速度に非常に大きな差が出ると考えています。重要なのは使い方次第と言う点です。前述のように様々な感想が溢れているのはAIツールの習熟度が大きく影響しているようにも感じます。AIツールは静的解析同様、利用者側の手腕が大きく問われるツールであると筆者は感じています。コマンドプロンプトエンジニアリングという言葉もあるように、AIツールを使いこ
- TDD
- あとで読む
- AI
- copilot
- テスト
- プログラミング
- test
日本語特化の言語モデル「Japanese Stable LM 2 1.6B」をリリースしました — Stability AI Japan
- 172 users
- ja.stability.ai
- テクノロジー
- 2024/05/09
ポイント Japanese Stable LM 2 1.6B（JSLM2 1.6B）は16億パラメータで学習した日本語の小型言語モデルです。 JSLM2 1.6Bのモデルサイズを16億パラメータという少量にすることによって、利用するために必要なハードウェアを小規模に抑えることが可能であり、より多くの開発者が生成AIのエコシステムに参加できるようにします。ベースモデルとしてJapanese Stable LM 2 Base 1.6Bと、指示応答学習（Instruction tuning）済みのJapanese Stable LM 2 Instruct 1.6Bを提供します。両モデルともStability AI メンバーシップで商用利用が可能です。また、どちらのモデルもHugging Faceからダウンロードすることができます。 Japanese Stable LM 2 Base 1.6B
- AI
- あとで読む
- LLM
- 人工知能
- 学習
- 自然言語処理
- 日本語
- japan
- IT
大規模言語モデルの開発
- 163 users
- speakerdeck.com/chokkan
- テクノロジー
- 2024/05/30
2024年度人工知能学会全国大会（第38回）チュートリアル講演１本講演では、大規模言語モデルの開発に必要な基礎および最新動向を概観する。その後、東京工業大学情報理工学院の岡崎研究室と横田研究室、産業技術総合研究所の研究チームで開発された大規模言語モデルSwallowの開発経験を踏まえ、学習データの構築、モデルの学習や評価などを説明し、日本語に強い大規模言語モデルの現状や課題を議論したい。
- LLM
- あとで読む
- 自然言語処理
- 研究
- 開発
- 機械学習
- 学習
- AI
- 技術
プログラマ視点での生成AIとの付き合い方
- 157 users
- zenn.dev/mizchi
- テクノロジー
- 2024/05/31
プログラミングについて、最近考えてることについてのポエム。基本的に、 GPT-4 と Claude-3-Opus を使った経験を念頭に置いて話をする。機械学習エンジニアではないので、あくまで利用者に徹した視点での話。仕事で生成AIを使ったパイプラインを作ったりはしている。生成AIの進化速度を予測しておく今大事なことは、今AIがどの程度の性能かという定点の話ではなく、その進化の速度を認識すること。コード生成というタスクにおいて、生成AIモデルを人間に当てはめると、こんな感じの人物像を自分は持っている。 GPT-4: プログラミング経験2年目の大学2年生 Claude-3-Opus: プログラミング経験3年目の大学3年生ここでいうn年目は、業務経験ではなく、プログラミングの単位がある大学での、教育課程としての経験年数。今のひたすら学習量を増やす方式だと、単に1年に1年分ぐらい賢くなっ
【西川和久の不定期コラム】初心者も簡単！ついにPCで104BのLLMも動かせるようになった！そして巷を騒がせるマルチモーダルも試した
- 153 users
- pc.watch.impress.co.jp
- テクノロジー
- 2024/05/30
- AI
- LLM
- 人工知能
- PC
- あとで読む
- ドキュメント
- 機械学習
- techfeed
生成AIによる「慣用表現の『乗っ取り』」と、その根底にある別の問題と - 渋谷駅前で働くデータサイエンティストのブログ
- 149 users
- tjo.hatenablog.com
- テクノロジー
- 2024/05/31
かなり前から「ChatGPTに学術論文を（英語で）書かせると"delve"のような普段使わないような単語が多く使われるのでバレやすい」という話がSNS以下各所で頻繁に噂されていたんですが*1、最近になってこの件について面白いpreprintが発表されていたのを知りました。それがこちらです。もう読んで字の如しで「ChatGPTが登場して以来学術論文に使われる単語のレパートリーが劇的に変わってしまった」というのを、実際に具体的なデータに基づいて示した論文です。割と短めの読みやすい論文であることと、先述したようにSNSでは頻繁に噂されていた推測を明確化したということもあり、折角ですのでこのブログで簡単に紹介してみようと思います。 Preprintあげたのでご報告！📣 ChatGPTが使いがちな英単語ってありますよね。「delve」「realm」「utilize」あたり。（限界助教先生の記事
- AI
- LLM
- あとで読む
- 論文
- 人工知能
- 言語
- ChatGPT
- language
- research
- 学習
OpenAIのGPT-4oを日本語OCRとして使ってみる
- 142 users
- zenn.dev/tomioka
- テクノロジー
- 2024/05/14
昨日、OpenAIが生成AIの新しいモデルであるGPT-4oを発表しました。消費するトークン数の節約や、音声合成機能の改善、応答速度の向上など着実な品質改善を見せているようです。私も、特に音声合成（Text To Speech）の表現力について非常に興味を持っています。私は以前、「OpenAIのGPT-4 Turbo with visionを日本語OCRとして使ってみる」で、GPT-4 Turboの画像認識機能の日本語OCRについて検証を行いました。その当時は、既存のコグニティブAI APIに比べて認識精度が十分でないという評価をしています。とはいえ、その後に出てきたClaude 3 Opusは驚くべき認識精度だったので、OpenAIも巻き返す可能性は十分にあると感じました。Azure OpenAI Serviceを使っている場合は、Vision enhancementという既存のコグニ
- AI
- あとで読む
- ChatGPT
- 日本語
- GPT
- OCR
- 人工知能
- api
大実験！ChatGPTは競プロの問題を解けるのか (2024年5月版) - E869120's Blog
- 141 users
- e869120.hatenablog.com
- テクノロジー
- 2024/05/15
1. はじめに 2024 年 5 月 14 日、OpenAI 社から新たな生成 AI「GPT-4o」が発表され、世界に大きな衝撃を与えました。これまでの GPT-4 よりも性能を向上させただけでなく1、音声や画像のリアルタイム処理も実現し、さらに応答速度が大幅に速くなりました。「ついにシンギュラリティが来てしまったか」「まるで SF の世界を生きているような感覚だ」という感想も見受けられました。しかし、いくら生成 AI とはいえ、競技プログラミングの問題を解くのは非常に難しいです。なぜなら競技プログラミングでは、問題文を理解する能力、プログラムを実装する能力だけでなく、より速く答えを求められる解法 (アルゴリズム) を考える能力も要求されるからです。もし ChatGPT が競技プログラミングを出来るようになれば他のあらゆるタスクをこなせるだろう、と考える人もいます。それでは、現代最強の
Microsoft、「AI Toolkit for VS Code」を発表／既存の「Windows AI Studio」をクロスプラットフォーム拡充、発展させる
- 141 users
- forest.watch.impress.co.jp
- テクノロジー
- 2024/05/22
- AI
- vscode
- microsoft
- あとで読む
- LLM
- 人工知能
- windows
- アプリ
- techfeed
6次元の揺らぎがもたらす準結晶の奇妙な物性 | 東京大学
- 126 users
- www.u-tokyo.ac.jp
- 学び
- 2024/05/14
東京大学日本原子力研究開発機構発表のポイント 6次元結晶の3次元空間の断面とみなせる「準結晶」の比熱が異常に大きくなる現象を、実験と機械学習シミュレーションで追求し、高次元での原子のゆらぎが原因であると突き止めた。準結晶のシミュレーションには膨大な計算が必要で、これまでは簡単なモデルでしか行われてこなかったが、今回、高精度かつ長時間の機械学習シミュレーションを行い、実験と比較することが可能になった。この結果は、複雑な物質において実験と比較可能な機械学習シミュレーション手法を確立できた事を意味しており、準結晶を用いた新たな熱電材料など様々な材料にこの手法を適用することで、材料開発が加速すると期待される。高次元の揺らぎが3次元空間に影響を与える様子の概念図 Credit: UTokyo ITC/Shinichiro Kinoshita 概要東京大学情報基盤センターの永井佑紀准教授、
- 科学
- あとで読む
- 研究
- 大学
- science
話題のLLMローコード構築ツールDifyをAWSのマネージドサービスで構築してみた - エムスリーテックブログ
- 108 users
- www.m3tech.blog
- テクノロジー
- 2024/05/30
こんにちは。エムスリーエンジニアリンググループのコンシューマチームに所属している園田です。普段の業務では AWS やサーバーサイド、フロントエンドで遊んでいるのですが、最近はもっぱら OpenAI や Claude3 で遊んでます。今回は、最近巷で話題の LLM ローコード構築ツールである Dify の OSS 版を AWS のマネージドサービスのみを使って構築してみました。 DifyとはオープンソースのLLMアプリ開発プラットフォームで、様々なLLMを使用してChatGPTのGPTsのようなものがノーコードで簡単に作れます。引用元: DifyでSEO記事作成を試してみる｜掛谷知秀試しにAskDoctorsのガイドラインHTMLをナレッジ登録してみたローカル環境で Dify を構築する記事はたくさん見かけますが、AWS のマネージドサービスで構築する内容は見かけなかった*1ので公
- Dify
- あとで読む
- LLM
- AI
- AWS
- db
- OpenAI
- プロジェクト
GitHub Copilot Workspaceが利用可能になったのでゼロからアプリを作ってみた - Alternative Architecture DOJO
- 104 users
- aadojo.alterbooth.com
- テクノロジー
- 2024/05/13
こんにちは、MLBお兄さんこと松村です。昨年の MLB 全体ドラフト1位のポール・スキーンズ投手がメジャーデビューしました。予想通りの豪速球でした。 2024年4月29日についにテクニカルプレビューが開始となった GitHub Copilot Workspace ですが、ゴールデンウィーク中に私のアカウントでも利用可能となっていたため、試してみたことを書いていきます。利用開始までこの記事を書いている時点では、 GitHub Copilot Workspace の利用には待機リスト (Waitlist) への登録が必要であり、その通過を待つ必要があります。そのため GitHub Copilot Workspace を利用したい方は、こちらから登録を行いましょう。 githubnext.com ゼロからアプリを作ってみる今回は練習として私がコードを書くこと無く、 C# の簡単なアプリ
ベクトルデータの容量を96%削減するBinary Embedding
- 98 users
- zenn.dev/knowledgesense
- テクノロジー
- 2024/05/21
導入こんにちは、株式会社ナレッジセンスの須藤英寿です。普段はエンジニアとして、LLMを使用したチャットのサービスを提供しており、とりわけRAGシステムの改善は日々の課題になっています。 RAGのシステムの中では、どんな情報にアクセスするかを決定する際に、Embeddingと呼ばれる文章をベクトル化する技術が使用されています。そして多くの場合では小数(float)の多次元ベクトルが採用されています。しかし、Embeddingの中には各ベクトルの数値を1Bitのデータとして扱うBinary Embeddingというものが存在します。本記事では、Embeddingの手法の一つであるそのBinary Embeddingについて解説と検証を行います。サマリー Binary Embeddingを採用することで以下のような効果を得ることができます。保管するベクトルデータの容量を96%ほど削減で
- RAG
- AI
- Embedding
- DB
- 精度
- あとで読む
- 推薦
- recommendation
- LLM
噂のノーコードAIシステム開発環境Difyを使ってツールを作ってみた。使った感想｜shi3z
- 93 users
- note.com/shi3zblog
- テクノロジー
- 2024/05/08
最近にわかに話題のLLMツール「Dify」を僕も使ってみた。いいところと「?」となったところがあったので纏めておく Difyとは、GUIでワークフローを組むことができるLLM-OPSツールだ。 ComfyUIのようにワークフローが組めたり、GPTsのように自分専用のアシスタントを作れたりできる。特に、OpenAIのGPTシリーズとAnthropicのClaude-3、そしてCohereのCommand-R+なんかを組み合わせて色々できるところは良いところだと思う。また、ローカルLLMにも対応しているので、企業内でのチャットボットを作るんだったらGPTsよりこっちの方がいいだろう。元々色々なテンプレートが用意されているが、テンプレだけ使うとGPTsっぽいものを作れる(それだってすごいことだが)。テンプレを改造するだけでも欲しいものが作れる人はいるし、ここはノーコード環境と言えるテンプ
- AI
- LLM
- あとで読む
- Dify