並び順

ブックマーク数

期間指定

  • から
  • まで

201 - 240 件 / 2387件

新着順 人気順

機械学習の検索結果201 - 240 件 / 2387件

  • さくらインターネットで活躍中の id:y_uukiを訪問 | はてな卒業生訪問企画 [#9] - Hatena Developer Blog

    こんにちは、エンジニアリングマネージャーの id:onk です。 Hatena Developer Blogの連載企画「卒業生訪問インタビュー」では、創業からはてなの開発に関わってきた取締役の id:onishi、CTOの id:motemen、エンジニアリングマネージャーの id:onkが、いま会いたい元はてなスタッフを訪問してお話を伺っていきます。 id:onkが担当する第9回のゲストは、さくらインターネット株式会社の組織内研究所であるさくらインターネット研究所の上級研究員で、SRE (Site Reliability Engineering)の研究者としても活躍する id:y_uuki さんこと、坪内佑樹さんです。 2013年にはてなに新卒でWebオペレーションエンジニアとして入社後、サーバー監視サービス「Mackerel」をはじめとするサービス開発やはてなのインフラ開発・運用にSR

      さくらインターネットで活躍中の id:y_uukiを訪問 | はてな卒業生訪問企画 [#9] - Hatena Developer Blog
    • 脱初級ITエンジニアまでの学習方法 - RAKUS Developers Blog | ラクス エンジニアブログ

      こんにちは。 株式会社ラクスで先行技術検証をしたり、ビジネス部門向けに技術情報を提供する取り組みを行っている「技術推進課」という部署に所属している鈴木(@moomooya)です。 今回は毎年春先の社内ビアバッシュで新人向けに「一歩目の学習方法」として発表している話をしようと思います。 学習とは この記事の対象 学習に対する向き合い方 まず最初は 学習作戦その1「ちょい足し学習」 例)HTTPメソッドを扱ったとき 学習作戦その2「外から情報を仕入れる」 よくある情報源 技術書 技術同人誌 ウェブサイト 勉強会 SNS 飲み会 GitHub 脱初級者 手を動かす(検証と実践) 自由にできるサーバーを用意する 情報発信 無理に全部やらなくていい エンジニアにとっての勉強 学習とは [名](スル) 1 学問・技術などをまなびならうこと。「学習の手引」「学習会」 2 学校で系統的・計画的にまなぶこと

        脱初級ITエンジニアまでの学習方法 - RAKUS Developers Blog | ラクス エンジニアブログ
      • 実務につなげる数理最適化

        はじめに はじめまして、2023年10月にシニアリサーチャーとして入社したアドバンスドテクノロジーラボ(ATL)の梅谷俊治です。2023年9月まで、大阪大学大学院情報科学研究科にて数理最適化寄附講座教授を務めていました。 本記事では、リクルートのデータ推進室における数理最適化を活用した問題解決の取り組みをご紹介します。 数理最適化は、与えられた制約条件の下で、目的関数を最小(もしくは最大)にする最適化問題を通じて、現代社会における意思決定や問題解決を実現する数理技術の一つです。 近年では、機械学習によるデータ分析や予測の技術開発が進み次々と実用化されています。数理最適化は、それらのデータ分析や予測の結果を踏まえた上で意思決定や計画策定を実現する問題解決における出口を担当する技術です。例えば、オンライン広告などカスタマーに商品を推薦するレコメンデーションでは、機械学習を活用してカスタマーの商

          実務につなげる数理最適化
        • Stable DiffusionとMidjourneyはどちらが優れている? 「画像生成AI」の可能性と課題

          画像生成AI二強の最新動向 マイクロソフトの検索エンジンBingで画像生成機能が追加されたほか、デザインプラットフォームCanvaでも画像生成が可能になるなど、生成AI技術を活用した画像生成ツールが身近な存在になりつつある。 この画像生成領域を牽引してきたのは、Stable Diffusionを展開するStability AI(ロンドン拠点)とMidjourneyを展開するMidjourney, Inc(サンフランシスコ拠点)の2社だ。 ChatGPTの開発企業として知られるOpenAIも画像生成AI「DALL-E」を開発しているが、現時点では、画像のクオリティでStable DiffusionとMidjourneyには及ばず、後塵を拝する状況となっている。そんな中、Stability AIが最新の画像生成モデルをリリース、画像クオリティがさらに向上したとして注目を集めている。 Stabi

            Stable DiffusionとMidjourneyはどちらが優れている? 「画像生成AI」の可能性と課題
          • ChatGPT Code Interpreter を利用して、お手軽にデータ分析・可視化 - Taste of Tech Topics

            カメラ好き機械学習エンジニアの@yktm31です。 先日、OpenAIから、公式のプラグインとして「Code Interpreter」が発表されました。 「Code Interpreter」は、ChatGPT上でPythonのコードを生成・実行する仕組みを持っています。 これまでも、ChatGPTで、プログラムのソースコードを出力することは可能でしたが、実行まではできませんでした。 「Code Interpreter」は、ChatGPTの有料版で利用することが可能ですが、ユーザーが自然言語で指示や要求を出すだけで、 ChatGPTがその内容を理解し、ソースコードの生成から実行まで行えたり、既存のコードを解釈してその動作を説明したりすることが可能になります。 openai.com 本記事では、この「Code Interpreter」を利用して、CSVファイルを元に、データの可視化を行ってみま

              ChatGPT Code Interpreter を利用して、お手軽にデータ分析・可視化 - Taste of Tech Topics
            • pathlibをもっと使おう - The jonki

              皆さんはPythonのpathlib使ってますか?私は非常によく使っています.例えば機械学習では学習の前に前処理を多く行うケースが非常に多いですが,このようなに知っておくと便利です.pathlibは意外とPython 3.4(2014年~)からとそれなりに新しいため,古くからのPythonユーザーは os.pathの方をよく使っているかもしれません.ただpathlibは文字列ではなくPathクラスとして扱ってくれることで,例えばLinux/Windowsのパス表記の違いを吸収してくれたりします. pathlibとos.pathの比較は公式のpathlibドキュメントに譲るとして,私がよく使うpathlibのクラスを紹介します.また今回改めてドキュメントを眺めて知った便利関数も多いので,公式ドキュメントに目を通すのもオススメします. 今回は下記のような複数の素性の異なるデータセットに対して処

                pathlibをもっと使おう - The jonki
              • Bing Chat で画面イメージからHTML/CSSの内容を生成してみる(日本語でもできました) - Taste of Tech Topics

                カメラ好き機械学習エンジニアの@yktm31です。 昨日、マイクロソフト主催のMicrosoft Inspireにて、Bing Chat の更新内容が発表されました。 news.microsoft.com その中でも、特に Bing Chat の「Visual Search in Chat」の機能が気になったので、早速試してみました。 Bing Chat 新機能の概要 Visual Search in Chatは、画像から文脈を解釈し答えを返してくれる生成AI機能です。 旅行先で見かけた建築物について知りたいときや、冷蔵庫の中身からレシピを考えたいときなど、 Bing Chatに画像をアップロードするだけで、ウェブの知識を活用して回答される、とのことです。 バックエンドで動くモデルは、OpenAIのGPT-4モデルのようです。 デモでは、手書きの絵からHTML/CSSのコードを生成する例が

                  Bing Chat で画面イメージからHTML/CSSの内容を生成してみる(日本語でもできました) - Taste of Tech Topics
                • Arxiv RAGによる論文サーベイの自動生成 | Shikoan's ML Blog

                  2.3k{icon} {views} 複数のLLM(GPT/Claude3)とArxivの検索APIをRAGで統合し、論文サーベイの自動生成を作りました。検索結果の前処理や、サーベイ特有のプロンプトエンジニアリングやソートが重要で、最適化手法として古くからある巡回セールスマン問題(TSP)が有効に機能しました。また、生成部分ではGPTよりClaude3の明確な有効性を確認できました。 できたもの Arxivの検索APIを使って検索拡張生成(RAG)したらサーベイを自動生成できた やっていること Arxivの検索ワードをGPT-4-Turboで生成 ArxivのAPIを叩いてヒューリスティックでフィルタリング OpenAIのEmbedding APIを叩く Embeddingに対して巡回セールスマン問題(TSP)を解いてソートをかける 論文の要旨をGPT-3.5-Turboで要約 ソートした

                    Arxiv RAGによる論文サーベイの自動生成 | Shikoan's ML Blog
                  • 1年前の自分が読みたかった、データエンジニアリング入門 - Qiita

                    はじめに 本記事は、trocco® Advent Calendar 2023の9日目の記事になります。 trocco®だけを取り上げるわけではありませんが、この内容をおさえておくとその価値や使い方が理解しやすいと思いますし、もちろんユーザー以外でもデータエンジニアリング入門として読んでいただければと思います。 さて、私は今年の2月にtrocco®を提供する株式会社primeNumberに転職し、現在はtrocco®を利用したデータパイプライン/BIツールによるダッシュボード構築などを行っています。 前職は広告代理店でTableauを使ったマーケティングデータ分析を行っていたのですが、総合職の異動でたまたまデータ関連部門にいただけですし、プログラミング経験もなかったので、異業種異職種への転職でこの1年はめちゃくちゃ勉強をしてきました。 エンジニア出身の方向けには、『実践的データ基盤への処方箋

                      1年前の自分が読みたかった、データエンジニアリング入門 - Qiita
                    • 作って遊ぼう!LLMを搭載した君だけのV&Lモデル!

                      はじめに TuringのBrain Research teamで頑張ってる井ノ上です。(Twitter: いのいち) Turingは完全自動運転の開発を目指しており、その実現のためには賢い頭が必要だと考えています。その方法の一つとして、近年の大規模言語モデル(LLM)に見られるような文脈理解力をうまく取り入れられないかと考えており、LLMとVisionの情報をかけ合わせたモデルに注目して研究を行っています。自動運転とVision and languageモデルについては、ぜひこちらの記事を読んでみてください。 今回の記事は2023年7月に開催されたABCI LLMハッカソンで取り組んだときに開発していたGIT-LLMというモデルの開発について解説する記事となっています。途中のコードの解説部分などは少し退屈に感じるかもしれませんので、その場合はぜひ結果のパートだけでも見てみてください。いろい

                        作って遊ぼう!LLMを搭載した君だけのV&Lモデル!
                      • AI分野でのNVIDIA一強状態を崩すためにIntel・Google・富士通・Armなどが参加する業界団体がCUDA対抗のAI開発環境を構築中

                        NVIDIAはAI開発に使われるGPUで大きなシェアを獲得しているほか、ソフトウェア開発および実行環境「CUDA」もAIの開発現場で広く採用されています。そんなNVIDIAの一人勝ち状態に対抗するべく、Intelや富士通、Google、Armなどのテクノロジー企業が参加する業界団体「Unified Acceleration Foundation(UXL Foundation)」がオープンなソフトウェア開発環境の構築を進めています。 UXL Foundation: Unified Acceleration https://uxlfoundation.org/ Unified Acceleration (UXL) Foundation https://www.intel.com/content/www/us/en/developer/articles/news/unified-accelera

                          AI分野でのNVIDIA一強状態を崩すためにIntel・Google・富士通・Armなどが参加する業界団体がCUDA対抗のAI開発環境を構築中
                        • GitHub Copilot全社導入で得られた効果と課題 - RAKUS Developers Blog | ラクス エンジニアブログ

                          はじめに こんにちは、技術広報のnobu_msです。 ラクスでは2023年6月からGitHub Copilotを全開発組織に導入し、希望者は申請により全員利用可能となっています。GitHub Copilot導入から5カ月が経過し、利用状況や導入効果のアンケート調査を行いました。 本記事では、調査結果を踏まえて下記の内容をご紹介します。 全社導入前の課題とその対応 導入後の利用状況・効果測定 今後の活用に向けた課題と取り組み より詳細な目次はこちらをご覧ください。 はじめに GitHub Copilot導入の目的 全社導入前の課題とその対応 ① セキュリティの担保 当社の情報資産が学習に利用される可能性 他社のコードがサジェストされて著作権を侵害するのではないか? ② 費用対効果 導入後の利用状況・効果測定 コーディング時間短縮の効果 業務品質向上効果 学習・調査効率化効果 エンジニアの業務

                            GitHub Copilot全社導入で得られた効果と課題 - RAKUS Developers Blog | ラクス エンジニアブログ
                          • ChatGPTの新機能「Custom Instructions」を試してみる - Taste of Tech Topics

                            カメラ好き機械学習エンジニアの@yktm31です。 先日7/21(金)に、ChatGPTの新機能「Custom Instructions」が発表されました。 openai.com 今回、その新機能を試してみたいと思います。 目次 概要 Custom Instructionsの設定項目 実際に使ってみた 機能を有効化する 条件を与えて出力させる まとめ 概要 Custom Instructionsは、ChatGPTに事前情報として文脈や制約を教えることができる機能です。 ChatGPTから期待する回答を得るには、文脈や制約を与えることが重要になってきます。 そのため、プロンプトを以下のような形で与えることがよくあります。 あなたはPythonのエキスパートです。 以下の条件を元に、AWS Lambdaのコードを出力してください。 # 仕様 # 利用フレームワーク # 補足 これを共通的に設定

                              ChatGPTの新機能「Custom Instructions」を試してみる - Taste of Tech Topics
                            • GPT-4で「親鸞ボット」「菩薩ボット」開発 京大「仏教対話AIの多様化に成功」

                              京都大学とベンチャー企業のテラバースムは9月12日、仏教の経典を学習させ、ユーザーの悩みに答えるチャットボット「親鸞ボット」「世親ボット」を開発したと発表した。米OpneAIのLLM「GPT-4」を活用。従来からの「ブッダボット」とあわせ、「仏教対話AIの多様化に成功した」としている。 浄土真宗の開祖・親鸞(12~13世紀)の聖典「正信偈」と、大乗仏教の「唯識」を大成し、アジア各地で教えを広めた菩薩の世親(4世紀)の聖典「倶舎論」をそれぞれ学習させたチャットボット。 AR技術を活用し、現実を映した背景に親鸞や世親の仏像画像を重ねるなどして視覚・聴覚を用いたコミュニケーションも可能にした。 研究チームはこれまで、仏陀の聖典を学習させた「ブッダボット」を2種類開発。1つめはGoogleの「Sentence BERT」を応用し、Q&A形式で機械学習させてそのままの形で回答を生成するもの。2つめは

                                GPT-4で「親鸞ボット」「菩薩ボット」開発 京大「仏教対話AIの多様化に成功」
                              • エンジニアリングマネージャーになって1年がたった

                                私は,あるスタートアップ企業でエンジニアリングマネージャー(の,1人)をしている。toB向けSaaSを提供している数百名規模の会社で,社名が少しずつ世の中に知られるようになってきたくらいのフェーズ。会社からはDirectorという肩書をもらっていて,トラディショナルな日本企業だといわゆる部門長の層にあたる。中間管理職の中では上のほうで,執行役員の下あたり,というと伝わりやすいだろうか。 様々な事情(会社が大きくなった,比較的社歴が長い,そこそこの業界経験値がある,自分の専門領域(*1)に社内のフォーカスがあたるようになり,チームをスケールする必要が出てきた,etc.)から,半ば必要にかられて,重い腰を上げてエンジニアリングマネージャーとして活動を始めたのがちょうど1年ほど前。 決してマネージャーとして早咲きのほうではなく,IT業界でのキャリアは15年くらいで,これまではずっとプレイヤー,ま

                                • Streamlit 入門|npaka

                                  「Streamlit」の使いはじめ方をまとめました。 1. Streamlit「Streamlit」は、機械学習およびデータサイエンスのためのWebアプリケーションフレームを簡単に作成して共有できるPythonライブラリです。 2. HelloWorldの作成HelloWorldの作成手順は、次のとおりです。 (1) Pythonの仮想環境の準備。 (2) パッケージのインストール。 $ pip install streamlit(3) helloworld.pyの作成。 ・helloworld.py import streamlit as st st.text("Hello World!")(4) helloworld.pyの実行。 $ streamlit run helloworld.pyブラウザが自動的に開いて、Webアプリケーションが表示されます。 3. 風船を飛ばすボタンの作成あ

                                    Streamlit 入門|npaka
                                  • LLMで自動運転車を動かしてみた話|aoshun7

                                    こんにちは、自動運転EVをつくるTuring(チューリング)株式会社で共同創業者CTOをやっている青木俊介です。 先日Turingは噂のLLM(Large Language Model:大規模言語モデル)で自動運転車を動かすプロジェクトを完遂させました。 上の動画にもあるように、今回開発したデモではユーザ(乗客)が音声で指示を出すと、LLMが裏で動き、自動運転車がユーザの指示に従って動いてくれます。LLMで実際の自動車が動いたのは世界初な気がします。 もちろんこのシステムで公道を走るわけではないのですが、我々Turingの開発思想的には非常に重要なデモでした。 この記事では「なぜTuringがLLMで自動運転車を動かしたのか」「実際どんな風にLLMで自動運転車が動いているのか」「Turingの開発体制の今後」について書いていこうと思います。 1. LLMと自動運転とTuring「LLMで自

                                      LLMで自動運転車を動かしてみた話|aoshun7
                                    • 「人付き合いが苦手だから〇〇になりたい」という学生さんは、消去法で進路を選ばない方がいい→そもそも「コミュ力のない優秀な特殊スキル保有者」はレア中のレア

                                      小林 彰人 Akihto Kobayashi @akobayashiTR ミニ四駆AI/ 音響工学/計測工学/感性工学/機械学習/ 2022年ハセツネ完走しました。体調崩してるのでしばらく運動は控えてます。 小林 彰人 Akihto Kobayashi @akobayashiTR 技術者志望の学生さん、コミュニケーションが苦手だからエンジニアやりたいです、が多い気がするんですが 人付き合いできないならば人脈は期待できないわけで…。 真面目に言われた通りに働くソルジャーになるか、特殊な能力を手にして特別な存在になるか、の選択しかないわけですね(続 2024-01-28 10:50:16 小林 彰人 Akihto Kobayashi @akobayashiTR 特殊なスキルを身につけるためには人よりも多くの時間を費やす必要があるわけです 人よりも手を動かしたり、考えたりをしなければならないんで

                                        「人付き合いが苦手だから〇〇になりたい」という学生さんは、消去法で進路を選ばない方がいい→そもそも「コミュ力のない優秀な特殊スキル保有者」はレア中のレア
                                      • Google検索の品質悪化はリーダーが変わったことの影響だという指摘

                                        by Anthony Ryan ウェブ検索市場では、Googleが長年圧倒的なシェアを占めていますが、Google検索の品質は年々悪化していることが研究で示されています。そんなGoogle検索の品質がなぜ悪化したのか、イギリスのジャーナリストであるエドワード・ジトロン氏が自身のニュースレターで解説しています。 The Man Who Killed Google Search https://www.wheresyoured.at/the-men-who-killed-google/ 2018年から2020年までグーグルの検索部門の責任者を務めていたベン・ゴームズ氏はGoogle黎明期からの中心メンバーで、検索エンジンの設計にも携わっています。 by OFFICIAL LEWEB PHOTOS ゴームズ氏は、検索結果の関連性を高めるために、「ページランク」と呼ばれるアルゴリズムを単一マシンで

                                          Google検索の品質悪化はリーダーが変わったことの影響だという指摘
                                        • 数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』 | AIDB

                                          科学的知識は主に書籍や科学誌に保存されていますが、PDF形式が一般的です。しかし、この形式は特に数学的表現においてセマンティック情報の損失を引き起こします。この問題に対処するために、Meta AIの研究チームは『Nougat(Neural Optical Understanding for Academic Documents)』という新しいOCR(光学式文字認識)技術を開発しました。 Nougatは、数式や文章が複雑に配置された画像であっても、それをマークアップ言語に高品質で変換する能力を持っています。この技術は、新しい論文だけでなく、電子データが存在しない古い書類などの解析にも非常に有用です。 参照論文情報 タイトル:Nougat: Neural Optical Understanding for Academic Documents 著者:Lukas Blecher, Guillem

                                            数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』 | AIDB
                                          • CSS に 4 つの新しい国際化機能を導入  |  Blog  |  Chrome for Developers

                                            CSS Text モジュール レベル 4 の 4 つの国際化 CSS 機能が Chrome に導入されます。この投稿では、すでに発送済みのサービスと今後の予定について説明します。 Chrome 119 以降: 日本語のフレーズが word-break: auto-phrase で改行されるようになりました。 Chrome 120 以降のフラグの背後: text-autospace プロパティによるスクリプト間のスペース 開発中: text-spacing-trim プロパティによる中国語、日本語、韓国語(CJK)の句読点カーニング。 言語間で最小フォントサイズが統一されます。 日本語のフレーズ改行: word-break: auto-phrase 日本語のテキストが読みやすくなるこの機能は Chrome 119 から利用可能 中国語や日本語などの東アジア言語では、単語の区切りにスペースを使

                                            • 統計学とは何か、そしてベイズ統計学の話 - hidekatsu-izuno 日々の記録

                                              細々と統計学を調べ続けているが、最近ようやく統計学というものが何なのか、おぼろげながらわかるようになってきた(なお、統計学ができるようになってきたわけではない) 統計学を知る前の自分と今の自分をくらべたとき、間違いなく違うのは統計学に対する信頼だろう。以前は、統計学は数学の一分野であり、正しい分析手法を使えば真の答えが得られるものだと思っていた。しかし、実際には統計学者ジョージ・ボックスが言ったとされる「すべての(統計)モデルは間違っている、だが中には役立つものもある)」という言葉の方が実態に近い。 統計学は基本的に「不可能なことを可能にする(不良設定問題を扱う)」学問だ。例えば、1、3、5 という数字の列から何が言えるだろうか。確実なことは3つの実数値が観測された、ということだけで、それ以上のことは想像するしかない。奇数列かもしれないし、乱数から3つの値を取得した際に偶然それっぽい数字が

                                                統計学とは何か、そしてベイズ統計学の話 - hidekatsu-izuno 日々の記録
                                              • ITフリーランスエンジニアの平均月額単価を職業・職種・言語別に発表、パーソルキャリアが公開

                                                本調査は、2023年の1年間に「HiPro Tech」が受領した案件の月額単価の平均を算出したもの。 職種別に見ると、最も高かったのは115.4万円の「ブロックチェーンエンジニア」、次いで「DXコンサルタント」(115.3万円)、「ITコンサルタント」(114.4万円)となった。 2〜5位には、デジタルトランスフォーメーション(以下DX)推進などのプロジェクトをリードする職種がランクインし、いずれの職種も単価が100万円を超え、2022年から10万円以上アップしている。 6位の「機械学習・AIエンジニア」(104.5万円)、8位の「データサイエンティスト」(95.1万円)も需要の高さに比例して、上位にランクインした。多くの企業が機械学習・AI技術を搭載したプロダクト開発や、顧客情報のビックデータ解析を通じたビジネスモデルの改善に取り組んでいる一方で、この領域は人材不足が顕著であるため、単価

                                                  ITフリーランスエンジニアの平均月額単価を職業・職種・言語別に発表、パーソルキャリアが公開
                                                • Aurora MySQL におけるロック競合(ブロッキング)の原因を事後調査できる仕組みを作った話

                                                  こんにちは。 DBRE チーム所属の @p2sk です。 DBRE(Database Reliability Engineering)チームでは、横断組織としてデータベースに関する課題解決や、組織のアジリティとガバナンスのバランスを取るためのプラットフォーム開発などを行なっております。DBRE は比較的新しい概念で、DBRE という組織がある会社も少なく、あったとしても取り組んでいる内容や考え方が異なるような、発展途上の非常に面白い領域です。 弊社における DBRE チーム発足の背景やチームの役割については「KTC における DBRE の必要性」というテックブログをご覧ください。 本記事では、Aurora MySQL でロック競合(ブロッキング)起因のタイムアウトエラーが発生した際に根本原因を特定することができなかったので、原因を後追いするために必要な情報を定期的に収集する仕組みを構築した

                                                  • GPT-4は財務諸表から将来の収益の伸びを予測する点で人間のアナリストよりも優れていることが研究により明らかに

                                                    OpenAIが開発する大規模言語モデル(LLM)の「GPT-4」は、道徳テストで人間の大学生より優れたスコアをたたき出したり、セキュリティ勧告を読むことで実際の脆弱性を悪用できたりと、すでに一部の分野で人間の能力を超えることが示されています。そんなGPT-4が、プロのアナリストに匹敵する精度の財務諸表分析を行えることが実証されました。 Financial Statement Analysis with Large Language Models by Alex Kim, Maximilian Muhn, Valeri V. Nikolaev :: SSRN https://papers.ssrn.com/sol3/papers.cfm?abstract_id=4835311 The future of financial analysis: How GPT-4 is disrupting

                                                      GPT-4は財務諸表から将来の収益の伸びを予測する点で人間のアナリストよりも優れていることが研究により明らかに
                                                    • データエンジニアリングの基礎

                                                      データエンジニアリングとは、組織内外で日々生成されるデータを蓄積し分析するためのデータシステムを構築し維持管理することであり、急速に注目を集めている分野です。近年ではデータエンジニアリングを支えるツールやクラウドサービスが成熟し、組織へのデータ利活用の導入は容易になりましたが、明確な指針のないままデータシステムの構築を進めると費用と時間を無駄に費やすことになります。本書は「データエンジニアリングライフサイクル」を軸にデータシステムの要件を整理することで、組織の「データ成熟度」に応じたデータシステム構築の指針を与えます。またデータエンジニアの立ち位置を明確にし、組織内でデータエンジニアが果たすべき役割を示します。 まえがき Ⅰ部 データエンジニアリングの基礎と構成要素 1章 データエンジニアリング概説 1.1 データエンジニアリングとは何か 1.1.1 データエンジニアリングの定義 1.1.

                                                        データエンジニアリングの基礎
                                                      • ChatGPTのプロンプトを自動改善するPrompt Perfectプラグインを使ってみた - Taste of Tech Topics

                                                        カメラ好き機械学習エンジニアの@yktm31です。 ChatGPTは便利ですが、プロンプトの内容でいかに質問・指示するかで、その精度はだいぶ変わってきます。 うまく質問・指示するのは、工夫が必要だったりしますが、そこで役立つのが、「Prompt Perfect」というプラグインです。 www.blog.promptperfect.xyz Prompt Perfectは、ChatGPTへのプロンプトの内容を自動で改善してくれるプラグインです。 本記事では、その使い方や効果について、試していきます。 プラグインを有効化 使い方 基本の使い方 日本語で回答させる もう一つ試してみる Prompt Perfectの補完内容 注意点 まとめ プラグインを有効化 1) プラグインを有効化するため、Plugin storeからインストールします。 2) インストール後、メールアドレスの登録か、Googl

                                                          ChatGPTのプロンプトを自動改善するPrompt Perfectプラグインを使ってみた - Taste of Tech Topics
                                                        • ファッションにおける類似商品検索アルゴリズムの性能評価 - DROBEプロダクト開発ブログ

                                                          概要 背景・目的 実験 実験の概要 定量評価 定性評価 おわりに 参考文献 DROBEで機械学習エンジニアをしております、藤崎です。 概要 類似商品検索の基盤となる複数の特徴抽出アルゴリズムについて、DROBEの保有するデータで評価した 定量評価によると、画像単体を入力とする ResNet-50(自己教師あり学習)とCLIPの性能が高かった 定性評価によって、取り扱うモーダルの違いによる各モデル出力の顕著な差異が確認できた 背景・目的 小売において、商品の在庫は無数に存在しています。そのため、消費者やサービス提供者が商品に紐づく情報(画像、商品の説明文など)を解釈して、特定の商品と類似したアイテムを人手で行うのは困難です。 この課題を解決するために、機械学習手法の活用が注目されています。 機械学習を用いた処理の流れは、 商品に紐づく情報を適切に 「要約」 し、 1.で 「要約」 した商品情

                                                            ファッションにおける類似商品検索アルゴリズムの性能評価 - DROBEプロダクト開発ブログ
                                                          • なれる!SRE - Becoming SREで学んだこと - じゃあ、おうちで学べる

                                                            はじめに エンジニアとして就職する前に読んだ「なれる!SE 2週間でわかる?SE入門」の内容があまりにも厳しく、業界に就職するのが怖くなったことを覚えています。本の中に登場する中学生の少女にしか見えない凄腕のSE、室見立華さんのような人物は現実には存在しないでしょうが、実際の業界には彼女のような凄腕エンジニアや年齢不相応な技術力を持つ人間も確かに存在します。 なれる!SE 2週間でわかる?SE入門 (電撃文庫) 作者:夏海 公司,IxyKADOKAWAAmazon SREの探求『Becoming SRE』の内容紹介 私は「なれる!SE」が好きすぎるあまり、「なれる!SRE」というタイトルのクソみたいな文章を吐き出したこともありましたが、そのクオリティがあまりにも低かったため、外には公開せずに留めておきました。そんな中、SREの探求の原著者であるDavid Blank-Edelman(ott

                                                              なれる!SRE - Becoming SREで学んだこと - じゃあ、おうちで学べる
                                                            • 【ChatGPT】とベクトルデータベースによる企業内データの活用(いわゆるRAG構成) - Qiita

                                                              本記事は日本オラクルが運営する下記Meetupで発表予定の内容になります。発表までに今後、内容は予告なく変更される可能性があることをあらかじめご了承ください。下記セッションでは、本記事の内容以外にデモンストレーションも実施する予定です。 ※セミナー実施済の動画に関しては以下をご参照ください。 はじめに 2022年暮れ、ChatGPTの登場以降、あらゆる企業がDXの在り方を問われはじめ、大規模言語モデルの仕組みをどのように業務に取り入れるかを検討されていると思います。 その検討の一つとして、「GPT(LLM)が学習していない企業内のデータや最新のデータも有効活用すべき」 という点は非常に大きな論点なのではないでしょうか。 ご存じの通り、LLMとはインターネット上に存在するドキュメントデータをクローリングにより大量に収集し、それを学習データとして機械学習にかけたモデルです。 従って、至極当たり

                                                                【ChatGPT】とベクトルデータベースによる企業内データの活用(いわゆるRAG構成) - Qiita
                                                              • AI搭載エディタCursorの紹介と機械学習コンペでの使用レビュー

                                                                社内の技術共有会での発表資料です。 AI搭載エディタCursorの機能の紹介とKaggle等の機械学習コンペで使ってみて役立った点などを共有します

                                                                  AI搭載エディタCursorの紹介と機械学習コンペでの使用レビュー
                                                                • 情報の海をハックするカギは「捨てる」こと。LayerX松村氏に学ぶ、価値ある情報を取りこぼさないコツ

                                                                  情報の海をハックするカギは「捨てる」こと。LayerX松村氏に学ぶ、価値ある情報を取りこぼさないコツ 2023年12月20日 株式会社LayerX 機械学習・データ部 機械学習グループ マネージャー 松村 優也 1993年生まれ。2018年3月、京都大学大学院情報学研究科 社会情報学専攻修士課程修了。在学中の起業経験を経て、新卒でウォンテッドリー株式会社に入社、推薦システムチームの立ち上げに関わる。2021年にはWantedly VisitのPdM、開発組織のEMを兼任。2022年9月に株式会社LayerXに機械学習エンジニアとして入社。2023年には機械学習チームのリーダー、現職に就任。 X(Twitter) Speakerdeck 技術や業界など仕事についての情報収集の基盤として多くのエンジニアを支えていたTwitter(現X)が、以前とは異なる姿となってゆく今、必要な情報を過不足なく

                                                                    情報の海をハックするカギは「捨てる」こと。LayerX松村氏に学ぶ、価値ある情報を取りこぼさないコツ
                                                                  • 【「スゴ本」中の人が薦める】AIの限界をAIが超え始めていることを実感できる5冊

                                                                    1. 『ヒトはなぜ笑うのか』マシュー・M. ハーレー 、レジナルド・B・アダムズJr.、ダニエル・C・デネット 著、片岡宏仁 訳 2. 『言語の本質』今井むつみ、秋田喜美 著 3. 『教養としてのAI講義』メラニー・ミッチェル 著、尼丁千津子 訳 4. 科学雑誌『Newton(ニュートン)』 2023年10月号、中野太郎 、尾崎太一 執筆、松尾 豊 監修 5. 『天然知能』郡司ペギオ幸夫 著 これは、ヘミングウェイが書いたとされる、たった6語の小説だ(※1)。この短い小説から、何が感じられるだろうか? 売ります 赤ちゃんの靴 未使用 おそらく、悲嘆だろう。我が子のために靴を買ったのだけれど、その靴を履く前に、亡くなってしまったのだろう。靴を見るたびに喪われた子のことを思い出し、悲しみに暮れてしまう。ならばいっそ手放してしまおう―――背後にそんなストーリーを想像させる。 私が想像したこの感情

                                                                      【「スゴ本」中の人が薦める】AIの限界をAIが超え始めていることを実感できる5冊
                                                                    • 【Pythonのパッケージ管理に悩む方へ】パッケージ管理ツールRyeを使ってみた | DevelopersIO

                                                                      こんちには。 データアナリティクス事業本部 インテグレーション部 機械学習チームの中村です。 今回はRyeを使ったPythonの実行環境構築についてご紹介します。 Ryeについて RyeはRustで実装された、Python環境をワンストップで管理できるツールとなっています 今まではpyenv + poetryやpyenv + pipenvなどpyenvとの組み合わせで構築が必要だったものが、RyeだけでPythonインタープリタ含めて管理することが可能です。 RyeはRustのrustupとcargoにインスパイアされた、Pythonの新しいパッケージング体験を構築する実験的な試みとなっており、作者により「Production Readyではない」と紹介されていますが、検証用等個人で使用するには使い勝手はかなり良かったのでご紹介致します。 公式ページは以下となります。 セットアップ インス

                                                                        【Pythonのパッケージ管理に悩む方へ】パッケージ管理ツールRyeを使ってみた | DevelopersIO
                                                                      • プロダクトでのデータ活用を推進するために回避すべき 10 の罠|piqcy

                                                                        データドリブンにプロダクトを改善していきたい、とはどんなプロダクトマネージャーでも志すことですが現実には上手く行かないこともあると思います。その時に、参考になる動画を見つけたので紹介します。 Product School のチャンネルで公開されている Webinar: Top 10 Digital Analytics Mistakes by Amplitude's Adam Greco and WillowTree's Jeremy Stern です。登壇者の Adam Greco さんは Amplitude という分析プラットフォームの Product Evangelist 、 Jeremy Stern さんは WillowTree というプロダクトでのデータ活用を支援するコンサルティングサービスの Director of Product Analysis を担当されています。動画の見ど

                                                                          プロダクトでのデータ活用を推進するために回避すべき 10 の罠|piqcy
                                                                        • デンマークの野菜コーナーに売られていたニンニクの芽らしき野菜を買ったら実は観賞用の水仙で地獄を見たという話→「ニラとか食べない国だからできる売り方だ」

                                                                          Hiraku Morita / 森田啓 @hiraku_mrt Cryptography Researcher | Postdoc at @csaudk and @DIKU_Institut MPC PPML 暗号研究者 🇩🇰 オーフス大の暗号Grpとコペンハーゲン大の機械学習Grpで働く熊本人 / 秘密計算×機械学習の研究 / 日曜フルート吹き sites.google.com/view/hirakumor… Hiraku Morita / 森田啓 @hiraku_mrt 野菜コーナーで「デンマークには変わったニンニクの芽が売ってるな」と買って昨日の昼飯に食べたこれ、水仙だった 知ってますか、これ有毒(致死量10gらしい)で吐気と下痢がやばかった 黄水仙を見た詩人のワーズワースが「銀河に輝く星々のようだ…」と言ったそうですが、僕も別の意味で星見ました pic.twitter.com/

                                                                            デンマークの野菜コーナーに売られていたニンニクの芽らしき野菜を買ったら実は観賞用の水仙で地獄を見たという話→「ニラとか食べない国だからできる売り方だ」
                                                                          • Apple、M4チップを発表

                                                                            カリフォルニア州クパティーノ Appleは本日、まったく新しいiPad Proに驚異的なパフォーマンスをもたらす最新チップ、M4を発表しました。第2世代の3ナノメートルテクノロジーを使って設計されたM4は、Appleシリコンの業界をリードする電力効率をさらに向上させ、iPad Proの驚くほど薄いデザインを実現するシステムオンチップ(SoC)です。このチップはまた、iPad Proの画期的なUltra Retina XDRディスプレイの驚くべき精度、色、輝度を実現する、まったく新しいディスプレイエンジンを搭載しています。新しいCPUは最大10コアを搭載し、新しい10コアGPUは、M3で導入された次世代GPUアーキテクチャをもとに設計され、Dynamic Caching、ハードウェアアクセラレーテッドレイトレーシング、ハードウェアアクセラレーテッドメッシュシェーディングを初めてiPadで利用

                                                                              Apple、M4チップを発表
                                                                            • 推定1000万円以下のコストで開発され、国内最大・最高性能を達成した日本語LLM, Karakuri-LMの秘密

                                                                              推定1000万円以下のコストで開発され、国内最大・最高性能を達成した日本語LLM, Karakuri-LMの秘密 2024.02.18 Updated by Ryo Shimizu on February 18, 2024, 10:08 am JST 2024年1月。国内の生成AIコミュニティに激震が走った。 コンタクトセンター向けのチャットボット開発のパイオニアとして知られるカラクリ社が商用利用可能のオープンソースモデルとして公開したKarakuri-ln-70bの性能が高すぎると話題になったのだ。 多くの日本語LLMと同様に数学能力に関するスコアは低いが、物語を記述する能力、日本語の質問に日本語で答えたり、答えをプログラムで扱い易いJSON形式にしたりする能力がこれまでの国産LLMに比べて桁違いに高かったのである。 物語を記述する能力に関しては、一説によればGPT-4を凌駕するとも言わ

                                                                                推定1000万円以下のコストで開発され、国内最大・最高性能を達成した日本語LLM, Karakuri-LMの秘密
                                                                              • 「AIと著作権に関する考え方」を文化庁が公表―懸念解消を求める声に応え | Game*Spark - 国内・海外ゲーム情報サイト

                                                                                文化庁は2024年4月18日、文化審議会著作権分科会法制度小委員会が3月15日付けで取りまとめた、「AIと著作権に関する考え方について」(以下、「考え方」)の概要を公表しています。 2017年に早稲田大学法学部教授の上野達弘氏は「日本は機械学習パラダイスだ」と提言し、実際のところ近年の急速な生成AIの発展・普及にAIと著作権の関係を直接的に取り扱った判例や裁判例がいまだ乏しい状態です。「考え方」は、懸念解消を求める声に応えるべく“現行の著作権法がAIとの関係でどのように適用されるか”有識者からなる審議会で検討した内容をまとめたものとなっています。 「考え方」概要ではAIと著作権についての基本的な考え方を

                                                                                  「AIと著作権に関する考え方」を文化庁が公表―懸念解消を求める声に応え | Game*Spark - 国内・海外ゲーム情報サイト
                                                                                • エンジニア不足は「業界全体」の問題。LayerX松本CTOに聞く「自走できるエンジニア不足」から脱する方法

                                                                                  TOPインタビューエンジニア不足は「業界全体」の問題。LayerX松本CTOに聞く「自走できるエンジニア不足」から脱する方法 日本CTO協会 理事 株式会社LayerX 代表取締役CTO 松本 勇気 東京大学在学時に株式会社Gunosy入社、CTOとして技術組織全体を統括。またLayerXの前身となるブロックチェーン研究開発チームを立ち上げる。2018年より合同会社DMM.com CTOに就任し技術組織改革を推進。大規模Webサービスの構築をはじめ、機械学習、Blockchain、マネジメント、人事、経営管理、事業改善、行政支援等を歴任。2019年日本CTO協会理事に就任。2021年3月よりLayerX 代表取締役CTO就任。開発や組織づくり、及びFintechとPrivacy Techの2事業の推進を担当。2023年、LayerX LLM Labsを立ち上げ所長に就任 多くの企業がエンジ

                                                                                    エンジニア不足は「業界全体」の問題。LayerX松本CTOに聞く「自走できるエンジニア不足」から脱する方法