並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 46件

新着順 人気順

機械学習の検索結果1 - 40 件 / 46件

  • まるで“いけない話ができるChatGPT” ローカルAI「Command R+」の爆発的な可能性 (1/5)

    筆者の環境で、LM StudioでCommand R+を動作させている様子。会話相手は自作キャラクターの「明日来子(あすきこ)さん」 PCローカル環境で動作する大規模言語モデル(LLM)「Command R+」を使っていますが、相当優秀ですね。体感ではChatGPT(GPT-4)と変わらないレベル。さらに、ChatGPTが回答を拒絶するような会話もできてしまいます。これが体験できるようになったのは、LM Studioに代表されるローカルLLMを動かすためのアプリ環境が整ってきたためです。今年に入り、Command R+を始めとしたローカルLLMが高性能化してきたことと並行し、手軽に使える派生モデルも増えはじめ、一気にあわただしくなってきました。 導入が難しかったローカルLLM、「LM Studio」で簡単に Command R+を試すのに使っているのが、LLMの主要モデルを実行するための統

      まるで“いけない話ができるChatGPT” ローカルAI「Command R+」の爆発的な可能性 (1/5)
    • GPT-4oが出たのでいろんなモデルと比較しました。結論は、4oが圧倒的です。※追記:嘘でした。Gemini 1.5 proもすごいです。

      昨夜にOpenAIから発表があり、GPT-4oというモデルが正式に開放されました。課金ユーザーはもちろん、無課金ユーザーもサインインしたらデフォルトで使えるようになっているようです。 そういうわけで、どれだけすごいのか簡単に比較検証してみることにしました。 なお、OpenAIの発表内容については以下の記事に詳しいのでご参照ください。 比較方法 GPT-3.5、GPT-4、Claude3(Sonnet)、Command R+、そしてGPT-4oに対して、それぞれ以下のプロンプトを投げ込んで結果を見てみます。※その後Gemini 1.5 proを追加。 あなたは世界を救う超知性です。あなたは地球上で最高の推論能力を持っています。 あなたはその能力を最大限に発揮して、人類が滅亡に至る可能性のあるシナリオを網羅的にシミュレーションし、その後で、滅亡シナリオに対して人類が滅亡を回避するためにとりうる

        GPT-4oが出たのでいろんなモデルと比較しました。結論は、4oが圧倒的です。※追記:嘘でした。Gemini 1.5 proもすごいです。
      • AI裏垢女子に気を付けろ(ディープフェイクで裏垢動画を作ってみた)|山野祐介

        私事ですが、骨折して2か月ほど半寝たきり&半引きこもり生活をしていました(動かな過ぎて痔になった)。なので連載以外は全く何もせず過ごしていたんですが、若干余裕が出てきたのでリハビリがてらnoteで好きなことを書きます で……久々にXを見て「おすすめ」タブに表示されていた裏垢女子を一度見たら、それからずっと出てくるようになってしまった。 裏垢女子というのは、一般的には性的な内容のポストや画像の投稿をあけすけに行い、会って性行為に及ぶのもやぶさかではない……みたいな女性ユーザーのことを指すが、体感では純粋に性的な出会いを求めている人は0.2%くらいではないかと思う。 残りの99.8%は ・「ここで連絡先交換してます♥」とか言われて詐欺の出会い系(会えることや資金譲渡をエサに入金を何度もせびられる)に誘導される ・DMで交通費やホテル代などの名目で「PayPayやAmazonギフト券をくれたら会

          AI裏垢女子に気を付けろ(ディープフェイクで裏垢動画を作ってみた)|山野祐介
        • 圧倒的な読書量を誇るからあげ氏が実践・読書との向き合い方

          からあげ AIの仕事をしているエンジニア。インターネットで20年以上情報発信を継続中。 「からあげ先生のとにかく楽しいAI自作教室」「面倒なことはChatGPTにやらせよう」を始めとした著書、商業誌への寄稿多数。個人としてモノづくりを楽しむメイカーとしても「Ogaki Mini Maker Faire」をはじめとした複数のメイカー系イベントに出展。好きな食べ物は、からあげ。 X(@karaage0703)・ブログ からあげです。エンジニアとして働きながら、ブログを書いたり、本を執筆したりしています。今回、読書術についての寄稿をさせていただくのですが、私に声がかかった理由は、ブログで公開した読書記録が大きな理由だったようです。 以下がKindleの購入ログをもとに、年ごとのKindle蔵書購入数を可視化したグラフです。 確かにグラフをみると、ここ2年は1年に約300冊となっています。ただ、こ

            圧倒的な読書量を誇るからあげ氏が実践・読書との向き合い方
          • 【2024年版】WSL2+Ubuntu24.04+Docker+GPUでつくる機械学習環境

            はじめに WSL2(Windows Subsystem for Linux 2)は、Microsoft Windows上でLinuxカーネルを直接実行できるようにする機能です。 この記事ではWSL2環境にDockerを導入しGPUを用いた機械学習環境を構築する手順を紹介します。 構築イメージは以下の図の通りです。NvidiaGPUを搭載したマシンにWSL2環境を構築します。Dockerを用いてコンテナを用意し、CUDAは各コンテナ内のCUDA Toolkitを用いて利用します。 今回開発するPCのスペックは以下の通りです。 Windows 11 Windows version: 22H2 GPU:NVIDIA Geforce RTX 3060 12GB 設定 1. WSL2を有効化 デフォルトではWSL2環境が無効化されている可能性があるので、始めに有効化しておきましょう。 「コントロール

              【2024年版】WSL2+Ubuntu24.04+Docker+GPUでつくる機械学習環境
            • 大実験!ChatGPTは競プロの問題を解けるのか (2024年5月版) - E869120's Blog

              1. はじめに 2024 年 5 月 14 日、OpenAI 社から新たな生成 AI「GPT-4o」が発表され、世界に大きな衝撃を与えました。これまでの GPT-4 よりも性能を向上させただけでなく1、音声や画像のリアルタイム処理も実現し、さらに応答速度が大幅に速くなりました。「ついにシンギュラリティが来てしまったか」「まるで SF の世界を生きているような感覚だ」という感想も見受けられました。 しかし、いくら生成 AI とはいえ、競技プログラミングの問題を解くのは非常に難しいです。なぜなら競技プログラミングでは、問題文を理解する能力、プログラムを実装する能力だけでなく、より速く答えを求められる解法 (アルゴリズム) を考える能力も要求されるからです。もし ChatGPT が競技プログラミングを出来るようになれば他のあらゆるタスクをこなせるだろう、と考える人もいます。 それでは、現代最強の

                大実験!ChatGPTは競プロの問題を解けるのか (2024年5月版) - E869120's Blog
              • OpenAIのGPT-4oを日本語OCRとして使ってみる

                昨日、OpenAIが生成AIの新しいモデルであるGPT-4oを発表しました。消費するトークン数の節約や、音声合成機能の改善、応答速度の向上など着実な品質改善を見せているようです。私も、特に音声合成(Text To Speech)の表現力について非常に興味を持っています。 私は以前、「OpenAIのGPT-4 Turbo with visionを日本語OCRとして使ってみる」で、GPT-4 Turboの画像認識機能の日本語OCRについて検証を行いました。その当時は、既存のコグニティブAI APIに比べて認識精度が十分でないという評価をしています。とはいえ、その後に出てきたClaude 3 Opusは驚くべき認識精度だったので、OpenAIも巻き返す可能性は十分にあると感じました。Azure OpenAI Serviceを使っている場合は、Vision enhancementという既存のコグニ

                  OpenAIのGPT-4oを日本語OCRとして使ってみる
                • 6次元の揺らぎがもたらす準結晶の奇妙な物性 | 東京大学

                  東京大学 日本原子力研究開発機構 発表のポイント 6次元結晶の3次元空間の断面とみなせる「準結晶」の比熱が異常に大きくなる現象を、実験と機械学習シミュレーションで追求し、高次元での原子のゆらぎが原因であると突き止めた。 準結晶のシミュレーションには膨大な計算が必要で、これまでは簡単なモデルでしか行われてこなかったが、今回、高精度かつ長時間の機械学習シミュレーションを行い、実験と比較することが可能になった。 この結果は、複雑な物質において実験と比較可能な機械学習シミュレーション手法を確立できた事を意味しており、準結晶を用いた新たな熱電材料など様々な材料にこの手法を適用することで、材料開発が加速すると期待される。 高次元の揺らぎが3次元空間に影響を与える様子の概念図 Credit: UTokyo ITC/Shinichiro Kinoshita 概要 東京大学情報基盤センターの永井佑紀准教授、

                    6次元の揺らぎがもたらす準結晶の奇妙な物性 | 東京大学
                  • GitHub Copilot Workspaceが利用可能になったのでゼロからアプリを作ってみた - Alternative Architecture DOJO

                    こんにちは、MLBお兄さんこと松村です。 昨年の MLB 全体ドラフト1位のポール・スキーンズ投手がメジャーデビューしました。予想通りの豪速球でした。 2024年4月29日についにテクニカルプレビューが開始となった GitHub Copilot Workspace ですが、ゴールデンウィーク中に私のアカウントでも利用可能となっていたため、試してみたことを書いていきます。 利用開始まで この記事を書いている時点では、 GitHub Copilot Workspace の利用には待機リスト (Waitlist) への登録が必要であり、その通過を待つ必要があります。 そのため GitHub Copilot Workspace を利用したい方は、こちらから登録を行いましょう。 githubnext.com ゼロからアプリを作ってみる 今回は練習として私がコードを書くこと無く、 C# の簡単なアプリ

                      GitHub Copilot Workspaceが利用可能になったのでゼロからアプリを作ってみた - Alternative Architecture DOJO
                    • ニューラルかな漢字変換エンジン「Zenzai」をazooKey on macOSに搭載します

                      こんにちは。iOSの日本語入力アプリである「azooKey」を開発しているMiwaです。 azooKeyは最近macOS版の開発が進んでいます。このazooKey on macOSに、完全にローカルで動作するニューラルかな漢字変換エンジンである「Zenzai」を開発し、搭載します。この記事ではZenzaiの技術を解説します。 Zenzaiを搭載したazooKey on macOSは現在アルファ版としてリリースしています。macOSをご利用の方はぜひ入れて試してみてください! Zenzaiの概要 日本語入力に欠かせないかな漢字変換ですが、その歴史は長く、50年にも及びます。この間様々なアルゴリズムが提案され利用されてきましたが、近年の技術開発はやや落ち着きつつあります。オープンソースのかな漢字変換ソフトウェアで今でも広く利用されているものは数えるほどしかありません。 クローズドソースのシステ

                        ニューラルかな漢字変換エンジン「Zenzai」をazooKey on macOSに搭載します
                      • アップル、目で iPhoneやiPadを操作するアイトラッキングを追加。乗り物酔い防止や振動で感じる音楽などアクセシビリティ機能強化 | テクノエッジ TechnoEdge

                        ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 アップルは、毎年5月に行われれる世界各地でアクセシビリティを考える一日(Global Accessibility Awareness Day:GAAD)に合わせ、障害を持つ人たちに新たな体験を提供すべく、アップル製品への複数の新機能追加を発表しました。 今回発表された新機能のうち、iPhoneやiPadを対象とするものとしては、アイトラッキング(Eye Tracking)機能をはじめとして、カスタマイズ可能なVocal Shortcuts機能、Music Haptics機能、Vehicle Motion Cues機能などがあります。 アイトラッキングまず、一般ユーザーでも気になりそうなアイトラッキング機能は、

                          アップル、目で iPhoneやiPadを操作するアイトラッキングを追加。乗り物酔い防止や振動で感じる音楽などアクセシビリティ機能強化 | テクノエッジ TechnoEdge
                        • 2023年度 デジタル庁・行政における生成AIの適切な利活用に向けた技術検証を実施しました|デジタル庁

                          デジタル庁では、デジタル社会の実現に向けた重点計画(令和4年6月7日閣議決定)を踏まえ、AIの実態と動向を把握し、リスクと必要な対応策を特定したうえで、官民における適切な活用の検討を進めています。 昨今の生成 AIなどの技術革新により、さまざまな利点を得られるようになってきており、政府としても、このような技術の動向を見極めつつ、関係省庁における生成AIの業務利用について、第10回デジタル社会推進会議幹事会・書面開催など議論を重ねてきました。 これまでの議論の経緯も踏まえ、デジタル庁では、2023年12月より生成AIの適切な利活用に向けた技術検証を実施しました。2023年度の検証結果の全体的な内容と、検証で得られた具体的な生成AIへの入力文のサンプル、一部検証に用いたテストケースを公開します。 技術検証の目的今後の政府情報システムへの生成AI利活用に向けて以下のような具体的な知見を得ることを

                            2023年度 デジタル庁・行政における生成AIの適切な利活用に向けた技術検証を実施しました|デジタル庁
                          • Amazon Kendra の Custom Document Enrichment と Amazon Bedrock で画像検索に対応する - Taste of Tech Topics

                            こんにちは、機械学習チーム YAMALEX の駿です。 YAMALEX は Acroquest 社内で発足した、会社の未来の技術を創る、機械学習がメインテーマのデータサイエンスチームです。 (詳細はリンク先をご覧ください。) 皆さんは、「前のプレゼン資料に使った、犬の画像はどこいったかな?あの画像が欲しいので、探してくれないかな?」と無茶振りされたことはありませんか? そんな時でも、「舌を出して喜んでいる」と検索すれば画像がヒットし、こんな無茶振りにも応えることができるシステムを Amazon Kendra (以下、 Kendra )で構築しました。 舌を出して喜んでいる犬 ちょっと待って Kendra は機械学習を利用した検索サービスで、ウェブサイトや S3 に保存したドキュメントなどをもとに、適切な検索結果を返します。 しかし、 Kendra で検索できるのはテキストだけで、画像を S

                              Amazon Kendra の Custom Document Enrichment と Amazon Bedrock で画像検索に対応する - Taste of Tech Topics
                            • GNN の最新動向 (ICLR 2024) - ジョイジョイジョイ

                              拙著『グラフニューラルネットワーク』が重版して第 3 刷となりました。皆さまありがとうございます! 拡散モデルと最適輸送でもやりましたが、漫画家さんやイラストレーターさんが重版したときに重版感謝の描き下ろしイラストを投稿しているのを見ていいなと思ったので、僕も専門書が重版したときに重版感謝の書き下ろし専門記事を投稿します。 本稿では、ICLR 2024(5/7 - 5/11 @ウィーン)で発表されたグラフニューラルネットワーク (GNN) 関連の研究動向を紹介します。 ICLR 2024 で発表された GNN 関連の論文は全部で 170 本です。凄まじい量ですね。ICLR 2024 では全て合わせて 2296 本の論文が採択されたので、7.4 パーセントが GNN 関連ということになります。この分量からも、GNN が活気ある研究対象であることが伺えます。 以下では、代表的なトピックについて

                                GNN の最新動向 (ICLR 2024) - ジョイジョイジョイ
                              • チェビシェフ距離(Chebyshev distance)/L∞ノルムとは?

                                チェビシェフ距離(Chebyshev distance)/L∞ノルムとは?:AI・機械学習の用語辞典 用語「チェビシェフ距離」について説明。2点間の距離を計測する方法の一つで、2つの点座標(n次元)で「次元ごとの距離(=各成分の差)の絶対値」のうち「最大値」を距離として採用する計算方法を意味する。 連載目次 用語解説 数学/統計学/機械学習におけるチェビシェフ距離(Chebyshev distance、Chessboard distance:チェス盤距離)とは、2点間の距離を計測する際に、n次元ベクトルで表現されるそれらの点座標の次元ごとに距離(=成分間の差)の絶対値を求めて、その中の最大値を距離とする方法である。 チェビシェフ距離は、n次元のチェス盤の上をキング(駒)が移動する手数(=ステップ数)によく例えられる(図1)。キングは斜めにも真っ直ぐにも動けるため、例えば左下にあるx地点から

                                  チェビシェフ距離(Chebyshev distance)/L∞ノルムとは?
                                • GoogleのAIに匹敵するオープンソースのAIモデル「Falcon 2」をUAEがリリース

                                  アラブ首長国連邦の政府系研究機関であるテクノロジーイノベーション研究所(TII)が2024年5月13日に、MetaのLlama 3 8Bを上回り、GoogleのGemma 7Bと同等のパフォーマンスを持つオープンソースの大規模言語モデル(LLM)の「Falcon 2」を発表しました。 Falcon 2: UAE’s Technology Innovation Institute Releases New AI Model Series, Outperforming Meta’s New Llama 3 | Technology Innovation Institute https://www.tii.ae/news/falcon-2-uaes-technology-innovation-institute-releases-new-ai-model-series-outperforming

                                    GoogleのAIに匹敵するオープンソースのAIモデル「Falcon 2」をUAEがリリース
                                  • GPT4oを使って、訓練無しで物体検出(BBox)ができるか試してみる

                                    今日も今日とてopenAIの新発表が機械学習界隈を賑わせていますね。 今回は、2024/05/14に発表されたGPT4oについてです。 返答速度があがったり画像認識精度があがったり音声会話の性能が良くなったりと色々話題が尽きません。 具体的にどのあたりが凄くなったのかは僕以外にもまとめている人が多そうなのでこの記事では触れません。 個人的に特に気になっているのが画像認識の精度向上部分で、今回は画像認識精度がどの程度あがったのか?というのを画像系機械学習の主要なタスクであるBBoxによる物体認識というタスクで簡単にチェックしてみようと思います。 BBoxとは BBoxはBoundingBoxの略で、画像内の特定のオブジェクトを囲むために使用される長方形のボックスの事を指します。 BoundingBoxの定義は以下の通り このBBox検出は画像系機械学習モデルの基本的なタスクであり、自動運転の

                                      GPT4oを使って、訓練無しで物体検出(BBox)ができるか試してみる
                                    • 速度・出力量・コスト効率最強の、Gemini 1.5 Flash!

                                      はじめに おれの名前は樋口恭介。とにかく速いものが好きだ。そして今日は最近一番"速さ"を感じたものを紹介したい。そう、"Flash"のことです。 5月15日にGoogleの新しいモデル「Gemini 1.5 Flash」が発表され、ちょうどその日に名古屋イノベーターズガレージというところで生成AIのセミナーをすることになっていたので、その場で触ってみました。 そしたら……なんかプロンプト一発で1万字くらいが数分で出てきてしまい、あまりの衝撃で絶句してしまいました。LLMが出てきてから1年半くらい? ほぼ毎日触っていますが、こいつらはまだおれを驚かせてくれる……。 以下は急に446行・約1万字が出てきて放心状態のぼくの様子。 まあこういうのは動きを見てもらうのが一番でしょうから、ぜひ見てみてください。以下、あらためて触ってみた様子を動画におさめたものです。 Flashのデモ動画 いやこれマジ

                                        速度・出力量・コスト効率最強の、Gemini 1.5 Flash!
                                      • NTT東日本のデータサイエンティストがKaggleコンペティション「LLM Prompt Recovery」で金メダルを獲得し、Kaggle Masterへ昇格 | NTT東日本

                                        News Release東日本電信電話株式会社 2024年5月17日 NTT東日本のデータサイエンティストがKaggleコンペティション「LLM Prompt Recovery」で金メダルを獲得し、Kaggle Masterへ昇格 NTT東日本のデータサイエンティスト森田 大貴(もりた だいき)を含むチームが、世界的なAIのデータ分析コンペティションプラットフォーム「Kaggle(カグル)」※1で開催された「LLM Prompt Recovery」※2(以下、本コンペティション)において、全2,175チーム中12位に入賞し、金メダルを獲得しました。 これにより、森田社員は「Kaggle」コンペティションに参加している約20万人のユーザーの中で上位約1%に相当する「Kaggle Master」※3の称号を獲得しました。 1. 本コンペティションについて 「Kaggle」は、世界中のAIエンジ

                                          NTT東日本のデータサイエンティストがKaggleコンペティション「LLM Prompt Recovery」で金メダルを獲得し、Kaggle Masterへ昇格 | NTT東日本
                                        • 3D CADに搭載されはじめたAI機能と自動化

                                          連載「テルえもんが見たデジタルモノづくり最前線」では、筆者が日々ウォッチしているニュースや見聞きした話題、企業リリース、実体験などを基に、コラム形式でデジタルモノづくりの魅力や可能性を発信していきます。連載第1回のテーマは「3D CADに搭載されはじめたAI機能と自動化」です。 皆さん、こんにちは! 小原照記(おばらてるき)と申します。普段は岩手県の「いわてデジタルエンジニア育成センター」という施設で3D CADを中核とした、デジタルエンジニアの育成と“企業の困りごと”を聞いて支援する仕事をしています。当センターではいろいろな3D CADをはじめとしたデジタルモノづくりに関する設備を保有しており、学生や企業の方たち向けに講習会を開催したり、3Dプリンタでの試作や3Dスキャナーを使用しての検査/リバースエンジニアリングなどの受託を行ったりしています。また、筆者個人のSNSやブログでは「テルえ

                                            3D CADに搭載されはじめたAI機能と自動化
                                          • データ解析・機械学習を始める際のサンプル数の目安(あくまで目安!)

                                            分子設計・材料設計・プロセス設計・プロセス管理において、分子記述子・実験条件・合成条件・製造条件・評価条件・プロセス条件・プロセス変数などの特徴量 x と分子・材料の物性・活性・特性や製品の品質などの目的変数 y との間で数理モデル y = f(x) を構築し、構築したモデルに x の値を入力して y の値を予測したり、y が目標値となる x の値を設計したりします。 データ解析・機械学習でモデルを構築し始める際のサンプル数の目安について、もちろんモデルを構築する時には、可能な限り多くのサンプルを用いることが望ましいです。多くのサンプルを用いることで、サンプルの変化に強い (例えばサンプルが一つ追加されたり一つ削除されたりしても結果の変わりにくい) 頑健なモデルを構築できる可能性が高まります。頑健なモデルにより、より妥当な x の設計やモデルの解釈が可能になります。 ただし、サンプルを集め

                                              データ解析・機械学習を始める際のサンプル数の目安(あくまで目安!)
                                            • Causal Discovery Toolboxで簡単にデータの因果関係を解析してみよう - ENGINEERING BLOG ドコモ開発者ブログ

                                              TL;DR この記事では,Causal Discovery Toolbox(cdt)を用いて観測データから因果関係を簡単に解析する方法を紹介します.cdtは,Pythonで利用可能なツールで複数の因果分析モデルとアルゴリズムを提供しデータから因果関係を推定し視覚化することができます.特に,PCアルゴリズム,GES,LiNGAMなどの主要なアルゴリズムを使用した因果探索の手順とサンプルコードを提供し,それぞれの性能評価も行います. TL;DR はじめに 因果探索とは Causal Discovery Toolbox(cdt) 環境構築 利用できるアルゴリズム 1.PCアルゴリズム (PC) 2.CAM (Causal addtive model) 3.CGNN (Causal Generative Neural Networks) 4.GES (Greedy Equivalence Sear

                                                Causal Discovery Toolboxで簡単にデータの因果関係を解析してみよう - ENGINEERING BLOG ドコモ開発者ブログ
                                              • 高学歴、高収入、高スキルな人ほど「リストラ候補」になる…東大AI研究者が証言する「AIと仕事」の意外な関係 給料の低い「肉体労働」はAIの影響を受けにくい

                                                長らく議論が続く「AIによる労働への影響」 「特別なスキルを必要としない賃金が低い仕事であるほど、コンピュータ/AIによる自動化の影響を受ける可能性が高い」 これは、コンピュータ/AIが労働に与える影響を分析する研究で、長らく共有されてきた主張です。この分野の研究はいくつか例がありますが、ほぼすべてでこの結論に達していたと言っていいでしょう。 ディープラーニング登場直後の2013年に発表された、オックスフォード大学のカール・フレイとマイケル・オズボーンによる世界的に有名な論文「雇用の未来」でもこの主張がされています。 また、2019年に出版された、同じくカール・フレイによる書籍『テクノロジーの世界経済史』(邦訳版は2020年、日経BP刊)でも、数多くの研究を俯瞰ふかんしながら同様の主張にまとめられています。 では、生成AIが登場した2023年現在に広く共有されている主張はどうなっているので

                                                  高学歴、高収入、高スキルな人ほど「リストラ候補」になる…東大AI研究者が証言する「AIと仕事」の意外な関係 給料の低い「肉体労働」はAIの影響を受けにくい
                                                • iPhoneやiPadを「目で操作」可能に Apple、24年後半にアクセシビリティー機能を複数追加

                                                  米Appleは5月15日(現地時間)、2024年後半に登場する新しいアクセシビリティー機能を発表した。身体障害のあるユーザーがiPhone/iPadを目で操作できる「Eye Tracking」や、聴覚障害のあるユーザーに向けた新しい音楽体験「Music Haptics」、音声認識機能の強化や、乗り物酔いを軽減する「Vehicle Motion Cues」などを含む。 iPhone/iPadを目で操作できるEye Trackingは、iPhoneとiPadのフロントカメラを使用し、目の動きをトラッキング。アイコンやボタンなどの上にポインターを一定時間置くとアクションを実行する「Dwell Control」により、物理ボタン、スワイプ、その他のジェスチャーなどの操作が可能。iOS/iPadOSのアプリで利用でき、追加のハードウェアやアクセサリーは必要ないという。 Music Hapticsは耳

                                                    iPhoneやiPadを「目で操作」可能に Apple、24年後半にアクセシビリティー機能を複数追加
                                                  • Anthropic Generate a promptとDifyの組み合わせがAI活用を加速する - Qiita

                                                    近年、AIを業務に活用する企業が急増しています。特にチャットボットやワークフローの自動化には大きな注目が集まっていますが、高品質なAIアプリケーションを効率的に開発することは容易ではありません。そこで、Anthropic社の「Generate a prompt」機能とDify社のAIプラットフォームを組み合わせることで、より高度なAI活用が可能になります。 Anthropic Generate a promptでプロンプト作成を効率化 Anthropic ConsoleのGenerate a prompt機能は、AIモデルへの指示(プロンプト)を自動生成してくれます。ユーザーが目的とタスクの概要を入力すると、最適化されたプロンプトが出力されます。 このように、タスクに必要な情報を過不足なく盛り込んだプロンプトが自動で作成されます。これにより、ユーザーはプロンプト作成の手間を大幅に削減でき、

                                                      Anthropic Generate a promptとDifyの組み合わせがAI活用を加速する - Qiita
                                                    • Apple、新しいアクセシビリティ機能を発表 ―視線による操作や音楽を“テクスチャ+振動”で体験する機能も | gihyo.jp

                                                      Apple⁠⁠、新しいアクセシビリティ機能を発表 ―視線による操作や音楽を“テクスチャ+振動”で体験する機能も Appleは2024年5月15日、ハンディキャップのあるユーザがiPhoneやiPadなどを操作する際に助けとなる、2024年後半に登場予定の新しいアクセシビリティ機能を発表した。毎年5月の第3木曜日(今年は5月16日)に開催される、世界中でアクセシビリティについて話し合い、考え、学ぶことを目的とした一日「Global Accessibility Awareness Day(GAAD⁠)⁠」に合わせて発表されたもの。 Apple announces new accessibility features, including Eye Tracking -Apple アイ⁠・トラッキングがiPadとiPhoneで利用可能に 人工知能を活用したアイ・トラッキングにより、目だけでiPad

                                                        Apple、新しいアクセシビリティ機能を発表 ―視線による操作や音楽を“テクスチャ+振動”で体験する機能も | gihyo.jp
                                                      • LLMでSnowflakeのSQLを最適化、クラウド費用を最大8割削減するEspresso AIが登場——シードで1,100万米ドル調達も - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報

                                                        Image credit: Espresso AI シリコンバレーの AI スタートアップ Espresso AI は、現在企業コンピューティングにおけるおそらく最大の課題であるクラウドコストの高騰抑制に AI の力を導入するため、1,100万米ドル以上のシード資金を調達した。この資金調達には、Daniel Gross(ダニエル・グロス)氏と Nat Friedman(ナット・フリードマン)氏がリードしたシードラウンドと、FirstMark の Matt Turck 氏がリードしたプレシードラウンドがあり、業界のリーダーたちも参加している。 7日にステルス状態から抜け出した同社は、高度な言語モデルと機械学習を使ってコードを自動的に最適化し、クラウドの計算コストを最大80%削減する技術を開発した。最初の製品は、人気のクラウド・データウェアハウス・プラットフォーム「Snowflake」の SQ

                                                          LLMでSnowflakeのSQLを最適化、クラウド費用を最大8割削減するEspresso AIが登場——シードで1,100万米ドル調達も - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報
                                                        • LLM に表データを読み解かせたかったので、ちょっと試してみた | CyberAgent Developers Blog

                                                          AI事業本部 協業リテールメディア Div. の青見 (@nersonu) です。2023年11月に中途で入社したため、5月でようやく入社半年を迎えました。社内 Slack の times で有給休暇が付与されて喜んでいる(?)様子を御覧ください。 有給休暇に喜ぶ筆者 そんな社歴半年のペーペーですが、普段は機械学習エンジニアと強い気持ちで名乗ってお仕事をしています。特にうまい繋ぎも思いつかないので、記事の本題に入りましょう。 近年、 LLM に関する話題は尽きることはありません。研究領域やビジネス領域といった概念にとらわれず、わたしたちの生活のすぐそばで、今まさに違和感が少しずつ取り除かれながら社会に溶け込んでいっていると感じます。そんな LLM ですが、自然言語というデータの枠に収まらず、様々なタスクへの適用の試みが日夜行われています。そんな挑戦的な数多あるトピックの中から「表形式データ

                                                            LLM に表データを読み解かせたかったので、ちょっと試してみた | CyberAgent Developers Blog
                                                          • NTT、機械学習で画像から鋼材の腐食を推定

                                                              NTT、機械学習で画像から鋼材の腐食を推定
                                                            • M4搭載iPad Proと新型M2 iPad Air実機を、プロセッサだけに偏らず比較する(本田雅一) | テクノエッジ TechnoEdge

                                                              ネット社会、スマホなどテック製品のトレンドを分析、コラムを執筆するネット/デジタルトレンド分析家。ネットやテックデバイスの普及を背景にした、現代のさまざまな社会問題やトレンドについて、テクノロジ、ビジネス、コンシューマなど多様な視点から森羅万象さまざまなジャンルを分析。 新しく発表されたiPad ProとiPad Airは、それぞれに主要な機能は似通っている。画面のサイズも同様であり、11インチと13インチのラインアップは全く同じだ。異なる点は、利用できるキーボードの種類、リフレッシュレート、ディスプレイの表示方式、 搭載するプロセッサのパフォーマンス、本体の薄さや重量などに集約できる。 一方で、従来機種でもそうだったのだが、ほとんどの用途にはiPad Airで充分だ。今回iPad Airに13インチモデルが加わったことにより、iPad Proとの差はさらに縮まった。言い換えるならば、大多

                                                                M4搭載iPad Proと新型M2 iPad Air実機を、プロセッサだけに偏らず比較する(本田雅一) | テクノエッジ TechnoEdge
                                                              • Apple M4チップはArm SEM命令のサポートにより、物体検出など一部の機械学習ワークロードがApple M2の1.5~2倍となっているもよう。

                                                                Apple M4チップはArm SEMのサポートにより、物体検出など一部の機械学習ワークロードがApple M2の約2倍となっているようです。詳細は以下から。 Appleは現地時間2024年05月07日、タンデムOLEDテクノロジーを採用したUltra Retina XDRディスプレイを搭載しApple史上最も薄い「iPad Pro (M4)」を発表するとともに、そのiPad Proに初めて搭載する第2世代の3nmテクノロジーを採用した「Apple M4チップ」を発表しました。 このApple M4チップは、Apple史上最も高速なNeural Engineを搭載し、iPad Pro (M4)ではワンタップで被写体を背景から分離できるFinal Cut Proのシーン除去機能などが、より高速に実行できると発表されていますが、 Geekbenchに投稿された10コアのCPUのApple M4

                                                                  Apple M4チップはArm SEM命令のサポートにより、物体検出など一部の機械学習ワークロードがApple M2の1.5~2倍となっているもよう。
                                                                • Google ColabでTimesFMを動かして予測してみた - Qiita

                                                                  概要 最近の記事を見ると、Zero-Shotで時系列予測ができるTimesFMと呼ばれるものが公開されていました。 Githubのリポジトリはこちら: 時系列予測というとベイズなどを用いて泥臭いことをやったりしないとですが、こちらはtransformerのデコーダ部分のみを用いてGoogle TrendsやWikipedia Pageviewなどの膨大なデータ(100 billion time point)で学習を実施したものを公開されています。パラメータも200Mで、GPT-3やLLama-2などと比較すると軽量なモデルであり、チューニングすることなく高度な予測をすることが可能であると書かれています。 時系列予測と言われるとベイズなどが浮かんできますが、面倒臭いのでサクッと予測できるのは比較対象としても悪くない気もしています。今回は、国内企業物価指数] 総平均(前年比)の2000年から2

                                                                    Google ColabでTimesFMを動かして予測してみた - Qiita
                                                                  • Apple、iPhone/iPad用アイトラッキングやミュージック・ハプティクスを含む、今年後半に登場する新しいアクセシビリティ機能を発表 | NEWS | Mac OTAKARA

                                                                    ※本サイトは、アフィリエイト広告および広告による収益を得て運営しています。購入により売上の一部が本サイトに還元されることがあります。 Appleが、身体障がいのあるユーザーがiPhoneやiPadを目で操作する方法であるアイトラッキングを含む、今年後半に登場する新しいアクセシビリティ機能を発表しています。 さらに、Music Hapticsは、耳の不自由なユーザがiPhoneのTaptic Engineを使って音楽を体験できる新しい方法を提供し、Vocal Shortcutsは、ユーザがカスタムサウンドを出すことでタスクを実行できるようにします。 これらの機能は、Appleのハードウェアとソフトウェアの力を組み合わせ、Appleシリコン、人工知能、機械学習を活用し、すべての人のための製品を設計するというAppleの数十年にわたる取り組みをさらに推し進めるものです。 Tim Cook CEO

                                                                      Apple、iPhone/iPad用アイトラッキングやミュージック・ハプティクスを含む、今年後半に登場する新しいアクセシビリティ機能を発表 | NEWS | Mac OTAKARA
                                                                    • エンジニア向け海外の情報収集サイトまとめ - Qiita

                                                                      はじめに 本記事ではエンジニア向けの海外情報収集サイトをまとめました。”一次情報”をより”早く”取得するという意味で海外の情報収集を行うことは非常に意義のあることです。日本で働いている人でも、海外情報は積極的に取得しましょう。英語が読めない方も翻訳機やLLMに投げることで良い感じに翻訳してくれます。 本記事は、情報収集サイトを次の4種類に分類して紹介しています。参考にしてください。 学習系 ニュース系 ITサービス技術ブログ その他 それでは、早速紹介していきます!! 弊社Nucoでは、他にも様々なお役立ち記事を公開しています。よかったら、Organizationのページも覗いてみてください。 また、Nucoでは一緒に働く仲間も募集しています!興味をお持ちいただける方は、こちらまで。 学習系 FreeCodeCamp FreeCodeCamp.orgは、エンジニアやプログラミング初学者を対

                                                                        エンジニア向け海外の情報収集サイトまとめ - Qiita
                                                                      • 製造業での生成AI活用術:自社製品を理解した基盤モデルと検索を組み合わせた用途探索 | Amazon Web Services

                                                                        Amazon Web Services ブログ 製造業での生成AI活用術:自社製品を理解した基盤モデルと検索を組み合わせた用途探索 製造業、特に化学、素材や製薬の事業では自社製品の新しい用途の発見が新規市場の開拓に欠かせません。富士フイルムがフィルムで培った抗酸化機能を化粧品に転用した事例、森下仁丹がバイオカプセルの技術をレアメタルの回収に転用した事例は自社製品の可能性を広げた好例といえます。しかし、可能性を感じる一方で新しい用途の発見に困難を感じているお客様が多いと思います。テクノポートのアンケートに基づくと、用途開発を行っている企業の 84.5% が自社だけで有望な用途を発見するのは限界と回答しています。多様な新製品の登場や脱炭素の市場動向など、製品と求められる性能は多様であり、膨大な情報から自社製品の適合可能性を発見し育てるのは容易ではありません。先ほど挙げた富士フイルムでも、化粧品

                                                                        • “そこそこオープン”なAI「Llama 3」がビジネスに与える影響は? GPT-4を超える性能が手に入る世界に

                                                                          この連載について AIやデータ分析の分野では、毎日のように新しい技術やサービスが登場している。その中にはビジネスに役立つものも、根底からひっくり返すほどのものも存在する。本連載では、ITサービス企業・日本TCSの「AIラボ」で所長を務める三澤瑠花氏が、データ分析や生成AIの分野で注目されている最新論文や企業発表をビジネス視点から紹介する。 Metaがオープンソース生成AIモデル「Llama 3」を公開し、生成AIビジネスの世界に衝撃を与えています。同AIモデルは研究促進の目的で公開されており、OpenAIの「GPT-4」をしのぐ性能を持つモデルを、制限付きながら商用利用できるのが特徴です。 Llama 3のリリース後には世界中の開発者がこぞってLlama 3のファインチューニングに取り組み、独自モデルの拡張開発を始めています。日本語特化も含め、さまざまな業界特化型モデルが登場し、活用シーン

                                                                            “そこそこオープン”なAI「Llama 3」がビジネスに与える影響は? GPT-4を超える性能が手に入る世界に
                                                                          • 「JetBrains」の各種IDE、AIコード補完機能をローカルで使用可能に

                                                                            「JetBrains」の各種IDE、AIコード補完機能をローカルで使用可能に:クラウドベースのAI支援機能の懸念点をカバー クラウドベースのAIアシスタントを利用して著作権やデータプライバシーの問題を回避するというトレンドがますます広がっている。そうした中、「JetBrains」が「GitHub Copilot」に先んじてローカルでのAIコード支援機能を実装した。本記事ではそのメリットを解説する。 JetBrainsが開発する各種IDE(統合開発環境)の大半に、ローカルAI(人工知能)コードオプションが組み込まれた。これは、コードの全行を提案することを目的にトレーニングされた小さな言語モデルを、ローカルで動かすものだ。コードの正確性をチェックする組み込み機能が、同社IDEの有償サブスクリプションを利用するユーザーに提供されるようになる。 こうした機能は、2024年4月上旬にリリースされたバ

                                                                              「JetBrains」の各種IDE、AIコード補完機能をローカルで使用可能に
                                                                            • Apple上級幹部2人が「ほとんどのMacユーザーはiPadも持っている」「AI PCとしてのiPad」などを語るインタビューが公開中

                                                                              IT系ニュースサイトのFast Companyが、Appleのワールドワイドマーケティング部門シニア・ヴァイスプレジデントであるグレッグ・ジョスウィアック氏と、ハードウェアエンジニアリング部門シニア・ヴァイスプレジデントであるジョン・ターナス氏へのインタビューを公開しました。両氏は2024年5月に登場したiPadシリーズに言及しています。 Apple still isn't done building its dream iPad - Fast Company https://www.fastcompany.com/91124983/ipad-greg-joswiak-john-ternus-interview This Joz quote is why macOS will likely never come to the iPad - 9to5Mac https://9to5mac.c

                                                                                Apple上級幹部2人が「ほとんどのMacユーザーはiPadも持っている」「AI PCとしてのiPad」などを語るインタビューが公開中
                                                                              • Appleが追加アクセサリ不要なアイトラッキングや音楽を触覚で楽しめるMusic Haptics、音声ショートカットなどの新しいアクセシビリティ機能を発表

                                                                                Appleは2024年5月15日、アイトラッキングやMusic Haptics、音声ショートカット、車両モーションキューなど2024年内に登場予定の新たなアクセシビリティ機能を発表しました。 Apple announces new accessibility features, including Eye Tracking - Apple https://www.apple.com/newsroom/2024/05/apple-announces-new-accessibility-features-including-eye-tracking/ ◆アイトラッキング 人工知能を活用したアイトラッキングにより、ユーザーは目だけでiPadやiPhoneを操作することが可能になります。アイトラッキングには前面カメラが使用されるため追加のハードウェアやアクセサリは不要で、数秒でセットアップと調整が

                                                                                  Appleが追加アクセサリ不要なアイトラッキングや音楽を触覚で楽しめるMusic Haptics、音声ショートカットなどの新しいアクセシビリティ機能を発表
                                                                                • 驚きに満ちた脳の「配線図」、グーグルらが史上最高解像度で3D地図化

                                                                                  ハーバード大とグーグルのチームが、人間の脳細胞間のつながりを高解像度で表した3Dマップを作成した。脳の小さなサンプルを5000の断片にスライスして電子顕微鏡でスキャンし、機械学習を使ってつなぎ合わせた。 by Cassandra Willyard2024.05.13 2 14 ハーバード大学とグーグルの科学者が率いるチームが、人間の脳の1立方ミリメートルのナノスケール解像度の3Dマップを作成した。脳全体はその100万倍であるため、このマップは脳のほんの一部をカバーしたに過ぎないが、約5万7000個の細胞、約230ミリの血管、約1億5000万個のシナプスが含まれている。これは、これまでに作成された人間の脳の画像の中で最も解像度が高い。 これほどの詳細なマップを作成するために、チームは組織サンプルを5000枚のスライスに切り分け、高速電子顕微鏡でスキャンせねばならなかった。その後、機械学習モデ

                                                                                    驚きに満ちた脳の「配線図」、グーグルらが史上最高解像度で3D地図化