  • Host the Whisper Model on Amazon SageMaker: exploring inference options | Amazon Web Services

    AWS Machine Learning Blog Host the Whisper Model on Amazon SageMaker: exploring inference options OpenAI Whisper is an advanced automatic speech recognition (ASR) model with an MIT license. ASR technology finds utility in transcription services, voice assistants, and enhancing accessibility for individuals with hearing impairments. This state-of-the-art model is trained on a vast and diverse datas

    • Amazon EC2 Inf2 instances, optimized for generative AI, now available globally

      Starting today, the Amazon Elastic Compute Cloud (Amazon EC2) Inf2 instances are generally available in the Asia Pacific (Mumbai), Asia Pacific (Singapore), Asia Pacific (Tokyo), Europe (Ireland), and Europe (Frankfurt) regions. These instances deliver high performance at the lowest cost in Amazon EC2 for generative AI models. You can use Inf2 instances to run popular applications such as text sum

      • Cohereの多言語用の埋め込みモデルを日本語で評価してみる - Ahogrammer

        Cohereが提供を開始した多言語用のテキスト埋め込み用のモデルであるembed-multilingual-v3.0の性能を日本語の文類似度と検索のデータセットで評価してみました。 Cohere Embed v3とは CohereのEmbed v3はテキストを埋め込むためのモデルです[1]。これまでもv2モデルがありましたが、それと比べた主な改良点は、単純に性能が向上していることに加えて、コンテンツの全体的な品質を評価する機能が挙げられます。この機能はノイズの多いデータセットを扱う場合に役立ち、品質の高い文書を上位にランク付けすることができとしています。さらに、圧縮を考慮した特別な学習方法を実装しており、ベクトルデータベースの実行コストを大幅に削減できるとしています。この機能の詳細については、近日中に公開とのことです。 画像はhttps://txt.cohere.com/introduci

        • Vector databases (1): What makes each one different?

          Yahoo! JapanThere’s clearly a LOT of activity in the Bay Area, California when it comes to vector databases! Also, there’s a large amount of variation in funding and valuations, and it’s clear that there exists no correlation between the capabilities of a database and the amount it’s funded for. Choice of programming language#Fast, responsive and scalable databases are typically written these days

          • Zoom's updated Terms of Service permit training AI on user content without Opt-Out

            Well, well, well… It looks like Brave isn’t the only company out there that is willing to bet all its chips on reusing other people’s content for AI training. Zoom Video Communications, Inc. recently updated its Terms of Service to encompass what some critics are calling a significant invasion of user privacy. 📢 An update. Hey everyone – Zoom users and curious readers alike. This update was writt

            • Beyond Jupyter | TransferLab — appliedAI Institute

              Beyond Jupyter is a collection of self-study materials on software design, with a specific focus on machine learning applications, which demonstrates how sound software design can accelerate both development and experimentation. The software being developed in machine learning contexts often remains at fairly low levels of abstraction and fails to satisfy well-established standards in software des

              • AWS勉強モチベーションを上げたければ、JAWS-UG初心者支部に行け!!! - Qiita

                こんにちは、har_はる と申します。 2024年1月27日(土)にJAWS-UG初心者支部の勉強会に参加し、勉強モチベーションが爆裂アップしたので、その経験を書き記します。 ※著者はJAWS-UGの運営に一切携わっておりません。ただの一般参加者です。 1.そもそもJAWS-UGとは? 一言で表すと、AWS (Amazon Web Services) が提供するクラウドコンピューティングを利用する人々の集まり(コミュニティ)です。 AWSを愛する人・AWSを学びたい人・AWSを好きになりたい人など、様々な志を持つ人たちが集まり、その知見を共有し合って学びを深めていくコミュニティとなっております。 ハンズオン形式で学んでいく回もあれば、希望者のLTを拝聴するような回もあり、1人では出来ない学びや交流を提供してくださっています。 しかし、このJAWS-UGに対して、不安な思いの方もいるのではな

                • ”新生”アマナイメージズ、日本画像生成AIコンソーシアム設立

                  ”新生”アマナイメージズ、日本画像生成AIコンソーシアム設立画像生成AIを安心・安全に活用できるための持続可能な枠組み実現へ 日本最大級の画像ライブラリを運営する、「ビジュアル権利の総合カンパニー」株式会社アマナイメージズ(本社:東京都品川区、代表取締役CEO:沼澤裕太、以下アマナイメージズ)が主導となり、2023年6月20日、「日本画像生成AIコンソーシアム(Japan Image Generative AI Consortium、以下JIGAC(ジーガック)」が設立されたことをお知らせします。 本コンソーシアムは、画像を中心とする「ビジュアル素材」を生成するAI(artificial intelligence、人工知能)が、日本社会において安心・安全に活用できるための持続可能な枠組みの議論と実証を行うことを目的としたものです。本コンソーシアム設立にあたり、画像ライブラリ、AI開発者、ユ

                  • 7月新刊情報『コンピュータビジョンのための実践機械学習』

                    『コンピュータビジョンのための実践機械学習 ―モデルアーキテクチャからMLOpsまで』 Valliappa Lakshmanan、Martin Gorner、Ryan Gillard 著、大山 匠 監訳、松田 晃一 訳 2023年7月19日発売予定 512ページ(予定) ISBN978-4-8144-0038-6 定価4,620円(税込) 機械学習モデルを使用して画像に関するさまざまな課題を解くための実践的な解説書。コンピュータビジョンは機械学習で最も注目度の高い分野のひとつです。本書では、機械学習エンジニアやデータサイエンティストを対象に、コンピュータビジョンに関連する機械学習の手法、アーキテクチャ、課題、運用などを網羅的に解説します。読者は、分類、物体検出、セグメンテーション、異常検知、画像生成、キャプション生成といった画像関連の問題を、機械学習で解決する方法を学びます。また、データセ

                    • New localllm lets you develop gen AI apps locally, without GPUs | Google Cloud Blog

                      No GPU? No problem. localllm lets you develop gen AI apps on local CPUs In today's fast-paced AI landscape, developers face numerous challenges when it comes to building applications that use large language models (LLMs). In particular, the scarcity of GPUs, which are traditionally required for running LLMs, poses a significant hurdle. In this post, we introduce you to a novel solution that allows

                      • OpenAI Assistants APIを使わずに無限にスケールする汎用AI(仮)を開発した - LIFULL Creators Blog

                        KEELチーム の相原です。 前回のエントリ で我々KEELチームはKubernetesベースの内製PaaSであるKEELを開発・運用する傍ら、LLMという新たなパラダイムの台頭にあわせてベクトルデータベースの提供や周辺ソフトウェアを社内向けに開発していることを紹介しました。 www.lifull.blog あれから数ヶ月が経ち、現在私達はLIFULLのグループ会社全体に向けて汎用AI(仮)を提供しています。 もともと我々KEELチームはPlatform Engineeringの一環として、Kubernetesベースの内製PaaSであるKEELのほかにコードジェネレータによる一貫したPaaS体験を中心に様々なユーティリティをコマンドラインから提供するkeelctl, KEELが提供するプラットフォームのユーザ体験を向上させるブラウザ拡張のkeelextを開発してきました。 Platform

                        • 深層学習と新しい心理学(明治学院大学 研究員:池田功毅、九州大学准教授:山田祐樹、慶応義塾大学教授:平石界) |「こころ」のための専門メディア 金子書房

                          深層学習と新しい心理学(明治学院大学 研究員:池田功毅、九州大学准教授:山田祐樹、慶応義塾大学教授:平石界) 近年の深層学習(ディープラーニング)の発展には目を見張るものがあります。この発展の前で心理学は、何ができるのでしょうか? 深層学習技術が発展した世界における新しい心理学の可能性について、お三方の先生にご執筆いただきました。 科学的な心理学の目標は、心を科学的に理解・予測し、その成果を社会に役立てていくことだと言われます (e.g. 鹿取 et al., 2020)[1]。しかしこの記事の著者である私たちは、当の心理学者であるにもかかわらず、ここのところ再現可能性危機やらエビデンスレベルやらと、心理学の科学性やその社会的役割について疑問を呈し、不安を感じさせるような議論ばかり行ってきました (池田 & 平石, 2016; 平石, 2022; 平石 & 中村, 2022; 山田, 20

                          • LLMの推論を効率化する量子化技術調査 【技術動向調査】 - Platinum Data Blog by BrainPad

                            本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 ブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 本記事から週に1回程度の頻度で、社内で実施している生成AI・LLMに関する論文レビュー会の内容をピックアップのうえ配信していきますので、ぜひご期待ください。 今回は、LLMの学習や推論の効率化・高速化に関する4つの技術論文をご紹介させていただきます。 目次 LLM論文レビュー会とは 今回のテーマ A Survey of Quantization Methods for Efficient Neural Network Inference 選定理由 論文概要 量子化の基本的な手

                            • Appleがニュース記事で生成AIをトレーニングするためさまざまなメディアと5000万ドル以上の複数年契約について話し合ったことが発覚

                              アメリカのNBC News、Condé Nast、IACなど、複数のメディアにAppleが接触し、今後Apple独自のAIを育てるためにニュースのアーカイブを共有することについて話し合った可能性があることが報じられました。 Apple Explores A.I. Deals With News Publishers - The New York Times https://www.nytimes.com/2023/12/22/technology/apple-ai-news-publishers.html Apple relies heavily on AI/ML in iOS https://appleinsider.com/articles/23/09/02/how-apple-is-already-using-machine-learning-and-ai-in-ios Apple

                              • LLMOpsを推進!Azure Log Analyticsを活用したLLMの継続的な監視と改善 - AITC - ISID | AI トランスフォーメンションセンター コラム

                                こんにちは!AIソリューショングループの太田です。 このコラムでは、Azure Log Analyticsを使ったLLMOpsの実現方法について紹介します。 昨年から大規模言語モデル(LLM)を製品やサービスに組み込む企業が増えています。 しかし、LLMサービスの品質を維持するには、その運用にも注意を払う必要があります。 具体的には、LLMの出力の品質管理や、ユーザーからのフィードバックを元にしたプロンプトの最適化など、継続的な監視と改善が求められています。 これらの運用上の活動にAzure Log Analyticsが役立ちます。 LLMOps(LLM(Large Language Model)+ Ops(Operations))とは LLMOpsは製品に組み込まれたLLMの運用に必要なベストプラクティスの概念を指します。 例えば、LLMの運用ではLLMの出力の監視と評価とプロンプト管理

                                • 公開論文から学ぶ Google のテクノロジー : パート 1:分散処理基盤(コンテナ技術)とデータセンター編 | Google Cloud 公式ブログ

                                  Google Cloud のサービスは、Google が長年に渡って構築してきたグローバルネットワーク、そして、世界各地のデータセンターによって提供されています。これは、Google 検索をはじめとするさまざまな Google のサービスを支えるインフラでもあり、その上では、Google 独自の技術を活用したさまざまなミドルウェアが稼働しています。 Google Cloud で提供されるマネージドサービスの多くは、これらのミドルウェアをマルチテナント化して提供しているものであり、いわば、Google Cloud を利用することで、Google 以外の企業でも「Google のサービスを支える技術」が活用できるのです。Google Cloud を活用する開発者の中には、このような Google の技術に興味を惹かれて、Google Cloud を使い始めたという方も少なくないかも知れません。

                                  • Meta、画像から高レベルの抽象化を学ぶ機械学習モデル「I-JEPA」をリリース - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報

                                    Meta のチーフ AI サイエンティスト Yann LuCan 氏 Image credit: Meta Meta のチーフ AI サイエンティスト Yann LeCun 氏は、数年前から、人間の助けをほとんど借りずに世界のモデルを学習できるディープラーニングシステムについて話してきた。現在、そのビジョンは徐々に実現しつつあり、Metaは、画像に対する自己教師あり学習を通じて世界の抽象的な表現を学習する機械学習(ML)モデル「I-JEPA」最初のバージョンをリリースした。 初期テストでは、I-JEPA が多くのコンピュータビジョンタスクで高い性能を発揮することが示された。また、他の最先端モデルよりもはるかに効率的で、トレーニングに必要な計算資源は10分の1である。Metaは、トレーニングコードとモデルをオープンソース化し、来週開催されるCVPR(Computer Vision and P

                                    • ある朝、Azure使用料で数十万ドルの請求書が…… クラウドリソース不正利用の最新手口

                                      合併などを想定したテナント移転機能が、リソース悪用の糸口に クラウドコンピューティング環境はサイバー攻撃者にとって魅力的なターゲットの一つだ。ダヴラエフ氏によると、「Microsoft Azure」(以下、Azure)においても、数十テナントにまたがり、数百万ドル規模に上る不正利用が判明したケースがあったという。平均被害額はわずか数日で30万ドル規模に上った。 「被害者はある朝目覚めると、数百万ドル規模の被害を受けたことに気が付きます。調査に入る頃には、その金額はすでに失われた後です」(ダヴラエフ氏) ダヴラエフ氏が紹介したのは、Azureのサブスクリプションとテナント、ディレクトリの関係を悪用した手法だ。 課金単位であるサブスクリプションと、リソース管理の単位であるテナントは別々の概念だが、Azureのサブスクリプションは基本的にテナントにひも付けられている。そしてサブスクリプションごと

                                      • Tailwind Skeleton Generator

                                        Your skeleton will appear hereGet started by converting your component! About AE StudioWe are a development, data science and design studio that works closely with founders and executives to create custom software, machine learning and BCI solutions. Learn more about human agency Why did we build this?In the digital world, time is precious. We transformed loading delays into an opportunity by crea

                                        • Gorilla

                                          UC Berkeley, Microsoft Research sgp@berkeley.edu, tianjunz@berkeley.edu Gorilla is a LLM that can provide appropriate API calls. It is trained on three massive machine learning hub datasets: Torch Hub, TensorFlow Hub and HuggingFace. We are rapidly adding new domains, including Kubernetes, GCP, AWS, OpenAPI, and more. Zero-shot Gorilla outperforms GPT-4, Chat-GPT and Claude. Gorilla is extremely r

                                          • Snowflakeのデータに対して探索的データ分析をしたい!SnowsightのチャートとAmazon SageMaker Studioの例 | DevelopersIO

                                            Snowflakeのデータに対して探索的データ分析をしたい!SnowsightのチャートとAmazon SageMaker Studioの例 Snowflakeに格納したデータに対する探索的データ分析(EDA)ツールの例として、Snowsightのチャート(ダッシュボード・ワークシート)とAmazon SageMaker Studioのご紹介です。 データアナリティクス事業本部 機械学習チームの鈴木です。 Snowflakeに格納したデータを使って機械学習モデルを構築したい際に、最初のステップとして探索的データ分析(Exploratory data analysis、以降EDA)をどこでするとよいかを検討する機会がありました。 Snowflakeが公開している情報を確認しつつ、私がよく利用するSnowsightのチャートとAmazon SageMaker Studioの例をご紹介します。

                                            • UI and UX: Crucial Components of Product Design

                                              The most commonly used terms in product design are User Interface (UI) and User Experience (UX). These similar-sounding terms are not new concepts but are often used interchangeably. Understanding the differences in UI and UX gives a better insight into what product design entails. This also helps clear out any generic confusion commonly associated with these concepts. UI and UX are overlapping co

                                              • Amazon SageMaker StudioでMLOpsを始めました - inSmartBank

                                                こんにちは!スマートバンクでSREをしている @maaaato です。 今回はスマートバンクが提供するB/43の裏側にAmazon SageMaker Studio(以下SageMaker Studio)の利用を開始したのでSageMaker Studioにまつわる話をしたいと思います。 筆者はこれまでにMLOpsの運用は行った経験がなく初めての試みでした。同じくSageMakerの構築・運用も初めてだったためいくつか悩んだポイントがありました。 特にSageMakerにはいろんな機能がありどれを使うのがベストなのか迷ったり、MLOpsを設計するにあたり、AWS Step Functions(以下Step Functions)を採用している事例などもあることからAmazon SageMaker Studio Pipelinesとどちらがベストなのか?Step Functionsとの違いはな

                                                • Introducing Google’s new Arm-based CPU | Google Cloud Blog

                                                  Introducing Google Axion Processors, our new Arm-based CPUs At Google, we constantly push the boundaries of computing, exploring what is possible for grand challenges ranging from information retrieval, global video distribution, and of course generative AI. Doing so requires rethinking systems design in deep collaboration with service developers. This rethinking has resulted in our significant in

                                                  • 生成 AI をセキュアにする: 関連するセキュリティコントロールの適用 | Amazon Web Services

                                                    Amazon Web Services ブログ 生成 AI をセキュアにする: 関連するセキュリティコントロールの適用 本ブログは「Securing generative AI: Applying relevant security controls」を翻訳したものとなります。 本ブログは、生成 AI をセキュアにするシリーズのパート 3 です。まずは、スコーピングマトリックスについての詳細を紹介したブログ「生成 AI をセキュアにする: 生成 AI セキュリティスコーピングマトリックスの紹介」の概要から始めましょう。本ブログでは、生成 AI アプリケーションを保護するためにセキュリティコントロールを実装する際の考慮事項について説明しています。 アプリケーションをセキュアにするための最初のステップは、アプリケーションのスコープを理解することです。本シリーズのパート 1 では、アプリケーショ

                                                    • External endpoints and testing of task states now available in AWS Step Functions | Amazon Web Services

                                                      AWS News Blog External endpoints and testing of task states now available in AWS Step Functions Now AWS Step Functions HTTPS endpoints let you integrate third-party APIs and external services to your workflows. HTTPS endpoints provide a simpler way of making calls to external APIs and integrating with existing SaaS providers, like Stripe for handling payments, GitHub for code collaboration and rep

                                                      • 2023 JSConf JP 資料まとめ

                                                        はじめに JSConf JPに参加してきました。 後で見返せるように資料をまとめておきます。 Youtube Track A: https://www.youtube.com/watch?v=yxMJaXke9Hc Track B: https://www.youtube.com/watch?v=N1lhkH33fwY Track C: https://www.youtube.com/watch?v=pdgB0Y5ZQGk- Track D: https://www.youtube.com/watch?v=rDfPXDEot_A 資料リンク There and Back Again: A Proposal's Tale Web Internals: Mastering the JavaScript Engine Deep dive into Biome LLM全盛時代の開発プラクティス M

                                                        • GPT-4 で作るスライド風の論文要約チャレンジ📝 - ABEJA Tech Blog

                                                          はじめに 本記事で目指すこと スライド作成のステップ プロンプト作成 ステップ1~3: スライドコンテンツ作成までの準備 ステップ4: 日本語でスライドコンテンツを作成 ステップ5: Reveal.js のコードを作成 工夫点 明示的に CoT をさせるため、ステップの中で複数回に分けて GPT-4 にリクエストを送る Role-Play Prompting を先頭に仕込む STEP-BACK PROMPTING として途中にメタ質問を加える 作成した結果 パターン1 パターン2 その他のトライ さいごに はじめに ABEJAアドベントカレンダー2023の14日目の記事になります。 こんにちは、ABEJAでデータサイエンティストをしている中西 @cfiken です。 LLM の登場のおかげで arxiv に上がる論文やテクニカルレポートの概要をチェックするのが簡単な時代になりました。例えば

                                                          • Gartner Places Generative AI on the Peak of Inflated Expectations on the 2023 Hype Cycle for Emerging Technologies

                                                            Gartner Places Generative AI on the Peak of Inflated Expectations on the 2023 Hype Cycle for Emerging Technologies Generative artificial intelligence (AI) is positioned on the Peak of Inflated Expectations on the Gartner, Inc. Hype Cycle for Emerging Technologies, 2023, projected to reach transformational benefit within two to five years. Generative AI is encompassed within the broader theme of em

                                                            • Appleが人工知能「Apple Intelligence」を発表。略してAI… #WWDC24

                                                              Appleが人工知能「Apple Intelligence」を発表。略してAI… #WWDC242024.06.11 03:2117,436 小暮ひさのり こうくるか…! これまで頑なに「AI(人工知能:Artificial Intelligence)」と言わなかったApple。 機械学習(Machine Learning)は何度も言ってるけど、AIとは言えない呪いが書けられているの? と疑うレベルでしたが、答えはWWDC 24。 今日の日のためにAppleの新しい言い方を用意していたからでした。 「Apple Intelligence」 AppleのAI機能はこう呼ばれます。 つまり? そう、縮めて「AI」。 Source: Apple

                                                              • MLOpsの意義:機械学習プロジェクトを成功させるための鍵 - Qiita

                                                                はじめに MLOpsエンジニアとして、MLOpsの意義を他人に説明する機会が定期的にあるので、まとめてみました。 このブログでは、MLOps(Machine Learning Operations)という概念を紹介し、機械学習プロジェクトの成功に向けてどのように活用し得るかを記載します。 MLOpsが登場した背景 機械学習(ML)は今日、ビジネスにおいて重要な役割を果たしています。 しかし、機械学習プロジェクトというのは「データサイエンティストが自身のラップトップでモデルを開発すれば終わり」ではありません。そのモデルがシステム・プロダクトに組み込まれ、価値を発揮し続けるためには、様々な工程を繰り返し経る必要があります。(参考: ITコンサル企業のAIチームでMLOpsをすることの面白みと今後の展望) そこで発生する課題に対応するためには、従来のソフトウェア開発手法とは異なる、新たなアプロー

                                                                • Understand errors and warnings better with Gemini  |  Chrome DevTools  |  Chrome for Developers

                                                                  In the dialog window, learn what data will be sent to Google. To view the data in new tabs, you can click the corresponding links. To get an explanation, click Continue. After a few seconds, an explanation will appear below the console error. If you don't think the explanation is satisfactory, you can click Use search instead to open a new tab with search results for the error. We would greatly ap

                                                                  • 「Microsoft Copilot for Security」の一般提供が2024年4月1日にスタート、利用価格は計算ユニット1つごとに1時間4ドル

                                                                    Microsoftが、これまでプレビュー版として提供してきたセキュリティ向けのジェネレーティブAI「Microsoft Copilot for Security」を、2024年4月1日から一般提供することを発表しました。 Microsoft Copilot for Security | Microsoft Security https://www.microsoft.com/ja-jp/security/business/ai-machine-learning/microsoft-copilot-security Microsoft Copilot for Security is generally available on April 1, 2024 | Microsoft Security Blog https://www.microsoft.com/en-us/security/bl

                                                                    • 日本語データセットを用いたMPT-7Bのファインチューニングおよび性能評価とチャットボット構築 - Platinum Data Blog by BrainPad

                                                                      本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 最近、オープンソースかつ商用利用可能なLLMを日本語に対応させるファインチューニングが注目を集めている中、商用利用可能な日本語データセットを用いてMPT-7Bをファインチューニングしてみました。 はじめに こんにちは、アナリティクスサービス部の内田です。 最近、オープンソースかつ商用利用可能なLLMを日本語に対応させるファインチューニングが注目を集めています。上記のようなLLMを使用すれば、ChatGPTやそのAPIとは異なり、オンプレ環境やクラウド環境で実行する場合

                                                                      • Nvidia H100 GPUs: Supply and Demand

                                                                        This post is an exploration of the supply and demand of GPUs, particularly Nvidia H100s. We’re also releasing a song and music video on the same day as this post. This post went mega viral. It was on the frontpage of HN, techmeme, many email newsletters, got tweets from Andrej Karpathy and others, comments from Mustafa (who will have $1B of GPUs online soon) from Inflection and Emad from Stability

                                                                        • Financial Machine Learning

                                                                          • A Guide to Deep Learning and How It Works

                                                                            Deep learning is attracting rapidly growing research and development in today’s world, where artificial intelligence is exponentially growing with newer breakthroughs by the day. Deep Learning is one of the methodologies that is receiving a lot of attention. Deep Learning (DL) is a subset of Machine Learning that teaches computers to do what humans naturally do. It trains an algorithm to predict o

                                                                            • Automation in Information Technology (IT)

                                                                              Automation seems to be a buzzword these days. And when we talk about automation, we are talking about Information Technology. How can things be automated if it is not IT? IT Automation Of course, we can automate a few things mechanically, but not for processes. And the processes run businesses, not the machines. What then? Machines help us, but we, as human beings, survive because of businesses. T

                                                                              • Google Cloud をゼロから学ぶならこれ! おすすめの学習リソース

                                                                                Google Cloud、始めてみませんか? この記事は Google Cloud Japan Advent Calendar 2023 (入門編) の 1 日目の記事です。 この記事では、「Google Cloud を始めてみたいけど、何から手をつけて良いのか分からない」「ドキュメントの見方もよくわからないぞ?」という方々にとって、お役に立ちそうな情報を記載していきます。 全体像を学ぶ方法から、最新情報をキャッチアップする方法まで、自分の今の状況に合わせて、記事で紹介しているコンテンツを活用いただければと思います! 全体像を学ぶ プロダクトや機能について学ぶ前の段階として、そもそも Google Cloud で何ができるのか、どんなラインアップがあるのかを掴みましょう。 ここでは、全体像を掴むためのリソースを紹介していきます。 他社クラウドの知識をベースに学ぶ 既に他社クラウドの知識があ

                                                                                • Sparse Transformers:入力シーケンスの長さによる計算量増加問題への革新的なアプローチ

                                                                                  3つの要点 ✔️ Attentionのレイヤー毎の特徴を再現することで,計算量の削減を達成 ✔️ Sliding Window Attenion、Dilated Sliding Window Attention、Global Attentionという3つのAttentionを使ってTransformernの計算量を削減した ✔️ 計算量を削減しただけではなくて,当時のSOTAを達成している. Generating Long Sequences with Sparse Transformers written by Rewon Child, Scott Gray, Alec Radford, Ilya Sutskever (Submitted on 23 Apr 2019) Comments: Published on arxiv. Subjects: Machine Learning (c

