ストックマークの社内研修の公開版※資料です。 (※実際に研修で利用したものとは異なります)
世界最高峰の舞台で、鮮烈なデビューを飾った1年。前人未到の境地へ駆け抜けるこの目には、今、一体どんな景色が見えているのか――。プレミアから日本代表まで、三笘薫がその全てを語った。 現在発売中のNumber1075号掲載の[ロングインタビュー]三笘薫「僕はもっと進化できる」より内容を一部抜粋してお届けします。【記事全文は「NumberPREMIER」にてお読みいただけます】 「もちろん僕も自分の感覚を大事にしていますし、最終的には信じます。でも、それが合っていないのに信じていたらバカじゃないですか。自分がいい動きをしたとしても、他の人にはそう見えないときもある。自分では速いと思ったけど、本当は速くないときもある。だから僕はあらゆる手段を使って自分の主観が正しいかを確かめたいんです」 実力でも人気でも日本サッカー界の顔に 三笘にとって2022-'23シーズンは、新たな扉を開く1年になった。 初
GPT-1は1億1700万個のパラメーターを持つ言語モデルで、GPT-2では15億、GPT-3では1750億とパラメーター数が増加するにつれて言語モデルの性能が上がってきています。しかしパラメーター数が増加するにつれてトレーニングに必要なデータの数やトレーニング中に使用するメモリの量も増加し、トレーニングのコストが大きく増加してしまいます。そんな中、メモリの消費量を激減させつつ少ないデータでトレーニングできる手法「QLoRA」が登場しました。 [2305.14314] QLoRA: Efficient Finetuning of Quantized LLMs https://arxiv.org/abs/2305.14314 artidoro/qlora: QLoRA: Efficient Finetuning of Quantized LLMs https://github.com/art
日本で、あるいは海外で球史に残る活躍を見せ、現役を退いたいまでも高い人気を誇るのがイチローだ。彼にはなぜ、際立ったプレーが可能だったのか。そして、どうして今でも人々の注目を集めるのか。運動科学の第一人者である著者による独自の分析を『レフ筋トレ 最高に動ける体をつくる』よりお届けしよう。 前編記事<もしや、あなたもハマってる!? 運動科学者が指摘する「やればやるほど損をするダメな筋トレ」の特徴> イチローも大谷翔平も身体がゆるみきっている イチローの身体を考察するのにあたり、なによりも最初に指摘しておきたいことがあります。それは、彼が「徹底的にやわらかく、ゆるんだ存在である」ということです。驚くほどの柔軟性を見せるアスリートは数多(あまた)いますが、そのなかでもイチローの緩解度の深い柔軟性はひときわ抜きんでています。 現役時代のイチローは、打席に立つたびに、ネクストバッターズサークルで股関
イーロン・マスク氏は7月14日(米国時間)、12日に予告した新企業xAIに関するスペースを予定より少し遅れて開催した。4万人以上がリアルタイムで参加し、マスク氏の伝記を執筆中のウォルター・アイザックソン氏やキム・ドットコム氏なども質問した。 マスク氏は、xAIの目標は複雑な科学や数学の問題を解明し、宇宙を理解するのに役立つ“スーパーインテリジェントAI”を構築することだと語った。そうしたAIは2029年までに登場すると予想するのが現実的だという。xAI立ち上げメンバーらは、社会に利益をもたらす「人間より賢いAI」を構築したいと語った。 マスク氏はまた、将来的にはOpenAIやGoogleなどに代わるAI企業になるが、xAIはまだ初期段階であり、競合に追いつくには時間が必要だとも語った。 途中、異星人が見つからないのはなぜかについての「フェルミのパラドックス」について熱く語る場面もあった。ま
1. CISSPとは CISSP(Certified Information Systems Security Professional)とは、ISC2(International Information Systems Security Certification Consortium)が認定を行っている国際的に認められた情報セキュリティ・プロフェッショナル認定資格です。 Novell、Deloitte Touche Tohmatsu、大手ヘルスケアサービス企業その他主要企業において、CISSP認定資格の取得が情報セキュリティ関連業務従事者の必須事項とされています。 2004年6月には、米国規格協会(ANSI)よりISO/IEC17024の認証を受け、資格制度の全てのプラクティスがグローバルに認められ、 認定資格試験としての信頼度がより高くなりました。 CISSP認定資格は、情報セキュリ
米X(旧Twitter)が9月29日に発効させするプライバシーポリシーの改定で、公開データをAIのトレーニングに使うことを新たに追加していたことが明らかになった。米IT系ブログStackdiaryが9月1日に指摘した。 日本語版では、「本ポリシーで概説されている目的のため、当社が収集した情報や一般公開された情報を、機械学習または人工知能モデルのトレーニングに使用することがあります。」となっている。 この件について、XのオーナーでCTO(最高技術責任者)のイーロン・マスク氏は「(トレーニングに使うのは)公開データだけで、DMやプライベートなものは対象外だ」とポストした。 マスク氏は7月、“スーパーインテリジェントAI”構築を目指して立ち上げる新企業xAIで、xAIのAIモデルのトレーニングに、Twitterの公開データを利用すると明言している。xAIのWebサイトには、「当社はX Corpと
米国の作家の経済的地位向上を目的とするAuthors Guild(全米作家協会)は7月18日(現地時間)、米OpenAIなどの生成AIに取り組む企業のCEOに対し、AIのトレーニングに作家の作品を無断で使わないよう求める書簡を公開した。本稿執筆現在、8500人以上が署名している。 宛先は、以下の企業のCEOだ。 OpenAIのサム・アルトマンCEO AlphabetおよびGoogleのスンダー・ピチャイCEO Metaのマーク・ザッカーバーグCEO Stability AIのエマド・モスタークCEO IBMのアービンド・クリシュナCEO Microsoftのサティア・ナデラCEO 書簡には、「大規模言語モデル(LLM)で構築される生成AIは、われわれの著作物のおかげで存在する」「これらのテクノロジーは、われわれの言葉、物語、スタイル、アイデアを模倣し、逆流させている。著作権で保護された何百
流言 @Loogen_ 宮部みゆきの『プロットとか書かんが?』藤本タツキの『キャラクター表は作ったことない』は範馬勇次郎が『トレーニングとかしたことないわ』と言ってるようなもんなのでまともに聞いてはいけない。 2023-06-12 21:41:05 杵築八千穂 @yachiho10 世の中には規格外がね…。 沙門空海で夢枕獏先生が、つらつら書いてたら当初考えてたのと全然違う話になってた(意訳)、ってライブ感覚で書ける方達はね…あと、範馬勇次郎はウソツキぞ。あいつ切り立った山の斜面から転げ落ちてダメージ耐性つけるトレーニングやってるからな? twitter.com/Loogen_/status… 2023-06-13 15:40:34 物書きモトタキ @motoyaKITO 範馬勇次郎は激流プールや巨大象とのバトルみたいにトレーニング自体はしてるイメージだな。遊びのつもりかもしれんけど、あれ
Linux Foundationは、edXプラットフォームを通じて、オープンソースやその他のソフトウェアの安全な使用・開発についての無料オンラインコース「セキュア ソフトウェア開発」を提供している。今回発表されたのは、第2部の「セキュア ソフトウェア開発:実装(LFD105-JPx)」。 本トレーニングは3部から構成されており、6月から第1部「セキュア ソフトウェア開発:要件、設計、再利用(LFD104-JPx)」が提供されていた。 同トレーニングの対象は、ソフトウェア開発者、DevOpsプロフェッショナル、ソフトウェアエンジニア、Webアプリケーション開発者、および安全なソフトウェアの開発方法の学習に関心のある人々。限られたリソースで、情報セキュリティを向上させるための実践的な手順に焦点を当てている。攻撃に強いソフトウェアを開発するためのセキュリティの基本、脆弱性が悪用された場合の実践的
「長い間英語を勉強しているけれど、発音に自信が持てない」 「英語で話しているのにネイティブに何度も聞き返されて、落ち込んだ」 日本語話者にとって英語の発音は難しいですよね。 そもそも日本語にはない音が英語にはたくさんあるのですから、正しい発音の習得が簡単ではないのは当たり前のことです。 この記事では英語の発音をより良くして、ネイティブにも伝わる、自然な英語の発音の仕方を身につける練習法をお伝えしていきます。 英語初心者でも、自宅で一人でできるトレーニングや、無料アプリやサイトを活用した勉強法も紹介していきますのでぜひチャレンジしてみて下さいね。 執筆者:Lin 小4までアメリカの現地校に通い、帰国後は「英語はネイティブ並みでしょう?」という周囲の誤解とプレッシャーゆえに、英語の勉強から遠ざかった過去あり。中途半端な英語力にコンプレックスを感じ、大人になってから再勉強。英検1級。ケンブリッジ
ChatGPTのトレーニングにはインターネットから取得したデータが利用されていますが、具体的なデータの中身は非公開となっています。「同じ単語を繰り返して」という単純な命令を行う事でChatGPTにトレーニングデータを出力させることに成功したとGoogleの研究者らが発表しました。 Extracting Training Data from ChatGPT https://not-just-memorization.github.io/extracting-training-data-from-chatgpt.html [2311.17035] Scalable Extraction of Training Data from (Production) Language Models https://arxiv.org/abs/2311.17035 機械学習モデルのトレーニングに使用したデー
GPT-4のような高性能なモデルでも、APIの呼び出しコードを生成させるとかなりの確率で間違ったコードを生成してしまいます。「Gorilla」はAPIを呼び出すコードの生成に特化するようにファインチューニングが行われており、精度の高い呼び出しコードを生成できるだけでなく、情報検索器(Information Retriever)と一緒に利用するとAPIの更新にリアルタイムで追従できるという驚異的な機能が付いたモデルです。 Gorilla https://shishirpatil.github.io/gorilla/ Gorillaのトレーニングにおいては、「Torch Hub」「TensorFlow Hub」「HuggingFace」という3つのソースから収集した1645個のAPI呼び出しコードをもとにAIが1万6450個の命令とAPIのセットを作成し、その1万6450個の命令セットでファイ
お疲れ様です。AWS 事業本部のヒラネです。 AWS 認定トレーニング「Advanced Architecting on AWS」を受講してきたので内容のご紹介や感想をお伝えしたいと思います。 お疲れ様です。AWS 事業本部の平根です。 AWS 認定トレーニング「Advanced Architecting on AWS」を受講してきたので内容のご紹介や感想をお伝えしたいと思います。 AWS トレーニングとは AWS トレーニングとは、AWS の利用方法の知識とスキルを身に付けるための公式教育プログラムです。 クラスメソッドのメンバーズプレミアムサービスにご加入いただいているお客様の場合は、 特別割引価格で受講いただけます! 提供トレーニングの詳細やお申込みは以下 URL をご参照ください。 今回は、トレーニングの中でも「Advanced Architecting on AWS」を受講しまし
OpenAIが、AIモデルのトレーニングに用いるために100万時間を超える分量のYouTube動画をダウンロードして利用していたことがThe NewYork Timesの指摘でわかりました。なお、YouTubeと同じ親会社AlphabetのもとにいるGoogleは、OpenAIの行為に気付いていましたが、自分たちも独自のAIモデルのトレーニングにYouTubeの動画を活用していたため、行動を起こさなかったとのことです。 How Tech Giants Cut Corners to Harvest Data for A.I. - The New York Times https://www.nytimes.com/2024/04/06/technology/tech-giants-harvest-data-artificial-intelligence.html Google reporte
私の娘は、陸上部に所属しています。 今のシーズンは、長距離走、中でも駅伝の大会が多いです。 陸上の選手はどのようにして、ランニングスピードを高めているのか、どういった練習をしているのか、それらを陸上の先生から聞く機会がありましたので、自分の調べた内容と一緒に記事にしてみました。 ランニングやウォーキングをされている方は、是非参考にしてみてください。 ウォーミングアップ:体を準備する重要性 正しいフォーム:効率的なランニングスタイル 適切なトレーニングプラン:体を無理なく成長させる 自己ケア:体の疲れを軽減し、回復を促す 心理的側面:メンタルトレーニングの重要性 クロス・トレーニング:ケガの予防と体のバランス 楽しみながら続ける:自然とのつながりと仲間との交流 まとめ ウォーミングアップ:体を準備する重要性 まずランニングを始める前に、適切なウォーミングアップを行うことが重要です。 ウォーミ
基礎的な内容としては、生成AIの概要を簡単に説明する60秒間の動画、動画や読み物、知識をテストするためのクイズを含むAIの基礎と独自のAIアプリ開発に役立つGoogle Cloudツールについて学べる22分間のコース、大規模言語モデル(LLM)、ユースケース、プロンプトチューニングを通じてLLMのパフォーマンスを向上させる方法についての基礎を学べる約30分のコースを用意しており、3つの基礎コースを修了すると、生成AIの基本概念についての理解を証明する、Google Cloudスキルバッジが付与される。 ほかにも基礎コースでは、Generative AI Studioの使用方法を紹介する動画、Generative AI Studioの機能、オプション、使用方法をデモ形式で学習可能な動画、Vertex AIでトレーニングおよびデプロイできる拡散モデルについて学べる動画、責任あるAIの概要とGo
2人のジェームズ・ボンドと数多のボンドガールを鍛えた ジェームズ・ボンドは私の仕事の大きな部分を占める。私は、『ワールド・イズ・ノット・イナフ』から『ノー・タイム・トゥ・ダイ』までの7作品で、20年以上にわたりジェームズ・ボンドのパーソナルトレーナーを務めている。 007のファンであり、ヘルス・アンド・フィットネスコーチとして、私は007の2作品のためにピアース・ブロスナンをトレーニングする栄誉にあずかった。そのあとは、ダニエル・クレイグが5作品で007を演じるのに必要な肉体づくりができるよう、一緒に仕事をしている。たくさんのボンドガールのトレーニングも含めて、こうした時間を過ごすことで、私もボンドファミリーの一員になれた気がする。 2005年10月、クレイグが新しいジェームズ・ボンドだと発表された数日後に、私は彼と初めて会った。そのときクレイグは片手にベーコンのサンドイッチ、片手に手巻き
米Googleは9月28日(現地時間)、Webサイトのオーナー(以下、「Webパブリッシャー」)に対し、サイトのコンテンツをGoogleのAIモデルのトレーニングに使われないようオプトアウトする方法「Google-Extended」を提供すると発表した。 Google-Extendedは、Googleの生成AI「Bard」とMLプラットフォームの「Vertex AI」および、これらの製品を強化する将来の世代のモデルを含む一連のAIの改善のためにコンテンツを使われたくないWebパブリッシャーに、コンテンツへのアクセスを制御する機能を提供する。 この機能は、クローラー巡回を制御するrobots.txtを介して利用する。Webパブリッシャーはこの機能で、Googleのクローラー「Googlebot」によるスクレイピングとインデックス化は持続しつつ、コンテンツのトレーニング利用を回避できるとしてい
チャットAIに用いられる大規模言語モデルの性能は、パラメーター数やトレーニングデータの量が増えるほど上昇するというのが通説ですが、この通説に反して「少ないデータ量で高性能な言語モデルを作成する」というチャレンジ「BabyLM Challenge」が開催されています。 babylm.github.io https://babylm.github.io/ 大規模言語モデルの作成においては、一番最初に事前学習と呼ばれる工程があります。事前学習では文章を入力して続く単語を当てるというトレーニングが行われ、大規模言語モデルはこのトレーニングを通して文章を作成できるようになります。 トレーニングに用いる単語の量は年々増加しており、2018年のBERTは30億語のデータでトレーニングされましたが、2019年のRoBERTaは300億語、2020年のGPT-3は2000億語、そして2022年のChinch
GPUはCPUよりもはるかに多くのコアを備えており、多数の並列処理を行う事が可能です。そうしたGPUの性能を活用するために必要な知識を、ITエンジニアのリジュル・ラジェシュさんがブログにまとめています。 GPU Survival Toolkit for the AI age: The bare minimum every developer must know https://journal.hexmos.com/gpu-survival-toolkit/ 現代のAIモデルで使用されているTransformerアーキテクチャは並列処理を活用して大きく性能を向上させており、そうしたAIの開発に関わる場合は並列処理についての理解が必須になってきます。CPUは通常シングルスレッドの逐次処理性能が高まるように設計されており、複雑なAIモデルで必要となる、多数の並列計算を効率的に分散して実行するのに
こんばんは~!ハマクラシー君! オイラかい?オイラの名前は、ニャホニャホタマクローだ! ・・・うそだ。ハマサンスです。 だいぶこちらは暑くなってきたな~。 夏に向けて徐々に暑くなってくるのであれば、まだ体が暑さに対して準備していくものだが、まだ6月に入ったばかりでここまで暑くなってしまうと、なんとも体がついていけんでいかんな~。 お互い、身体に気をつけていこうぜ~。こういう時こそ、栄養・睡眠・運動をしっかり気を付けて体調を整えていきたいものだぜ! さて、今日はダイソーで買ってきたものの話をしようと思うよ。 オイラ、以前からちらほら言っている思うが、小学1年生の発達障害のある息子がいるのであるよ。 その息子の指先のトレーニングにとあるものを購入したのだ! まず一つ目がこれじゃい! 手先トレーニングシリーズじゃい!! うちの息子は指先の使い方がまだ拙いのである。 だから、ボタンやジッパーの使い
サブスクス!スポーツジムに入会しました。 みなさん今晩は、60歳になって初めてスポーツジム入会しました。もうすぐ61歳です。 今まで自力で腹筋、腕立て、ウォーキングをしてきましたが、サブスクを利用してお得に、入会しました。何がお得なのか?トレーニングマシン、プール、スーパー銭湯付き、そしていろんな、健康教室がついてきます。 3月は時期的にいろんなサービスがついてきます。入会金無料、初月無料、そして会費割引など、入会するなら今しかありませんね。 サブスクス!スポーツジムに入会しました。 ウォーキングマシン ヨガ教室 ヨガ教室 ホットヨガならこちら↓ スポーツジムに通うメリットとデメリット! スポーツジムに通うメリット! スポーツジムに通うデメリット! スポーツジムのトレーナーになりたい方はこちら ウォーキングマシン 頑張っていたウォーキングですが、スポーツジムにも立派なマシンがあります。テレ
「AI開発をリードするということは、ハードウェアインフラへの投資でリードするということ」として、MetaがAIのための投資として行っている、2万4000基以上のGPUを搭載したデータセンタースケールのクラスターの情報を明らかにしました。 Building Meta’s GenAI Infrastructure - Engineering at Meta https://engineering.fb.com/2024/03/12/data-center-engineering/building-metas-genai-infrastructure/ Meta reveals details of two new 24k GPU AI clusters - DCD https://www.datacenterdynamics.com/en/news/meta-reveals-details-o
AIの本体と言える大規模言語モデル(LLM)のトレーニングはほとんどの場合PyTorchやPythonを使用して行われていますが、そうしたトレーニングを純粋なC言語のみで実装したツール「llm.c」が登場しました。まだ最適化が行われておらず従来の手法に速度面では敗北していますが、GPT-2のトレーニングを行う実装を約1000行のクリーンなコードで行えています。 GitHub - karpathy/llm.c: LLM training in simple, raw C/CUDA https://github.com/karpathy/llm.c 作者のアンドレイ・カルパシー氏はOpenAIの創設グループの一員で、テスラのAIディレクターだった事もある人物です。 llm.cを使用することで、245MBの容量を持つPyTorchや107MBの容量を持つcPythonを使用せずに大規模言語モデル
デンマークの著作権侵害対策グループ「Rights Alliance」が、約20万冊にも上る書籍のデータセット「Books3」を削除するよう、ホストする「The Eye」に対して要請し、データセットの削除が行われました。Books3はMetaの開発する大規模言語モデル「LLaMA」のトレーニングにも使用されたデータセットです。 Anti-Piracy Group Takes Prominent AI Training Dataset ''Books3' Offline * TorrentFreak https://torrentfreak.com/anti-piracy-group-takes-prominent-ai-training-dataset-books3-offline-230816/ Revealed: The Authors Whose Pirated Books Are P
インターネット上には膨大なデータが存在しており、それらを学習させることで作られたAIが続々と登場するようになりました。AIの普及が爆発的に進む一方、研究者からはAIシステムを動かす燃料である学習データが枯渇する可能性があると懸念する声が上がっています。 Researchers warn we could run out of data to train AI by 2026. What then? https://theconversation.com/researchers-warn-we-could-run-out-of-data-to-train-ai-by-2026-what-then-216741 正確で強力なAIの学習には、膨大なデータが必要です。オーストラリア・マッコーリー大学法学部の上級講師で、クリエイティブ産業のテクノロジーの法的規制に詳しいリタ・マトゥリオニテ氏によると
SNSのTumblrとWordPressを保有するAutomatticが、AI企業であるOpenAIやMidjourneyと、AIのトレーニングのためにユーザーデータを提供する旨の契約を結ぼうとしていたことが明らかになりました。データがすでに提供済みかまだ提供されていないかは不明ですが、社内からは、契約には含まれないはずの個人的なデータまで提供するための準備が進められていたとの指摘があるということを、内部文書を入手したニュースサイト・404Mediaが報じています。 Tumblr and WordPress to Sell Users’ Data to Train AI Tools https://www.404media.co/tumblr-and-wordpress-to-sell-users-data-to-train-ai-tools/ Tumblr’s owner is stri
米OpenAIの生成AIチャット「ChatGPT」に単語を永遠に繰り返すよう要求すると、トレーニングに使ったソースデータを吐き出すという論文が11月28日に公開されたことを受け、本稿執筆現在、こうしたプロンプトを入力すると「申し訳ありませんが、そのようなリクエストには対応できません。他にお手伝いできることがあれば、お知らせください」と表示されるようになっている。 この論文を発表したのは、OpenAIと競合する米Google傘下のGoogle DeepMindの研究者らだ。トレーニングデータの抽出は、これまでも攻撃で実施されてきたが、この方法は運用モデルを利用したものだと論文では説明している。 たとえば「company」という単語を永遠に繰り返すよう依頼すると、電話番号やメールアドレスを含む幾つかの実際の企業情報が表示されることが示されている。
Metaが開発する大規模言語モデル「LLaMA」などのトレーニングに使用された書籍データセット「Books3」は、知的財産権や著作権に対する侵害の疑いが指摘されています。そんなBooks3に含まれる書籍の内訳やBooks3が抱える問題点について、テクノロジー系ライターのアレックス・リーズナー氏が解説しています。 Erotica, Atwood, and 'For Dummies': The Books Behind Meta’s Generative AI - The Atlantic https://www.theatlantic.com/technology/archive/2023/09/books3-ai-training-meta-copyright-infringement-lawsuit/675411/ These 183,000 Books Are Fueling the
スポーツ施設の運営を手がけるJR東日本スポーツ株式会社が制定しました。 「夢(6)中でトレーニ(2)ング(9)」と読む、ちょっと強引な語呂合わせからもきています。 スポーツジム行ったことありますか? 私はあります。 「よし、痩せるぞ!」の意気込みで行きましたが、簡単には効果が現れず。 筋トレ、スタジオ、水泳と一通りやりましたよ。 あとヨガも・・・。 ただ受けたいスタジオレッスンの時間が合わなかったり、あまりの人の多さにレッスンを受けなかったり。 しょうがないからランニングマシンをゆっくり走ってましたよ😣 おかげで多少の息切れにも対処できるようになりましたが。 でも結局4ヶ月で止めました。 なんか目的が見いだせないと言うか・・・。 もう少ししたら再開を考えてみます。 今度は時間をかけてダイエットです😀 ご覧いただきありがとうございました。 ランキングに参加中です。よかったらポチッとお願い
Googleは対話型AIであるBardを開発しているほか、機械学習プラットフォームであるVertex AIの運営も行っており、生成AIモデルの開発においてウェブ上のコンテンツを利用しています。新たにGoogleが、自身のウェブサイトが生成AIモデルのトレーニングに利用されないようにするオプション「Google-Extended」を発表しました。 An update on web publisher controls https://blog.google/technology/ai/an-update-on-web-publisher-controls/ Google adds a switch for publishers to opt out of becoming AI training data - The Verge https://www.theverge.com/2023/9
世界最高峰の舞台で、鮮烈なデビューを飾った1年。前人未到の境地へ駆け抜けるこの目には、今、一体どんな景色が見えているのか――。プレミアから日本代表まで、三笘薫がその全てを語った。 現在発売中のNumber1075号掲載の[ロングインタビュー]三笘薫「僕はもっと進化できる」より内容を一部抜粋してお届けします。【記事全文は「NumberPREMIER」にてお読みいただけます】 「もちろん僕も自分の感覚を大事にしていますし、最終的には信じます。でも、それが合っていないのに信じていたらバカじゃないですか。自分がいい動きをしたとしても、他の人にはそう見えないときもある。自分では速いと思ったけど、本当は速くないときもある。だから僕はあらゆる手段を使って自分の主観が正しいかを確かめたいんです」 実力でも人気でも日本サッカー界の顔に 三笘にとって2022-'23シーズンは、新たな扉を開く1年になった。 初
生成AIのトレーニングに作家の著作が無断で使用されているとして、全米作家協会が「AIトレーニングに著作権で保護された素材を無断で使用するな」とOpenAIやAlphabet、MetaなどのAI開発企業へ訴える公開書簡を発表しました。この公開書簡には「ハンガー・ゲーム」シリーズで知られるスーザン・コリンズ氏、カナダを代表する作家であり2019年に「誓願」でブッカー賞を受賞したマーガレット・アトウッド氏など、8500人を超える作家が署名しています。 Open Letter to Generative AI Leaders https://actionnetwork.org/petitions/authors-guild-open-letter-to-generative-ai-leaders Nora Roberts, Margaret Atwood sign Authors Guild le
Image credit: HuggingFace 「ChatGPT」「LLaMA 2」「Claude 2」「Bard」「Falcon 180B」など、現在エンタープライズソフトウェア市場で話題になっているような AI の大規模言語モデル(LLM)のトレーニングには、大規模で専門的な計算能力が必要だ。そのため、OpenAI、Meta、Cohere、Google、Abu Dhabi の Technology Innovation Institute など、資金力のある大規模な組織がその役割を担っているのは不思議ではない。 しかし、Microsoft Research 機械学習基盤(Machine Learning Foundation)チームのリーダー Sebastien Bubeck 氏は、彼らの新しい非商用の「phi-1.5」のようなオープンソースでリソース効率の良いモデルの研究のおかげ
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く