並び順

ブックマーク数

期間指定

  • から
  • まで

641 - 680 件 / 4954件

新着順 人気順

ディープラーニングの検索結果641 - 680 件 / 4954件

  • Zero-shot Learning網羅的サーベイ:CLIPが切り開いたVision & Languageの新しい世界 - エクサウィザーズ Engineer Blog

    こんにちは! 画像システムグループで機械学習エンジニアをやっている小島です。 この記事では、今ホットな「Zero-shot Learning」と「Vision & Language」に関する最新情報を、CLIPという研究を起点として網羅的にサーベイをしていきます。このために論文1000本に目を通し、70本程度を記事にしました。 Zero-shotやVision & Languageは、Stable Diffusionに代表される画像生成AIとも密接に関連している技術です。この記事を通して、Vision & Languageの奥深い世界を体感できるでしょう。 注意事項 この記事は非常に長いため、全部読むのに1時間以上かかる可能性があるので、休憩を取りながら、または必要な部分だけ読んでください。各セクションを個別に読んでも問題ありません。 また、文章中の画像は、特別な記載がない限り、引用元の論

      Zero-shot Learning網羅的サーベイ:CLIPが切り開いたVision & Languageの新しい世界 - エクサウィザーズ Engineer Blog
    • 絵師の“AI学習禁止宣言”に意味はあるのか? AIに詳しい弁護士に聞いてみた

      しかし発表直後からTwitterでは「他人の絵を学習して自分の作品と発表するなど悪用のリスクがあるのでは」などの声が殺到。これを受け、ラディウス・ファイブは発表からわずか1日でサービスを停止。不正利用を防ぐ仕組みができ次第、正式版として再リリースすることになった。 その後、SNSで活動するイラストレーターを中心に「私の絵をAIに学習させることは禁止です」など“AI学習禁止宣言”をする人たちが現れた。しかしこのような宣言で、AI学習への利用を禁止できるのか? 日本ディープラーニング協会の有識者委員を務めるなど、AI領域の法務に詳しい柿沼太一弁護士に話を聞いた。 “AI学習禁止宣言”に法的拘束力はない 柿沼弁護士は「Twitterをポートフォリオとして使い、プロフィール欄に“二次転載禁止”などのルールを書く人がいると思う。そこに加えるように“AI学習禁止”など一方的に記載しても、契約は成立しな

        絵師の“AI学習禁止宣言”に意味はあるのか? AIに詳しい弁護士に聞いてみた
      • M5StickVで超お手軽エッジAI画像認識 - karaage. [からあげ]

        超お手軽エッジAIデバイス「M5StickV」 ファブコア・カフェでお話しした「AIエッジデバイス入門」(詳細は以下記事参照下さい)。 主に、Jetson Nanoについてお話ししたのですが、小ネタとして使えないかなと、最近私のTL周りで話題の「M5StickV」も買っていました。初めて触ったのがプレゼン当日ということもあり、プレゼン自体には直接活かすことは無かったのですが(プレゼン後の質疑応答で少し話題に出しました)、なかなか予想外に面白いデバイスでした。 M5Stack UnitV Kendryte K210デュアルコア64ビットRISC-V CPUのAIカメラ最先端のニューラルネットワークプロセッサ (Stick V) メディア: エレクトロニクス 外観 ケースに描いてあるこの可愛い図が回路図(!?)らしい。まあソフト開発にはたしかにこれで良いですね このサイズで、カメラの写真をリア

          M5StickVで超お手軽エッジAI画像認識 - karaage. [からあげ]
        • アニメをAIで高解像度化、4K・8Kに変換 AIベンチャーが技術開発

          AIベンチャーのラディウス・ファイブは2月19日、ディープラーニングを活用し、アニメを高解像度に変換できるサービス「AnimeRefiner」(アニメリファイナー)の提供を始めた。低解像度と高解像度の動画を学習したAIが高解像の状態を予測し、動画のノイズなどを取り除く。4K・8Kのコンテンツ制作にかかる時間や費用、工程数など制作現場の負担を軽減する狙い。 HD(1440×1080ピクセル)のアニメは4Kサイズ(3840×2160ピクセル)以上、フルHD(1920×1080ピクセル)のアニメは8Kサイズに変換が可能という。動画の他、原画の処理にも対応する。 従来の技術は、動画を引き伸ばして中間を補完するというもので、ノイズがそのまま引き伸ばされたり、ぼやけが発生したり──といった課題があったという。AnimeRefinerではノイズを除去し、ぼやけを鮮明化するため、これらを防げるとしている。

            アニメをAIで高解像度化、4K・8Kに変換 AIベンチャーが技術開発
          • ChatGPT Code Interpreterで画像データを加工してみる - Taste of Tech Topics

            カメラ好き機械学習エンジニアの@yktm31です。 先日、OpenAIから、公式のプラグインとして発表された「Code Interpreter」ですが、 趣味の写真でもなにか使えないかと思い、画像処理を試してみることにしました。 openai.com Code Interpreterの概要や有効化の方法は前の記事をご覧ください。 acro-engineer.hatenablog.com 以前撮影した、富士山の写真から、Zoomの仮想背景に使うことを想定し、色々と加工させてみたいと思います。 画像処理/加工 今回、以下のような画像処理/加工を実施してみました。 画像サイズの確認 画像をFullHDサイズにする 画像の明るさと彩度を調整する 指定の形で切り抜く データをダウンロードする 画像サイズの確認 まずは画像のサイズを確認します。 これくらいはお手の物。写真アプリで確認したサイズとも一致

              ChatGPT Code Interpreterで画像データを加工してみる - Taste of Tech Topics
            • メルカリのデータ分析を支える機械学習システムのデザインパターン

              データ分析基盤の構築について共有するTECH PLAY主催のイベント「データ分析基盤Developers Night〜」。第4回となる今回は、「活用されるデータ基盤」がテーマです。メルカリでの機械学習を用いたデータ分析基盤の活用について、澁井雄介氏が登壇し知見を共有しました。 ※新型コロナウイルス対策のためオンライン開催に変更されています。 機械学習とシステムデザイン 澁井雄介 氏(以下、澁井):メルカリの澁井と申します。今日は「機械学習とシステムデザイン」というテーマで話させてください。 先ほどマクロミルさんがデータ分析基盤の話をされましたが、私はデータ分析基盤の出口のほうでやっている機械学習とそれによるサービスの改善をやっています。出口のほうでどういった仕組みを作っているのか、メルカリの事例から共有できることをお話したいと思っています。 まずは自己紹介をさせてください。澁井と申します。

                メルカリのデータ分析を支える機械学習システムのデザインパターン
              • 画像の中の文字を認識してくれるオープンソースのOCR「PaddleOCR」レビュー

                画像に含まれる文字をテキストデータ化する光学文字認識(OCR)は、請求書やレシート、名刺などの印刷物をデジタル化する手法として広く使われています。そんなOCRをディープラーニングフレームワークで実現したのが、オープンソースのOCRシステム「PP-OCRv2」のデモ版となる「PaddleOCR」です。 PaddleOCR - a Hugging Face Space by akhaliq https://huggingface.co/spaces/akhaliq/PaddleOCR GitHub - PaddlePaddle/PaddleOCR: Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recog

                  画像の中の文字を認識してくれるオープンソースのOCR「PaddleOCR」レビュー
                • 主成分分析(PCA)の数学的な理論とPythonによる実装

                  $$ \newcommand{\bm}[1]{\mathbf #1} $$ 主成分分析(PCA)の数学的な理論とPythonによる実装¶ Author: Yuki Takei (noppoMan) Github: https://github.com/noppoMan Twitter: https://twitter.com/noppoMan722 Blog: https://note.com/noppoman これは、noteの主成分分析の背景にある数学理論の話(最適化問題)の本文です。 主成分分析の数学的な理論の理解に必要な知識¶ 主成分分析は、アルゴリズム的な観点で見るとデータの分散を最大化させる最適化問題であり、その理論は数学(とくに微分学、線形代数)により与えられている。以下は、主成分分析で使われる数学の分野をざっくりとリストしたものである。 データ分析 分散、共分散 解析学 多

                    主成分分析(PCA)の数学的な理論とPythonによる実装
                  • 機械学習・アルゴリズム関連まとめ - Qiita

                    損失関数・不均衡 不均衡データにおけるsampling ランク学習のListNetをChainerで実装してみた 不均衡データへの決定打となるか!?「Affinity loss」の論文を読む、実装する 不均衡データを損失関数で攻略してみる 解説編:オーバーサンプリング手法解説 (SMOTE, ADASYN, Borderline-SMOTE, Safe-level SMOTE) LightGBMでランキング学習 半教師あり学習のこれまでとこれから Struggling with data imbalance? Semi-supervised & Self-supervised learning help! 深層学習 転移学習:機械学習の次のフロンティアへの招待 ディープラーニングの判断根拠を理解する手法 DNC (Differentiable Neural Computers) の概要 +

                      機械学習・アルゴリズム関連まとめ - Qiita
                    • これはAI技術なんだよ(追記あり)

                      ちょっと話題になっていたもののブコメ https://b.hatena.ne.jp/entry/s/www.itmedia.co.jp/news/articles/2210/05/news181.html このトップコメで 「数年前なら同じシステムでもAIって言葉は使ってなかっただろ。」 とあるんだけども、槍玉に挙げて申し訳ないんだけども、これはAI技術そのものなんだよ。 というか、これをAIと言わなかったら何をAIというのか、というものなんだけども。 (強いAI弱いAIとかいうややこしい話があって、まだAIはないとかいう議論はあるけども、 とりあえず世の中のAIと言われるものの筆頭技術だよ、という意味で。) これは、ディープラーニングの物体認識の技術を応用しているんだけども、 その精度がすごく上がって、今では人間が識別するより精度が高くなっている、というもので、 それを応用して、人間が残

                        これはAI技術なんだよ(追記あり)
                      • ピアノの演奏動画から楽譜を自動作成 ディープラーニングで 京大が技術開発

                        Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 京都大学の研究チームが開発した「Non-Local Musical Statistics as Guides for Audio-to-Score Piano Transcription」は、Web上のピアノ演奏動画の音声データから楽譜を作成する、深層学習(ディープラーニング)を用いた自動変換システムだ。 システムは、3段階で構成される。1段階目は、入力された動画の音の信号に対してMIDIシーケンスを深層学習ネットワークで推定(Multipitch detection)する。ピッチ解析用とベロシティ推定用のネットワークを別々で学習し、その出力を組み合わせてMIDIシーケンスを合成する。2段

                          ピアノの演奏動画から楽譜を自動作成 ディープラーニングで 京大が技術開発
                        • GAFAは「イノベーション」なんて目指してない、日本企業の現状認識は間違いだらけ

                          ソニー、ベイン・アンド・カンパニー、ウォルト・ディズニー、AOLなどを経て、アップル米国本社副社長 兼 日本法人代表取締役に就任。独自のマーケティング手法で「iPod mini」を大ヒットに導き、スティーブ・ジョブズ氏に託された日本市場でアップルを復活させた。リアルディアを設立し、セルフ・イノベーション事業を展開している。最新アプリ「DEARWONDER」は、創造的知性を磨く革新的なプラットフォーム。著書に『僕は、だれの真似もしない』(アスコム)などがある GAFAの戦略、AI分野でリードしている企業は? ──GAFAの戦略についてどう見ていますか。 僕も在籍していたアップルは今後、人工知能(AI)という領域ではGAFAのほかの3社、特にグーグルとアマゾンにはもう追いつけないと見ています。 なぜなら、ディープラーニングのための学習データ蓄積量がまったく違うからです。すでにアマゾン、グーグル

                            GAFAは「イノベーション」なんて目指してない、日本企業の現状認識は間違いだらけ
                          • 【Gradio】爆速で機械学習アプリを作る -PyTorch・TensorFlow・scikit-learnの好きなモデルで遊ぼう-|はやぶさの技術ノート

                            【Step1】Google Colaboratory のノートブックを新規作成 Google Colab を起動して、ノートブックを新規作成します。 【Step2】Gradio インストール 以下のコマンドでPythonライブラリの Gradio をインストールします。

                              【Gradio】爆速で機械学習アプリを作る -PyTorch・TensorFlow・scikit-learnの好きなモデルで遊ぼう-|はやぶさの技術ノート
                            • 喋り声を手本に、より自由で高品位な表現を実現する新たなAI音声合成システム、Seiren Voiceをドワンゴが発売開始|DTMステーション

                              5月17日、ドワンゴがSeiren Voice(セイレンボイス)という、これまでにない新たなAI音声合成システムの販売を開始しました。これは、従来のTTS(テキスト to スピーチ)と呼ばれる文字を入力して音声合成とは異なり、人が喋った声を入力し、その発音の仕方、イントネーションやスピード、間の取り方などを、トレースするかのようにターゲットのキャラクタの声に置き換え、非常に高品位な音声合成を実現する、というものです。 今回、その第一弾製品として、「結月ゆかり」、「琴葉 茜・葵」が、それぞれ19,800円(税込)でダウンロード販売の形でスタート。Windows10/11用となっていますが、動作させるにはNVIDIAのある程度のスペックを持ったGPUを搭載していることが必須となっています。そのため、体験版もリリースされており、これを使うことで実際に自分のPC環境で動作させることが可能なのかチェ

                                喋り声を手本に、より自由で高品位な表現を実現する新たなAI音声合成システム、Seiren Voiceをドワンゴが発売開始|DTMステーション
                              • 「なぜここまで賢くなるのか説明不可能」 ―画像生成系AI、GANを例にして

                                今回紹介するのは、画像生成AI、GAN(敵対的生成ネットワーク)の中身を詳しく調査したという研究です。最近のGANは人でも本物の写真かどうか見間違うほどの性能を発揮しますが、GANがどのように『描いている』かを可視化した結果、簡単には説明できないような描画スキルを獲得していることがわかってきました。(※1) 論文 https://openreview.net/forum?id=Hyg_X2C5FX (1) AIの中身 先週、日本政府がまとめた人工知能(AI)に関する原則が明らかになったと日経新聞が報じました(※2)。AIの社会浸透は急激に進んでいますが、その判断過程がブラックボックスのまま使われることを国、あるいは国際的な枠組みである程度規制するとともに、AIの中身を専門家でなくても理解しやすくするための研究開発が進められています。 今回扱うのはGANを使った画像生成AIです。以前AI-S

                                  「なぜここまで賢くなるのか説明不可能」 ―画像生成系AI、GANを例にして
                                • オープンソースのニューラルネットワーク向けプログラミング言語「Triton」をOpenAIが公開

                                  NVIDIAが開発・提供するGPU向けの汎用並列コンピューティングプラットフォームである「CUDA」を超える生産性と高速コード記述が可能になるようなオープンソースのニューラルネットワーク向けプログラミング言語「Triton」が公開されました。非常に効率的なカスタムディープラーニングプリミティブを作成するための言語コンパイラとなっており、GitHub上で開発リポジトリが公開されています。 Introducing Triton: Open-Source GPU Programming for Neural Networks https://www.openai.com/blog/triton/ OpenAI debuts Python-based Triton for GPU-powered machine learning | InfoWorld https://www.infoworld.

                                    オープンソースのニューラルネットワーク向けプログラミング言語「Triton」をOpenAIが公開
                                  • 「危険すぎる」と話題の文章生成AI「GPT-2」の最新版がリリース、実際に使えるデモサイトも登場

                                    by Suzy Hazelwood 人工知能を研究する非営利組織のOpenAIが開発したAIによる文章生成ツール「GPT-2」は、高精度のテキストを簡単に自動生成できるといわれており、開発陣が「あまりにも危険過ぎる」と危惧するあまり論文公開が延期される事態にまで発展しました。そんなGPT-2は2019年2月、5月、8月と段階的にパラメーターを増やしたモデルが公開されてきましたが、ついに15億個ものパラメーターを持つ最新版がリリースされました。 GPT-2: 1.5B Release https://openai.com/blog/gpt-2-1-5b-release/ GPT_2_Report.pdf (PDFファイル)https://d4mucfpksywv.cloudfront.net/papers/GPT_2_Report.pdf OpenAIはGPT-2が非常に高度な文章を生成する

                                      「危険すぎる」と話題の文章生成AI「GPT-2」の最新版がリリース、実際に使えるデモサイトも登場
                                    • 2020年ソフトウェア開発の7つのトレンド - Qiita

                                      以下はTiara Brown Neilさん ( hackernoon )による記事、7 Software Development Trends 2020 Revealedの日本語訳です。 7 Software Development Trends 2020 Revealed 知ってますか? ITプロジェクトの半分以上が失敗しています。 ソフトウェア開発業界の複雑さと動的な性質を認識している私たちの多くにとっては、それほど衝撃的な事実ではありません。 絶え間ない革新と進歩が伴うこの予測不可能な業界で生き残るためには、そのペースに合わせることが必須です。 賢い者は、ソフトウェア開発のサービスを利用するだけでなく、すべてのテクノロジーの長所と短所を比較し検討します。 世界のIT支出は2021年までに4兆1,018億米ドルに達すると推定されています。 以下は、2005年から2021年までの Sta

                                        2020年ソフトウェア開発の7つのトレンド - Qiita
                                      • 画像生成AI「Stable Diffusion」をGoogle ColaboratoryでWebアプリ的に簡単に動かすノートブックを作りました - karaage. [からあげ]

                                        Stable Diffusionの衝撃 つい先週「Midjourney」というAIによる画像生成AIを紹介しましたが、Stable Diffusionという超新星が登場いたしました。 何が凄いかというと、オープンにモデルが公開されているので、誰でもこのモデルを改変したり、モデルを使用したアプリが作れるのです。詳しくは、以下の深津さんのnote記事を参照ください。 さすらいAIプログラマーのshi3zさんは、既に日本語で誰でも無料で手軽に使えるWebアプリを公開されています。 サーバー代めちゃくちゃかかっているけど、自腹でやり続けるそうです。凄すぎです。上記記事のshi3zさんのYouTube動画から、shi3zさんの熱狂が伝わってきます。 Stable DiffusionをWebアプリ的に手軽に使えるツールを作成しました。 思えば、私もディープラーニングおじさんも、AIにハマった大きなきっ

                                          画像生成AI「Stable Diffusion」をGoogle ColaboratoryでWebアプリ的に簡単に動かすノートブックを作りました - karaage. [からあげ]
                                        • [論文実装_その1] 畳み込みニューラルネットワークは何を見ているか - Qiita

                                          1. はじめに PyTorchの使い方にも少し慣れてきたので、arXivに公開されているディープラーニング関連の論文の実装にチャレンジをはじめました。まず今回はVisualizing and understanding convolutional networksを実装してみました。本論文はディープラーニングの可視化の文献としてよく参照されているので1、以前から興味がありました。 本論文の流れは、前半でCNNの可視化手法を中心に取り扱い、後半では構築したモデルのパフォーマンスを取り扱います。有名な論文ということもあり、Web上で日本語の解説もこちらに公開されています。 本論文の概要に関しては上記リンクの解説の通りなので、本記事では上記解説であまり触れられていない提案された可視化手法の実装に重点を置いて解説してみようと思います。 2. 本論文の概要 CNNは画像分類において高い精度を実現する

                                            [論文実装_その1] 畳み込みニューラルネットワークは何を見ているか - Qiita
                                          • 【2023年2月】プログラミング言語別単価ランキング!フリーランスエンジニアにおすすめの言語は?

                                            IT業界は変化が激しく、人気の言語も時代とともに移り変わっていきます。最新の情報を追い続けるのは簡単ではないので、「将来性のある言語はどれ?」「単価が高くて稼げる言語は?」と気になっている人も多いのではないのでしょうか。 本記事では、「レバテックフリーランス」に蓄積されたデータを元に、プログラミング言語別の月単価・案件数を集計しランキングを作成しました。ランキング上位の言語については、将来性や市場価値を上げるためのポイントなども紹介しています。今回のランキングデータを元に、今後の案件選びやスキルアップの参考にしてみてください。 最新版のランキングはこちら▼ 【1位はGoの87万円】プログラミング言語別単価ランキング|2023年7月最新版 ※本記事の調査結果や画像を引用する際は【レバテックフリーランス調べ】とご記載ください。 レバテックフリーランスはITエンジニア専門の フリーランスエージェ

                                              【2023年2月】プログラミング言語別単価ランキング!フリーランスエンジニアにおすすめの言語は?
                                            • TensorFlow 事例: から揚げを認識して弁当箱に入れる Foodly

                                              .app 1 .dev 1 #11WeeksOfAndroid 13 #11WeeksOfAndroid Android TV 1 #Android11 3 #DevFest16 1 #DevFest17 1 #DevFest18 1 #DevFest19 1 #DevFest20 1 #DevFest21 1 #DevFest22 1 #DevFest23 1 #hack4jp 3 11 weeks of Android 2 A MESSAGE FROM OUR CEO 1 A/B Testing 1 A4A 4 Accelerator 6 Accessibility 1 accuracy 1 Actions on Google 16 Activation Atlas 1 address validation API 1 Addy Osmani 1 ADK 2 AdMob 32 Ads

                                                TensorFlow 事例: から揚げを認識して弁当箱に入れる Foodly
                                              • Kaggle上位ランカーの5人に聞いた、2019年面白かったコンペ12選と論文7選 | 宙畑

                                                2019年も様々なデータサイエンス関連のコンペが実施され、論文が発表されました。その中でも面白かったものはどれか、5人のkagglerの方に直接お伺いしました。 2019年はTellusxSIGNATEで実施された衛星データコンペの解説(第1回・第2回)が、データサイエンティストの方に読んでいただいた宙畑のヒット記事としてランクイン。 では、データサイエンティストの方は他にどのようなコンペや論文に興味を持たれていたのか……と気になった宙畑編集部。 今回、以下5名のKagglerの方に協力いただき、2019年の振り返りとして面白かったコンペと論文、そしてその理由を教えていただきました。 あきやま様(@ak_iyama) jsato様(@synapse_r) Hiroki Yamamoto様(@tereka114) smly様(@smly) ※順不同 ※1名、非公表 Kaggleについては「世

                                                  Kaggle上位ランカーの5人に聞いた、2019年面白かったコンペ12選と論文7選 | 宙畑
                                                • AIエンジニアが知っておきたいAI新ビジネス立案のノウハウ・コツまとめ - Qiita

                                                  本記事では、AIエンジニアやAI関連のビジネスパーソン向けに、起業および新規事業立案に関するノウハウ・情報をお知らせします。 AIに特化していない新ビジネス立案関連の内容も多いのですが、ご容赦ください。 AIに関わる内容は本記事の後半部分から始まります。 本記事は、 [1] スタートアップ系での有名なアドバイスを引用掲載 [2] それに対して、私(小川)なりの私見を記載 という構成で執筆します。 AIエンジニア向け記事シリーズの一覧 その1. AIエンジニアが気をつけたいPython実装のノウハウ・コツまとめ その2. AIエンジニアが知っておきたいAI新ビジネス立案のノウハウ・コツまとめ(本記事) 本記事の目次 はじめに 0. 起業や新規事業立案を学ぶうえで知っておきたい人物・組織 アイデアの見つけ方 アイデアの育て方 ユーザーインタビューの仕方 AI新ビジネス立案について MVPの作成

                                                    AIエンジニアが知っておきたいAI新ビジネス立案のノウハウ・コツまとめ - Qiita
                                                  • 単体のGPUでもGPT-3などの大規模言語モデルを処理できる「FlexGen」が登場

                                                    GPT-3などの大規模言語モデルを処理するには高い計算量とメモリが必要なため、通常は複数のハイエンドなAIアクセラレーターが求められます。この処理を、メモリ16GBのNVIDIA Tesla T4やメモリ24GBのNVIDIA GeForce RTX 3090など、メモリ容量が限られたGPU単体でも実行するための生成エンジン「FlexGen」が公開されました。 GitHub - Ying1123/FlexGen: Running large language models like OPT-175B/GPT-3 on a single GPU. Up to 100x faster than other offloading systems. https://github.com/Ying1123/FlexGen#readme FlexGenは大規模言語モデルの推論リソース要件を単一のGPU

                                                      単体のGPUでもGPT-3などの大規模言語モデルを処理できる「FlexGen」が登場
                                                    • セキュリティエンジニアのための機械学習

                                                      情報セキュリティのエンジニアや研究者を読者対象とした機械学習の入門書。フィッシングサイト、マルウェア検出、侵入検知システムなどの情報セキュリティ全般の課題に対して、機械学習を適用することでどのようなことが可能になるのか? 本書ではサイバーセキュリティ対策でとても重要なこれらの知識を実装レベルで身につけることができます。また、どうすれば機械学習による検出を回避できるか、という点についても同時に解説します。サンプルコードはPython 3対応。Google Colaboratory上で実際に手を動かしながら学ぶことができます。 訳者まえがき まえがき 1章 情報セキュリティエンジニアのための機械学習入門 1.1 なぜ情報セキュリティエンジニアに機械学習の知識が必要なのか 1.2 本書のコードサンプルの実行環境 1.2.1 Google Colaboratory入門 1.2.2 GPU/TPUラ

                                                        セキュリティエンジニアのための機械学習
                                                      • 独学で学べるPython(パイソン)のプログラミング入門講座おすすめ一覧

                                                        自分の夢や仕事の都合上など、さまざまな理由でPython(パイソン)を入門レベルで、これから勉強したい人もたくさんいますよね。例えばAI(人工知能)開発のエンジニアになりたい、これからAI(人工知能)に関連する業務が始まる、新しい事業としてAI(人工知能)を活用したものを作りたい。だからAI(人工知能)開発でよく使われるPython(パイソン)を一からしっかりと勉強したい・・・などなど。 Python(パイソン)を学ぶ方法はいろいろありますが、スクールなどに通わず自分のペースで進めることのできる独学で進めたいでしょう。しかし、独学で始めるといってもどのようなWebサイトの講座を受講すればいいのかPython(パイソン)の入門者にはわからない部分が多く、どうすれば良いのか悩んでしまいますよね。 そこで今回は、独学に向いているおすすめのPython(パイソン)入門講座を解説しましょう。講座の紹

                                                          独学で学べるPython(パイソン)のプログラミング入門講座おすすめ一覧
                                                        • Neural Audio Codec を用いた大規模配信文字起こしシステムの構築 - Mirrativ Tech Blog

                                                          こんにちは ハタ です。 最近Mirrativ上に構築した配信の文字起こしシステムを紹介したいなと思います 音声からの文字起こしは、各社SaaSでAPI提供されているものがあると思いますが、今回紹介するものはセルフホスト型(自前のGPUマシンを使う)になります 構築していく上で色々試行錯誤したのでそれが紹介できればなと思っています どんなものを作ったか 前提知識: 配信基盤 前提知識: Unix Domain Socket Live Recorder Archiver DS Filter VAD Filter NAC / Compress Transcriber NAC / Decompress Speach To Text コンテナイメージ まとめ We are hiring! どんなものを作ったか 今回作ったものは Mirrativで配信されるすべての音声を対象に文字起こしを行う シス

                                                            Neural Audio Codec を用いた大規模配信文字起こしシステムの構築 - Mirrativ Tech Blog
                                                          • プログラマーが本当に支持するプログラミング言語がわかる「人気の高いプログラミング言語2019」が発表

                                                            by Kevin Ku 世界最大の専門職団体であり電気・電子工学・コンピューターサイエンス分野の文献や論文誌を発行するIEEEによる学会誌IEEE Spectrumが、「Top Programming Languages 2019(人気の高いプログラミング言語2019)」を発表しました。毎年発表されているランキングですが、2019年からはランク付けに使用する指標の一部が変更されています。 The Top Programming Languages 2019 - IEEE Spectrum https://spectrum.ieee.org/computing/software/the-top-programming-languages-2019 IEEE Spectrumは、プログラミング言語の人気を判断するためには、あるプログラミング言語が別の分野では全く使用されていないケースなどについ

                                                              プログラマーが本当に支持するプログラミング言語がわかる「人気の高いプログラミング言語2019」が発表
                                                            • 深層学習入門 ~基礎編~ - Qiita

                                                              対象者 深層学習について勉強始めたいな〜って考えている人向け。 いきなりライブラリを利用して何か作るのも手ですが、やっぱりちゃんと理解するには「車輪の再発明」しないといけませんね〜 本記事は深層学習の基礎理論メインですが、できるだけ数式を少なくして図メインでざっくり説明します。 実装などは次回以降順番にやっていこうと思います。 次回の記事はこちらです。 目次 深層学習とは ニューロンモデル レイヤーモデルとニューラルネットワークモデル 活性化関数 シグモイド関数(sigmoid) tanh関数 ReLU関数 ソフトマックス関数(softmax) 計算グラフ 足し算の計算グラフ 掛け算の計算グラフ 割り算の計算グラフ 指数関数の計算グラフ 底がネイピア数の指数関数の計算グラフ 対数関数の計算グラフ 底がネイピア数の対数関数の計算グラフ sigmoid関数の計算グラフ sigmoid関数の順伝

                                                                深層学習入門 ~基礎編~ - Qiita
                                                              • ChatGPTとCanvaでスタイリッシュなプレゼンスライドをお手軽に作成する - Taste of Tech Topics

                                                                カメラ好き機械学習エンジニアの@yktm31です。 最近、デザインツールのCanvaが、気になって色々試しています。 そこで今回、ChatGPTとCanvaを使って、どれだけ簡単にきれいなスライドを作れるか試してみました。 Canvaとは Canvaは、簡単にスタイリッシュなスライドや画像等を作成できる、デザインツールです。 テンプレートや素材が豊富にあり、デザイン知識がなくても、質の高いコンテンツを作ることができます。 基本的に無料で使えるのですが、有料契約(Canva Pro)にすると、生成AIでさらに強力にデザインをサポートしてもらえます。 今回利用するのは、「Docs to Decks」と「Text to Image」という機能です。 それらの機能を利用すれば、文章から簡単にデザインを作成することができます。 ただ今回は、そのデザインのベースとなる文章自体も、ChatGPTで自動生

                                                                  ChatGPTとCanvaでスタイリッシュなプレゼンスライドをお手軽に作成する - Taste of Tech Topics
                                                                • 機械学習とは?種類やできること、プログラムとの違いを解説

                                                                  機械学習とは 本稿では、まず機械学習とは何かについて説明します。機械学習とは何が何を学習しているのか、従来のプログラムとの違いは何か、についても触れます。類語としてよくでてくるディープラーニング(Deep Learning、深層学習とも)、教師あり学習、教師なし学習についても用語を整理します。 その前に人工知能とは? 機械学習の説明の前に、本来なら人工知能(AI:Artificial Intelligence)の説明が必要なのですが、じつは人工知能(以降AIと表記)に対する明確な定義は存在しません。そもそも知能の定義ができているかどうかも定かではないので、AIもまた定義できないという専門家の意見もあります。 AI研究には2つのアプローチがあります。ひとつは、人間の意識や感情、思考そのものを機械によって再現または構築する試みです。SF映画などで、人間の人格をそっくりそのままチップやロボットに

                                                                    機械学習とは?種類やできること、プログラムとの違いを解説
                                                                  • Fumiko Miyama on Twitter: "@Ohsaworks 3回聞きました。面白かったです。w 特に、これ⇩ 某氏「tweetは家でしています」 大学側「10分前のtweetは家ではありませんよね」 某氏「そういう態度を取られるのでは・・・」 大学側「事実を述べてい… https://t.co/GtUFkzPe6d"

                                                                    @Ohsaworks 3回聞きました。面白かったです。w 特に、これ⇩ 某氏「tweetは家でしています」 大学側「10分前のtweetは家ではありませんよね」 某氏「そういう態度を取られるのでは・・・」 大学側「事実を述べてい… https://t.co/GtUFkzPe6d

                                                                      Fumiko Miyama on Twitter: "@Ohsaworks 3回聞きました。面白かったです。w 特に、これ⇩ 某氏「tweetは家でしています」 大学側「10分前のtweetは家ではありませんよね」 某氏「そういう態度を取られるのでは・・・」 大学側「事実を述べてい… https://t.co/GtUFkzPe6d"
                                                                    • 文章を自動で分類するAI、ユーザーローカルが無償提供 AIをプログラミングなしで作れる機能も

                                                                      ユーザーローカルは1月8日、入力された文章を「エンタメニュース」「趣味の話」といったカテゴリーに自動で分類する「ユーザーローカル テキスト自動分類AI」の無償提供を始めた。AIが文章を分析し、テーマや書き手の感情を推定する。 AIは、入力された文章を「仕事」「恋愛」など13のカテゴリーに振り分ける「ニュースカテゴリー分類」と、「肯定的」「否定的」といった感情に分類する「感情カテゴリー分類」の2パターンに対応。 ユーザーがExcelで作ったカテゴリー分け済みの文章の表を、教師データとしてアップロードすれば、オリジナルのAIを作成できる機能も搭載している。 具体的な用途としては、企業に届いた問い合わせメールの振り分けや、アンケート結果の分類、作品へのレビューやコメントの感情ごとの分類などを想定。今後は作成したオリジナルのAIを外部システムに組み込むためのAPIを提供する予定。 関連記事 Web

                                                                        文章を自動で分類するAI、ユーザーローカルが無償提供 AIをプログラミングなしで作れる機能も
                                                                      • 機械学習の実装とアルゴリズムをバランス良く学べる書籍を執筆しました - Qiita

                                                                        scikit-learnライブラリを用いて、機械学習の実装とアルゴリズムをバランス良く学んでいただく書籍を執筆しました。 AIエンジニアを目指す人のための機械学習入門 実装しながらアルゴリズムの流れを学ぶ(電通国際情報サービス 清水琢也、小川雄太郎 、技術評論社) https://www.amazon.co.jp/dp/4297112094/ 既に発売開始しています。 機械学習の ・各種アルゴリズムの実装 ・それぞれのアルゴリズムの動作の仕組み これらを学んでみたい方に向けて執筆いたしました。 ご活用いただければ幸いです。 昨年書いた書籍 つくりながら学ぶ! PyTorchによる発展ディープラーニング(小川雄太郎、マイナビ出版) の、機械学習版のような位置付けです。 本記事では、 ・本書を書いたモチベーション ・本書の概要 ・本書の目次 を紹介いたします。 本書を書いたモチベーション 本書

                                                                          機械学習の実装とアルゴリズムをバランス良く学べる書籍を執筆しました - Qiita
                                                                        • スプラトゥーン3で、やられたシーンをOBSのリプレイバッファで自動保存する - Qiita

                                                                          この記事は スプラトゥーン3の試合中に、やられる直前15秒の動画を自動作成するシステムを開発したので紹介します。 ここに至るまでの15秒の動画を試合中に自動作成します。 スプラトゥーン2の時に開発した、やられたシーン自動抽出システムは、時間がかかる スプラトゥーン2に引き続きスプラトゥーン3もやりこんでいますが、対面力に課題ありです。そこで、やられたシーンを録画で振り返りつつXマッチに潜っています。 その振り返りの効率化のため、スプラトゥーン2の時にプレイ録画から、やられたシーンを自動抽出するシステムを作りました。その様子はこちらの記事で解説しています。 スプラトゥーン2のプレイ動画から、やられたシーンだけをディープラーニングで自動抽出する Flutter Webで画像分類を行う(AutoML Vision, TensorFlow.js) しかしこのシステムには問題があります。試合が終わっ

                                                                            スプラトゥーン3で、やられたシーンをOBSのリプレイバッファで自動保存する - Qiita
                                                                          • キカガクが初心者向けに無料でAIが学べるオンライン学習サイト「KIKAGAKU」を公開 | AI専門ニュースメディア AINOW

                                                                            最終更新日: 2020年4月2日 総受講生数25,000人以上に、AIなどの先端技術に関する教育を展開してきた株式会社キカガクが、 AIの数学・プログラミング・ビジネス活用方法などについて解説する、 オンライン学習資料「KIKAGAKU」を無料公開しました。 KIKAGAKUは誰しもが挫折せず、 最短距離で最先端の知識を身に付ける事を1つの目標とし、厳密性よりわかりやすさ・言葉よりイメージで理解すること重視して設計されています。 また、 学ぶ道筋・知識を体系化することにで、遠回りすることなく、 学習を進めることができるといいます。 初回リリースでは、 ディープラーニングの基礎から画像認識、 自然言語処理の基礎について学ぶことができるコンテンツが公開されています。 KIKAGAKU のコンテンツは大きく以下の2つに分かれています。 数学を通して理論を理解するパート 学んだ理論をTensorF

                                                                              キカガクが初心者向けに無料でAIが学べるオンライン学習サイト「KIKAGAKU」を公開 | AI専門ニュースメディア AINOW
                                                                            • 画像ディープラーニングの始め方(画像系AIの概要理解からUdemy受講, E資格取得まで) - Qiita

                                                                              本記事の目的 もともと本業でデータサイエンスやディープラーニングを扱っていたわけでもなく、ディープラーニング周りは「なんとなく知っている」という状態。ちゃんと勉強したいと思いながらもなかなか手が出ず、モデル実装の経験もない。 上記の状態から、この1年間くらいでやっと、初めてディープラーニング実装の経験をするところまでたどり着いた。とりあえずデータサイエンスの入口に立てた(かもしれない)ということで、整理のためここまで取り組んできたことをまとめてみた。 これから勉強を始める、誰かのために役立てば嬉しい。 <画像ディープラーニングの始め方> ◇ ステップ1. 画像系AIの全体像を把握する ◇ ステップ2. 画像分類を実装してみる ◇ ステップ3. 理論をフォローアップする ◇ ステップ4. 実装の経験を積む ステップ1.画像系AIの全体像を把握する とりあえず初心者向けの書籍や動画などを見て全

                                                                                画像ディープラーニングの始め方(画像系AIの概要理解からUdemy受講, E資格取得まで) - Qiita
                                                                              • 品質管理における機械学習の有用性<br>~事例に学ぶ、製造業での機械学習の活用方法~

                                                                                はじめに はじめまして、Martingale(Twitterアカウント)と申します。 10年間、半導体分野の生産技術者をしたのち、データアナリストに転職し、今はデータ分析を使って化学プラントの故障原因の解明や予知保全をやっています。 近年、注目されているディープラーニングをはじめとする機械学習ですが、私の感覚では、製造現場への導入があまり進んでいないように思います。 その背景には従来から品質管理に活用されている統計的品質管理の影響があるのではと感じています。 統計的品質管理が上手く機能しているが故に、製造現場で機械学習の必要性があまり感じられていないのではないか?ということです。 つまり、以下のような会話が繰り広げられているのではないかと。。 製造現場でのやり取り (注)絵の中で、若手エンジニアとベテランエンジニアと書いたのは、あくまでイメージです。若手の方が、学生時代にPythonを触っ

                                                                                • AI界の“ゴッドファーザー” ヒントン博士の警告 | NHK

                                                                                  「人類の終わりを意味する可能性がある」 そう警告する1人の技術者がいます。 グーグルでAIの製品開発にも携わり、警告のためグーグルを退社したジェフリー・ヒントン博士です。 「ChatGPT」に代表される、質問を入力するだけで、まるで人間が書いたような文章で回答を作成できる生成AI。解き放たれた高度な技術は人々の暮らしを豊かにする一方で、核戦争並みの脅威になりうると警告しています。 単独インタビューで生成AIの利点と危険性をじっくり聞きました。 (ロサンゼルス支局 山田奈々) 世界的な権威がグーグル退社 ジェフリー・ヒントン博士(75)は、イギリス生まれのコンピューター科学者で、半世紀にわたってAI=人工知能、特にディープラーニングの中核となる技術を研究してきた人物です。1980年代に別の2人の研究者と提案した、「バックプロパゲーション」というアルゴリズムの手法の研究で知られており、「AIの

                                                                                    AI界の“ゴッドファーザー” ヒントン博士の警告 | NHK