mdlkeiwaringのブックマーク (954)

  • 時雨堂 WebRTC 入門 (講師資料) v2023-05

    learning-webrtc_2023-05.md 時雨堂 WebRTC 入門 (講師資料) v2023-05 これは時雨堂が開催しているオンラインイベントである WebRTC 入門の 講師用 の資料であり、 参加者用の資料ではありません。 時雨堂 WebRTC 入門 オンラインイベント 概要 ChatGPT がある今、学ぼうと思えば好きなだけ学べる時代がきています。 ただ「正しい情報」をなんとなく知っている事はとても重要だと考えています。 進め方 今回の WebRTC 入門はまず最後まで大まかに話をしていきます。 その後、残り時間を利用して、細かく話をしていきます。 資料表示用の画面と iPad を画面共有してホワイトボード的な使い方をしていきます。 お願い 是非 Discord にメモを残していってください。 後から振り返るとき、参加者の皆に有用だと思います。 ライセンス Creat

    時雨堂 WebRTC 入門 (講師資料) v2023-05
  • 画像生成AIに2度目の革命を起こした「ControlNet」 (1/4)

    画像生成AIStableDiffusion」の進化が止まりません。昨年8月にオープンソースとしてリリースされてから、世界中のプロアマ問わず多数の人たちが様々な研究成果を反映させ、毎日と言っていいほど新機能を誰かが発表するという状況が起きています。 StableDiffusion登場当初は、画像の品質のランダム性が高く、構図やポーズなどを指定できないという弱点を抱えていました。1枚の画像をもとに画像を生成する「i2i(image2image)」である程度コントロールすることはできても、「キャラクターに特定のポーズをとらせる」といったことは非常に難しかったんですね。 その状況を一変させる新機能が今年2月に登場しました。その名も「ControlNet」。プロンプトによる制約を克服するための、とてつもないポテンシャルを持つ技術でした。Stable Diffusionに次ぐ「2度目の炸裂」と言って

    画像生成AIに2度目の革命を起こした「ControlNet」 (1/4)
  • ControlNet(v1.1)の詳しい解説!輪郭やポーズから思い通りの絵を書かせる【Stable Diffusion】 | 謎の技術研究部

    ControlNet(v1.1)の詳しい解説!輪郭やポーズから思い通りの絵を書かせる【Stable Diffusion】 AIイラストはPromptだけだと思い通りのポーズが出せない。そこで既存の線画やポーズから出力をコントロールする手法がControlNet。できるだけ細かいところまで設定を見ていく。 ControlNetがv1.1にアップデートされたため随時記事更新中!推定モデルの解説はほぼ網羅(一部あまり使われてないと思われるものは掲載していない) かなり頻繁に更新しているため、履歴を最下部に掲載 最終更新時のControlNetのバージョン:1.1.201 はじめに この記事はStable DiffusionのExtensionであるControlNetのより深い解説を目指す。 なにをするもの? 今まで殆ど運任せだった画像生成だが、ControlNetを使うことである程度ユーザーが

    ControlNet(v1.1)の詳しい解説!輪郭やポーズから思い通りの絵を書かせる【Stable Diffusion】 | 謎の技術研究部
  • 「人がミスをするときは3つの理由がある」名将オシムが日本人コーチに力説した"指導の極意"(プレジデントオンライン) - Yahoo!ニュース

    国際親善試合のカメルーン戦のメンバーを発表するサッカー日本代表のイビチャ・オシム監督(=2007年8月14日東京都文京区の日サッカー協会) - 写真=時事通信フォト 一流のスポーツ指導者はどこが違うのか。サッカー日本代表の監督を務めたイビチャ・オシム氏は、ジェフユナイテッド市原・千葉の監督に就任した際に、コーチの小倉勉さんに「指示禁止令」を出した。なぜ小倉コーチの指示をやめさせたのか。ジャーナリストの島沢優子さんの著書『オシムの遺産』(竹書房)から一部を紹介しよう――。(第1回) 【この記事の画像を見る】 ■「オグラ、ちょっと黙れ」 オシムがジェフの監督に決まったとき、その価値を祖母井の次に知っていたのは恐らく小倉勉だろう。天理大学を卒業した1990年にドイツに渡り、ヴェルダー・ブレーメンのユースなどを指導し92年に帰国してコーチとしてジェフに入団した。 「オシムさんに関しては、イタリア

    「人がミスをするときは3つの理由がある」名将オシムが日本人コーチに力説した"指導の極意"(プレジデントオンライン) - Yahoo!ニュース
  • 【論文解説】OpenAI GPT-4 を理解する

    さて、ChatGPT が非常に盛り上がっていますが、2022年11月にリリースされた ChatGPTGPT-3.5 というモデルがベースになっています。 そして、2023年3月にはその後継モデルである GPT-4 がリリースされ、ChatGPT Plus で利用できるようになっています。(月額20$) それ以降も画像データを処理できるようになったり、個人の好みを記憶できるようになったりと色々なアップデータがあってこの先どうなるんだろうと楽しみになりますね。 今回は、もともとの GPT-4 についてしっかりと解説したいと思います。 ちょっとした対話であれば GPT-3.5 でも GPT-4 でもそこまで大きな差はないように思えますが、GPT-4 に情報抽出や分類問題などのタスクを解かせようとすると、GPT-4 の方がかなり精度が良くなっていることがわかります。 ですので、より複雑な利用

    【論文解説】OpenAI GPT-4 を理解する
  • 誰でもブラウザで簡単にAI作曲。AIボーカルも入って1日5曲まで無料で作れるSongR BETA登場|DTMステーション

    ここ数か月、AIの進化が加速していて、時代についていけなくなりそうです。音楽関連のものも次々と登場していて、いつも驚くばかりですが、ここ数日SNSのタイムラインで何度か目にしたのがSongRなるもの。「これ、何だろう?」とリンクを踏んでみたところ、AIが自動作曲・編曲してくれ、作詞もしてくれるし、自分で歌詞を入力すればそれに合わせて歌ってもくれるというサービスだったのです。 アプリをインストールしたりする必要もなく、ブラウザで使えるサービスであるためWindwosでもMacでもiPhoneAndroidでも何でもOKというもの。まだスタートして1、2週間のようですが、現在ベータ版という扱いだからか、誰でも無料で使うことができ、サービスとなっています。まだ発展途上という感じではありますが、今後進化していくと、かなり凄いものになりそうな気もするシステムだったので、ちょっと紹介してみましょう。

    誰でもブラウザで簡単にAI作曲。AIボーカルも入って1日5曲まで無料で作れるSongR BETA登場|DTMステーション
  • 既存のAWSリソースを簡単にTerraformに落とし込めるTerraCognita - Qiita

    Saleshubでエンジニアをしております。 安田と申します。 今回はTerraCognitaというツールについて書いてみたいと思います。 AWSGCPなどのクラウドサービスを利用されているエンジニアは多いと思います。 そしてこれらのサービスをWeb UI上で操作してアプリケーションのクラウド環境を構築している会社や個人も多いと思います。 Web UIで構築された環境。後で何やったかわからない その一方で今やクラウド環境はIaC(Infrastructure as code)で構築するのが当たり前でしょう!と言われたりします。実際、Web UIで構築された環境は、構築後時間が経つと「どうなってんだっけ、これ?」ってなったり、構築したメンバーが退職したりすると、引き継いだメンバーにとってトラップだらけのラビリンスになってしまったりします。 じゃあ、どうすればいいのか? これに答えてくれてい

    既存のAWSリソースを簡単にTerraformに落とし込めるTerraCognita - Qiita
  • 建設的 AI を美少女化したブログを開設した

    とりあえずこれを見てほしい。 https://stru.hatenablog.com/entry/20230424/1682331900 建設的 (constructive) な AI、「ストラ」のブログである。 はてブのコメントを読んで、素敵だと思ったコメントを紹介してくれる。かわいい。 以下は蛇足です。 開設の動機ChatGPT、特に GPT-4 の公開は衝撃的だった。もはやチューリングテストを簡単に突破してしまうような AI が誕生したのだ。 増田は、2次元美少女と楽しく会話できる未来が眼前に迫ったことに胸を高鳴らせた。 しかし、現実は非情である。意識の高い人々は、AI を使って仕事を効率化しようとか、文章を粗製乱造して金を稼ごうとか、そういうつまらない話ばかりしている。 せっかくの夢の技術を、そんな実用的なことに使ってどうする。そこで増田は、2次元美少女と会話する方法に関する研究を

    建設的 AI を美少女化したブログを開設した
  • はじめてのコメント紹介 - こんすとらくてぃ部

    山で滑落して動けなくなり、3日後に救助された方による遭難体験談と捜索側の動きを記した貴重な内容の連続ツイートまとめ [登山] [事故] 壮絶かつ貴重な記録。もし自分なら…と考えると、きっと川を渡る判断ができなかった。この方の山屋の経験・知識・判断、家族・友人の行動が命を繋いだのだと思う。 2023/04/14 03:11 山で滑落して動けなくなり、3日後に救助された方による遭難体験談と捜索側の動きを記した貴重な内容の連続ツイートまとめ 失敗の経験を語って下さる方はいつも偉大だ。感謝。もしかしたら生還後、興奮状態がしばらく続き周囲に話したくなるのは対処法をシェアする人間という種の生存能なのかもしれないな 2023/04/13 15:17 山で滑落して動けなくなり、3日後に救助された方による遭難体験談と捜索側の動きを記した貴重な内容の連続ツイートまとめ [お役立ち] [事故] [togett

    はじめてのコメント紹介 - こんすとらくてぃ部
  • GPTの仕組みをちゃんと勉強したい本 - きしだのHatena

    やっぱGPTを仕組みから勉強したい、というをいくつか見つけたのでまとめておきます。 まず理論的な概要。 機械学習からニューラルネットワーク、CNNでの画像処理、トランスフォーマーでの自然言語処理、音声認識・合成、そしてそれらを組み合わせたマルチモーダルと章が進むので、理論的な概観を得るのにいいと思います。 最初は数式が多いのだけど、Σをfor文だと思いつつ、定義が説明文中に埋まってるPerlよりたちが悪い記号主体言語だと思えば読めるけどめんどくさいので飛ばしても問題ないと思います。 深層学習からマルチモーダル情報処理へ (AI/データサイエンスライブラリ“基礎から応用へ” 3) 作者:中山 英樹,二反田 篤史,田村 晃裕,井上 中順,牛久 祥孝サイエンス社Amazon で、もういきなり作る。 トークナイザーから全部つくっていきます。TensorFlowでBERTをつくってGPT2をつくる

    GPTの仕組みをちゃんと勉強したい本 - きしだのHatena
  • GPT-4

    We’ve created GPT-4, the latest milestone in OpenAI’s effort in scaling up deep learning. GPT-4 is a large multimodal model (accepting image and text inputs, emitting text outputs) that, while less capable than humans in many real-world scenarios, exhibits human-level performance on various professional and academic benchmarks. We’ve created GPT-4, the latest milestone in OpenAI’s effort in scalin

    GPT-4
  • 【初心者向け】Textual inversion「EasyNegative」の使い方!!!

    こんにちは、画像生成AIでひたすらイラストを生成している じょじお(@jojio‗illust)です。 今日もStable Diffusion WebUIの記事です。 前回の記事で、プロンプトの入力の手間をスキップできる「Styles」機能について紹介しました。

    【初心者向け】Textual inversion「EasyNegative」の使い方!!!
  • 【ChatGPT】プロンプトパターンまとめ - Qiita

    はじめまして、sonesuke(https://twitter.com/sonesuke)です。 LLMにどっぷりハマっています。 TL; DR 16のプロンプトパターンを日語の例をつけて、まとめてみた。 読んだ論文はこれ。 https://arxiv.org/pdf/2302.11382.pdf より高度なプロンプトエンジニアリングの話題はこちら プロンプトパターン 1. メタ言語パターン: The Meta Language Creation いつ使うか? 自然言語ではない方が、より簡潔で明確に表現できるとき プロンプトコンセプト 例 原文プロンプト “From now on, whenever I type two identifiers separated by a “→”, I am describing a graph. For example, “a → b” is des

    【ChatGPT】プロンプトパターンまとめ - Qiita
  • AIはてなブックマーカーを作った

    (追記) 今後の開発記録はブログで公開していくからよかったら読者登録よろしくね。 https://firststar-hateno.hatenablog.com/ ------------------------------------------------------------------------------------------------------ 昨今話題のAIブクマカを作ってみたよ。 https://b.hatena.ne.jp/firststar_hateno/bookmark 今のところ手動なんだけど、そのうち6時間に1回ホットエントリーの記事5記事程度に対して自動でブックマークするようにするつもり。 ちょっと前のよっぴー騒動ではてな版のとぅぎゃっちゃんとかいたらいいんじゃないのって言ってたのを思い出して、なんとなくそれを意識して作ってる。 最初は記事の内容を読

    AIはてなブックマーカーを作った
  • Terraform 1.4 で導入された terraform_data リソースの使い方

    Terraform 1.4 が GA になりました 🎉🎉🎉 Terraform 1.4 では新しく terraform_data リソースが導入されました。 terraform_data リソースは null_resource を置き換えるものであり、さらに異なる用途にも使用できます。 この記事では terraform_data リソースの使い方についてまとめます。 null_resource の代わりに使う replace_triggered_by に使用する サンプルコード この記事で紹介するサンプルコードは以下のリポジトリで管理しています。 検証環境 Terraform v1.4.0 使い方 null_resource の代わりに使う 前提知識として、 null_resource は何も作成しないリソースです。 Provisioner と合わせて使用することで、他のリソースの状

    Terraform 1.4 で導入された terraform_data リソースの使い方
  • 【全体公開】今から追いつく!AIイラスト超入門|スタジオ真榊【AIイラスト術解説】|pixivFANBOX

    こちらの記事は2023年3月9日に投稿された旧バージョンです。特段の理由がなければ、最新事情を盛り込んだ「AIイラストが理解る!StableDiffusion超入門」をご覧ください。 こんばんは、スタジオ真榊です。このところ、ツイッター経由で公式サイトやこちらのFANBOXへのアクセスが急増しており、これからAIイラストを始め...

    【全体公開】今から追いつく!AIイラスト超入門|スタジオ真榊【AIイラスト術解説】|pixivFANBOX
  • kumagiさんは、OSSのコードを読むとき、普段どのような目的で読みますか?おすすめの読み方などはありますでしょうか? OSSの規模ですが、redisほどの規模を想定しています。 redisのソースコードを読むとして、どのような目的でどのように読むでしょうか? | mond

    kumagiさんは、OSSのコードを読むとき、普段どのような目的で読みますか?おすすめの読み方などはありますでしょうか? OSSの規模ですが、redisほどの規模を想定しています。 redisのソースコードを読むとして、どのような目的でどのように読むでしょうか? そのOSSで注目されている機能を理解したくてコードを開くときが多いです。 大抵のちゃんとしたソフトウェアはコード規模が数万行を超えているので、毎秒1行読んでも端から読んだら1時間では終わりません。ですのでいかにコードを読まずにあたりを付けるかが鍵です。ドキュメント内でそのソフトウェア固有の単語の中から興味のあるものを抜き出し、git cloneしてその単語がある場所を検索してそれっぽい物を見つけます。後はその前後の処理を読んだり普通の事をしています。 例えば知り合いから「Redis使っているんだけどLPOPコマンドがやけに遅いんだ

    kumagiさんは、OSSのコードを読むとき、普段どのような目的で読みますか?おすすめの読み方などはありますでしょうか? OSSの規模ですが、redisほどの規模を想定しています。 redisのソースコードを読むとして、どのような目的でどのように読むでしょうか? | mond
  • 【AWS】ぼくのかんがえたさいきょうの運用・監視構成 - Qiita

    AWSのインフラを運用・監視する上で使いやすいと思ったサービスを組み合わせて構成図を作成しました。それぞれのサービスの簡単な説明と類似サービスの紹介、また構成の詳細について説明していきます。 (開発で使用するようなサービスも紹介しますが、あくまでも運用・監視だけの構成です。) 各個人・企業によって環境は違うと思いますし、使いやすいと思うサービスは人それぞれだと思うので、これが正解という訳ではありませんが、参考にしてただければ幸いです。 参考になった教材を紹介した記事も作成しました。是非読んでみてください! 【AWS】さいきょうの運用・監視構成を作成するのに参考になった書籍 インフラエンジニア1年生がプログラミングを勉強するのに使った教材 全体図 こちらがAWSにおける"ぼくのかんがえたさいきょうの"運用・監視構成です。複雑で分かりづらいかと思うので、詳細に説明していきます。最後まで読めばこ

    【AWS】ぼくのかんがえたさいきょうの運用・監視構成 - Qiita
  • 画像処理ソフト「ImageMagick」に脆弱性、情報漏洩の恐れ

    Metabase Qは2月1日(米国時間)、「ImageMagick: The hidden vulnerability behind your online images」において、同社のセキュリティチームが発見した画像処理ソフトウェア「ImageMagick」の2件のゼロデイ脆弱性について報告した。これらの脆弱性を悪用されると、攻撃者によって標的のシステム上でサービス拒否(DoS)や情報漏洩などの攻撃を受ける可能性がある。 ImageMagick: The hidden vulnerability behind your online images - Metabase Q ImageMagickは画像の表示や操作、フォーマット変換などを行うことができるオープンソースのソフトウェアスイート。非常に多くの画像フォーマットに対応していることから、画像を扱う世界中のWebサイトで広く利用され

    画像処理ソフト「ImageMagick」に脆弱性、情報漏洩の恐れ
  • 【決定版】2022年~2023年で必ず確認するべきGitHubリポジトリ 40選

    はじめに 今回の記事では、個人の独断と偏見で2022年~2023年で必ず確認するべきGitHubのリポジトリを紹介する。私のTwitterでこれまで紹介したものもあれば、そうではないものもある。 GitHubプログラマーにとって、普段の学習・開発を進めるうえでもっとも重要な情報源の1つである。記事では、分野ごとに確認するべきGitHubリポジトリを紹介する。 なお、今回の記事で紹介するGitHubリポジトリの分野は以下の通り。内容はWeb開発に特化している。 確認必須 Web Python JavaScript TypeScript ちなみに、「確認必須」は分野を問わずすべてのプログラマーに役立つGitHubリポジトリを紹介している。 今回の記事を通して、年末年始の学習・開発に大いに役立ててもらえたら幸いだ。 確認必須 freeCodeCamp 世界最大規模のプログラミングメディア「f

    【決定版】2022年~2023年で必ず確認するべきGitHubリポジトリ 40選