[B! あとで読む] pcrdのブックマーク

GitHub - Fannovel16/comfyui_controlnet_aux: ComfyUI's ControlNet Auxiliary Preprocessors

pcrd 2023/12/14

“ComfyUI's ControlNet Auxiliary Preprocessors”

リンク

GitHub - svaante/dape: Debug Adapter Protocol for Emacs

pcrd 2023/12/07

“Dape - Debug Adapter Protocol for Emacs Use dape-configs to set up your debug adapter configurations. To initiate debugging sessions, use the command dape.” emacs

リンク

大規模言語モデル(LLM)をLoRAで強化する際に役立つ情報を研究者が公開

LoRAは画像生成モデルや大規模言語モデル(LLM)に追加の情報を学習させてモデルを微調整できる仕組みです。LoRAを用いてLLMを強化する際に役立つ情報をAI研究者のセバスチャン・ラシュカ氏が解説しています。 Practical Tips for Finetuning LLMs Using LoRA (Low-Rank Adaptation) https://magazine.sebastianraschka.com/p/practical-tips-for-finetuning-llms ◆LoRAの効果には一貫性がある Metaが開発したLLM「Llama 2」をLoRAで強化した際のベンチマーク結果を示した表が以下。「LoRA defaul 1」「LoRA defaul 2」「LoRA defaul 3」はそれぞれ異なるタイミングで作成されたLoRAモデルですが、ベンチマークスコア

pcrd 2023/11/24

“大規模言語モデル(LLM)をLoRAで強化する際に役立つ情報を研究者が公開”

リンク

SDXLでライブ映像をリアルタイム画像生成できる高速化ツール「LCM-LoRA」、GPT-4Vより良い結果も示す画像理解モデル「CogVLM」など重要論文5本を解説（生成AIウィークリー） | テクノエッジ TechnoEdge

2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless（シームレス）を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第20回目は、Stable Diffusion微調整モデルなどを高速化するツール「LCM-LoRA」、画像理解を得意とするオープンソース視覚言語モデル「CogVLM」をはじめとする、生成AI最新論文の概要5つをお届けします。生成AI論文ピックアップStable Diffusion微調整モデルなどを高速化するツール「LCM-LoRA」　Hugging Faceらが開発画像理解を得意とするオープンソース視覚言語モデル「CogVLM」テキスト内容と画像内の物体とを細かく関連付けて対話できるモデル「GLaMM」　Googleらが開発大規模言語モデルを低コストで効率よく

pcrd 2023/11/24

あとで読む

リンク

DALL-E3 (ダリスリー) の無料教科書:初級編｜プチpony

DALL-E3を実装日からほぼ毎日使用し面白さにとりつかれています。何となくで触っているため, いまいち思った画像が出来ないことも多々ありましたので今回まじめに作成法を勉強してみました。初級編と名前がついているのは高等テクニックを教えるほどの技術がないだけで後に上級編が控えているという意味ではないです。 0. はじめに DALL-E とはシンプルなテキストのみで画像がつくれるAIです。簡単なテキストのみで画像生成語源は『ウォーリー探せ』と芸術家の『ダリ』から来ているみたいです。ウィーリーはある種の「探し物」をする, userが提示するテキストのプロンプトから隠された要素やまだ見ぬ画像を「探し出し」生成することらしいです。ウォーリーをインスパイアした少年1. 問題点, 主に著作権やはり何と言っても著作権問題ではないでしょうか。現在法整備が進行しているところです。OpenAIはコンテンツポ

pcrd 2023/11/24

“DALL-E3を実装日からほぼ毎日使用し面白さにとりつかれています。何となくで触っているため, 画像が出来ないことも多々ありましたので今回まじめに作成法を勉強後に上級編が控えているという意味ではないです。”

リンク

無料お絵描きアプリ「Krita」に画像生成AIを組み込んで落書きから美麗イラストを作成する方法まとめ、Stable DiffusionとControlNetをコマンドなしでサクッと導入可能

無料かつ高機能なペイントアプリ「Krita」に画像生成AI「Stable Diffusion」を組み込むプラグインが「krita-ai-diffusion(AI Image Diffusion)」です。Generative AI for Kritaを使えば落書きのような下描き画像から美麗イラストを生成できるとのことなので、インストール手順や使い方をまとめてみました。 GitHub - Acly/krita-ai-diffusion: Streamlined interface for generating images with AI in Krita. Inpaint and outpaint with optional text prompt, no tweaking required. https://github.com/Acly/krita-ai-diffusion ・目次 ◆1

pcrd 2023/11/22

“2023年11月21日 19時29分レビュー無料お絵描きアプリ「Krita」に画像生成AIを組み込んで落書きから美麗イラストを作成する方法まとめ、Stable DiffusionとControlNetをコマンドなしでサクッと導入可能”

リンク

Practical Tips for Finetuning LLMs Using LoRA (Low-Rank Adaptation)

Low-rank adaptation (LoRA) is among the most widely used and effective techniques for efficiently training custom LLMs. For those interested in open-source LLMs, it's an essential technique worth familiarizing oneself with. Last month, I shared an article with several LoRA experiments, based on the open-source Lit-GPT repository that I co-maintain with my colleagues at Lightning AI. This Ahead of

pcrd 2023/11/20

“Practical Tips for Finetuning LLMs Using LoRA (Low-Rank Adaptation)”

リンク

GitHub - mattyamonaca/LCM_i2i_PoC: LCM-LoRAを用いた高速i2iの検証用リポジトリ

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

pcrd 2023/11/18

“LCM-LoRAを用いた高速i2iの検証用リポジトリ使い方（Windows環境での実行を想定）以下のライブラリが使用できるようにセットアップ cv2 numpy pygetwindow pyautogui diffusers pyTorch”

リンク

Azure アプリケーションの設計原則 | Microsoft Docs

次の設計原則に従って、アプリケーションのスケーラビリティを上げて、回復力や管理しやすさを強化します。自動修復機能を設計します。分散システムでは、障害が発生します。障害の発生に備えてアプリケーションの自動修復機能を設計します。すべての要素を冗長にします。単一障害点をなくすようにアプリケーションに冗長性を組み込みます。調整を最小限に抑えます。アプリケーションサービス間の調整を最小限に抑えてスケーラビリティを実現します。スケールアウトするように設計します。需要に応じて新規インスタンスを追加または削除し、水平方向に拡張できるようにアプリケーションを設計します。制限に対処するようにパーティション化します。パーティション分割を使用して、データベース、ネットワーク、コンピューティングの制限に対処します。操作に合わせて設計します。運用チームが必要なツールを得られるよ

pcrd 2023/10/06

“Azure アプリケーションの 10 の設計原則 [アーティクル] 2023/07/11 12 人の共同作成者次の設計原則に従って、アプリケーションのスケーラビリティを上げて、回復力や管理しやすさを強化します。”

リンク

GraphQLはいつ使うか、RESTとの比較

さぼです、沖縄でWebと設計について考えてます。2023/09/23 に沖縄で行われたTechBaseOkinawa2023 にて上記のタイトルで登壇しました。今回の内容は GraphQLを設計の観点から考えてみる GraphQLの目的や用途を整理する GraphQLを使う時、または使わない時のヒントを持ち帰ってもらう最近、GraphQLじゃなくてRESTで良くないと思うケースがなんとなくわかってきたのでそれを共有するという感じで話しました。話した内容を文字に起こし少し改修してZennでも共有することとします。まえおき最近はクライアントAppとサーバーAppを分けて実装する事が増えてきたクライアントの環境はますます複雑になっているクライアントとサーバーはWebAPIで通信を行うクライアントが複雑になるのと同時にWebAPIの要求が更に増して来ている APIの要求・応答を効率

pcrd 2023/10/06

“GraphQLを検討する時の質問項目サービスサービスの規模は? サービス提供においてエンゲージメントが占める比重が大きいかサービスの進化速度が速いか、今後も変化し続けるか”

あとで読む

リンク

遊びながらAWSを学べる“AWSクエスト”日本語対応　クラウドで街を救うRPG　プレイ無料

関連記事 AWS、オンラインゲームを遊んでソリューション構築を学ぶ「AWS Cloud Quest」公開　実際にプレイしてみた米Amazon Web Servicesが、AWSでのソリューション構築を学べるオンラインRPG「AWS Cloud Quest: Cloud Practitioner」を無料公開」。Webブラウザでプレイできる。「Azureのこの機能、AWSで例えると何？」を簡潔に知る方法　実は公式サイトに…… 「Azureのこの機能、AWSで例えると何？」──その疑問、実は答えがまとまってます。 AWS専業SIerのサーバーワークス、Google Cloud事業へ参入　韓国Bespin Globalとの合弁で AWS専業のクラウドSIer、サーバーワークスが、韓国のBespin Globalとの合弁でGoogle Cloud専業のSIer企業「G-gen」を設立し、Goog

pcrd 2023/10/06

あとで読む

リンク

SDXLでコピー機学習法を試す｜Kohya S.

はじめにコピー機学習法は、LoRAを教師画像と同様の画像しか出力されないレベルまで過学習し（コピー機と呼ばれる理由です）、そこから目的のLoRAを取り出す手法です。詳細は以下の月須和・那々氏の記事をご覧ください。今回、SDXLでコピー機学習法を試してみました。品質的にはいまひとつですが、一応成功はしましたので、設定等を共有します。学習にはsd-scriptsを利用しています。教師データとりにく氏の画像を利用させていただきます。 SDXLにおけるコピー機学習法考察（その1） ①まず生成AIから1枚の画像を出力(base_eyes)。手動で目をつぶった画像(closed_eyes)に加工（画像1枚目と2枚目） ②画像3枚目のレシピでまずbase_eyesを学習、CounterfeitXL-V1.0とマージする ③②のモデルをベースに4枚目でclosed_eyesを学習 pic.twitt

pcrd 2023/09/10

リンク

【決定版】『絶対に入れるべき』Chrome拡張ランキングTOP10を発表するぜ！！

他Chrome拡張再生リストはこちら！！ https://youtube.com/playlist?list=PL-IMu-2kQ0Lt3SfYa3fcCxkTrHJaOKaGI ■Twitter https://twitter.com/YukkuriAIch ■リンク・Dark Reader https://chrome.google.com/webstore/detail/dark-reader/eimadpbcbfnmbkopoojfekhnkhdbieeh?hl=ja ・DeepL翻訳 https://chrome.google.com/webstore/detail/deepl-translate-reading-w/cofdbpoegempjloogbagkncekinflcnj?hl=ja ・Enhancer for Youtube https://chrome.go

pcrd 2023/09/09

リンク

emacs-bedrock: Stepping stones to a better Emacs experience

#Emacs Bedrock Stepping stones to a better Emacs experience #Synopsis An extremely minimal Emacs starter kit uses just one external package by default, and only GNU-ELPA packages on an opt-in basis. Intended to be copied once and then modified as the user grows in knowledge and power. As of 2024-02-07, Bedrock is officially hosted on Codeberg. Mirrors: Old project on SourceHut GitHub (just a place

pcrd 2023/09/06

“#Emacs Bedrock Stepping stones to a better Emacs experience #Synopsis An extremely minimal Emacs starter kit uses just one external package by default, and only GNU-ELPA packages on an opt-in basis. Intended to be copied once and then modified as the user grows in knowledge and power.”

リンク

なぜ脱OSSが増えているのか？

はじめに TerraformやVaultを開発するHashiCorpは自社製品をOSSのMPL(Mozilla Public License v2.0) から、ソースコードは公開するも一部の利用に制限があるBSL(Business Source License) への変更をアナウンスしました。これは2018年のRedisを皮切りにMongo DBやCockroachDB、ElasticSearchなど多くのプロダクトで進められている脱OSSの流れです。商用のオープンソース[1]と言われてしまうこともある最近のこの動きの理由は何故なのか？　という点を以下の動画で解説しました。動画中では尺の都合で端折った個所も多いので、こちらの記事の方にもまとめておきたいと思います。 OSSとは？ OSSの定義まず、OSS（オープンソース）とはなんでしょうか？これはRMSのフリーソフトウェアを源流とする

pcrd 2023/09/03

リンク

ぼくのかんがえたさいきょうのGAS開発手法2023

前提clasp の制約、Script API の考え方、Google Drive の考え方に素直に従うその条件下である程度モダンな開発環境での開発を目指す可能ならコードは VCS で管理する（pull-req など）ドキュメントベースで共同作業に向いた手法で開発を進める特にカジュアルに始めやすい Google Apps Script は悪い意味での属人化まっしぐらになりやすい。これが長期間の業務に影響しないような、ワンショットのものなら別にそれでもよいが、これが誰かに引き継がなければいけないような状況が生まれると一気に地獄みが増してしまうので、そうなってしまう前により良い開発手法を考えておきたい。考慮したことGAS は素朴に作ると Script 本体の構造がそれを利用する container （例えば Spreadsheet）のデータ構造などと密結合になってしまう。この状態のままコード

pcrd 2023/08/24

あとで読む

リンク

Google、コード生成や補完のAIモデル「Codey」が日本語での指示や説明に対応したと発表

Googleは、都内で開催したイベント「Generative AI Summit Tokyo」で、コード生成や補完のためのAIモデル「Codey」が日本語に対応したと発表しました。 CodeyはGoogleの最新の大規模言語モデルPaLM 2をベースとした、コード生成や補完のための基盤モデルです。 Codeyは、自然言語による指示に基づいてコードを生成する機能、チャットで会話しつつコード関連の質問に回答する機能、コードの足りない部分を補完する機能などを備えています。対応するプログラミング言語は、Java、JavaScript、TypeScript、PHP、Python、Ruby、Rust、C＋＋、C＃、Go、Kotlin、Scala、Swift、Google SQLなど。さらにGoogle Cloud CLIやKubernetes Resource Model（KRM）、Terraform

pcrd 2023/08/23

あとで読む

リンク

How to invoke Github Copilot programmatically? · Issue #8 · thakkarparth007/copilot-explorer

pcrd 2023/08/20

“The best way I'm aware of doing this is to do UI automation on VSCodium with copilot installed. VSCodium has some UI tests in its repository, written”

リンク

漫画未経験のエンジニアが今のAIで漫画制作にトライしてみた記録2023年夏時点版｜Anno Takahiro

画像生成AIの躍進が目覚ましい。エンジニア兼SF作家の筆者としては、AIが絵を描けるようになるのなら、絵が描けない自分でも漫画制作ができるようになるのではという期待があった。実際に2022年の末頃にはstable diffusionを使った漫画制作UIのプロトタイプを作ってみたこともある。 Google ColabでAI 漫画制作用のUIを試作してみた。コマごとにプロンプトが割り当ててあって、AIが裏でたくさん選択肢を作りまくってくれる。人間が大量の絵からベストなものを選んだり、構図やセリフの調整に集中できるようなワークフローがいいのではないかという仮説 #stablediffusion pic.twitter.com/zI64zm3cNI — 安野貴博 (@takahiroanno) November 10, 2022 それから半年以上の月日が経ち、世の中でもMulti ControlNe

pcrd 2023/08/18

“漫画未経験のエンジニアが今のAIで漫画制作にトライしてみた記録2023年夏時点版”

リンク

AIはどのような仕事ができるようになったのか？ChatGPTで変わる「優秀な人材」

この図はざっくりと3つの領域に分かれます。まず左下が従来のプログラミングの領域です。これは簡単に言うと「プログラムは間違ってはいけない定形な仕事を奪う」ということです。次にその上の士業が責任を取る領域です。これは「責任」を取る人がいないと成立しない仕事です。ミスが発生した際に罰則を与えるという形で、ミスの発生を防いでいます。最後に右側のホワイトカラーの仕事の領域です。ホワイトカラーの仕事は入出力が不定形であり、作業フローも非定型であったりします。そのため、多少のミスはあっても仕方ないという前提の上で仕事が行われています。機械学習がビジネスに組み込まれるにつれ、ホワイトカラーの仕事領域はそれらによって少しずつ代替されつつあります。その図がこちらになります。ホワイトカラーの担っていた領域は、表データの機械学習（重回帰や、Lasso回帰、SVM、RandomForest、LightGBMなど

pcrd 2023/08/18

“ChatGPTでは、数学サービスのWolframをプラグインを経由して呼び出すことで、数学関連の問題であればハルシネーションを起こさずほぼ確実に解けるようになりました”

あとで読む

リンク

はてなブックマーク

タグ

関連タグで絞り込む (243)

あとで読むに関するpcrdのブックマーク (317)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第2週）

今週のはてなブックマーク数ランキング（2024年5月第1週）

月間はてなブックマーク数ランキング（2024年4月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス