サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
GPT-4o
weel.co.jp
皆さん、Nougatという論文読み込みツールをご存知ですか? 画像からテキストに変換するOCR技術を使い、LaTeXという論文を記述する言語に変換するんですが…… え、ご存知ないんですか!!??まさかぁ(茶番) Nougatは、FacebookのMeta社が開発しました。論文をChatGPTなどの生成AIに読み込ませるのは一苦労ですが、それがめちゃくちゃ楽になるんですよ!! ということで、今回の記事ではNougatの概要、導入、実際に使ってみた感想についてまとめています。 この記事を最後まで読むと、論文読み込みツールのNougatを理解できるようになります。 ぜひ最後までご覧ください! なお弊社では、生成AIツール開発についての無料相談を承っています。こちらからお気軽にご相談ください。 Nougatの概要 NougatはFacebook Researchによって開発された学術文書のPDFパ
【AI秘話】ChilloutMix生みの親が語る、日本の画像生成AI業界における可能性 2024 3/27 この記事は、二本立てのうちの後半です。 前半の記事をご覧になっていない方は、こちらをご覧ください。 WEELメディア事業部です。 みなさん!今SNSで話題の「AIグラビア」ってありますよね。 この度なんとAIグラビアの元祖、TASUKUさん(@TASUKU2023)へのインタビューが実現しました! TASUKUさんは、リアルなAI美女が生成できちゃうStable Diffusionの派生モデル「ChilloutMix」を作られた方。顔出しありでTVに出演されたこともある、AIアートの伝道師なんです。 ということで前回に引き続き、TASUKUさんへのインタビュー記事2本目!今回はStable Diffusion界隈で活躍する、日本人コミュニティのすごさをお届けします。
WEELメディア事業部リサーチャーの大竹です。 2022年12月頃、検索エンジンMicrosoft Bingと大規模言語モデルGPTを活用したPerplexityが登場。AIに質問を投げかけると、インターネットから収集した情報を基に回答を生成できます。 大規模言語モデルは、10兆トークンの学習データで開発されたGPT4も選択可能。人間が書いた文章に近い回答を出力できます。 まるで、映画『アイアンマン』にてトニー・スタークが使う、リアルタイムで情報を取得し問題を解決するAIアシスタントのジャービスのようです! この記事では、Perplexityの特徴と使い方について解説します。社内業務改善や研究のための論文検索などにお役立てください。 なお弊社では、生成AIツール開発についての無料相談を承っています。こちらからお気軽にご相談ください。 Perplexityの概要 Perplexityとは、A
最新のAIツールの活用方法やAIの面白いトリビア・AIの裏技を紹介します。「そんな使い方もあったのか!」とちょっと驚くような記事もお届けしています。
WEELメディア事業部テックリサーチャーの中田です。 オープンソースのローコード自動化ツールの「n8n」がGitHubで公開され、誰でも簡単にワークフローを作れるようになりました。 これにより、サービスとサービスを簡単に、コードを書かずに繋げらるんです…! 本ツールを紹介しているYouTubeの動画は、すでに2.7万再生回数を獲得しており、かなり注目されていることがわかります。 この記事ではn8nの使い方や、有効性の検証まで行います。本記事を熟読することで、n8nの凄さを実感し、従来のZappierなどには戻れなくなるでしょう。 ぜひ、最後までご覧ください。 なお弊社では、生成AIツール開発についての無料相談を承っています。こちらからお気軽にご相談ください。 n8nの概要 n8nはオープンソースのローコードツールで、ワークフローを作成できます。具体的には、既存のサービス同士を繋げることで、
2024年4月23日、Microsoft社からコスト効率の高い小型LLMである「Phi-3-mini」が公開されました。 Phi-3 mini model released under MIT! 🚀 Last Week Llama 3, this week Phi-3 🤯 @Microsoft Phi-3 comes in 3 different sizes: mini (3.8B), small (7B) & medium (14B). Phi-3-mini was released today, claiming to match Llama 3 8B performance! 🚀 3.8B TL;DR: 2️⃣ Instruct Versions with 4k… pic.twitter.com/1aYlWpPKeb — Philipp Schmid (@_philschmid
WEELメディア事業部リサーチャーのいつきです。 突然ですが、みなさんは、ユーザーが入力した歌詞を音楽に変えてくれる「Suno AI」という音楽生成AIをご存知でしょうか? なんと、ユーザーが歌詞をテキストデータで入力するだけで、メロディやボーカルをAIが生成して1つの楽曲を完成させてくれるという優れものです。 すでに音楽やAIに精通している多くの方が実際に利用しており、X(旧Twitter)でとくに注目度が高いものでは、1,000いいね以上を獲得している投稿も珍しくはありません。 そこで今回の記事では、Suno AIの活用事例を13個ご紹介します。 最後まで目を通していただくと、Suno AIの使い道を理解できるので、音楽クリエイターや配信者として活躍できるかもしれません。ぜひ最後までご覧ください。 なお弊社では、生成AIツール開発についての無料相談を承っています。こちらからお気軽にご相
【Leonardo.AI】日本語での使い方やおすすめプロンプト、商用利用や著作権について解説 2024 1/09 WEELメディア事業部LLMリサーチャーの中田です。 11月3日、オーストラリアの会社によって運営されている画像生成AIツール「Leonardo.AI」がアップデートされ、誰でも簡単に「より高品質な」画像を生成できるようになりました。 これにより、巷で話題のリアルタイム生成やSketch-to-Imageも可能になったんです…! 本ツールのYouTube紹介動画の再生回数は、日本国内でも注目を集めていることがわかります。 まるで、映画『レディ・プレイヤー・ワン』のような世界観も簡単に作れるように! 2023年12月31日には新機能「Realtime Gen」をリリース。 プロンプト入力するとリアルタイムで即時生成 スライダーで詳細を調整できる より自由な画像生成が可能 今までよ
メディア事業部AIライターのたけしとLLMリサーチャーの中田です。この記事は専門的な内容を含むため、AIスペシャリストとの共同執筆となっています。 2023年11月15日、Builder.ioより「GPT Crawler」がオープンソース化されました。 GPT Crawlを利用すれば、URLを指定するだけで、そのサイト独自のGPTsをたった2分で簡単に作れてしまうんです! というわけで今回は、GPT Crawlerの概要や使い方について詳しく解説します。 ぜひ最後までご覧いただき、お手元のPCでGPTsを作成してみてください! なお弊社では、生成AIツール開発についての無料相談を承っています。こちらからお気軽にご相談ください。 GPT Crawlerの概要 GPT Crawlerは、【サイトのURLを指定するだけで、独自のGPTsをChatGPT上で作成できるソフトウェア】です。 例として
SDXL Turboは、2023年11月29日にStability AIより公開された最新のリアルタイムテキスト画像生成モデルです。 このモデルは、新しい蒸留技術によって画像生成に必要なステップ数を50ステップからなんと1ステップに削減することで、超高速で画像生成が可能になり、文字を入力した瞬間に画像を生成できるようになりました。 実際に動作している様子です。 Introducing SDXL Turbo: A real-time text-to-image generation model. SDXL Turbo achieves state-of-the-art performance with a new distillation technology, enabling single-step image generation with unprecedented quality,
【Stable Diffusion 3】ついに公式APIが公開!使い方と料金を徹底解説! 2024 4/26 WEELメディア事業部LLMライターのゆうやです。 2024年2月23日、Stability AIから最新の画像生成AIである「Stable Diffusion 3」が公開されました! 2022年のStable Diffusion 1.4のリリース以来、Stability AIはStable Diffusion1.5、2.0 、2.1、XL、XL Turboと次々にバージョンアップモデルをリリースし、今回のStable Diffusion 3を発表しました。 その進化は目覚ましく、Stable Diffusion 3は前バージョンと比較して、複数の主題のプロンプトへの対応力、画像品質、テキスト生成の品質が大幅に向上しています。 以下が、Stable Diffusion 3で生成され
WEELメディア事業部LLMライターのゆうやです。 2024年4月24日、ついにあのAppleからオープンソースLLMである「OpenELM」が登場しました! Appleが「OpenELM」なるAIモデルファミリーをオープンソースでリリース! ネットに接続なしで、完全にデバイス上で動く前提でを重視して作ったとのこと。 これはスマホ上で動く大本命LLMになる可能性大! pic.twitter.com/N25jNwQzq5 — とーます|AIX人材育成|AIコーチ開発|可能性開花をAIX (@Xroid_Lab) April 24, 2024 このモデルは、4つの異なるサイズ(270M、450M、1.1B、3B)で公開され、軽量で実行コストが低いためAppleデバイスでも動作します。また、「layer-wise scaling戦略」を使用し、効率的にパラメータを活用することで他の同規模モデルよ
WEELメディア事業部LLMリサーチャーの中田です。 2月3日、日本語特化型のText-to-Speechモデル「Style-Bert-VITS2 JP-Extra」が公開されました。 その他のTTSよりも、より自然な日本語の発音、アクセント、イントネーションの音声を出力できるんです、、、! 【日本語でも自然な音声合成AI】 Style-Bert-VITS2は、日本語特化モデル JP-Extraを搭載し、かなり自然な日本語による発話をTTSで実行してくれます。 公式のサンプルを聞く限り、スタイル無しでもかなりの精度。文脈と感情がかなり合致。 是非音声ONで!! 続く>>#生成AI #AI pic.twitter.com/4ghjEClTwM — 田中義弘 | taziku CEO / AI × Creative (@taziku_co) February 7, 2024 公式のGitHub
WEELメディア事業部LLMリサーチャーの中田です。 LAION社が、音声と言語のマルチモーダルモデル「CLAP(Contrastive Language-Audio Pretraining)」を公開しました。 このAIモデルを使うことで、音声と言語を紐づけた特徴量抽出ができ、高度な音声分類や音声検索、Text-to-Auioに活用できるんです! 以下の動画は、AudioLDMというText-to-Audioのモデルですが、背後にはCLAPが大活躍しています。 Update: the AudioLDM paper with additional demos is now live. AudioLDM is a Text-to-Audio (TTA) system that is built on a latent space to learn the continuous audio re
【Langchain】何ができるのかや日本語での使い方、GPT-4との連携方法を解説 2024 4/30 皆さんは、Langchainというライブラリをご存知でしょうか? Langchainを使うことで、ChatGPTの機能を高め、より実用的に使えるようになるのです。現代においてChatGPTは、プログラミングやWebライティングをはじめ、あらゆる業種において「なくてはならない存在」となっているのが現状。 他社よりもできる限りChatGPTを有効活用したいですよね。そこで、ライブラリ「Langchain」の出番です! 具体的にどのような変化があり、どの点が便利になるのか、そして導入方法は何か、気になりますよね? そこで今回の記事では、Langchainの概要や導入方法、実際に使ってみた感想をお伝えしていきます。 本記事を一読することで、いつも使用しているChatGPTが見違えるほど高機能に
【Suno AI】テキストだけで曲、歌詞、歌声を作れる禁断の音楽生成AIの使い方〜実践まで 2024 4/18 皆さんは「Suno」という音楽生成AIをご存じですか? Suno AIは、これまで出来なかったユーザーが入力した歌詞でヴォーカルまで生成してくれる革新的な音楽生成AIです。さらに音楽の知識や作曲知識がなくともプロンプト次第で、あなたも音楽プロデューサーになれてしまうとんでもないAIなのです。 今回は、Sunoの概要や実際に使ってみた感想、Stability AI社が2023年9月に公開したStable Audioとの比較をお届けします。 Suno AIの登場によって誰でも簡単に音楽制作をできるような時代がやってきたと言えるほど、革新的なサービスであるSuno。 その優れている点や将来性についても触れますので、是非最後までご覧ください! なお弊社では、生成AIツール開発についての無
みなさんは、誰でも簡単に息をのむような美しいイラストが作れる画像生成AI「Midjourney」をご存知ですか? 実際にMidjourneyで生成した画像を、米コロラド州の美術品評会に出品して1位を勝ち取った強者も出てきているんです! 2023年12月末には、「Midjourney V6」という最新バージョンもリリースされ、大きな注目を集めています。 というわけで当記事では、Midjourneyの概要や使い方、料金プランなどを、実際に使ってみた結果も添えてわかりやすく解説していきます。Midjourneyをより効果的に活用するコツもご紹介していますので、ぜひ最後までご覧ください! なお弊社では、生成AIツール開発についての無料相談を承っています。こちらからお気軽にご相談ください。 Midjourneyとは まずは「Midjourney」がどのような画像生成AIなのか、その概要と魅力を紹介し
【悪用厳禁ChatGPTプラグイン】他社サイトをスクレイピングできる「Scraper」の導入方法から使い方 2024 4/29 今回は、Webサイトから情報をスクレイピングできる、ChatGPTプラグイン「Scraper」を紹介します。スクレイピングとは、Webサイトから情報を自動的に取得する技術のことを指します。手動で情報を集める手間が省け、大量のデータを効率的に処理することが可能です。 例えば、下記の様なことができます。 特定した商品の価格情報を複数のECサイトから一括で取得 ニュースサイトの最新記事を自動的に取得 この技術は、市場調査や競合分析、ニュースのトレンド分析など、ビジネスの様々な場面で活用されています。「Scraper」プラグインは、プログラミング知識がなくても、スクレイピング作業をChatGPTの簡単なプロンプトで行うことが可能です。 スクレイピングは情報収集の効率化を実
LangChainは、大規模言語モデルの革命的な力を持つ技術ツールです。 例えば、情報の抽出や自動処理が可能で、開発においてもさまざまな効果が期待できます。 この記事を読めば、LangChainの真価や機能、開発の流れ、費用や実際の開発事例まで、より詳しく理解できます。LangChainの活用方法やその有益性を深く知る手助けとなるでしょう。 LangChainを組み込むことで、従来の方法よりも作業の効率が大幅に向上します。自動化された情報処理が可能になり、開発や分析タスクの時間短縮など。高精度なデータ分析をおこなうことで、仕事の質も一段と高まります。 なお弊社では、生成AIツール開発についての無料相談を承っています。こちらからお気軽にご相談ください。 Langchainとは LangChainは、ChatGPTやその他の言語系モデルの機能拡張を効率的に実装するためのライブラリです。現在、P
近年、大規模言語モデル(LLM=Large Language Model)の急成長に伴い、膨大なデータ処理の保管先としてベクトルデータベースが重要な役割を担っています。 あらゆる産業や仕事に大きなインパクトを与えている生成AIをうまく活用するためには、LLMのデータ保管先としてベクトルデータベースの活用が欠かせません。 今回は、ChatGPTの台頭によって注目度が急上昇している「Pinecone」というベクトルデータベースに焦点を当てて、概念やPythonによる実装方法をわかりやすく解説します。 さらに、ベクトルデータベースであるPineconeと、従来のデータベース(リレーショナルデータベース)のSQLを比較していますので、ぜひ参考にしてください。 なお弊社では、生成AIツール開発についての無料相談を承っています。こちらからお気軽にご相談ください。 ベクトルデータベースとは ベクトルデー
【リートン(wrtn)】なぜ無料でGPT-4を使える?本当なのか真相を確かめてみた 2024 1/11 メディア事業部AIライターのたけしです。 2023年11月に公開された、「リートン(wrtn)」というAIチャットボットサービスをご存じでしょうか? こちらのサービス、なんとGPT-4が無料で使い放題で、それに加えて豊富な機能・ツールも備わっているというコスパ最強のAIツールなんです! ただ冷静に考えてみると、ChatGPTではGPT-4を利用するのに月額20ドルかかる上に、利用回数制限もあります。それなのに、リートンではGPT-4が無料で使い放題って、ちょっと怪しいですよね? というわけで今回は、リートンで本当にGPT-4が無料で使い放題なのか、実際に利用して検証してみました! 最後までご覧いただき、興味があればぜひ一度リートンを使ってみてください! なお弊社では、生成AIツール開発に
WEELメディア事業部LLMライターのゆうやです。 2024年4月18日、ついにMetaよりLlamaシリーズの最新モデルとなるLlama 3が公開されました! Introducing Meta Llama 3: the most capable openly available LLM to date. Today we’re releasing 8B & 70B models that deliver on new capabilities such as improved reasoning and set a new state-of-the-art for models of their sizes. Today's release includes the first two Llama 3… pic.twitter.com/Q80lVTeS7m — AI at Meta (@
WEELメディア事業部LLMライターのゆうやです。 AlphaGeometryは、Google DeepMindが開発した国際数学オリンピックレベルの複雑な幾何学問題を解決できるAIです。 このAIは、言語モデルと、記号と論理ルールを使って推論する記号演繹エンジンを組み合わせたもので、国際数学オリンピックの問題を標準制限時間内に 25 問を解決しました。 これは国際数学オリンピックの金メダリストとほぼ同等のレベルであり、AlphaGeometryが数学と推論における高度な AI システムであることを示しています。 AlphaGeometryは、「速く、そしてゆっくりと考える」というコンセプトのもと、言語モデルは迅速で「直感的な」アイデアを提供し、記号演繹エンジンはより慎重で合理的な意思決定を提供します。 AlphaGeometryの極めて高い計算能力は、映画「ハロルド・クマー/ホワイトハウ
WEELメディア事業部LLMライターのゆうやです。 OpenGPTは、ChatGPTアプリケーションを簡単に作成できるプラットフォームです。 このアプリケーションは、OpenAIが11月に発表したGPTsとほぼ同じものですが、こちらはオープンソースなので完全無料で作成や、他の人が作ったものを使用できます。 今回は、OpenGPTの概要や使ってみた感想をお伝えします。 是非最後までご覧ください! なお弊社では、生成AIツール開発についての無料相談を承っています。こちらからお気軽にご相談ください。 →無料相談で話を聞いてみる OpenGPTの概要 OpenGPTは、ChatGPTアプリケーションを簡単に作成できるプラットフォームです。 このアプリケーションは、OpenAIが11月に発表したGPTsとほぼ同じものですが、こちらはオープンソースなので無料でChatGPTアプリケーションの作成や、他
文脈による意味の変化 「グラウンドを走る」と「犯罪に走る」 「体にやさしい」と「やさしい算数の問題」 「胃がむかつく」と「彼の態度にむかつく」 ニュアンスの違い 好意:「気に入った」と「大好き」は別物 人による解釈の違い 彼が冷たい:「彼の態度がそっけない」or「彼の体温が低い」 文化的・社会的背景による意味の変化 いい人:恋愛なら「いい人止まり」 / 職場なら「感じがいい人」 適当:テスト・契約書なら「ふさわしい」 / 日常会話なら「いい加減・やっつけ」 肌色:人種によって違う 抽象概念 自由 / 平等 / 愛 / 幸福 / 善悪…etc. といったブレが含まれるからです。例えるなら、国語のテストに数学の尺度で採点をするようなものですね。 テストで網羅できる範囲の限界 LLMの性能・精度を測る際、以下のようなテストが用いられています。 MMLU:理数・人文のテスト HumanEval:コ
Stable Diffusionの特徴3つ Stable Diffusionの特徴は大きく分けて3つあります。 リアル調からアニメ調まで画像生成が可能 ブラウザ&ローカル環境にて無料で使える 商用利用も部分的に可能 それぞれの内容について、わかりやすく解説します。 リアル調からアニメ調まで画像生成が可能 上記は筆者が「Cute dog」で生成した犬の画像。 Stable Diffusionはリアルな人物像からアニメ風の美少女まで、多岐にわたる画像を生成できます。リアル調は映画のVFXやCG技術並の美しさを誇り、遠目から見れば現実と虚構の見分けがつかないほど精密な作りです。 アニメ調は流行りのグラデーションを用いており、イラストレーター風から平坦なVtuber風の色合いまで幅広く対応しています。Stable Diffusionが画像生成AIの中で人気な理由も、リアル調からアニメ調まで1つの技
WEELメディア事業部LLMリサーチャーの中田です。 2月7日、Stable Diffusionの新webUI「Stable Diffusion WebUI Forge」が公開されました。このモデルを使うことで、省エネかつ高速な画像生成が可能になるんです、、、! Stable Diffusion WebUI Forgeに関するXの投稿のいいね数は、すでに1100を超えており、国内だけでもかなり注目されていることが分かります。 Controlnetのlllyasviel氏がStableDiffusion用の新webUI「forge」を公開。8GB程度のVRAMなら約30~45%の高速化が見込め、out of memoryを起こさずに約2~3倍の解像度で生成できるようになるとしています。 A1111版webUIを100%使用しており、基本UIは変わらない模様(▼)https://t.co/mk
WEELメディア事業部LLMリサーチャーの中田です。 4月9日、スマホのUI(画面)を理解するのに特化したマルチモーダル大規模言語モデル(MLLM)である「Ferret-UI」を、Appleが公開しました。 従来のマルチモーダルモデルと違って、スマホ画面の内容を理解し、スマホ操作のための適切な指示を出せるんです! Ferret-UI関連の、Xでの投稿のいいね数は、すでに2000を超えており、かなりバズっていることが分かります。 Apple presents Ferret-UI Grounded Mobile UI Understanding with Multimodal LLMs Recent advancements in multimodal large language models (MLLMs) have been noteworthy, yet, these general-
WEELメディア事業部LLMリサーチャーの中田です。 4月10日、音楽生成AIの「Udio」がパブリックベータ版として一般公開されました。 以前から「Suno AIの対抗馬」として注目を集めており、高品質な音楽生成が可能だと話題なんです! Udioで1曲フルで作ってみました↓! 正直かなり高品質で、音楽として成り立っていますね。 Introducing Udio, an app for music creation and sharing that allows you to generate amazing music in your favorite styles with intuitive and powerful text-prompting. 1/11 pic.twitter.com/al5uYAsU5k — udio (@udiomusic) April 10, 2024 公
次のページ
このページを最初にブックマークしてみませんか?
『WEEL | AIを使う全ての人へ』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く