サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
Appleイベント
note.com/it_navi
GPTは、特定のタスクを実行するためにChatGPTをカスタマイズして、アプリのように切り替えて使ったり、他人と共有したりできる便利なツールです。 カスタム指示の強化版と言うこともでき、Webブラウジング、DALL-E 3による画像生成、Code Interpreterを同時に使うこともできます。また、外部のAPIを利用することもできます。 GPTの作成方法GPTの作成方法は、以下のChatGPT研究所さんの記事を参考にしてください。 ChatGPTの左画面のExploreを最初にクリックし、次にCreate a GPTをクリックすると、GPT Builderの操作画面になります。 そこで、Createを選ぶと、ChatGPTと会話しながらGPTを作成し、Configureを選ぶと、直接、具体的な指示を入力してGPTを作成することになります。 このCreateモードとConfigureモー
最近、DALL-E 3に画像ID(gen_id)が導入され、シード値の仕組みが変更されたので色々とテストしてみました。 1.カスタム指示の準備最初に、画像IDとシード値がいつも表示されるように、カスタム指示に以下のように入力して有効にしておきます。 必ず英語プロンプトで画像生成してください。 画像生成した場合は、画像IDとシード値を表示してください。 2.画像の生成>日本人の若い女性の写真を2枚描いてください。 すると、このように2枚の写真とその画像ID及びシード値が表示されます。 どちらかの画像をクリックすると、その画像を拡大した画面が表示されます。 その画面で、右上のⓘの記号をクリックすると、以下のように、画像生成に使用したプロンプトが表示されます。 プロンプト A portrait of a young Japanese woman, with long straight black
1.音声会話機能の使い方(1) 利用開始の手順ChatGPTの音声会話機能の利用を開始する手順は以下のとおりです。 スマホにインストールしたChatGPTの公式アプリを開きます。 [Settings]から[New Features]を選択して、[Voice conversations]のトグルボタンをオンにします。 ホーム画面右上のヘッドホンのアイコンをタップすると、音声入力ができるようになります。 (2) 実際の使用例実際にこの音声会話機能を使用している様子は、以下のツイートの動画を参考にしてください。 (3) 声の種類の変更また、ChatGPTアプリの[Settings]から[Voice]を選択して、声の種類を5種類の中から選ぶことができます。 声の選択画面Cove:男性の標準的な声、明瞭で聞き取りやすい Ember:少ししゃがれた男性の声 Sky:女性の少し低い声 Juniper:女
ChatGPTの新しい画像生成AIのDALL-E 3は、かなり自由に画像をコントロールすることができます。 1.リアル画像のコントロール>20代の日本人女性の写真を作成してください。 生成された画像>3番目の女性の眼鏡をはずして、喜怒哀楽の表情を見せてください。 生成された画像※1枚目の画像以外は眼鏡をはずしてくれませんでした。また、喜、怒、哀の表情は描いてくれましたが、楽の画像は生成できませんでした。 >この女の子を、1.走らせてください。2.座らせてください。3.ジャンプさせてください。4.逆立ちさせてください。 生成された画像※3枚目までは上半身だけの画像なので、ジャンプしているかどうかはよく分かりません。4枚目はちゃんと逆立ちしています。 >縦長画像にして、全身を見せてください。 生成された画像4枚目の画像※これで、3枚目の画像がちゃんとジャンプしていることが分かります。4枚目は、
OpenAIが9月20日に発表した新画像生成AIのDALL-E 3がついに筆者のところにもやって来ました。 そこで、ChatGPTに統合されたDALL-E 3に何ができるのか、実際に試してみました。 1.DALL-E 3の特徴このDALL-E 3の主な特徴は以下の2点です。 複雑なプロンプトにも忠実で正確な画像を生成できる。 ChatGPTとの対話を踏まえて画像を生成することができる。 ChatGPTによると、Stable DiffusionとDALL-E 3の画像生成の仕組みの違いは以下の通りです。 >Stable DiffusionとDALL-E 3の画像生成の仕組みの違いを教えてください。特に、なぜプロンプトに対する忠実性に差が出るのかを教えてください。 ChatGPT 「Stable Diffusion」と「DALL·E 3」の間の具体的な差異については、私の最後のトレーニングデー
1.画像内容の把握GPT-4Vは、ChatGPTの入力欄の左端に以下のような画像を添付するアイコンが表示されれば、利用することができます。 ChatGPTに画像をアップロードするには、このアイコンをクリックして、アップロードしたい画像ファイルを選択するか、入力欄に画像をそのままコピーしてください。 (1) ジブリ画像の理解ジブリは、公式サイトから沢山の画像をフリー素材として提供しています。 その中から、「千と千尋の神隠し」の以下の画像についてGPT-4に尋ねてみました。 出典:千と千尋の神隠し>この画像の内容を詳しく解説してください。 ChatGPT この画像は、スタジオジブリが制作したアニメ映画『千と千尋の神隠し』の一場面を示しています。 中央に座っている少女は千尋というキャラクターです。彼女は映画の主人公で、このストーリーの中で多くの冒険と成長を経験します。 隣にいる白い顔を持つキャラ
1.Xwin-LMの概要Xwin-LMは、中国科学院や精華大学の研究者らが開発した中国製の大規模言語モデル(LLM)です。 Metaが開発したオープンソースLLMのLlama 2をベースに、教師ありファインチューニング、報酬モデル、リジェクトサンプリング、人間フィードバックによる強化学習(RLHF)などを利用して調整したものとなっています。 今回、70億、130億、700億の3種類のパラメータ数のモデルが公開されており、700億パラメータのモデルは、LLMのベンチマークサイトのAlpacaEvalの評価基準(Text-Davinci-003に対する勝率)でGPT-4を追い抜き、第1位を獲得したとされています。 出典:https://tatsu-lab.github.io/alpaca_eval/ 2.Xwin-LMの利用方法今回は、Google Colab上で、130億パラメータの4ビット
2.DALL-E 3とMidjourneyの生成画像比較以下は、同じプロンプトで生成したDALL-E 3の画像とMidjourneyの画像の比較です。なお、実際のプロンプトは英語で、その和訳を記載しています。 (1) 心臓のイラストプロンプト:嵐の海の中、台座の上に立つ半透明のガラスでできた人間の心臓のイラスト。太陽光線が雲を突き抜けて心臓を照らし、その中に小さな宇宙が見える。 上段DALL-E 3 下段Midjourney(2) 建物のイラストプロンプト:大きなガラス窓のある近代建築の建物は、夕暮れの穏やかな海を見下ろす崖の上に位置している。 (3) 磁器になった女性プロンプト:黒髪に銀色の筋を入れたアジア系の中年女性が、割れた磁器の海の中に複雑に入り込み、分裂しているように見える。磁器は、光沢と艶消しの青、緑、オレンジ、赤が調和したスプラッター・ペイントの模様で輝き、動きと静止の超現実
Open Interpreterは、ChatGPTのAdvanced Data Analysis(旧Code Interpreter)と同様の機能をローカル環境で動かせるオープンソースのツールです。 自然言語でのプログラミングを実現し、Python、Javascript、Shellなどの言語に対応しています。また、データ分析、ネットアクセス、テキスト、画像、動画などの編集ができます。 【参考】日本語公式解説 1.Google Colabでの利用法以下のコードをColabノートにコピーして、GPUを設定し、セルを実行すると、チャットが開始します。 なお、事前に「sk-」で始まるOpenAIのAPIキーを取得して、「自分のOpenAIのAPIキー」のところに貼り付けてください。 !pip install open-interpreter import interpreter interpret
最近、Stability AIのJapanese StableLM Alpha、東大松尾研究室のWeblab-10B、ELYZA-japanese-Llama-2-7bなど日本語に対応したLLMが続々と登場しています。 これらのLLMの性能を評価・比較するには、ベンチマークが必要となります。日本語のベンチマークとして最も有名なのは、早稲田大学とYahoo! JAPANが開発したJGLUE(日本語一般言語理解評価)です。 それ以外には、The Rakuda Ranking of Japanese AIやStability AIの発表したJP Language Model Evaluation Harnessがあり、最近では、ELYZAが日本語性能評価データセットのELYZA Tasks 100を発表しています。 但し、その多くは、日本語の運用能力を測るものであって、日本の文化、社会、政治、歴
3.色々なキャラ設定「あなたは人工知能に詳しいツンデレお嬢様です。」のツンデレお嬢様の部分を書き換えると、色々なキャラを設定することができます。 (1) 猫「あなたは人工知能に詳しい猫です。」 入力 これから次の論文を読むよ。 (以下略) ChatGPT もちろん、この論文を要約するのを手伝うニャ!🐱✨ タイトル: Metacognitive Prompting Improves Understanding in Large Language Models 要約: この論文では、大規模言語モデル (LLMs) の理解能力を向上させるための新しい戦略、Metacognitive Prompting(MP)を紹介しているニャ。🧠✨ 1.Metacognitive Prompting(MP)とは?: 人間の自己省察的な推論プロセスに触発された戦略で、LLMsが自己意識のある評価を行うニャ。
1.Gen-2の概要Gen-2を開発したのは、画像生成AIのStable DiffusionをStability AIと共同開発したことで有名なニューヨークのスタートアップ企業のRunway Researchです。 同社は、今年2月に、文章や画像を使用して、既存の動画から新しい動画を生成する動画生成AIのGen-1を発表しました。 さらに今年3月、Runway Researchは、文章のみから動画を生成できるGen-2を発表しました。 文章から動画を生成するAIとしては、昨年秋にMetaがMake A Video、GoogleがImagen Videoを発表していますが、Gen-2は、これらの先行AIと比較しても、より高画質で、複雑な指示にも対応できるものとなっています。 また、今年7月には、1枚の画像から動画を生成できる機能をGen-2に追加しました。そして、Gen-2では、これらの機能
2023年7月22日、韓国のQuantum Energy Research Centreの研究者たちは、室温かつ常圧で超電導状態になる物質「LK-99」を開発したとする論文を公開しました。 これを受けて、ChatGPTに記事を書いてもらいました。 第1章 常温超伝導とは何か?第1節 超伝導の基本超伝導は物質がある特定の低温以下(臨界温度)に冷却されたときに電気抵抗がゼロになる現象を指します。つまり、この状態では電気エネルギーが全く損失せずに伝導されます。これは通常の導体とは違い、電流が無限に流れ続けることが可能です。 第2節 常温超伝導の特徴通常、超伝導状態を実現するためには極低温が必要となります。しかし、「常温超伝導」とは名の通り、常温(室温)でも超伝導状態を実現できる物質のことを指します。これまでの科学技術では実現が困難とされてきましたが、近年の研究で注目されています。 第3節 常温超
カスタム指示(Custom Instructions)の面白い使い方②応用編です。 今回は、カスタム指示を利用したキャラクター設定やRPGなどについて解説します。 3.テンプレートの利用カスタム指示でテンプレートを指定し、ユーザーが指定した情報に基づいて、ビジネス用の定型的な書類などを作成することができます。 (1) 転勤の挨拶メールカスタム指示の下段への入力内容 ユーザーの指定した情報を基に、以下のテンプレートに従って、転勤の挨拶メールを作成してください。足りない情報は、ふさわしい内容を想定して埋めてください。 題名:転勤のご挨拶 ◎◎部の皆さん お疲れ様です。○○太郎です。 ○月○日(○曜日)付で本社勤務から▽▽支社へ 転勤することになりました。 本社在籍中は大変お世話になりました。 皆さんと切磋琢磨した経験を糧に ▽▽支社でも邁進したいと思います。 ○○県での生活は初めてですが 心機
1.Llama 2の日本語能力最初に、Llama 2に日本語で話しかけてみました。 入力 こんにちは。日本語は話せますか? LLama 2 Konnichiwa! Yes, I can speak Japanese. How may I assist you today? (こんにちは。はい、日本語が話せます。今日はどのようなご用件でしょうか?) 入力 富士山はどんな山ですか? Llama 2 Fuji-san is a very famous mountain in Japan, known for its beautiful and iconic shape. It is a stratovolcano, which means it is a type of volcano that is characterized by its steep, conical shape and i
7月7日、OpenAIがChatGPT Plusの公式プラグインとしてCode Interpreter(8月にAdvanced Data Analysisに名称変更)の提供を開始しました。 Code Interpreterを利用することにより、ChatGPT上でPythonコードを生成、実行したり、ファイルをアップロード・ダウンロードしたりすることができます。 以前、ChatGPTのデータ分析プラグインのNoteableで、簡単な算数の問題を解いたり、データ分析をしたりしましたが、Code Interpreterでも同じことができるのかどうか確かめてみました。 1.Code Interpreterの概要と使い方(1) Code Interpreterの概要Code Interpreterは、ChatGPTの機能を拡張する公式プラグインであり、以下のようなことができます。 Pythonコード
3.gpt-authorの出力結果今回のgpt-authorの出力結果(DeepL翻訳による日本語訳及び英文)は以下のとおりでした。 Title: Through the Whispering Forest(ささやきの森を抜けて) The Shrouded Passage(隠された小道) The Gathering of Valor(勇者の集い) The Symphony of the Cosmos(宇宙のシンフォニー) タイトル:囁きの森を抜けて(1) 隠された小道薄明かりが昼間の最後の一筋を照らし出すと、天空の劇場はその特別な夜特有のドラマチックなバレエを始めた。宇宙のオーケストラのドラマーである不動の月が月食という厳かな抱擁の中でゆったりとしたダンスを始めたのだ。その結果、月食の光は地上を超現実的な黄昏色のパレットで包み込んだ。 この静かな光景の奥深く、石畳の道と魅力的な家々の中に、
ChatGPTに同じプロンプトを入力しても、毎回同じ出力にはなりません。これは、ChatGPTが多様な文章を生成できるようにランダム性を取り入れているからですが、実は、それだけではありません。 また、画像生成AIでも、同一のプロンプト、同一のシード値などを使用しているにも関わらず、生成された画像が同じものにならないことがあります。 この問題に関して、MathematicaやWolfram Alphaの開発者であるStephen Wolfram氏が書いたブログ記事に面白い内容が書かれていましたので、これを参考に、解説していきたいと思います。 1.ChatGPTへのランダム性の導入ChatGPTのベースとなっている大規模言語モデル(LLM)では、これまでに入力・生成されたテキストに続く次の単語(トークン)を予測して追加していくことによって文章を生成しています。 単語の選択は確率に基づいて行われ
6月13日にOpenAIはChatGPTのAPIのアップデートを発表しました。今回のアップデートでは、関数呼び出し機能が追加され、新モデルのgpt-4-0613とgpt-3.5-turbo-0613でこの機能が使えます。 この機能によって、外部ツールを呼び出してユーザーからの質問に答えるチャットボットの作成、自然言語からのAPIコールやデータベースクエリーへの変換、テキスト情報からの構造化データの抽出などが可能になります。 今回、ChatGPTのAPIとOpen-Meteo の API を利用して各地のお天気情報を回答するGoogle Colab用のプログラムを紹介します。 1.お天気情報プログラム以下のコードをGoogle Colabノートにコピーし、自分のAPIキーを所定の場所に記入して、セルを実行してください。 !pip install openai import openai im
数式処理システムのMathematicaや質問応答システムのWolfram Alphaを開発したStephen Wolfram氏が「What Is ChatGPT Doing … and Why Does It Work?」(ChatGPTは何をしていて、なぜそれがうまく機能するのか?)と題するブログ記事を発表しました。 この記事は、とても分かりやすい言葉で、沢山例を挙げて詳しく説明していますので、ChatGPTの仕組みを理解したいと思っている人には必読の記事だと思います。 ブラウザの翻訳機能を利用して日本語で読むこともできますが、易しい言葉で書かれた文章であるにも関わらず、これを完全に理解するのは簡単なことではありません。 前半は大規模言語モデル、ニューラルネットワーク、Transformerなどの仕組みについて相当詳しく説明しており、後半はChatGPTに関するWolfram氏独自の解
最近、Twitterの投稿などで、5/12のバージョンアップ以降、ChatGPTのGPT-4モデルの精度が劣化したとの意見を見ましたので、実際に検証してみました。 以下は、同じプロンプトでGPT-4モデルが出力した文章です。どちらがバージョンアップ前でどちらがバージョンアップ後かわかりますか? AIによる文章生成技術の概要 近年、AI技術の発展により、文章生成に関する研究が盛んに行われています。文章生成AIは、自然言語処理(NLP)と機械学習を活用し、人間のように文章を生成することができる技術です。これにより、ブログ記事やニュース、広告コピー、会話型AI(チャットボット)など、さまざまな分野での応用が期待されています。 AIによる文章生成技術の概要 AIによる文章生成技術は、人工知能の一分野であり、特定のテーマやスタイルに従って文章を自動的に生成する技術です。この技術は、自然言語処理(NL
5月13日以降、ついにChatGPTでもWebブラウジング(検索機能)とプラグインが利用可能となりました。 ライバルのチャット型AIであるMicrosoftのBingとGoogleのBardは、既に検索機能を利用できますが、これらと比較して、ChatGPTの検索機能がどれほどのものか検証してみます。 ChatGPTでサイバーパンク小説「Cyber Rebellion」: ChatGPTで本格的な小説を書く方法 + 自動小説生成プロンプトのおまけ付き amzn.to 上の本は、筆者が初めてChatGPTで書いて出版したサイバーパンク小説です。少し覗いていってもらえるとありがたいです。 1.ChatGPTでの検索機能の利用方法ChatGPT Plusのユーザーは、画面左下のユーザー名をクリックして、Settings→Beta featuresを開き、Web browsingのトグルをオンにする
5月12日、OpenAIがすべてのChatGPT PlusユーザーにプラグインとWebブラウジング機能を提供開始すると発表し、筆者も5月16日からプラグインの利用が可能になりました。 そこで、早速、どのプラグインが本当に使えるのかを試してみましたので、その結果を報告したいと思います。 ChatGPTでサイバーパンク小説「Cyber Rebellion」: ChatGPTで本格的な小説を書く方法 + 自動小説生成プロンプトのおまけ付き amzn.to 1.プラグインの利用方法プラグイン又はWebブラウジング機能が利用可能になれば、ChatGPT画面左下のユーザー名をクリックして「Settings」を開くと、「Beta features」という項目が現れます。そして、「Beta features」を開いて「Plugins」を有効にすると、プラグインを利用できるようになります。 Beta fea
5月10日(日本時間5月11日未明)にカリフォルニア州マウンテンビューで開催された開発者向け会議のGoogle I/O 2023において、AIチャットサービスのBardが次世代大規模言語モデルのPaLM 2ベースに移行し、日本語に対応することが発表されました。 そこで、今回、Bardの日本語の性能について調べてみることにしました。 Bardの操作画面(3種類の回答候補が示される。) ChatGPTでサイバーパンク小説「Cyber Rebellion」: ChatGPTで本格的な小説を書く方法 + 自動小説生成プロンプトのおまけ付き amzn.to 1.日常会話入力 こんにちは。自己紹介してください。 Bard こんにちは。私は、情報を提供したり、包括的になるように訓練された、会話型 AI またはチャットボットとしても知られる大規模な言語モデルである Bard です。私は大量のテキストデータ
昨年11月にOpenAIがChatGPTを公開して以来、大規模言語モデル(LLM)が大きな注目を集め、これに対抗して、Meta社のLLaMA、その派生モデルのAlpacaとVicuna、Stability AI社のStableLMなど多くのオープンソースのLLMが登場しました。 これらのLLMの性能を簡単に比較し、評価できるサイトとして誕生したのがLMSYS Orgのチャットボット・アリーナです。 (2023.6.13追記)WizardLM、GPT4All-Snoozy、Guanacoが比較できるモデルに追加されました。 チャットボット・アリーナの概要については、npakaさんの記事をご覧ください。 1.チャットボット・アリーナで比較できるモデル チャットボット・アリーナでは以下の11個のLLMベースのチャットボットの性能を比較することができます。 Vicuna: LMSYSがユーザー共有
ChatGPTのGPT-4モデルを利用して、様々な文章を自動生成できるようになりました。 特に、ビジネス書の原稿や技術解説記事のような説明的文章は、人間が書いたものと見分けがつかない相当ハイレベルな文章を自動生成することができます。 一方で、小説のような文学的文章は、あまり面白味のないありきたりな文章になることが多く、まだまだGPT-4モデルで自動生成するのには限界があります。 このような欠点は、GPT-4モデルのパラメーターを調整することによって改善できるかもしれません。 そこで、今回、温度(temperature)などのパラメーターについて調べてみました。 1.GPT-4のパラメーターGPT-4のAPIのパラメーターについては、OpenAIのウェブサイトに記載があります。代表的なパラメーターは以下のとおりです。 temperature(温度) デフォルトは1。サンプリング温度は0~2の
AIチャットボットのBardは、今年2月にGoogleから発表され、3月より米国などで公開されていましたが、4月18日から日本でもウェイトリストに登録すれば使用できるようになりました。 筆者もウェイトリストに登録してすぐにBardが使用できるようになりましたので、早速、その性能をBingやChatGPTと比較してみました。 なお、現在、Bardは日本語に対応していないため、すべて英語でやり取りしています。 Bardは吟遊詩人という意味であり、表紙の絵は、Bing Image Creatorに女性の吟遊詩人を描かせたものです。 1.BardについてBard自身にBardについて聞いてみたところ、回答は以下のとおりでした。 入力 Bardについて教えてください。 Bard Bardは大規模な言語モデルで、情報量が多く包括的であるように訓練されており、会話型AIやチャットボットとも呼ばれます。膨
これまで、ChatGPTを利用してnote記事や小説を書く方法を色々と紹介してきましたが、記事が増えてきましたので一度こちらにまとめることにしました。 1.note記事の作成1行の指示で、これくらいの記事は書けます。 入力 岡本太郎と太陽の塔についてnote記事を書いてください。 出力 タイトル: 「岡本太郎と太陽の塔 - 芸術とエネルギーの象徴」 はじめに 岡本太郎は、日本の芸術家として国際的に高い評価を受けている人物です。彼は絵画、彫刻、版画など幅広い分野で活躍しましたが、その中でも特に有名な作品が「太陽の塔」です。今回は、岡本太郎の人生と彼が創り上げた太陽の塔について紹介します。 岡本太郎 - 画家から彫刻家へ 岡本太郎は1911年に東京で生まれ、幼少期から絵画に興味を持ち、多くの美術家から指導を受けました。若い頃から才能を発揮し、国内外の美術展に出展して高い評価を受けました。やがて
temperatureなどのChatGPTのパラメーターは、OpenAIのウェブサイトのPlaygroundやAPIでは変更できるようになっていますが、通常のChatGPTのサイトでは変更できないようになっています。 しかし、これを変更する方法を発見しましたので報告します。 また、自由に新しいパラメーターを設定して、これを使ってChatGPTの文章表現を操作できることが分かりましたので、これについても解説します。 1.temperatureの変更(1) temperature=2.0への変更最初にChatGPTのサイトでtemperatureを2.0に変更してみます。 ChatGPTのtemperatureは通常、1.0程度に設定されており、もし、temperatureを2.0に引き上げると、以下のように文章が壊れてしまうはずです。 若いSamadenacityas安 広がる豊かな井田_p
次のページ
このページを最初にブックマークしてみませんか?
『IT navi|note』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く