サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
掃除・片付け
note.com/kajiken0630
最近は毎日のように新しい生成AIサービスや事例が飛び込んできます。 そのため、生成AIが万能な道具のように見えてしまったり、逆に生成AIの本来の強みが見えづらかったりします。 しかし、実際に成功している生成AIサービスの数々を抽象化し、その本質的な価値を整理すると以下の7つに集約できると私は考えています。 本noteではそんな「生成AIの7つの価値」について、以下でグローバルで成長しているサービス事例を交えながら解説していきます。 【本質的価値1】 コンテンツの創造コストを限りなく0にする 生成AIの第一の本質的価値は、「創造の限界費用」を限りなくゼロに近づけることです。 「創造の限界費用」という言葉は、世界的ベンチャーキャピタルのAndreessen Horowitzのマーティン・カサド氏とサラ・ウォン氏の記事から引用しています。 彼らの「マイクロチップが計算の限界費用をゼロにし、インタ
どんな事業/サービスにおいても、UX(ユーザー体験)が重要であることは今さら言うまでもないでしょう。 しかし、「UX」を抽象的な概念のまま捉えていると、その言葉を使う人同士でイメージが揃っていなかったり、過度に複雑な理論も多く登場しているため、どうUX改善に取り組んでいけば良いのか混乱してしまっている人も多いのではないでしょうか? UXの質を測る手法や指標は多数存在しますが、私は突き詰めると以下の1つの方程式でUXというものを表せると考えています。 UXの方程式u(便益)とは、ユーザーがプロダクトやサービスを使用することで得られる具体的な利益を指します。例えば、生成AIを使ったライティングツールであれば、生成される文章によってユーザーが仕事を効率化するなどの恩恵がそれに当たります。 e(情緒価値)とは、製品やサービスがユーザーの感情に与えるプラスの影響を指します。例えばサービスが親しみやす
私は複数社の生成AIサービスのアドバイザーをしているのですが、最近ある考えが確信に変わりつつあります。 それは、「日本市場においてはAIサービスに対する期待値が米国に比べて高い」ということです。 ToB領域で米国でユニコーンになっている生成AIサービスを日本市場にそのまま持ってきても、米国では「まあ、AIってこれくらいの精度だよね。それでも十分実用的だよね」となってガンガン導入進んでいくのに対して、日本市場においては企業担当者の期待値が高く、実際にAIで出せるパフォーマンスと期待値の溝がなかなか埋まらず苦労するケースが多いように感じています。 これには様々な要因があると思いますが、あえて辛辣な言い方をすると、レイオフ(解雇)の心配のない企業担当者が、危機感の薄さから生成AI技術に自らが触わって試す時間をしっかり取らず、メディアやSNSで騒がれている事例やインパクトという表層的な知識だけイン
「Sora」の衝撃OpenAIが新たに発表した "動画生成AI"「Sora」が凄すぎると話題になっています。 個人的に一番驚いた生成動画は以下で、電車の中から車窓を映しているような映像で、窓の反射具合や、窓が暗くなった時に映り込む女性の像など、今までの動画生成AIとはレベルが数段違う生成結果です。 OpenAIのSoraで生成された動画で一番衝撃的なのはこの動画。 窓の反射具合とか、窓が暗くなった時に映り込む女性の像とか、昨日まででこれ見せられたら自分でも「これはAI生成ではないですねー」って答えてしまっていたと思う。 pic.twitter.com/5yY4ZEyoOU — KAJI | 梶谷健人 / 新刊「生成AI時代を勝ち抜く事業・組織のつくり方」発売! (@kajikent) February 16, 2024 物理世界のシミュレーター?そんな中で、OpenAIのTechnical
デザインの単位が "User" から "You" へ変わる「ユーザー体験」「ユーザー中心デザイン」「ユーザーインターフェース」などの言葉に現れている通り、基本的にサービスのデザインの対象を捉える単位は "ユーザー" である。 しかし私は、これから生成AI技術が発展し、それがサービスのインターフェースに取り入れられていく中で、デザインの対象を捉える解像度が従来の "ユーザー" から "個人" へと細分化されるのではないかと考えている。 その兆しとなるサービスが、顧客ごとにパーソナライズされた動画コンテンツの生成を可能にする「tavus」だ。 tavusでは、1つの動画を撮るだけで相手ごとにパーソナライズされた動画を生成することができる。ユーザーが商品紹介などのビデオを1つ録画すると、相手の名前や会社名などに該当する部分を生成されたユーザーの声で自動で置き換え、あたかも相手だけに作成されたかの
AdeptやWayveなどに投資するAI特化のベンチャーキャピタル「Air Street Capital」が160ページ以上に渡って、AIの現状をまとめたレポート、「State of AI」の2023年版が、2023年10月12日に公開された。 このレポートには今押さえておくべき生成AI市場や技術の状況が豊富な事例やデータとともにまとまっており、生成AIに事業として取り組む関係者は一度は目を通すべき内容になっている。 とはいえボリューミーなレポートを読む時間をなかなか確保できないという方も多いだろう。本記事では、そんな方々向けに特に興味深いスライドをピックアップして紹介していく。 State of AIについてこのレポートは、英国のAIに特化したベンチャーキャピタル「Air Street Capital」が2018年から毎年発行している、AIの現状を、豊富な統計データとともに網羅的にまとめ
大規模言語モデルの優秀さの秘訣ChatGPTなどに代表されるサービスで採用されている大規模言語モデル(LLM)によって、AIは今までとは比べ物にならないくらい自然な対話ができるようになった。 なぜLLMでは自然な対話ができるかというとその秘訣の1つは、LLMは大量のテキストを学習する際に、文章内の単語を「ベクトル(向きと長さを持つ数学的な量)」に変換して処理しているからだ。 GPTでは各単語は数万という次元でベクトル化されており、単語ベクトルは意味が近いほどベクトル同士の距離が近くなる。 https://openai.com/blog/introducing-text-and-code-embeddingsこれこそが大規模言語モデルがここまで高い言語能力を獲得したポイントであるが、たまたま最近読んだ脳科学、言語学、文字学の本の中で、このLLMにおけるベクトル化の仕組みは非常に理にかなってい
生成AIブームの裏でメタバースブームはすっかり勢いを失ってしまってように見える。 しかし、昨今の生成AI技術の発展によって、いままでXR/メタバース領域で大きな課題とされたいた事項が1つずつ解消されつつあり、XR/メタバース領域が大きく立ち上がる素地が整いつつあるのはあまり知られていない。 このnoteでは、XR/メタバース領域において生成AI技術が果たす5つの役割について触れながら、近い将来実現するであろうXR/メタバース世界の姿について考えていく。 XR/メタバース領域において生成AI技術が果たす役割は以下の5つだ。 1. 毎回変化する体験の実現 2. 同期的体験の過疎問題の解決 3. ユーザー投稿負荷の軽減によるCGMの実現 4. コンテンツ制作費のボトルネック解消 5. マルチモーダルで自然対話可能なインターフェースの実現 これから、その兆しとなる実際のサービス事例を紹介しながら1
セミナー後のQ&Aでよく「動きの早い生成AI領域でどのように新しい情報を追っているのか?」という質問をよく受ける。 色々なやり方を試したが自分がメインでAI関連ニュースを追っている方法は以下の2つだ。 1. X(Twitter)で「世界のAIトップランナーがフォローしている人」をフォローするX(Twitter)上でOpenAI代表のSam Altmanや、Midjourney代表のDavid Holzなど個人や、Google AIやMeta AIなどのR&D組織など、世界のAIトップランナーをフォローするところまではやっている人も多いかと思う。 自分はそこからもう一歩踏み込んで「そうしたアカウントがフォローしている人」も見に行ってフォローするようにしている。 こうした世界のトップランナーがフォローしているということはAI領域で彼らがお墨付きをしている良質な投稿をしているアカウントである可能
国内でも生成AIを使ったプロダクトづくりに取り組む企業は増えていますが、ユーザー体験の正解はまだほとんど体系化されていません。 そのため、サービスの実例を掲載しながら「生成AIサービスにおけるUXデザインのベストプラクティス」についてまとめました。 何でもかんでもチャットUIにしない Webサイトノーコード制作サービス「Wix」のAI機能は、テキストや画像など編集したい箇所をクリックした際にAI機能のボタンが出現する。 このように、制作系のサービスにおいて生成AI機能を提供する際には、むやみにチャットUIにせず、対象箇所に紐づいてAIをアシスタント的に呼び出せるようにするのがポイントだ。 Wixの生成AI機能のUXには以下のようなポイントも押さえられており、非常に参考になる。 ユーザーにプロンプトエンジニアリング力を求めない。UIのインプットフィールド側で必要な情報を過不足なく吸い上げられ
「若手で強みが何もない状態からどうすれば圧倒的に成長できるか?」という相談への回答を自分がキャリア1~2年目にやっていたことを思い出しながら考えてみます。 正直、一番成長できるのは「超成長フェーズの会社で経営者などの優秀なメンターに弟子入りすること」です。 自分が成長できたのは初期にVASILYという会社で代表の金山さんや諸先輩方の下で超修行させてもらえたことに依るところが大きいです。 なので、まずはそうした環境に自分を置けないかを考えてみましょう。 しかし、そうした環境に身を置けるかは正直「運」ですし、そうした会社で弟子入り許可をもらうためにも一定の能力が必要です。 (実際自分は最初の面接で落とされて、社交辞令で呼ばれた社内の飲み会に凸ってお酒の力で入れてもらいました笑) そうした環境以外で自分を最も成長させてくれたものは何かを考えると、以下の7つの自己成長ハックを意識的に実行していたこ
AIが凄まじい勢いで進化する中で、1人の人間として、企業として、クリエイターとして、このAIという存在にどう向き合うべきかモヤモヤしているという方は多いのではないだろうか? このnoteでは、「人間として、企業として、クリエイターとして、このAIの波にどう向き合うべきか」というテーマについて考えていきたい。 AIは人間の脳にとっての新しい新皮質的な存在である まず、人間とAIの関係性という観点で、これからのAIの進化は"人類史的な"ターニングポイントとなるはずだ。 我々人間の脳は、運動や本能を司る原始的な小脳の周りに、言語や思考を司る大脳新皮質が覆う形で形成されて進化してきが、AIは人間にとっての新しい新皮質、いわば「Artificial Cortex」とも言うべき存在になるだろう。 なぜそう考えるかというと、生成AIサービスによって人間の生産性が10倍以上になる事例がすでに出始めていると
ChatGPTの新機能として一般公開されたCode Interpreterがすごすぎて結構感動しているのだが、Code Interpreterで色んなことができるが故に「一言で言うと何なのか?」「一体それでなにができるのか?」疑問に思っている人も多いのではないだろうか? このnoteではそうした疑問に答えるべき、まず最初にCode Interpreterでできることを紹介した上で、最後に一言でこれを説明すると一体なんなのかを紹介していきたい。 Code Interpreterで主にできること1. データ分析とビジュアライズまずこれが最もベーシックな使い方だろう。 特定のデータセットをエクセルファイルやcsvファイルでアップロードすると、そのデータの中身を読み取ってくれて、ビジュアライズしてもらうことができる。 ビジュアライズの際の分析の切り口やデザインを細かく指示することも、ChatGPT
OpenAIの論文では今後全職業の80%がAIの影響を受けると指摘され、Goldman Sachsはホワイトカラー3億人の仕事をAIが奪うと発表。 生成AIによって自分の仕事が脅かされてしまうのではないかと感じている方も多いのではないだろうか。 Generative AI could raise global GDP by 7% しかし、ホワイトカラーやクリエイターがAIに代替されるということはしばらく起きない。 そうではなく、AIを使いこなした人間がそうでない人間を代替する。 そして、AIを良き友にできた人にとっては最高に楽しい時代になる。 なぜなら、まず自分の領域における能力/生産性が10倍に引き上がるからだ。 実際に、Githubの生成AIを活用したエンジニア支援サービスのCopilot Xではエンジニアの生産性を10倍にまで引き上げることを目指して開発されている。 今後は開発領域だ
ここ1~2年の生成AIの動きで「ジェネラリストの復権」が顕著になっていると感じる。 今まではクリエイティブ至上主義、スペシャリスト礼賛主義が台頭しており、一部の経営者を除いてジェネラリストは器用貧乏としてどちらかと言えば地位が貶められていたように感じる。 しかし、生成AIで専門的な技能がなくてもコードや画像、最近ではCGアニメーションも簡単に作成できるようになり、どちらかと言えば日々新しく登場するAI技術にキャッチアップして、幅広い知識やスキルを組み合わせて成果を生むジェネラリストの価値が相対的に上がっている。 実際に私自身もエンジニアやCGアーティスト、イラストレーターではないが、普通にコードを書いたり、以下のような建築画像やイラストを生成したりしている。 筆者がAIで生成した画像 筆者がAIで生成した画像 MITメディアラボのNeri Oxmanは、生成AIが話題になるはるか前からAg
新しくリリースされたChatGPTプラグインを使うことで、世界中の最新ニュースや研究論文を効率的に知ることができたり、高度なSEO分析、高クオリティな画像生成AIのプロンプトを自動で生成、動画の自動生成などなど、今までChatGPT単体ではできなかったことが簡単に実現可能になっている。 ここではそんな便利なChatGPTプラグインの中でも、特に業務効率化に役立つプラグインを3つ紹介する。 基礎)ChatGPTプラグインの導入方法Chat GPTプラグインを使用できるのは、現時点では有料版のChatGPT Plusを利用している方限定になっている。 実際にプラグインの導入方法と使用方法について解説する。 すでにこの方法はご存知という方はこのセクションはスキップして頂いて結構だ。 ChatGPT Plusに登録している状態で、画面左下にあるSettingsのBeta featuresからPlu
Appleが昨日のWWDCでMRデバイス「Vision Pro」を発表しました。 ハードウェアの設計やインタラクション方式の選定などで結構思い切った判断がされていたり、来年末までの発売なのになぜこのタイミングでの発表だったのかなど謎も多い今回の発表。 5年間AR/VR領域のスタートアップを経営してきた自分がそうした選択や謎について勝手な解釈や考察をしてみました。 インタラクションについて思い切ってコントローラーをなくしてハンドジェスチャー、視線操作、ボイスインターフェースだけに絞ったのは、これからのXRインタラクションのスタンダードを作るという強い気概を感じます。 なぜならコントローラーがあった方が短期的には操作の快適度合いが高いから。 ただし、過去に自分が以下noteでまとめているように、XRのインタラクションは「ジェスチャー」「声」「受動」の3つの組み合わせに収斂するはずなので、その先
POSTS代表 / 生成AIなどの先端テクノロジーに強いプロダクト戦略アドバイザーとして10社以上の顧問に従事 / XR Creative Company MESON創業者 /「生成AI時代を勝ち抜く事業・組織のつくり方」「いちばんやさしいグロースハックの教本」著者
メタバースの土地における価値とユーザー体験のジレンマ、そしてその解決法 メタバースの土地には、価値とユーザー体験のジレンマがあるように思う。 メタバースの土地の価値を釣り上げるには、「有名なあの土地の横にある」「メインストリートにある」などの付加価値が重要だが、ユーザーからしたらそうした空間的な関係性に煩わされることなく面白いワールドを自由にワープで行き来できた方が便利だし、メタバースらしいセカイの楽しみ方という感じがする。 もちろん、DecentralandにもCryptovoxelsにも、そして恐らくSandboxにもワープ機能はある。
毎日すさまじいペースで流れてくる生成AIのニュースを追っていると、つい読書から遠ざかってしまう。 また、職業的に執筆に携わっていない人にとって、継続してnoteなどの執筆を続けることはなかなか難しいことだろう。 自分も全く同じような悩みを抱えていたのだが、1つの習慣を始めるだけで簡単に読書量も執筆量も5倍以上にできたので今日はその方法を紹介したい。 もったいぶることでもないので、早速やり方を紹介すると、それは、 友達と朝待ち合わせて、読書したり、noteを書く時間を押さえてしまう ことだ。 なんだ、と拍子抜けしたあなた。 そうなのだ。こんな簡単な方法で読書量や執筆量は一気に増やせるのだ。 読書や執筆ができない最大の理由はシンプルに「時間を取れていないこと」だ。 読書や執筆はよくある重要度と緊急度のマトリクスの「そこそこ重要だけど全く緊急じゃない」ものだ。 そんな読書や執筆を進めるためには、
プロダクトを成長させていく上で、顧客に対して自社のプロダクトやサービスが提供する価値を明確に伝えることが重要だ。 ここで重要となるのが「バリュープロポジション」だ。 このnoteでは、バリュープロポジションとは何か、なぜそれを定めることが重要なのかについて簡単に触れつつ、優れたバリュープロポジションの作り方について解説していく。 バリュープロポジションの概要を既に知っている人は定義や意義は読み飛ばして最後のつくり方だけ読んで頂ければ幸いだ。 バリュープロポジションとは何かバリュープロポジションとは、自社のプロダクトやサービスが顧客に提供する独自の価値やメリットを明確に示すものだ。 これによって、顧客はそのプロダクトやサービスが他社と比較してどのような特徴や利点があるのかを理解しやすくなる。バリュープロポジションは、ターゲットとなる顧客層に対して魅力的であり、競合他社と差別化できる要素を盛り
Amazonがここまで生成AI領域で遅れを取っている理由は何だろうと考えてみると、逆説的に生成AI領域での勝ち筋のヒントが掴めるのではないかと思って徒然に考えてみた。 発明企業を標榜するAmazonがここまで出遅れてしまっている理由としては、以下の3点が大きいのではないだろうか。 1. ファウンダーのコミットの薄さMicrosoftには、今回のAI革命をGUI以来の衝撃と称するビル・ゲイツが復帰してきていて、OpenAIへの巨額の投資によって自社製品の次世代化やクラウドレイヤーのAzureのシェア拡大を実現するという、リスクも大きいが得られる果実も大きい領域で大胆な動きができている。 Metaも社名にするほど注力していたメタバースからZuckもBozも軽やかにAIにシフトできたのはZuckが陣頭指揮を取っていることが大きいと思われる。 Amazonも一応、Hugging FaceやStab
生成AI時代において、価値ある人材の定義は変わっていく。 生成AI時代に日々登場するツールを適切に使いこなせる人材が求められるようになるのだ。 そんな人材になるための最も重要な考え方は、「実際に生成AIツールを使ってみること」だ。 これは至極当たり前のように聞こえるかもしれない。 しかし、自分の周りやTwitterのタイムラインを見ていると、新しいサービス登場のニュース自体はキャッチアップしているが実際に触ってみている人は驚くほど少ない。 (Twitterでバズっている新しいAIサービスのデモ動画も、実際に触ってみれば感動するほどのレベルではないサービスも多い) これは本屋を例にすると分かりやすい。 日々大量にリリースされるAIツールは、日々大量に出版される本のようなものだ。 AIツールのリリースニュースだけを追っているのは、書籍が並ぶ書店を通り過ぎながら表紙だけを見て回って実際に知識を得
GPT-4やStable Diffusionなど次々と優れたAIモデルがAPIやオープンソースの形でリリースされている中で、そうしたAIモデルを組み合わせた新規サービスや、既存のサービスにそうした生成AIを組み込む領域には大きなビジネスチャンスがあります。 下のa16zの生成AIスタックの右上のアプリケーションレイヤーの戦いです。 (a16z) Who Owns the Generative AI Platform?しかし、この領域の戦いには固有の1つの課題が存在します。 それは、次々と新しいモデルがリリースされる生成AI領域のスタートアップにおいて、生成AIモデルはより高機能なモデルが日々リリースされるので機能それ自体は差別化要素にも長期的なMOATにもなりえないという課題です。 現時点で個人的には、生成AI領域で競合優位性を獲得するための戦略は大きく分けて6つだと思っており、このnot
歴史的な転換点が急速に訪れているChatGPTは史上最速でMAU1億人を突破したToCサービスとなり、一般ユーザーが生成AIサービスを使うのは当たり前の状態となった。 さらに、ビル・ゲイツは最新のエッセイの中で「自分が生きている間に革命的だと感じた技術のデモはたった2回で、最初は1980年にGUIを見たとき。そして2回目は2022年の時点のOpenAIのAIを見たときだ。」とまで語っている。 それくらい今回のAIのブレークスルーは歴史的な転換点である。 ソフトウェアサービスもAIにDisruptされる時代いままでは有名な「Software is eating the world」という言葉にもある通りソフトウェアサービスが従来のサービスをDisruptする立場だった。 しかし、現在は「AI is eating software」と言われており、ソフトウェアサービスがDisruptされる側に
OpenAIの大規模言語モデル「GPT」の第4世代である「GPT-4」が発表された。 これがとにかくスゴい。もはや業種を問わずGPT-4を抜きに今後のビジネスは語れないレベルに到達したと言える。 このnoteではいまだに興奮冷めやらぬGPT-4の凄さを紹介していく。 注目すべきGPT-4の3つの進化GPT-4への進化で注目すべきは「マルチモーダル」「処理能力の大幅な向上」「安全性の向上」の3つだ。 1. マルチモーダルGPT-4の大きな特徴はテキストだけではなく画像も組み合わせたインプットや処理ができることである。 例えば以下デモのように、手書きのウェブのスケッチを中身のジョークをちゃんと書き直しつつHTML/CSS/JSのコードを書き出して完全に機能するウェブサイトを生成することが可能だ。 GPT4の発表の中で分かりやすく凄かったのは、手書きのウェブのスケッチを中身のジョークをちゃんと書
世界中で大きな盛り上がりを見せる「生成AI」。 生成AIを活用したChatGPTが史上最速で月間ユーザー数1億人を突破し、TIME誌の表紙を飾ったことは、その勢いを象徴する出来事だろう。 だが、ここで以下の2つの問いが浮かぶ。 生成AIは今までのAIと明確に何がちがうのか? なぜ今このタイミングで生成AIがここまで盛り上がっているのだろうか? この記事では上記2つの問いを海外のいくつかの記事を参考にしつつ解説していく。 生成AIと今までのAI技術との関係性まず生成AI技術とこれまでのAI技術との関係性を概観しておこう。 広い意味でのAI技術として、データの特徴を学習してデータの予測や分類などの特定のタスクを行う機械学習が生まれ、その中でデータの特徴をマシン自体が特定するディープラーニング技術が発展した。 そして、生成AIはこのディープラーニング技術の発展の延長上にある技術だと言える。 そし
プロダクトを伸ばしていく上で数値分析や改善施策の方法論を正しく理解することも重要ですが、それらのアクションを実行していく基盤となる強いグロースチームを構築することが非常に重要です。 このnoteでは強いグロースチームをつくる方法を、以下の3つのポイントに沿って解説していきます。 【強いグロースチームを作る3つのポイント】 1. 木を見て森も見るしくみをつくる 2. チームのリズムと空気をデザインする 3. グロース人材の育成プログラムを用意する 1. 木を見て森も見るしくみをつくる "グロースに慣れてきた頃あるある"として、データに深く潜りすぎて、サービス体験全体の改善ではなく部分最適に走ってしまったり、いま自分たちがどこにアプローチしているか分からなくなることがあります。 俗に言う「木を近くで見すぎて、森が見えなくなる問題」です。 この問題は、1つのマインドセットと3種の神器で全体像を見
テレビ番組で特集されるなどChatGPTへの注目が高まっていますが、その上位互換となるBing AIはもう使われましたでしょうか? ChatGPTで使われてるGPT3.5というモデルの発展版を開発元のOpenAIがマイクロソフトに提供する形で作られたBing AIは、過去の学習範囲内で回答するChatGPTと異なり、事前学習データ+対話ごとに関連する検索結果を都度読みにいくことで、非常に精度の高く正確な解答をすることが可能になっています。 このnoteではそんなBingAIを時間を忘れて使い倒してみた自分が特に面白いなと思った使い方をジャンル別に紹介します。 仕事SpotifyとApple MusicのARPUを聞いたらWeb上の開示情報から比較数字を提示してくれ、さらにSpotifyの方が低い理由も仮説を提示してくれました。 Bing+GPTが凄すぎて深夜3時に興奮が止まらなくなってる。
次のページ
このページを最初にブックマークしてみませんか?
『梶谷健人 / Kent Kajitani|note』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く