タグ

ブックマーク / ascii.jp (217)

  • 画像生成AIとしても超進化したChatGPT「GPT-4o」

    OpenAIは5月13日(現地時間)、「Spring Update」と題したオンラインプレゼンテーションを配信。新しい大規模言語モデル(LLM)「GPT-4o(オー)」がお披露目された。 プレゼンテーションではまるで人間と話しているような音声会話機能が話題になっているが、実はウェブサイトに掲載された記事を見ると画像生成機能も大幅に性能アップしていたことがわかった。 一貫性の保持。AIコミックが描けるぞ! 今回のプレゼンテーションではなぜかまったくと言っていいほど触れられていなかったが、画像生成AI「DALL-E 3」(おそらく)を使用した画像生成能力も大幅に進化しているようだ。 まず、いちばん驚いたのは画像の一貫性の保持だ。なぜなら、DALL-E 3やStable Diffusionなどの画像生成AIにとって「同じキャラクター」を生成するのは最も苦手な仕事だからだ。

    画像生成AIとしても超進化したChatGPT「GPT-4o」
    toya
    toya 2024/05/14
  • WindowsでAndroidスマホをWebカメラにする機能を試した (1/2)

    Microsoftが提供するWindowsとスマートフォンの連携機能「Windowsにリンク」に、AndroidスマートフォンをWindowsの「Webカメラ」にする機能がリリースされた。 AndroidスマートフォンをWindowsのWebカメラにする機能が搭載された。設定すると、スマートフォンをWindows仮想カメラとして利用できる スマートフォンとは無線LANでの接続で、Windows側では仮想カメラとして認識され、Windows標準のカメラアプリや各種ネットワーク会議アプリなどから利用できる。この機能は、プレビュー版だけでなく、現在の通常版Windows 11でも利用することができる。 スマートフォンをWebカメラにする設定を整理する Microsoftのドキュメント(英語)(https://blogs.windows.com/windows-insider/2024/02/29

    WindowsでAndroidスマホをWebカメラにする機能を試した (1/2)
  • ChatGPTのライバル「Claude 3」の使い方 良い点、悪い点まとめ (1/5)

    3月4日の公開以来、「Claudeやばくない?」「GPT-4を越えた」と、界隈で話題の「Claude 3」は、OpenAIの元メンバーによって設立されたAIベンチャー「Anthropic」が開発する最新の大規模言語モデル(LLM)だ。今回はChatGPTのライバルClaude 3の有料版を2週間ほどヘビーに使ってみて感じたことを、良い点と悪い点どちらも書いていきたいと思う。 Claude 3とは? 既報の通り、Claude 3はAnthropicが開発する大規模言語モデルの名称だ。 パラメーターのサイズなどが異なる3つのモデルがラインアップされている。 「Claude 3 Opus」は最も知能が高く、複雑なタスクでも最高のパフォーマンスを発揮する強力なモデル。APIやデータベースを介した複雑なアクションの計画や実行、インタラクティブコーディングなどの高度な活用が想定されている。 「Clau

    ChatGPTのライバル「Claude 3」の使い方 良い点、悪い点まとめ (1/5)
    toya
    toya 2024/03/22
  • 女子大生が100日連続で生成AIで100本のプログラムを書いたらどうなったか?

    ボードゲームやアクションゲーム、各種ツールやシミュレーションなどさまざまなソフトが100日間に作られた いままで数えきれないほどのプログラマーに会ってインタビューもさせてもらってきたが、久しぶりに若いプログラマーの話を聞いてきた。ここ1、2年では U22グランプリの男子中学生や全国小中学生プログラミング大会の受賞者たちだが、今回は、ChatGPTを使ってプログラムを書きまくった女子大生である。 彼女は X(Twitter)の自分のアカウントで1日1のソフトを100日間連続で作るというイベントをやっていて「おっ、頑張っているな!」と思って応援していた。「こんなゲームを作ってほしい」などとリクエストを出したりもしていたのだが、どうも私が想像していたものと内容もやり方も違っていたようである。 目下、ソフトウェア産業の最大のテーマは「我々は人間の言葉でプログラムを書くようになるだろうか」というこ

    女子大生が100日連続で生成AIで100本のプログラムを書いたらどうなったか?
  • 控え目に言って革命。OpenAI、動画生成AIモデル「Sora」発表

    OpenAIは2月15日(現地時間)、テキストから最大1分間の動画を生成できる動画生成AIモデル「Sora」を大量のデモ動画と共に発表した。複数のキャラクター、特定の種類の動き、被写体と背景の正確な詳細を含む複雑なシーンを生成することができるという。 プロンプトから破綻のない動画を生成 Introducing Sora, our text-to-video model. Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W Prompt: “Beautiful, snowy… pic.twitter.com

    控え目に言って革命。OpenAI、動画生成AIモデル「Sora」発表
    toya
    toya 2024/02/17
  • これは嬉しい ChatGPTプロンプト書き方のコツ、OpenAIが公開

    OpenAIは、大規模言語モデル(GPT-4)でよりよい結果を出すためのプロンプトエンジニアリング(プロンプトのノウハウ)入門テキストを同社のウェブサイトで公開している。 同テキストでは、現在同社で最高の性能を持つ大規模言語モデルGPT-4を対象に、よりよい結果を導くための6つの戦略と、それぞれを実行する際の具体的な戦術(コツ)が掲載されている。 また、「Prompt examples」のページでは、上記で紹介したものを含む多数のプロンプト例が紹介されており、すぐに利用できるようになっている。 では紹介された6つの戦略を見ていこう。 明確な指示を書く LLMは利用者の心を読むことができないので、回答が長すぎる場合は「簡潔に」、単純すぎる場合は「専門家レベルで」と明示的に依頼する必要がある。 具体的な戦術としては下記が提案されている。 ・より関連性の高い回答を得られるよう、質問は詳細に ・モ

    これは嬉しい ChatGPTプロンプト書き方のコツ、OpenAIが公開
    toya
    toya 2023/12/18
  • バイバイDiscord、Midjourneyのスタンドアロン型アプリが登場か?

    生成AIサービス大手「Midjourney」は、コミュニケーションプラットフォーム「Discord」を介して利用する形で運営されているが、単独で利用できるようになるアプリが開発中であることがMidjourneyでクリエイティブを担当するNick St. Pierre氏のツイートでわかった。 ブラウザ?スタンドアロン? Midjourney Alpha is officially here!! If you've generated 10k or more images you should have access. This is still the alpha, so things may change a bit. But here is a quick look at image creation on the web. BYE BYE DISCORD 👋 pic.twitter.

    バイバイDiscord、Midjourneyのスタンドアロン型アプリが登場か?
    toya
    toya 2023/12/14
  • グーグルが完全に本気! 究極のマルチモーダルAIモデル「Gemini」登場!

    グーグルは12月6日(現地時間)、高性能AIファウンデーションモデル「Gemini(ジェミナイ)」を発表した。各種ベンチマークにおいてGPT-4を上回る成績を記録。Google検索やチャットAIの「Bard」などグーグルの各種サービスに順次利用されていくほか、12月13日より開発者にもAPI経由で公開される。 ネイティブでマルチモーダルを実現 マルチモーダル(異なる入力形式を同時に扱うこと)なAIとしてゼロから構築されたGeminiは、テキスト、画像、音声、動画、プログラムコードなど、さまざまな種類の情報をシームレスに理解し、操作し、組み合わせることができる。 これまでのマルチモーダルモデルは、画像認識、音声認識など、異なるデータを扱う個別のコンポーネントをつなぎ合わせたアプローチなので、画像の説明などの特定のタスクの実行には優れているが、概念的で複雑な推論に苦労することがあった。 You

    グーグルが完全に本気! 究極のマルチモーダルAIモデル「Gemini」登場!
    toya
    toya 2023/12/08
  • 大盛況だったサイボウズデイズ、オレはずっとトヨクモに追われていた

    大盛況だった先週のサイボウズデイズで、ひときわ目立っていたのが、kintone連携サービスを提供するトヨクモだ。ここではトヨクモとはどんな会社なのかをお伝えしつつ、サイボウズデイズに来られなかった方にメッセどころか、会場近辺をジャックしていたをトヨクモのアピールぶりをお伝えしていこう。 「トヨクモエブリウェア」だった幕張をレポート! 「kintone連携=トヨクモ」なんて、みんな当たり前のように知っているはずだと思っていたのに、まだまだ認知度が足りないらしい。ということで、先週行なわれていたサイボウズデイズではトヨクモが気を出してきた! サイボウズデイズと言えば、サイボウズが主催する年に一度の大型イベント。この数年は都内から幕張メッセに会場を移し、巨大なハコを活かした独自の世界観を実現しており、参加者を魅了している。コロナ禍も明け、kintoneの導入社数もいよいよ3万社を超えたという今

    大盛況だったサイボウズデイズ、オレはずっとトヨクモに追われていた
    toya
    toya 2023/11/17
  • Android派だけどiPhone 15 Pro Maxが買いの5つのワケ

    筆者はどちらかというとAndroid派です。メインはAndroid、サブ機にiPhoneという使い分けをしており、Androidスマホは毎年買い替えているのですが、iPhoneは基的にほぼ2年おきというスパンです。昨年iPhone 14 Pro Maxを買ったばかりなので、今年は見送る予定だったのですが、アップルの発表会を見て「今年は買いだ!」と180度方向転換したので、今年のiPhoneはなぜ買いなのかという理由を、独断と偏見でお伝えします。 ◆その1 USB Type-CでiPhoneに最大の転換期到来 コネクターがこれまでのLightningからUSB Type-Cになりました。これはかなり大きいです。これまでアップルは初代iPhoneからDockケーブル、2012年のiPhone 5でLightningケーブルに変更しましたが、一貫して独自規格で通してきました。EUの規定(モバイ

    Android派だけどiPhone 15 Pro Maxが買いの5つのワケ
    toya
    toya 2023/09/22
  • データセンターの所在地ってやっぱり書いてはいけないのか?

    いろいろなところからマサカリが飛んでくるのはわかっているが、以前から感じていた疑問について書いてみたい。「データセンターの所在地ってやっぱり書いてはいけないのか?」である。だって、ググれば所在地は出てくるんですよ。いろいろ秘密の多いデータセンターだが、インフラ界隈での内輪受けみたいな感じになっていやしませんかね。 実は制約の多いデータセンター取材 ITインフラ系の記者は、たまにデータセンター見学ツアーに招待される。エクイニクスやさくらインターネット、NTTコミュニケーションズなど、私も相当データセンターは見ている方だ。Coltテクノロジー(旧KVH)はシンガポールまで、IIJはコンテナ型データセンターを見に島根まで行っている。IDCフロンティアに至っては北九州も、白河も、府中も見ている。 5月には大阪までデジタルエッジのデータセンターを見にいった。関西のデータセンター事情までいろいろ説明し

    データセンターの所在地ってやっぱり書いてはいけないのか?
    toya
    toya 2023/07/29
  • 「撮影罪」はじまる、同意のない撮影は禁止 飛行機内の撮影にも注意を (1/2)

    日7月13日から「撮影罪」が施行される。これにより性的姿勢等のひそかな撮影(盗撮)、それらを第三者に提供する行為、インターネットや動画配信などで公開する行為、保管する行為がすべて処罰対象となり、盗撮に対して最大3年の拘禁または最高300万円の罰金が、不特定多数への提供行為に対してはさらに重い最大5年の拘禁、または最高500万円の罰金が科されることとなる。 法律改正のきっかけとなった事例のひとつに、飛行機内での客室乗務員の盗撮行為がある。高速で飛行する航空機の特性が都道府県ごとの法制度の抜け穴を生み、特定できない場所での盗撮行為を処罰できず、客室添乗員の盗撮が法の抜け穴となってしまうといった実態があった。 ANAは「撮影罪」についてのポスターを羽田空港に掲示し、空港の利用客に向けて撮影罪の法制化、無断撮影禁止についての周知を始めている。 「撮影罪」とは何か? 「撮影罪」は正式名称を「性的な

    「撮影罪」はじまる、同意のない撮影は禁止 飛行機内の撮影にも注意を (1/2)
  • 画像生成AI「Midjourney」の始め方・使い方 (1/3)

    今流行りの画像生成AIで遊んでみたいけど、始め方が分からん! という方のための、「Midjourney」始め方ガイドです。 ほかにも似たような記事がいくつもあるかとは思いますが、この記事とは別に「Midjourney」を使った似顔絵の書き方の記事を書きましたので、そちらの記事で興味を持っていただいた方向けに、始め方と簡単な使い方だけご紹介したいと思います。 「Midjourney」は、チャットアプリである「Discord」のコミュニティに参加して、画像生成AIとチャットすることで利用することができるインターフェースになっています。もちろん、他のユーザーも同じコミュニティに参加しているのですが、画像を生成するだけであれば、他のユーザーとコミュニケーションを取る必要はありませんので、ネットでも人見知りで……という方でも安心して使えます。 というわけで、まずは「Discord」アプリをダウンロー

    画像生成AI「Midjourney」の始め方・使い方 (1/3)
    toya
    toya 2023/05/11
  • 【初心者向け】ChatGPTの始め方

    ChatGPT、最近よく聞くよね ここ数ヵ月、「ChatGPT」というサービスが世界中の注目を集めている。日でもビジネス系のニュースや雑誌、SNSやYouTubeなどで見ることも多いだろう。では、あなたは「ChatGPTってなに?」と質問されたときにどう答えるだろうか? 「ChatGPT?ああ、グーグルのTransformerモデルをベースにOpenAIが開発した大規模言語モデルGPT-3を使った会話形AIチャットボットでしょ?今はGPT-4も使えるんだよね」 とスラスラ出てくる人はこの記事を読む必要はない。だが、多くの人の認識はこんな感じではないだろうか。 「すっごいかしこい人工知能でしょ?」 「質問するとなんでも答えてくれるらしい」 「でも嘘つくから仕事には使えないらしいよ」 「AI仕事が奪われちゃうって聞いたけどほんと?」 そう。この記事はそんなあなたのために書かれている。 Ch

    【初心者向け】ChatGPTの始め方
    toya
    toya 2023/05/08
  • 画像生成AI「Midjourney」でLINEスタンプを作ろう (1/3)

    画像生成AIで好きなイラストを作るようになったら、ぜひやってみたいと思っていたのが今回取り上げるLINEスタンプの制作です。 そもそももっと以前からやってみたいと思ってはいたのですが、1枚、1枚絵を描いて、色を付けて、それをスタンプの形にして……と考えているうちに腰が重くなってチャレンジせずにいました。ですが、AIの力を借りれば、いとも簡単に制作できることが分かったので、今回は実際に私がスタンプを作って申請、公開に至るまでの過程をご紹介しましょう。 とはいっても、「Midjourney」を利用して作られたイラストは、現状、AIの学習素材の元となっているイラストや絵画データの取得先が開示されておらず、かなりグレーな状態になっています。稿では、Midjourneyで生成したイラストLINEスタンプの制作に利用しますが、あくまで個人利用を目的に制作していきたいと思います。 ※記事は、5月3

    画像生成AI「Midjourney」でLINEスタンプを作ろう (1/3)
  • アスキーゲーム:倉持由香さんプロデュース「G-STAR Gaming」初のオフラインイベントをレポート、「Fall Guys」で大白熱!

    イベントでは、出演者と一緒に「Fall Guys」がプレイできる「ゲーム+観戦チケット」と、観戦のみとなる「観戦のみ」チケットを用意。新ビジュアルを起用したグッズも販売されていた。 イベント出演前に、メンバーの皆さんに意気込みを伺ったところ、宇佐だにかさんは「初めてのオフイベントですが、緊張しないような気楽にがんばっていきたいです」、華恋さんは「G-STAR Gamingとしてのイベントなので、みんなで楽しく思い出に残るイベントにしたいです」、桃井ルナさんは「緊張していて昨日の夜からナイーブですけど、振り切ってがんばりたいです」、菅原香雪さんは「普段なかなか東京に来てイベントに出るという機会が少ないので楽しみたいです」とコメント。 夏乃さやかさんは「G-STAR Gamingのイベントですけど、私が所属しているアイドルグループのニーキューオメガのメンバーも来ていて初めてご挨拶する機会でもあ

    アスキーゲーム:倉持由香さんプロデュース「G-STAR Gaming」初のオフラインイベントをレポート、「Fall Guys」で大白熱!
  • 値ごろ感が出始めた「ポメラ DM250」を衝動買い (1/4)

    ネット上では最新のポメラ DM250が早くも3万円台で見かけるようになったのでそこまで安くはなかったが、ヨドバシカメラのポイント利用で衝動買いしてしまった 2022年の夏(7月29日)に6万280円で発売されたキングジム「ポメラ DM250」が、年が明けからいくつかの販売店で4万円を切った30%以上のディスカウント価格で販売されているのを見かけた。そこまで安くはなかったが、ヨドバシカメラの店頭で4万5630円で衝動買いした。ポイント付加が4563円なので実質的には4万1067円、ポイントを数千円近く持っていたので大きな気持ちになって衝動買いした。しかし、最近はまたなぜか5万1780円まで価格が上がっている。どうもこの手の価格変動にはついていけない。 3世代を通じて外形サイズがほぼ同じため 最新モデルも初代モデルのケースを利用可能 家に持ち帰ってDM250をパッケージから取り出して見てみた第

    値ごろ感が出始めた「ポメラ DM250」を衝動買い (1/4)
  • DeepLのAI文章添削ツール「DeepL Write」英語学習教材としても優秀だった (1/3)

    間違いを修正するだけではなく表現の提案も DeepLは1月17日(現地時間)、同社のAI翻訳ツール「DeepL」に、入力された文章を添削するサービス「DeepL Write」のベータ版をリリースした。 サービスは誤字の修正はもちろん、間違いやすい冠詞、前置詞、単数複数、時制といった文法の間違いをAIで修正してくれるだけではなく、シチュエーションにあわせた言い回しや語調、文体や言葉の選び方を提案してくれるという。現在対応しているのは英語アメリカ、イギリス)とドイツ語のみだが、今後も拡充されていくものと思われる。 同社のブログ記事によるとこの機能は、第二言語や第三言語で正確な文章を書きたい場合はもちろん、ネイティブスピーカーが表現を推敲したり、ジャーナリストや文章作成のプロ、あるいは学術的な文章を書く人などにもインスピレーションを与えてくれるという。 問題作りはChatGPTが得意 では実

    DeepLのAI文章添削ツール「DeepL Write」英語学習教材としても優秀だった (1/3)
    toya
    toya 2023/01/23
  • 無料で使えなくなった今だから、楽天モバイルをメイン回線として使う (1/2)

    楽天モバイルが完全有料化、というより、無料で使うことができなくなった11月、筆者は満を持してメイン回線を楽天モバイルに乗り換えた。いろいろ理由はあるのだが、その背景や現在の使用感をまとめた。 なぜ今、楽天モバイルなのか 通話発信の機会が増えたのと、eSIMでの使い勝手がいいから と言っても理由は単純で、自分の使い方に合っているからだ。最近、個人的に状況の変化があり、通話の発信をする機会が増え、無料通話の範囲が広い楽天モバイルがオトクという結論になった。 もう1つの理由は、メインで使っているスマートフォンの仕様で、デュアルSIMを使うには、どちらかをeSIMにしなければならない。そうなるとeSIMの使い勝手の面で、eSIMは「楽天モバイル」一択になった。それならばメインの回線を楽天モバイルでeSIMにすれば、サブ回線を物理SIMになり、選択肢が広がる。 楽天モバイルというと懸念されるのがエリ

    無料で使えなくなった今だから、楽天モバイルをメイン回線として使う (1/2)
  • 発売から2年目のキングジムデジタルノート「FRENO」を衝動買い (1/5)

    2年前の発売時、他社のE Inkデバイスに比べて高過ぎたFRENOは買えなかった。しかし最近になって半額以下の税込1万7400円という価格を見て思わず衝動買いしてしまったが…… クラウドファンディングのMakuakeで、2019年末頃から3万2000円〜3万8000円で応援購入が始まったキングジムのデジタルノートFRENO(フリーノ)。一般発売は、2020年7月だ。当時の販売価格は体が税込約4万2000円だった。一般販売から約2年経過した今現在では、販売終了商品となっている。

    発売から2年目のキングジムデジタルノート「FRENO」を衝動買い (1/5)
    toya
    toya 2022/10/09