並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 239件

新着順 人気順

音声入力の検索結果1 - 40 件 / 239件

  • 発達障害者向けAIサポートツールgoblin.toolsを紹介|パトル | AI x Biz

    こんにちは、パトルです。 今回は、米国で話題になったgoblin.toolsを紹介します。 goblin.toolsは、主にニューロダイバーシティ(神経多様性)のある人々が苦労するタスクを手助けするためにデザインされたツールです。フリーランスのソフトウェアエンジニアであるBram De Buyserによって作成・管理されています。 ツール自体は英語ですが、日本語入力すれば日本語でも対応できます。シンプルなツールなので英語が読めなくても使うことはできます。 goblin.toolsの概要goblin.toolsには、6種類のツールがあります。簡単に概要を記載します。 マジックTODO・・・やりたいことを細かいタスクに分割してくれる フォーマライザー・・・伝えたいことを適切な表現に変えてくれる ザ・ジャッジ・・・文章に含まれる感情を説明してくれる エスティメーター・・・タスクにかかる時間を算出

      発達障害者向けAIサポートツールgoblin.toolsを紹介|パトル | AI x Biz
    • 仕事で差をつけるChatGPT活用術。初心者でも使えるスゴいテクニックを達人に聞く - ミーツキャリアbyマイナビ転職

      業務効率化に一役買ってくれると話題の「ChatGPT」。 今や「大学生の4人に1人が就活でChatGPTを使っている」といったデータもあり、リリース当初はあまり興味のなかった方でも、最近は「自分の仕事でうまく使えたりしないかな?」なんて考える機会も増えてきたのではないでしょうか? ただ、ChatGPTが作業をどこまで効率化してくれるのかはまだまだ未知数です。時間を食う資料の作成やExcelの集計作業などをまるっとお任せできたらうれしいけど、思うようなアウトプットが得られず手間が増えたら、本末転倒な気もしますよね。 それに、ChatGPTの生成データをめぐっては、権利関係や内容の中立性・正確性などの側面で一部懸念の声も挙がっています。業務内での利用を禁止する企業や、自身のコンテンツを「学習・流用」されないよう自衛措置を講じるクリエイターも存在します。使用にあたってのルールも、完全に整っている

        仕事で差をつけるChatGPT活用術。初心者でも使えるスゴいテクニックを達人に聞く - ミーツキャリアbyマイナビ転職
      • 【GPTs×業務活用】職場で神扱いされるGPTsを使った業務効率化・自動化事例10選 | WEEL

        メディア事業部AIライターの大竹です。 2023年11月に登場したChatGPTのGPTs機能の導入は、ChatGPTアップデートの中でも特に大きな印象をユーザーに与え話題となりました GPTsとは、自分好みに調整したChatGPTを作成できる機能。以前までは、毎回プロンプトを入力して出力の方向性を指示していましたが、GPTsを活用すればそうした手間がなくなります。作成したGPTsは他人と共有が可能。公開されているGPTsを活用することで業務効率を大幅に高められます。 今回は業務活用に役立つGPTsを紹介します。仕事の負担が大幅に軽減されるので、ぜひ最後までお読みください。 なお弊社では、生成AIツール開発についての無料相談を承っています。こちらからお気軽にご相談ください。 →無料相談で話を聞いてみる GPTsの活用事例【業務活用編】 ChatGPTは世界中に膨大な利用者数がいるため、作成

        • 私のJavaScriptの情報収集法 2024年版

          個人的なJavaScriptの情報収集の方法についてまとめてみます。 JSer.infoなどをやっているので、JavaScriptの情報については色々な情報源を見るようにしています。 JSer.infoの範囲の中での情報源については、次の記事でまとめています。 JSer.info 13周年: JavaScriptの情報源を整理する - JSer.info この記事では、少しスコープを広げてJavaScriptの情報収集についてまとめてみます。 かなりスコープが広がってしまうので、万人向けの方法ではなく、個人的な情報収集方法としてまとめています。 この記事では、膨大な情報の中から見つけるというアプローチをとっているので、人によって向き不向きがあると思います。 情報収集の方法 情報の元となる情報源はさまざまなサイトや人になると思います。 しかし、そのサイトや人ごとに見ていくというのはかなり大変

            私のJavaScriptの情報収集法 2024年版
          • Apple Watch を買って半年 - ぽ靴な缶

            去年の9月末に買いました。 Series 9 41mm シルバー GPS 発表を見るたびに欲しいなと思うものの、冷静に考えると要らないよな、という結論に行き着くので買ってなかった。常にスマホ持ってるでしょ。欲しい → 要らん → 欲しい というのを年1でやりつつ、ついに買ってしまった。 買ってからは便利で、風呂と充電以外は常に着けている。 生活をシャキッとさせたい フルリモートなので家から出る頻度が減って、体力も落ちだんだん太ってきた。運動習慣を付けたいけど、無策では続けられないので記録を付けるおもちゃが欲しい。他にも睡眠や心拍など Watch で体をモニタリングして遊びたい。自転車に乗っていた頃は記録に楽しさがあった。サイコンつけるし心拍計も胸に巻いてた。変化が分かると成長が見えるし満足できる。 TODO リストをもっと生活に密着させる狙いもある。Things を愛用していたけど、ここ何

              Apple Watch を買って半年 - ぽ靴な缶
            • Whisper、ChatGPTを活用した、テキスト入力不要な新感覚メモ日記アプリの紹介と、開発における学び|にょす

              日常生活の中で生まれた「できごと」や「思ったこと」を、楽しく記録できるメモ日記アプリを開発しました! しゃべったら、あとは丸投げして良い感じにメモを残してくれる「シャべマル」です!(笑) シャべマルの紹介具体的には、、 絵文字で見返せるメモアプリあんまりないですが、良いですよ…!音声入力でメモ内容を作成。かなり高精度な音声認識モデル(Whisper)を用いているので、想像以上にちゃんと文字起こししてくれます! 「今日あったこと」など、日記として利用するのもオススメです。1日を振り返る機会になって、それが後から振り返りできるので、あの時こんなこと考えていたなー、といった発見につながるはずです! そして個人的にここが目玉なのですが、文字起こしされたメモには、「タイトル」「絵文字アイコン」「感情アイコン」「カテゴリ」が自動で紐づきます! これ何が良いかというと、圧倒的に見返しやすくなるんですよね

                Whisper、ChatGPTを活用した、テキスト入力不要な新感覚メモ日記アプリの紹介と、開発における学び|にょす
              • 【個人開発】爆速で書籍管理システムを作って大幅な時間削減をした - Qiita

                はじめに こんにちは!!@Sicut_studyです! 今回は個人開発で「書籍管理システムYomuYomu」を作成したので紹介したいと思います。 サービスでやりたかったことがシンプルでなおかつユーザーの作業時間を大きく削減することができたというところから 個人開発に挑戦してみたいけど何を作ればよいかわからない このような方にとてもおすすめのサービスになっています。 私も実装していて「この内容はプログラミングコーチングJISOUの中でも1つの教材として今後使っていこう」と思うくらい良い題材でした 書籍管理システムYomuYomuとは 書籍管理システムYomuYomuは購入した本を登録できる簡単なアプリです 以下の機能が利用できます 1. 登録書籍一覧 登録した書籍を50音順で見ることができます 詳細検索を利用することで「あ行」などで書籍を絞ることができます 2. 書籍自動登録 書籍を登録する

                  【個人開発】爆速で書籍管理システムを作って大幅な時間削減をした - Qiita
                • Gboard チームからの新しい日本語入力方法のご提案 2023

                  Gboard は、優れた変換性能にくわえて、お好きな写真を背景にできるテーマ機能、音声入力や外国語への翻訳機能などの便利な機能をそなえたキーボード アプリです。 Android と iOS のどちらでもご利用いただけます。 Gboard を開発するチームは、いつでもどこでも思いどおりの文字入力を提供すべく、日々努力を重ねています。私たちは、ユニークな文字入力環境を実現するために、これまでにもさまざまなキーボードやデバイスを提案してきました。 そして今年もこれまでのキーボードと同様に、実際にみなさまに作っていただける DIY キーボードをご紹介します。 手に馴染んだキーボードを持ち歩きたいのに手が塞がってしまっていて持ち歩けない。そのような問題を解決しようと、今回は肌身離さずに持ち運びやすいキーボードのために頭を使いました。持ち運びやすさだけではなく、機能性や造形も頭に入れて開発しました。

                    Gboard チームからの新しい日本語入力方法のご提案 2023
                  • GPT-4o の概要|npaka

                    以下の記事が面白かったので、簡単にまとめました。 ・Hello GPT-4o 1. GPT-4o「GPT-4o」 (「omni」の「o」) は、人間とコンピュータのより自然な対話に向けた一歩です。テキスト、音声、画像のあらゆる組み合わせを入力として受け入れ、テキスト、音声、画像の出力のあらゆる組み合わせを生成します。 音声入力にはわずか232ミリ秒 (平均320ミリ秒) で応答できます。これは、人間の会話における応答時間とほぼ同じです。英語のテキストおよびコードでは「GPT-4 Turbo」のパフォーマンスに匹敵し、英語以外の言語のテキストでは大幅に改善されており、APIでははるかに高速で50%安価です。「GPT-4o」は、既存のモデルと比較して、特に視覚と音声の理解に優れています。 2. モデルの機能「GPT-4o」以前は、音声モードを使用して、平均2.8秒 (GPT-3.5) および5

                      GPT-4o の概要|npaka
                    • Udemyで夏のビッグセール開催! 話題の生成系AIからプロダクトマネジメントまで、新たな得意分野を見つけよう - はてなニュース

                      ※夏のビッグセール、およびキャンペーンは終了しました。ご応募ありがとうございました。なお、Udemyの講座修了者を対象とした「学習応援キャンペーン」は9月30日まで実施中です。 オンライン学習プラットフォーム「Udemy」では、2023年8月22日(火)から夏のビッグセールを開催します。対象の講座が1,200円から購入可能と、なかなかチャレンジできなかった新しい領域を学習するにはとってもお得なチャンス。 今回のセール対象講座から、ChatGPTやMidjourneyといった話題の生成系AI、その基礎となる大規模言語モデル(LLM)の入門や実装を扱う講座といった人気のトピックに加えて、アプリケーション開発やプロジェクトマネジメント、さらには英語学習など、ステップアップを目指すITエンジニアにオススメの中級から上級の講座もピックアップして紹介します。 Udemyで勉強を始めたいけれど、いろいろ

                        Udemyで夏のビッグセール開催! 話題の生成系AIからプロダクトマネジメントまで、新たな得意分野を見つけよう - はてなニュース
                      • 他人が装着するイヤフォンだけに“いきなり音楽を注入できる”システム 明治大が開発

                        このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 明治大学の渡邊研究室に所属する研究者らが発表した論文「WhisperCast: ヘッドフォン装着者だけが聴取可能な音を再生する磁気誘導を利用した手法の検討」は、ヘッドフォンやイヤフォンを装着している人のみが聞こえる音声や音楽を外部から挿入するシステムを提案した研究報告である。 このシステムは、磁気誘導を用いて、ヘッドフォンやイヤフォン内の振動板を直接鳴動させ、装着者だけが聴取できる音を生成する。WhisperCastのハードウェア構成には、空芯コイルとアンプを含んでいる。 具体的なプロセスとして、コンピュータが任意の波形(通知音や好きな音楽

                          他人が装着するイヤフォンだけに“いきなり音楽を注入できる”システム 明治大が開発
                        • はてなエンジニアによるApple Vision Pro座談会 - Hatena Developer Blog

                          2023年6月のWWDC(World Wide Developers Conference)23で発表され、2024年2月に米国で販売が開始されたApple Vision Proを、はてなのエンジニア5人が入手しました。 ということで、3月初旬に5人がApple Vision Proをつけて、オンライン座談会を行いました。その様子をお伝えします。 Google Meetで座談会をしています 本記事中のApple Vision Proは、使用者がそれぞれ「技適未取得機器を用いた実験等の特例制度」に基づく届出を行い、適切な管理の下に使用しています。 この無線設備は、電波法に定める技術基準への適合が確認されておらず、法に定める特別な条件の下でのみ使用が認められています。この条件に違反して無線設備を使用することは、法に定める罰則その他の措置の対象となります。 座談会の模様はYouTubeでも公開し

                            はてなエンジニアによるApple Vision Pro座談会 - Hatena Developer Blog
                          • AIこより爆誕!?の裏側|カバー株式会社 公式note

                            こんこよ~🧪 カバー株式会社CTO室エンジニアのAです。 カバー株式会社には2023年4月に新卒で入社し、第1回COVER Techを執筆したKさんの下で、タレントの皆様が日々のYouTube配信などで使用するホロライブアプリの開発に携わっています。 また、ここ数か月はそれと並行してAIこよりシステムの開発を担当してまいりました。 この記事では開発したシステムの概要についてご紹介します。 開発経緯AIこよりシステムの開発に至った経緯について。 まず社内に生成AIの可能性や関連技術の検討をしたいという需要がありました。そこへ、こよりさんからご自身のAIを作りたいというご要望をいただいたため、それがきっかけとなり、こよりさんの全面的なご協力の下でAIこよりシステムの開発が始まりました。 システム概要今回開発したものは、AIシステムへの入出力を操作し配信画面に映すフロントアプリと、各種外部AP

                              AIこより爆誕!?の裏側|カバー株式会社 公式note
                            • Meta、音声生成AIモデル「Voicebox」発表 ノイズ除去や言い間違い修正、多言語会話など多機能

                              Meta、音声生成AIモデル「Voicebox」発表 ノイズ除去や言い間違い修正、多言語会話など多機能 米Metaは6月16日(現地時間)、新たな音声生成AIモデル「Voicebox」を開発したと発表した。音声の編集、サンプリング、スタイルの設定などを行える。 音声とテキストを入力することで、以下のような音声を出力できる。 入力した声で入力したテキストを読み上げる音声クリップを作成する 録音した音声から犬の鳴き声やブザー音などのノイズを除去する 録音した音声の言い間違いを修正する 1つの言語のスピーチを同じ声のまま別の言語に変換する(英語の音声を仏語に、など) 1つのテキストを多様な声で読み上げる Metaは、Voiceboxで将来的にはメタバース内のバーチャルアシスタントやNPC(ノンプレイヤーキャラクター)が自然な声で話せるようになるとしている。また、自分の声のまま(本来は話せない)外

                                Meta、音声生成AIモデル「Voicebox」発表 ノイズ除去や言い間違い修正、多言語会話など多機能
                              • superwhisperでの音声入力を試す

                                superwhisperという、whisper.cppを使った音声入力ができるmacOSアプリケーションを最近使っています。 基本的にはggerganov/whisper.cppのモデルを使って、音声認識しながら文字入力ができるアプリケーションです。 特徴 Whisperの認識精度が高い かなり早く喋っても認識してくれる 日本語も認識してくれるモデルがある 日本語で喋って英語に翻訳してくれる機能もある オフライン対応 有料: サブスク と 買い切り の2種類のプランがある 無料で15分のトライアル、その後は選べるモデルが制限される 公式サイトのデモをみると、かなり早く喋っても認識してくれるのがわかります。 大抵の人にとっては、多分文字入力するよりしゃべったほうが早いぐらいの入力速度が出ると思います。 superwhisper 長文はそこまで得意じゃないけど、1行とか2行ぐらいの文章はかなり

                                  superwhisperでの音声入力を試す
                                • GPTのFunction callingを使って自然言語が新たなインターフェースになるかを試してみる | DevelopersIO

                                  GPTのAPIに新機能「Function calling」が追加され、ユーザーの自然言語入力に応じて特定の機能を呼び出し様々なツールとの連携が可能になりました。この記事ではFunction callingを利用して、自然言語がインターフェースになるかの可能性を探ります。 はじめに Function callingという機能がGPTのAPIに新たに追加されました。 Function callingはざっくりいうとユーザーが入力した文字列に応じて特定の関数を呼び出すことができる機能です。 例えば、ユーザーの入力が「Tannerに来週の金曜空いてるか日程調整のメールおくっといて!」だった場合、勝手にGmailを開いてメールを送信する関数を呼び出して処理を実施してくれたり、「5/20のタクシー代600円で経費登録しておいて」と記載すると勝手に経費登録を行う関数が処理を行ってくれるようなイメージです

                                    GPTのFunction callingを使って自然言語が新たなインターフェースになるかを試してみる | DevelopersIO
                                  • Metaが音楽生成AIモデルをオープンソースで公開、テキスト&音声入力で誰でも高品質な音楽を作成できるように

                                    Metaの研究チームが音楽を生成するAIモデル「MusicGen」を公開しました。オープンソースでの公開となっているため誰でも無料でモデルを利用できるほか、作例やデモが公開されており、その品質を実際に確かめることが可能になっています。 [2306.05284] Simple and Controllable Music Generation https://doi.org/10.48550/arXiv.2306.05284 MusicGen: Simple and Controllable Music Generation https://ai.honu.io/papers/musicgen/ MusicGenはChatGPTなどの大規模言語モデルと同様にTransformerを利用したモデルです。言語モデルは文の次の言葉を予測しますが、MusicGenは音楽の次のセクションを予測する仕組

                                      Metaが音楽生成AIモデルをオープンソースで公開、テキスト&音声入力で誰でも高品質な音楽を作成できるように
                                    • GeForce RTX搭載PCで動くローカルAI「ChatRTX」刷新。画像認識や音声入力に対応

                                        GeForce RTX搭載PCで動くローカルAI「ChatRTX」刷新。画像認識や音声入力に対応
                                      • 日本では一ヶ月かかる論文を海外は7日で書き終える→まさかの”音声入力”がカギ

                                        りっく @marudewakaran40 留学先のボスに『日本の研究者は国際会議の論文1本書くのに1ヶ月かけるって本当かい?ウチのスタッフは3日で書いて3日でリバイスして1日かけて最終確認&投稿する、7日のワークと決めている。報告書は鮮度が命だからね』と言われて、そんなことができるのかと思っていたら、(1/2) 2023-08-20 12:07:23 りっく @marudewakaran40 ある日ラボのスタッフがなにやらブツブツ言っていて『なにしてるのん?』と聞いたら『論文書いてる。打つの面倒だからディクテーション機能で書いてる。これが早いんだよ』と言っていて当時は目から鱗なのん。 最近の私は、口頭で書き殴ってGPTに文法ミス指摘させてるのん(2/2) 2023-08-20 12:10:53

                                          日本では一ヶ月かかる論文を海外は7日で書き終える→まさかの”音声入力”がカギ
                                        • これでフルキーボード。6つのキーでQWERTYが入力できる

                                          これでフルキーボード。6つのキーでQWERTYが入力できる2024.01.10 07:00132,251 岡本玄介 視覚障がい者が6つのキーでQWERTY入力できる。 弱視や全盲など視覚障がいのレベルはさまざまですが、健常者と比べるとタイピングによるテキスト入力にはさまざまな苦労があることと思います。 人によっては音声入力を使うかもしれませんし、点字使用者向けキーボードや、手話をテキストに変換するAIというのも存在します。 ゲームパッドみたいなキーボードONECOM Co., Ltd.が作ったのは、スマホサイズの入力デバイス「FINTIN V1」。 メインのボタン6つを押して打鍵しますが、これらの斜め左上・上・斜め右上・斜め左下・下・斜め右下方向への入力がQWERTY配列に対応しています。 Video: official_onecom/YouTube両肩のボタンと併せて使おうコンピューター

                                            これでフルキーボード。6つのキーでQWERTYが入力できる
                                          • [ここまで進化したChagGPT!] 今日から何がどう変わるのか [2023年11月最新版] - Qiita

                                            皆さん初めましてこんにちはこんばんは。スウェーデン在住のエンジニア、Harry(ハリー: https://twitter.com/harrythecode )と申します。 普段はDevOpsエンジニアとして働く傍ら、生成AIの最前線にも繰り出し、ToBやToC向けのアプリケーション開発などにフルスタックエンジニアとして携わっています。 2023年11月7日 日本時間午前3時より、ChatGPTの生みの親、OpenAI社のサム・オルトマンによる講演が行われました。 この中で、多くの人が待ち望んだ様々な機能の実装や改善が行われています。 読むのが辛いよ、って方は以下の一言まとめをどうぞ。 また今回の発表によって何が新しくなって、今後どう変わっていくのか、を現役エンジニア目線でご紹介します。では見ていきましょう。 何が新しいん? GPT-4 Turboの発表: コンテキスト長の拡張: 128,0

                                              [ここまで進化したChagGPT!] 今日から何がどう変わるのか [2023年11月最新版] - Qiita
                                            • 生成AIの活用事例 10選|masa_kazama

                                              「テクノロジーで人々を適切な医療に案内する」をミッションに、医療プラットフォームを提供しているUbie株式会社の@masa_kazamaです。 この記事は#Ubieアドベントカレンダー5日目にエントリーしています。 今年は生成AI一色の1年でした。Ubieでは、生成AIをプロダクト活用と社内生産性向上の観点で取り組んでいます。(取り組みの詳細は、こちらの記事で紹介しています。) この記事では、社内生産性向上観点で、社内の業務プロセスに溶け込んでいて、なくてはならない使い方になっている事例を10個ご紹介します。その中のいくつかは、実際に生産性が倍以上になっていたり、外部委託のコストが半分になったりしています。この記事が、生成AIを活用している人や活用していきたい人のご参考になれば幸いです。 プロダクト活用にもいくつか事例が出ており、問診の内容を大規模言語モデル(LLM)を活用して要約する機能

                                                生成AIの活用事例 10選|masa_kazama
                                              • 中国語の文字入力で「ピンイン」が最終的に普及した理由

                                                印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます 日本のスマートフォン世代の中には、PCのキーボード入力が苦手な人もいるという。一方で、中国の今どきの学生は、さまざまな入力方法が用意される中でも、フルキーボードを好むことが多く、慣れていないと恥ずかしいようだ。今回はその「なぜ」を考察したい。 中国語には文字入力の方法が多数あり、入力方式エディター(IME)をはじめとしたツールは「輸入法」と呼ばれる。例えば、PCでは日本語のローマ字入力のような「ピンイン」入力と、各キーに割り当てられた漢字の部首から入力する「五筆」入力がある。また漢字が多くて入力が難しい高齢者向けには、手書き入力用の外部入力機器やソフトウェアが用意されている。 スマートフォンではピンインと五筆が入力できるフルキーボードに

                                                  中国語の文字入力で「ピンイン」が最終的に普及した理由
                                                • 誰の声でも簡単・リアルタイムで女声・男声・ささやき声などへ自由自在に変換できる「Voidol3」のSYNTHモードを使ってみたよレビュー

                                                  AI技術を応用したソフトを開発するクリムゾンテクノロジーから、AIリアルタイムボイスチェンジャー「Voidol3」が2023年9月8日に登場しました。Voidol3はシンセサイジングによる超高速声質変換エンジンによるボイスチェンジャー「SYNTHモード」と、自身の声を特定のキャラクターの声に変換するAIリアルタイム声質変換が可能な「AIモード」を搭載し、さらにその両方を連結したリアルタイムの声質変換も可能だとのこと。まずはVoidol3のSYNTHモードによるボイスチェンジャーを試してみました。 Voidol3 | 変幻自在の声質変換 | クリムゾンテクノロジー株式会社 https://crimsontech.jp/apps/voidol3/ 今回Voidol3を使うにあたって、オーディオインターフェースとしてコンデンサーマイクのMPM-1000とヤマハ・AG-03をPCに接続して使用しま

                                                    誰の声でも簡単・リアルタイムで女声・男声・ささやき声などへ自由自在に変換できる「Voidol3」のSYNTHモードを使ってみたよレビュー
                                                  • 『ドラクエ』堀井雄二×『倉庫番』今林宏行×『かまいたちの夜』我孫子武丸:鼎談<過去探求編>人工知能時代へ向けて往年の「コマンド入力式ADV」を振り返る

                                                    人類の情熱に終わりはない。探求心と技術の進化が、新時代のゲームの幕開けを告げている。昨今の人工知能の台頭はビデオゲームのストーリーテリングに大きな革新をもたらす可能性を示唆している。それはしばしば歴史が示してきたように、アドベンチャーゲームが先陣を切るだろう。 アドベンチャーゲームは、プレイヤーに物語体験を提供し、謎解きや探索を通じて物語の世界を紡ぎ出すジャンルとして長らく愛されてきた。しかしこれまでの制約を超えて、プレイヤーの行動や選択に応じてダイナミックに変化する未来のアドベンチャーゲームはどのようなものなのだろう。 そもそもアドベンチャーゲームは出発点から人工知能と縁が深いものだった。最初のアドベンチャーゲーム『Adventure』(1976年)は、初期のチャットボット・プログラムを参考にして作られており、ゲームの背後にAIがいるかのようにプレイヤーに感じさせようとしていた。最初のア

                                                      『ドラクエ』堀井雄二×『倉庫番』今林宏行×『かまいたちの夜』我孫子武丸:鼎談<過去探求編>人工知能時代へ向けて往年の「コマンド入力式ADV」を振り返る
                                                    • 音声のみで操作できるTODOアプリを開発してたら思ったより革命だった - Qiita

                                                      はじめに この記事では、音声認識のみで扱えるVoice Todoというアプリを作っている話をします。 既存TODOアプリのかゆいところ 皆さんはTODOアプリを使っていますか? 正直に言うと、私は使っていません。 TODOアプリを使わない理由はいくつかあります。 まず、フリック操作が苦手。 フリックがとにかく苦手です。 どれぐらい苦手かというと、PCとスマホで同じ100文字程度の文章を打つと4,5倍ぐらい時間がかかります。 また、TODOの海を形成しがち。 TODOアプリを使っていると、気づいたらTODOの海を構築しています。 というのも、基本的に整理フェーズを置いてないからなんでしょう。 結果、消化するよりも探す時間の方が使うという状態に陥ります。 うーん。 どうにか、TODOアプリで楽して管理できないかなー。 ――――と思い立ったのがVoice Todo作成のきっかけです。 Voice

                                                        音声のみで操作できるTODOアプリを開発してたら思ったより革命だった - Qiita
                                                      • VSCodeで日本語の音声入力が可能に、Copilotがコードに合った変数名を提案など新機能。2024年2月のアップデート

                                                        VSCodeで日本語の音声入力が可能に、Copilotがコードに合った変数名を提案など新機能。2024年2月のアップデート コードエディタのVisual Studio Code(以下、VSCode)は2024年2月のアップデートで、音声入力やCopilotによる変数名の提案などの新機能が追加されました。 More developer goodness in the February update of @code Use your voice to write code (in your language!) Code faster with multi-cursor suggestions Renaming gets easier (because it's AI powered) Release notes: https://t.co/zwokiQvbPU Download: http

                                                          VSCodeで日本語の音声入力が可能に、Copilotがコードに合った変数名を提案など新機能。2024年2月のアップデート
                                                        • AirPodsを乗っ取り、スマホにこっそり音声入力する超音波攻撃 成功率は8割超 米研究者らが開発

                                                          Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。Twitter: @shiropen2 米ミシガン州立大学に所属する研究者らが発表した論文「■https://dl.acm.org/doi/10.1145/3581791.3596837■」は、被害者に気が付かれることなくスマートイヤフォン(Airpods、Pixel Budsなど)からスマートフォンに音声入力する不可聴攻撃を提案した研究報告である。被害者の近くから超音波を発して、スマートイヤフォンに音声コマンドを送り、音声入力を行う。 スマートイヤフォンはBluetoothを使って近くの機器(スマートフォン、スマートスピーカー、スマートホームデバイスなど)に接続し、音声認識技術を駆使して音

                                                            AirPodsを乗っ取り、スマホにこっそり音声入力する超音波攻撃 成功率は8割超 米研究者らが開発
                                                          • VSCodeへ「Hey Code!」と呼びかけ、Copilot Chatが起動する新機能。2024年1月のアップデート

                                                            VSCodeへ「Hey Code!」と呼びかけ、Copilot Chatが起動する新機能。2024年1月のアップデート コードエディタのVisual Studio Code(以下、VSCode)は2024年1月のアップデートで、「Hey Code!」と音声で呼びかけると、Copilot Chatが起動する新機能が追加されたことが明らかになりました。 The January release of @code is here! Check out what's new: Per-window zoom levels "Hey Code" voice command Triggered breakpoints ... & much more! Release notes: https://t.co/ourbLiwakw Download: https://t.co/1CSkQpMbwd pic.

                                                              VSCodeへ「Hey Code!」と呼びかけ、Copilot Chatが起動する新機能。2024年1月のアップデート
                                                            • パナソニックは「ChatGPT」をこんな仕事に使っている (1/4)

                                                              生成AI、中でもOpen AIの大規模言語モデルであるChatGPTを社内ツールとして取り入れ、業務に活用する動きが広がっている。筆者が記憶している限り、最も速い動きを見せた企業の1つがパナソニック子会社のパナソニック コネクトだ。 マイクロソフト「Azure OpenAI Service」の提供開始にあわせて独自システム「ConnectAI」を開発し、2月には全社導入を発表。今年9月からはさらに一歩踏み込んで、ChatGPTに社内データをつなぎ込み、10月以降カスタマーサポートで活用する計画も発表している。 導入から数ヵ月、ChatGPTは今、どのような業務にどう活用されているのか。見えてきた業務効率化の鍵と課題を、パナソニック コネクト IT・デジタル推進本部 戦略企画部 シニアマネージャーの向野孔己氏に聞いた。 使用回数は1日あたり5800回、トータルで26万回 ──今年2月に全社に

                                                                パナソニックは「ChatGPT」をこんな仕事に使っている (1/4)
                                                              • 約50万円のアップル「Vision Pro」予約にいたった経緯を解説する(西田宗千佳) (1/3)

                                                                1月19日22時(日本時間)といえば? そう、もちろん「Apple Vison Pro」の予約開始時間だ。 まあ普通に考えればハードルは高い。高いだけでなく、「アメリカ市場向けのみ」というのがいろいろ大変だ。普通なら「数ヵ月から1年以内に日本で出るから、それまで待とう」という判断になるだろう。 だが、筆者の友人・知人やSNSで絡む人々はテックガジェットガチ勢ばかりなので、「3500ドル(およそ51万8500円)の高額商品をアメリカから(もしくはアメリカに行って買う)」覚悟が完了した、面構えの違う人々なのでだいぶ麻痺している。 というわけで、その麻痺した頭で購入にいたった経緯をちょっと解説してみよう。 まずは「アカウントの準備」から アメリカからは事前に「Tips」メールも すでに述べたように、Vision Proはまずアメリカ市場でだけ売られる。 根本的な理由はアップルのみぞ知る、というと

                                                                  約50万円のアップル「Vision Pro」予約にいたった経緯を解説する(西田宗千佳) (1/3)
                                                                • ピーター・ターチン「トランプを支持して権力拡大を狙う対抗エリートたち」 | 米国はロシアより「崩壊」に近い

                                                                  理論生物学から始め、歴史を自然科学のように研究してきた進化人類学者のピーター・ターチン。その独得で大胆な主張は、世界から注目を集めてきた。ターチンから話を聞いた、英紙「フィナンシャル・タイムズ」のヘンリー・マンス記者が、その主張を鋭く分析する。 危機を予測した進化人類学者 2010年、英誌「ネイチャー」は、各分野の専門家らに自分の分野が10年後にどうなっているか、予測するよう求めた。グーグルのリサーチ・ディレクターは、インターネット検索がタイプ入力ではなく、ほとんど音声入力でなされるようになるだろうと述べた。 そこにはピーター・ターチンのものもあった。もともと生態学者であった彼の予想は、なかでもおそらく最も大胆だった。「次の10年は米国と西欧が不安定化する時期になる」というのだ。特に「2020年ごろに一気に不安定化する」と示していた。 この予想がなされたのは2010年2月のことだ。同年末に

                                                                    ピーター・ターチン「トランプを支持して権力拡大を狙う対抗エリートたち」 | 米国はロシアより「崩壊」に近い
                                                                  • OpenAIの「Voice Engine」は15秒分の声データを元に本人そっくりに喋る

                                                                    米OpenAIは3月29日(現地時間)、人の声を再現できる生成AIモデル「Voice Engine」を発表した。テキスト入力と15秒分の音声サンプルで、元の話者によく似た自然な音声を生成できる。感情的なリアルな音声で、母国語以外の言語も話せる。 2022年から開発していたこのモデルは、既に同社の「Text-to-Speech API」や「ChatGPT」アプリの音声チャット機能、ChatGPTのテキスト読み上げ機能「Read Aloud」などで採用されている。 OpenAIは、こうした合成音声が悪用される可能性を認めており、広範囲にリリースをするかどうかを検討するために、慎重にテストを行っているという。 スウェーデンSpotifyは昨年9月、このモデルを採用した新機能「Voice Translation」を発表した。これはPodcastをホスト自身の声で複数言語に吹き替えるものだ。 Ope

                                                                      OpenAIの「Voice Engine」は15秒分の声データを元に本人そっくりに喋る
                                                                    • ブログが続かない!継続出来る人がやっている事【実体験】|Laid Back salaryman

                                                                      ブログ初めてみたけど全然続かない.. どうやったらブログを習慣化できるのか方法が知りたい! ブログを始める時はめちゃくちゃやる気あるんですが、実際に投稿してみると、意外と労力と時間が掛かるし、何よりも読んでもらえず挫折する人も多い。 ブログが続かない!と悩んでる人にブログを継続出来る方法を紹介したいと思います。 本記事の執筆者のピロリについて紹介 本業:会社員 副業経験:CrowdWorks・個人ブログ運営・投資(株・仮想通貨・FX) ブログ総アクセス数:10万以上達成 副業収入:数千円 〜 数万円 副業への投資時間:週5〜6時間程度 副業継続期間:約3〜4年間 副業する為に大切にしてる事:睡眠時間・趣味の時間は絶対に削らない ブログが続かない原因 X(旧:Twitter)を通して多くのブロガーと交流してきましたが、その中のほとんどのブロガーがどんどん辞めていきます。 私がブログを始めた頃

                                                                        ブログが続かない!継続出来る人がやっている事【実体験】|Laid Back salaryman
                                                                      • iPhone上でAIが恋人になってくれるアプリ「Dolores」開発者がアプリの開発経緯と教訓を語る

                                                                        機械学習エンジニアのKe Fang氏が、AIをコミュニケーション相手にできるアプリ「Dolores」を開発した経緯とそこから得た学びを自身のブログでまとめています。 A Failed AI Girlfriend Product, and My Lessons | TL;DR https://mazzzystar.github.io/2023/11/16/ai-girlfriend-product/ Fang氏は、2023年4月にスタンフォード大学が発表した生成AIエージェントについての論文を読み、記憶・熟考・計画・行動を組み合わせたフレームワークを用いて、人間とGPTとのコミュニケーションを、映画「her/世界でひとつの彼女」のように、AIをガールフレンドとみなしてコミュニケーションをはかることができるのではないかと考えました。 Amazon | her/世界でひとつの彼女 ブルーレイ&D

                                                                          iPhone上でAIが恋人になってくれるアプリ「Dolores」開発者がアプリの開発経緯と教訓を語る
                                                                        • Evernoteヘビーユーザーだった僕が現在使っているノートサービス・メモアプリ - paiza times

                                                                          スマホやパソコンでメモを取るサービスといえば、一時期はEvernoteが代名詞とも言えるくらいのシェアを誇っていました。 最近ではさまざまなノートサービス・メモアプリが登場し、機能や用途に応じて使い分けている方も多いと思います。 僕は以前、「MoveEver」「MergeEver」「AutoEver」などのEvernoteとの連携アプリを多数リリースしていて、Evernoteを愛用していた1人なんですが、現在はほとんど使っておらず、より自分の手に馴染むサービスへと移行しました。 決してEvernoteを下げるわけではなく、自分のメモ運用方針とはしっくりこなくなってきただけなんですが、Evernoteを使っていたことを振り返りつつ、現在僕がメモを取るのに活用しているサービスやアプリを紹介します。 【目次】 当時はEvernote以外の選択肢がなかった やっぱりメモアプリには「速さ」がほしい

                                                                            Evernoteヘビーユーザーだった僕が現在使っているノートサービス・メモアプリ - paiza times
                                                                          • ChatGPTが変える英語学習、京都大の金丸敏幸氏「トレーナーとして…」 教師も影響?:朝日新聞GLOBE+

                                                                            2006年、京都大学大学院を単位認定退学後、独立行政法人「情報通信研究機構」の研究員などをへて、2007年京都大学大学院助教、2014年より現職。京都大学博士(人間・環境学)。専門は外国語教育、自然言語処理、認知言語学。 ――英語の習得に苦手意識を持つ日本人は多いと思います。ChatGPTといった生成AIの登場で、そういった悩みが解決されるのでしょうか。 これまでの英語学習の場合、読んだり、書いたりといった、学習者が「受け身」の形になる教材や学習が多かったと思うんですね。それが生成AIの登場によって変わると思います。 生成AIがあたかも先生や対話相手の役割を果たすことになるのです。例えばこちらが書いた英文をAIが添削することも可能で、さらには「ここが違う」「自然な英語にするにはこうしたらいい」などとアドバイスもしてくれるでしょう。 京都大のある授業では、英語のビデオ教材を使って学生がセリフ

                                                                              ChatGPTが変える英語学習、京都大の金丸敏幸氏「トレーナーとして…」 教師も影響?:朝日新聞GLOBE+
                                                                            • Appleの「Vision Pro」海外レビューまとめ、「これまでのVR・AR・MRヘッドセットの中で群を抜いて最高」という評価も

                                                                              2023年6月に発表され、アメリカでは2024年2月2日に発売されるApple初のARヘッドセット「Vision Pro」の事前レビューを、複数の海外メディアが公開しています。 Apple Vision Pro pre-reviews, this time with pictures! - 9to5Mac https://9to5mac.com/2024/01/16/apple-vision-pro-real-world-use/ アメリカでは複数メディアの記者たちがVision Proの試遊体験をこれまで12回にわたり実施しているそうです。Apple関連メディアの9to5Macによると、Vision ProはApple史上最も多く発売前に試遊されたAppleハードウェアであるとのこと。最新の体験会に参加したレビュアーたちはAppleから「Vision Proの写真を公開すること」を許可さ

                                                                                Appleの「Vision Pro」海外レビューまとめ、「これまでのVR・AR・MRヘッドセットの中で群を抜いて最高」という評価も
                                                                              • 「SwitchBotプラグミニ」一部に不具合 「断続的にON/OFFを繰り返す」など 交換で対応

                                                                                中国発IoTメーカーのSWITCHBOTは4月16日、コンセントと家電の間に差し込むことで、家電製品をスマートフォンなどから操作できるようにするガジェット「SwitchBotプラグミニ」の一部で、通常より故障率が高いことを確認したため、対象商品を交換すると発表した。 同社の想定よりも製品寿命が短く、電源が入らない、断続的にON/OFFを繰り返す、表示ランプが点灯しない、異音がするといった故障が起きる可能性があるという。 案内には「電気ショートや出火などの重大事故を引き起こすものではありませんので、どうぞご安心ください」と書かれているが、「『断続的にON/OFFを繰り返す』のは怖い」など、一部のユーザーがXに不安を吐露している。 該当する商品は、主に2023年1月~23年6月に販売されたもので、製造番号は「2219」「2220」「2221」「2224」「2225」「2226」「2227」「2

                                                                                  「SwitchBotプラグミニ」一部に不具合 「断続的にON/OFFを繰り返す」など 交換で対応
                                                                                • 【レビュー】Apple Watch用国産ブラウザアプリ「ワードウォッチ」使ってみた - iPhone Mania

                                                                                  Apple Watchで各種Webサイトを表示できるブラウザアプリ「ワードウォッチ」をインストールして試してみました。基本機能は無料で、会員登録なども不要で利用できます。iPhoneを取り出せない状況でも、Apple WatchでWeb検索ができる体験にワクワクできました。 ■3行で分かる、この記事のポイント 1. Apple Watch用ブラウザアプリ「ワードウォッチ」を試した。 2. iPhoneを取り出さずに手首でWeb検索が可能。 3. 改善を希望する点もあるが、活用方法の幅が広そうで楽しい。 通常、Apple WatchでのWeb表示は限定的 Apple Watchでは、watchOS5(2018年公開)からメールに含まれるリンクを開いてWebサイトを閲覧できますが、文字と写真だけが簡易表示される程度で、機能は限定的です。 「ワードウォッチ」は、アプリ開発者kiminori ku

                                                                                    【レビュー】Apple Watch用国産ブラウザアプリ「ワードウォッチ」使ってみた - iPhone Mania