並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 5404件

新着順 人気順

音声合成の検索結果1 - 40 件 / 5404件

  • 音声合成業界に激震! もはや人間の喋り声、入力文字読み上げソフトVOICEPEAKはビジネス用途でも自由に利用可能|DTMステーション

    日進月歩というより、秒進分歩で進化している感じのある音声合成、歌声合成の世界ですが、また新たな革命ともいえるAI音声合成ソフトが誕生しました。これまでDTMステーションでも何度も取り上げてきた歌声合成ソフト、Synthesizer Vを開発するDreamtonics株式会社と株式会社AHSと共同開発する形で、もはや人間の喋り声にしか聴こえない音声合成ソフト、VOICEPEAKを発表し、3月11日から発売を開始するのです。Synthesizer Vと同様、Windows、Mac、Linuxでも動くマルチプラットフォームソフトで価格はダウンロード版で23,800円(税込み)となっています。 このソフト「VOICEPEAK 商用可能 6ナレーターセット」という製品名になっていますが、実際には女性3人+男性3人+女の子1人=7人の声を切り替えることが可能なAI音声合成ソフトで、テキストを入力すれば

      音声合成業界に激震! もはや人間の喋り声、入力文字読み上げソフトVOICEPEAKはビジネス用途でも自由に利用可能|DTMステーション
    • VOICEVOX | 無料のテキスト読み上げ・歌声合成ソフトウェア

      オープンソースVOICEVOX は OSS(オープンソース・ソフトウェア)版 VOICEVOX をもとに構築されています。 製品版と OSS 版の違いやモジュール構成は VOICEVOX の全体構成 をご参照ください。 ソフトウェア部分は Electron + Vue 、音声合成エンジン部分は Python + FastAPI です。 追加したい・改善したい機能があれば、ぜひ開発にご参加ください。

      • 2022年「はてなブックマーク年間ランキング」トップ100 - はてなニュース

        はてなブックマークのブックマーク数が多い順に記事を紹介する「はてなブックマーク年間ランキング」の2022年版を発表します。上位トップ100の記事をピックアップしました(集計期間:2021年12月11日~2022年12月10日)。 2022年 はてなブックマーク年間ランキング(2021年12月11日~2022年12月10日) 順位 タイトル 1位 【詳しすぎる2週間】親の死亡後にまずやること(行動チェックリスト付) 2位 逮捕にそなえる人生継続計画 - やしお 3位 150 分で学ぶ高校数学の基礎 4位 ゲームの勝敗でかんしゃくを起こす子どもにできることは大人げない大人になること|フィンランドワークショップomena|note 5位 【アメリカで話題】ただ座るだけ!股関節がみるみる柔らかくなる「90/90ストレッチ」 | ヨガジャーナルオンライン 6位 Amazonプライムビデオで観てほしい

          2022年「はてなブックマーク年間ランキング」トップ100 - はてなニュース
        • 【必見】2020年に話題になったイケてるWebサービス・アプリまとめ

          あけましておめでとうございます。 今回は、2020年に話題になったイケてるWebサービス・アプリを紹介します。 多数リリースされているもののなかから、チェックし直しておいたほうがよさそうなサービスをピックアップしました。 2020年は新型コロナウイルスの流行もあり、世界が大きく変わりました。 それに伴い、生活様式にも変化が生まれ、リリースされるWebサービスやアプリも時代に則したものが多いように感じました。 冬休みのあいだに、ぜひおさらいしてみてください。 【その前に】毎月更新する本シリーズについて 2020年はしばらくお休みをいただいておりましたが、本年より更新を再開します。 引き続き、毎月末に更新となります。 また、新たに無料メルマガも開始します。 メルマガでは、運営者が気になったり、業界的に知っておいたほうが良さそうなWebサービスやアプリの紹介を不定期に紹介していく予定です。 最新

            【必見】2020年に話題になったイケてるWebサービス・アプリまとめ
          • 時間がない社会人でも大丈夫!TOEIC900点超の翻訳者が教える、レベル別英語学習アプリ16選 |

            ※以下のアプリ名を選択すると詳細について説明している箇所までジャンプします ・レベル1の方におすすすめのアプリ→「中学生の英単語2000」・「早打ち英文法」・「Duolingo(デュオリンゴ)」 ・レベル2の方におすすめのアプリ→「iKnow」・「スタディサプリ英単語」・「英会話フレーズ1600」 ・レベル3の方におすすめのアプリ→「英単語アプリmikan」・「英会話、英語 リスニング – スタディサプリENGLISH」 ・レベル4の方におすすめのアプリ→「POLYGLOTS(ポリグロッツ)」・「NHKゴガク 語学講座」 ・レベル5の方におすすめのアプリ→「EnglishUpgrader」・「VOA Learning English」 ・レベル6の方におすすめのアプリ→「BBC – 英語学習」・「Learn English Podcasts」 ・レベル7の方におすすめのアプリ→「TED」・

              時間がない社会人でも大丈夫!TOEIC900点超の翻訳者が教える、レベル別英語学習アプリ16選 |
            • JavaScriptを完全無料で学習できる最強の厳選コンテンツを大公開! - paiza times

              どうも、まさとらん(@0310lan)です! 今回は、JavaScript初心者から中級者までをカバーできる学習コンテンツを厳選してご紹介します。 完全無料で公開されているものばかりを集めており、なおかつ質の高いコンテンツを選んでいますので独学したい方にも最適です。テキスト、動画、本、Webアプリなど、さまざまな種類のコンテンツを楽しみながらぜひ学習に役立ててください! ■学習を始める前に これからJavaScriptの学習コンテンツについて解説をしていく前に、ひとつだけ以下のサイトをご紹介しておきます。 【 The Modern JavaScript Tutorial 】 これはJavaScriptの基礎構文・DOM操作・非同期処理・サーバ通信など、ほとんどの学習項目を網羅したリファレンスのようなサイトです。海外で作られたサイトですが、うれしいことに日本語化されているので初心者にも扱いや

                JavaScriptを完全無料で学習できる最強の厳選コンテンツを大公開! - paiza times
              • 無料で公開されている音声合成サービスが凄いと話題に「ボイロ殺しに来てる」「ベタ打ちで自然に話せる」

                CoeFont (コエフォント) @coefont Web音声合成サービス『CoeFont STUDIO』 coefont.studio をリリースしました。全サービス無料公開。すべてのクリエイターに声を届けます。#CoeFontSTUDIO #CoeFont pic.twitter.com/Wu5AFJpZ9d 2021-04-23 12:44:30

                  無料で公開されている音声合成サービスが凄いと話題に「ボイロ殺しに来てる」「ベタ打ちで自然に話せる」
                • 「AIきりたん」がすごい - すずしめにっき

                  ゆうべ、そろそろ寝ようかなと思っていたらものすごいものが投下され、興奮して結局3時半まで起きてしまいました。 ということで、昨晩公開された「AIきりたん」こと歌声合成エンジンNEUTRINO1について(今の興奮をあとで思い返すためにも)書いておきます。 AIきりたんとは とりあえずこれを聴いてみてください。 これが合成音声か!?と思ってしまうような仕上がりですが、これがAIきりたん……歌声合成エンジンNEUTRINOによって生成されたきりたんの歌声です。 NEUTRINOはSHACHIさん(@SHACHI_KRTN)によって製作されたフリーウェアで、昨晩公開されました。その標準の同梱ライブラリの1つが東北きりたんのものなので、そちらのことが「AIきりたん」または「AIシンガーきりたん」と呼ばれているというわけです。 ニューラルネットワークを用いた歌声シンセサイザー【NEUTRINO】を公開

                    「AIきりたん」がすごい - すずしめにっき
                  • 文字商標「ゆっくり茶番劇」に関するドワンゴの見解と対応について|ニコニコインフォ

                    (2023年7月24日追記) 2022年2月24日に登録された「ゆっくり茶番劇」商標(登録6518338号)について そもそも商標として登録されるべきではなかったことを明らかにするために無効審判を請求しておりましたが、 7月12日付けで無効審決が下されたとの通知を特許庁より受領いたしました。 すでに本件商標登録は放棄による抹消となっておりますが、登録日から抹消日までの間は商標権が発生しておりました。 この無効審決は、過去にさかのぼり「はじめからなかったこと」にして、当該商標権を打ち消すものです。 一定期間内に審決取消訴訟が提起されなければ、「ゆっくり茶番劇」の登録を無効とすべきと判断した無効審決が確定します。 無効審決の確定をもって、「ゆっくり茶番劇」にまつわる商標権についての問題がすべて解決することになります。 審決が確定しましたら、あらためてお知らせいたします。 当該騒動が発生してから

                      文字商標「ゆっくり茶番劇」に関するドワンゴの見解と対応について|ニコニコインフォ
                    • 文章の書き方をプロ並みにする話題の文章作成無料ツール10選 - 経営ハッカー | 「経営 × テクノロジー」の最先端を切り拓くメディア

                      引きつける文章、伝わる文章が作成できる無料ツールを集めました! サイトやブログ、プレスリリースなど、ビジネス上では文章を書く機会がたくさんあります。今日は、ライティングに苦手意識のある方でも、簡単に良い文章を作成することができるツールをご紹介します。すべて無料で、会員登録やインストールも不要です。ぜひ気軽に使ってみてください。 [目次] ■1)誤字脱字、タイプミスを正して読みやすく ■2)やさしい単語を使って伝わりやすく ■3)表現を豊かにして魅力的に ■4)忘れてはいけない最後の微調整 ■5)文章のたたき台を作るのにおすすめ ■1)誤字脱字、タイプミスを正して読みやすく 良い文章の基本は、誤りがないことです。まずは、誤字脱字やタイプミスがないかを確認しましょう。 【1】誤字脱字、変換ミスのエラーをチェックできる 「Enno」 日本語のあからさまなエラー (タイプミス、スペースのエラー、誤

                        文章の書き方をプロ並みにする話題の文章作成無料ツール10選 - 経営ハッカー | 「経営 × テクノロジー」の最先端を切り拓くメディア
                      • Adobe MAX 2017のスニークス – 人工知能Adobe Senseiの活用技術 - ICS MEDIA

                        米Adobeアドビ Systemsシステムズが主催の世界最大のクリエイティビティ・カンファレンス「Adobe MAX 2017」(ネバダ州ラスベガス)。二日目の10月19日は「スニークス」と題してAdobeの研究中の技術が発表されました。スニークスはAdobe MAXで最大の盛り上がりをみせる恒例の人気イベントです。 ここで発表されたものは現時点では製品に搭載されていないものの将来的に製品に組み込まれるかもしれない技術。過去の例を挙げると、Photoshopのディフォグ(霧を増減させる)機能やマッチフォント機能、最新のPremiere Proに搭載されたイマーシブ空間内での編集機能もかつてスニークスで発表された技術です。本記事では発表された11のテクノロジーを、現地のイベントに参加したスタッフ(池田)がレポートします。 今年は人工知能Adobe Senseiをフル活用した次世代技術のオンパ

                          Adobe MAX 2017のスニークス – 人工知能Adobe Senseiの活用技術 - ICS MEDIA
                        • 引っ越し祝いに大きめのエジプト神像を送りつけられたのでラズパイを仕込んで喋れるようにした - Qiita

                          プロローグ 恋人と暮らすことにしたので、新しい部屋に引っ越した。 家具やインテリアのテイストも二人で相談して、忙しい日々の中でもくつろげる落ち着いた空間を作ろうとしていた。 そんな幸福な日常が終わりを告げるまで、そう長くはかからなかった。 引っ越しも一段落して、新しい部屋にも慣れ始めたある朝、友人から引っ越し祝いと称して身の丈1mほどの神像が送りつけられた。 古代エジプトで天空神として崇められた、「ホルス神」をしつらえた置き時計だった。 その日からホルス神は、我が家のリビングに鎮座することになった。 準備 というわけで今回は、Raspberry Piを使ってリビングに突如として現れたホルスを喋らせて、さらに目覚まし機能を搭載してみようと思います。 今後エジプト神像を送りつけられた際の参考にしてください。 必要なものはこちら。 Raspberry Pi 2 micro SD スピーカー US

                            引っ越し祝いに大きめのエジプト神像を送りつけられたのでラズパイを仕込んで喋れるようにした - Qiita
                          • 検索じゃ学べない! HTML/CSS/JavaScriptの気づきTipsまとめ31こ | _level0 - KAYAC Front Engineer Blog

                            HTMLファイ部のほんだです。 気づきTips! Σ(・ロ・) カヤックの中でもHTML5のWebフロントエンド実装を担当する エンジニアを集めた部署「HTMLファイ部」では、 制作にあたってはまったことや、気づいたことをメモ的に蓄積・共有しています。 通常は、 1. 制作で何かわからないことがでた ▼ 2. Google等で検索して解決の糸口をさがす ▼ 3. こんな方法があったのか〜 と気づきを得る というフローでスキルアップしていくことがもっぱらだと思うのですが、 学びを増やしていくためには違うアプローチも必要なんじゃないかと思います。 カヤックHTMLファイ部では、 1. みんなで蓄積したTipsをざぁっと読む ▼ 2. こんな方法があったのか〜 と気づきを得る ▼ 3. 制作の際に導入していく というフローを繰り返し実践していくことで、 検索では気づけないことを学び、実装力アップ

                              検索じゃ学べない! HTML/CSS/JavaScriptの気づきTipsまとめ31こ | _level0 - KAYAC Front Engineer Blog
                            • iOS上で動作する革命的ものづくり環境「Pythonista 3」の魅力をとくと語る

                              iOS用のアプリは通常、開発アカウントを取得し、Macを使って開発します。 開発アカウントを取得するほどではないが、iOSデバイス上で何かやりたい処理がある、という人はいるでしょう。 あるいは、プログラム好きな人なら率先してiOSデバイス上でプログラミングをしたいと思うのではないでしょうか。 そうしたニーズに存分にこたえることができる、iOSデバイス上で動作する統合開発環境がPythonista 3です。 2016年9月21日に開催されたPyCon JP 2016で @equal_001 さんがPythonistaについて発表されていたのでご紹介。 Python支持者のことをPythonistaといいますが、アプリ名はそこから取ったんでしょうね。 正真正銘のPythonが内蔵されていて、ローカルで動きます。 [参考] Kazuhiro AbeさんはTwitterを使っています: 「インタプ

                                iOS上で動作する革命的ものづくり環境「Pythonista 3」の魅力をとくと語る
                              • 子どもがいる家庭で使うRaspberryPi&Slack

                                皆さんRaspberry Pi使ってますか?買ったけど使いみちが無くてほったからかしと言う方も多いのでは無いでしょうか。今回は、幼稚園~小学生くらいのお子様がいる家庭のリビングで使うRaspberry Pi(+ちょっとだけSlack)と言う内容です。電子工作はありません。 この記事は、家庭を支える技術 Advent Calendar 2016 – Adventar の13日目の記事として書きました。 色んな問題点 最近、子供が成長し写真や家族写真を撮らなくなった RasPi内の音楽再生をスマホで操作するのが面倒くさい 学校に出る時間など子どものルーチン的な事に関して毎日言うのが面倒 子どもに直接注意するのはエネルギー使う(宿題やったの?とか、自分の物くらい片付けて欲しいとか) 今日の予定や何ゴミかなど、スケジュールをいちいちスマホで見るのが面倒 と言うことで… 家ではこんな感じで使ってます

                                  子どもがいる家庭で使うRaspberryPi&Slack
                                • 第二世代人工知能の亡霊がもたらす”AIの冬”

                                  第二世代人工知能の亡霊がもたらす"AIの冬" AI Winter is coming!! 2016.11.21 Updated by Ryo Shimizu on November 21, 2016, 15:49 pm JST 日立が公開した「汎用人工知能」のプロモーションビデオが日本のAI業界で悪い意味での注目を集めています。 このビデオでは、日立は自社で開発したAI技術「H(エイチ)」を、「汎用人工知能」と自称しています。 しかし、「汎用人工知能」は、通常、AGI(Artificial General Intelligence)の訳とされ、人工知能研究のメインストリームでは、GoogleやFacebookなどを含めて「まだ世界の誰も開発に成功していない」ものとされています。 ビデオに登場する株式会社日立製作所、研究開発グループ技師長の矢野和夫氏によれば、このH(エイチ)は、「(カスタマ

                                    第二世代人工知能の亡霊がもたらす”AIの冬”
                                  • 3秒の音声があれば本人そっくりの声で日本語・英語・中国語合成できる「VALL-E X」はやはり脅威。MSが非公開にした技術のOSS版を試して実感した(CloseBox) | テクノエッジ TechnoEdge

                                    わずか3秒の元音声から本人そっくりな音声合成が可能な技術「VALL-E X」が誰でも使える形で公開されました。オープンソース版で、ローカルマシンからWebUIで利用できます。さっそくインストールして使ってみました。 以前、ディープラーニングベースの音声・歌声合成ソフトであるDiff-SVC、リアルタイム処理が可能なAIボイチェンRVCを紹介したとき、自分は記事タイトルに「驚異の」という形容詞を付けました。それでも学習には数十分の本人による音声データが必要で、そこまでのデータを用意するのは容易ではありません。それに対してVALL-E Xでは元データが3秒あれば本人に似た声を生成できるのです。

                                      3秒の音声があれば本人そっくりの声で日本語・英語・中国語合成できる「VALL-E X」はやはり脅威。MSが非公開にした技術のOSS版を試して実感した(CloseBox) | テクノエッジ TechnoEdge
                                    • 誰の声でも100人の声に変えられる声変換システム - Dwango Media Village(ドワンゴメディアヴィレッジ,dmv)

                                      著者の声を録画・録音して声を変換し元の映像と組み合わせてみた映像です。 このときの変換元の音声は撮影用のスマートフォンで録音しており、部屋の残響が含まれるなど声が少し不鮮明になる収録環境ですが、それでもしっかり声変換できていることがわかると思います。 概要 Dwango Media Villageの廣芝です。 誰の声でも狙った複数の人の声に変えることができる声変換システムを開発し、実際に声を変えることができるデモページを公開しました。 (2022年5月 SeirenVoiceシリーズの製品化に伴いデモページは終了しました。) この記事では、声変換技術を研究開発する際に取り組んだ課題について紹介します。 声の変換技術には、リアルタイム性と品質のトレードオフがあります。 既存の声変換システムはリアルタイム性を重視する傾向がある一方、品質を重視したものはあまり見かけません。 品質を優先した声変換

                                        誰の声でも100人の声に変えられる声変換システム - Dwango Media Village(ドワンゴメディアヴィレッジ,dmv)
                                      • 商業音楽がボカロ音楽に勝てない理由 - はてなポイント3万を使い切るまで死なない日記

                                        ニコニコ動画というサイトがある。 知っているひともいるかもしれないが、ちょうど一昨日に民主党の代表選の生中継をやっていて、それがニコニコ動画のこれまでの最大アクセスの記録を更新したらしい。 それ以前は、はやぶさの地球への帰還の生中継が最高記録だったという。 つまり、ニコニコ動画で、もっとも人気のあるジャンルは政治であり、2番目は宇宙ということだ。ニコニコという名前に似合わず、なかなか硬派なサイトだ。しかも、これが若い人たちのなかで飛び抜けて人気のあるサイトだというのだから恐れ入る。とかく批判されがちの最近の若者だが、案外、捨てたものじゃない。 そんな教養コンテンツ全盛のニコニコ動画であるが、ひっそりと、くだけたコンテンツもあったりする。ここで言及したいのはそのなかでもボカロ音楽というジャンルだ。 ボカロ音楽はYAMAHAがつくった音声合成歌唱ソフトVOCALOIDをつかって発表されている一

                                          商業音楽がボカロ音楽に勝てない理由 - はてなポイント3万を使い切るまで死なない日記
                                        • 30万円払って女性声優ユニットを地元に呼んだ話 - 湖底

                                          購入までの経緯 前回のクラウドファンディング 30万円は高いのか 実施まで 当日レポート 対戦開始 滋賀トーク ランナーに聞きたいこと チェキ完成 スペシャルライブ プリティーライブの話 じめんタイプ 直接お届けについて 別れの時 感想&告知 関連記事 購入までの経緯 それは去年10月1日のこと。 午後7時すぎ、いつものように社食で不味い晩飯を食いながらTwitterを開くと、つい数分前に推しユニット「Run Girls, Run!」の公式アカウントから新着ツイートの通知が。 推しメンである厚木那奈美さんのオンラインバースデーイベント(10/10)が迫っていたのでそれに関する告知かと思い開くと、「写真集」「クラウドファンディング」という想定外の文字が目に飛び込んできました。 ┏━━━━━━━┓ らんがちゃん 初めての写真集📸を つくろう プロジェクト ┗━━━━━━━┛ ユニット初の写真

                                            30万円払って女性声優ユニットを地元に呼んだ話 - 湖底
                                          • おじさんの心に芽生えた「美少女」 VRがもたらす、もう一つの未来

                                            自分のかわいらしさに心が跳ねる 男という外見が束縛してきたもの 今、おじさんたちが続々と「美少女」に 筆者、満56歳であります。分別盛り、世間的には定年も近い。恥ずかしながらこの年になって、心の中に「美少女」が宿っていることに気づきました。自分が美少女になって動くアプリケーションを使ったところ、今まで一切感じることのなかった少女の気持ちが心の中に生まれたのです。 最新のバーチャルリアリティー(仮想現実、VR)技術がもたらす圧倒的な没入感と表現力は、人の心の中にまで作用する力を持ち始めています。「おじさん」が「美少女の心」を感じるまでに何が起きたのか。専門家と一緒に考えてみました。 ヤマハの音声合成技術「ボーカロイド」を基に、クリプトン・フューチャー・メディアが生んだバーチャルシンガー初音ミク。オリジナルの持ち歌約10万曲、描かれたイラストは数知れず。今や世界ツアーも頻繁に行う、日本を代表す

                                              おじさんの心に芽生えた「美少女」 VRがもたらす、もう一つの未来
                                            • AIお姉ちゃんへの道 - nomolkのブログ

                                              ちょっと前に話題になっていたこの記事を読んだ。 honeshabri.hatenablog.com へー真似しよ〜と思ってやってみたら意外に難しくて謎のやりがいを感じ始めてしまい、仕事のクソ忙しい時期にかなりハマり睡眠不足で生命の危機を味わった。 おかげで寿命と引き換えに自分のAIお姉ちゃんを手に入れることができた。これは黒魔術か何かなのだろうか。 一通り終えて振り返ってみると、今まで生成AIをあまり積極的に触ってこなかった自分にとってはちょうどいい難しさの課題で、これは入門者向けのチャレンジとしてかなり良い気がする。 元記事に書かれていない少し細かい手順も含めてやったことを記録としてまとめようと思う。 初心者が試行錯誤でやったことなので誤りや非効率な手順もあるかもしれないけどご了承ください。 AIお姉ちゃんの姿を作る 元記事では「魂」、つまりChatGPTの設定から始まっているけど、それ

                                                AIお姉ちゃんへの道 - nomolkのブログ
                                              • 商用でも利用可能なAI音声合成ソフトウェア『VOICEVOX』がオープンソースとして無料でリリース|DTMステーション

                                                本日8月1日、音声合成技術の世界に、また画期的な動きがありました。「Seiren Voice」や「Yukarinライブラリ」の開発者としても知られるヒロシバ(@hiho_karuta)さんが、ITAコーパスを利用した商用利用も可能なAI音声合成システム、VOICEVOXなるソフトウェアをオープンソースのとして無料でリリースしたのです。具体的には現時点Windowsで動くシステムで、「ずんだもん」および「四国めたん」の声でテキストを読み上げるシステムとなっています。 これがオープンソースとなったことで、一般ユーザーが自由に利用できるというだけでなく、さまざまなシステムに組み込んで喋らせることが可能になったのが画期的なところ。たとえばロボットなどに組み込んで対話型のシステムを作ることや、観光案内システムに導入して喋らせる……といったこともできるほか、クラウド型のシステムを構築し、ブラウザを経由

                                                  商用でも利用可能なAI音声合成ソフトウェア『VOICEVOX』がオープンソースとして無料でリリース|DTMステーション
                                                • Windows 10は好きな文章を合成音声で簡単に喋らせることができる (1/2)

                                                  こんな簡単なコマンドで、Windowsは「しゃべって」くれる。画面キャプチャーでは声をお聞かせすることはできないが、お手元のWindows PowerShellで試してほしい スクリプトを作るとき、ちょっとユーザーの気を引きたくなることがある。たとえば、少し時間のかかる処理をするときに、終わったことを通知したい場合などだ。あるいは、実行後にすこし時間が経過してからエラーを通知するような場合にも、気を引きたくなることがある。 こんなとき昔のコンピューターならベル音やビープ音を鳴らすのが一般的だった。端末装置からコンピューターを使っていた頃、Ctrl+Gを出力するとベル音が鳴った。マイクロプロセッサが使われ始め、パソコンの原型ができあがった頃、BEEPと呼ばれる機能ができた。プログラムでビットをオンオフし、これをスピーカーに接続することで音を出していた。今もマザーボード上には、そのための小さな

                                                    Windows 10は好きな文章を合成音声で簡単に喋らせることができる (1/2)
                                                  • 19歳・東工大2年生が社長。音声合成界に衝撃を与えたCoeFont STUDIOが目指すこれからの世界|DTMステーション

                                                    4月23日、彗星のように現れたネット上のサービス、CoeFont STUDIO(コエ・フォント・スタジオ)は、誰でも無料で使える音声合成サービスということで、瞬く間に広がり、2日で累計ユーザー数が6万人を突破。すでに20万人を超えるところまで来ているようです。日本語でテキストを入力すれば、非常に滑らかな声でしゃべってくれ、その音声をユーザーは商用を含めて自由に利用できるという画期的ともいえるサービスとなっているのです。 このサービスを立ち上げたのは、なんと東京工業大学2年生、19歳の早川尚吾さん。株式会社Yellstonを立ち上げ、その新サービスとして、CoeFont STUDIOをスタートさせたのです。もちろん株式会社ですから、今後ビジネス展開をしていくことを目論んでいるわけですが、それはCoeFont STUDIOの延長線上にあるもので、世の中を大きく変えていく可能性もありそうです。先

                                                      19歳・東工大2年生が社長。音声合成界に衝撃を与えたCoeFont STUDIOが目指すこれからの世界|DTMステーション
                                                    • 参考になるiOS開発関連の良記事まとめ、ライブラリ、プログラミング、UI/UX、プロモーションのメモ - showrtpath - iOSブラウザ開発日記

                                                      2013-12-20 参考になるiOS開発関連の良記事まとめ、ライブラリ、プログラミング、UI/UX、プロモーションのメモ iOS開発で参考になる記事をまとめました。自分のメモも兼ねています。 今後、新しい記事を発見次第追加していきます。 ライブラリのまとめ ブラウザ開発で使用した超絶便利なオープンソースライブラリ10選 - showrtpath - iOSブラウザ開発日記 街のカタログアプリ「Here」で利用しているiOSライブラリのまとめ | heathrow.lab [iOS] iOS 7対応アプリで使いたいライブラリ4選 +α | アドカレ2013 : SP #17 | Developers.IO iOS開発で使って便利だったオープンソースライブラリ - Mokosoft開発者ブログ Q&Aアプリで使用した便利なiPhoneライブラリ | nanapi TechBlog [iOS]

                                                      • 朝目新聞-asame.com

                                                        今回テーマ:ジョジョ4部 『『働きたいと思っても働けないので ― そのうち露伴は考えるのをやめた。』 by QPさん(decorations) 『G戦場ヘヴンズ・ドアー』 by もなさん(Pixiv) <4/23> 4/23 <ゲーム-話題>までアップ。来週の現場が、トラブルで凄まじいスケジュールになりました。泣けるぜ。 ≪今回イチオシ≫ ●藤子F三大短編「ミノタウロスの皿」「ウルトラスーパーデラックスマン」 ●ゲームで「これ出来なかったわ…」って裏技やテクニック SNK系格ゲーの複雑なコマンドはもちろん、バーチャの崩撃雲身双虎掌なんかも全然ダメでした。 ●ペルソナ3のラスト、悲しすぎる ●RPGの元祖Wizardry、復活か ささやき - いのり - えいしょう - ねんじろ! ●お前らがスパロボシリーズでガチで一番カッコいいと思った戦闘アニメを挙げてけ ●エヴァンゲリオン ANIMAと

                                                        • 達人出版会:技術系電子出版・電子書籍

                                                          探検! Python Flask Robert Picard, 濱野 司(訳) BareMetalで遊ぶ Raspberry Pi 西永俊文 なるほどUnixプロセス ― Rubyで学ぶUnixの基礎 Jesse Storimer, 島田浩二(翻訳), 角谷信太郎(翻訳) 知る、読む、使う! オープンソースライセンス 可知豊 きつねさんでもわかるLLVM 柏木餅子, 風薬 Pythonではじめるゲーム制作 超入門 知識ゼロからのプログラミング&アルゴリズムと数学 廣瀬 豪 図解 深層学習 数理で理解する基本原理 小池 敦 独習 ガロア理論 新妻 弘 徹底攻略 情報セキュリティマネジメント教科書 令和6年度 瀬戸美月, 齋藤健一 エンジニアが知っておきたい思考の整理術 複雑な情報を【理解する】【伝える】テクニック 開⽶ 瑞浩 エンジニアのためのChatGPT活用入門 AIで作業負担を減らすた

                                                            達人出版会:技術系電子出版・電子書籍
                                                          • ディズニー、アニメ映画の3DCGデータを無償公開 “モアナの島”丸ごと約45GB分 研究用途に期待

                                                            米Walt Disney Animation Studiosが、ディズニーのアニメ映画「モアナと伝説の海」に登場する島の3DCGデータアセットを無償公開。研究開発に役立ててほしいという。 米Walt Disney Animation Studiosはこのほど、ディズニーのアニメ映画「モアナと伝説の海」(2016年)に登場する架空の島「モトヌイ島」の3DCGデータアセットを無償公開した。研究目的やソフトウェア開発用途に限り自由に使える。 公開されたデータには、島に生息する木や植物、岩、海、海中生物、雲などを含む150億以上の要素が含まれているという。島全体を静止画として書き出すために必要なデータだけで約45GB、アニメーションとして動かす場合に必要なファイルはさらに約24GBにも上る。 データのライセンス要項、アイテムごとの解説などは、同時に公開されたReadMe(PDF)から確認できる。

                                                              ディズニー、アニメ映画の3DCGデータを無償公開 “モアナの島”丸ごと約45GB分 研究用途に期待
                                                            • Cloud Vision APIの凄さを伝えるべくRasPi botとビデオを作った話

                                                              (この記事はGoogle Cloud Platform Advent Calendar 2015の12月3日分の記事です) Cloud Vision APIと私 Googleに入ってからまもなく5年、Google Cloud Platformのデベロッパーアドボケイト(エバンジェリストみたいな役割)の仕事に就いてから1年が経ちました。仕事の半分はアジア地域向けの開発者コミュニティ支援で、残り半分はGCPの新製品ローンチの支援をグローバル向けに行っています。 特にここ半年は、TensorFlowをはじめ、GCPの機械学習系プロダクトのローンチ支援にフォーカスしています。TensorFlowはその序章で、公開前からAlphaカスタマー向けのスライドを作ったり説明やデモしたりしていました。 そうしたGCPの新しい機械学習系サービスのひとつが、Cloud Vision APIです。これはGoogl

                                                                Cloud Vision APIの凄さを伝えるべくRasPi botとビデオを作った話
                                                              • 30分で完全理解するTransformerの世界

                                                                はじめに 初めまして。ZENKIGENデータサイエンスチームのはまなすです。正式な所属はDeNAデータ本部AI技術開発部なのですが[1]、業務委託という形で今年度から深層学習系の開発等に携わっています。 深層学習界隈では、2017年に衝撃的なタイトル(Attention Is All You Need)の論文が発表されてから早5年半、元出自の機械翻訳タスクを大きく越えて、Transformer関連の技術が様々な領域で用いられる汎用アーキテクチャとして目覚ましく発展し続けています。 今回はそんなTransformerが現時点までにどのように活用されてきたか、また、どのように工夫されてきたかをざっくりと俯瞰し、流れをおさらいする目的の記事になります。本記事の大枠は、2021年時点でのサーベイ論文である A Survey of Transformers に倣いつつ、適宜、2023年2月上旬現在ま

                                                                  30分で完全理解するTransformerの世界
                                                                • Clubhouse リアルタイム配信の仕組みについて (妄想編)

                                                                  Cloubhouse はすでに OSS である Janus Gateway に切り替えており Agora は使用していないようです ライセンス Creative Commons — 表示 - 非営利 - 改変禁止 4.0 国際 — CC BY-NC-ND 4.0 前提 @suthio_さんがつぶやいていたのがきっかけ https://twitter.com/suthio_/status/1353945619577008128?s=20 招待してくれた @dmnlk さんに感謝 DNS パケット見ただけ 他の方の解析は見ていない クライアント側の処理は知らない 気が向いたら更新している 著者 商用 WebRTC SFU 開発者 WebRTC プロトコルスタック実装者 End to End Encryption プロトコルスタック実装者 IRIAM 配信サーバ設計者 妄想 求人にメディアサーバ

                                                                    Clubhouse リアルタイム配信の仕組みについて (妄想編)
                                                                  • バンナム、約42万フレーム分のモーションデータ無償公開 歩行、格闘、ダンスなど 研究用に

                                                                    ライセンスは「CC BY-NC-ND 4.0」で、利用の際にクレジットを表示すること、非営利でのみ利用すること、内容を改変しないことを求めている。 バンダイナムコは、メタバースやXR技術が広まる中、コンテンツ規模が拡大すると従来のモーション制作過程では限界を迎えると予想。AIを活用したキャラクターのモーションを生成する研究を行っている。 一方、AIによるモーション研究はデータセットの入手が難しいため研究開発が進んでいないとして、自社で使っているデータの一部を提供することにしたという。 関連記事 実在しない顔の画像3000点を無償配布、AI学習用データセットに 法人向け・商用利用可 AI活用のコンサルティング事業を手掛けるAPTOなど2社が、AIの学習データとして利用できる、実在しない男女の顔写真3000枚の無償配布を始めた。法人を対象に11月30日までの期間限定で提供し、商用利用も認める。

                                                                      バンナム、約42万フレーム分のモーションデータ無償公開 歩行、格闘、ダンスなど 研究用に
                                                                    • 西川善司の3Dゲームファンのための「ラブプラス」グラフィックス講座 DSの3D能力を超えた5,000ポリゴンキャラクターをレンダリングする技術に迫る - GAME Watch

                                                                      西川善司の3Dゲームファンのための「ラブプラス」グラフィックス講座 DSの3D能力を超えた5,000ポリゴンキャラクターをレンダリングする技術に迫る 会場:KONAMI本社 本連載は、センセーションを与えた3Dゲームグラフィックスにスポットをあてていく連載である。 本連載ではこれまではどちらかと言えばハイエンド技術ばかりに目が向けてきたわけだが、PS3やXbox 360といったハイエンド現行機が普及期/熟成期に突入した今は、そうしたホットトピックに巡りあう機会が減ってきたように思える。これは、全体的な技術の底上げが行なわれてきたと言うことであり、喜ばしい反面寂しい気もする。 そんなわけで、これからは、アーティスティックな方向性で一工夫ある斬新な表現や、ユニークなアプローチの技術にも目を向けなければ、と思っていた矢先に、注目せざるを得ないタイトルと遭遇した。 それが今回取り上げる「ラブプラ

                                                                      • ひろゆき氏が明かす、「ニコニコ動画が人気な理由」と「コミュニティ運営のコツ」:インタビュー - CNET Japan

                                                                        ニワンゴが運営する動画コミュニケーションサービス「ニコニコ動画」の勢いが止まらない。 当初YouTubeなど外部サイトの動画にコメントを付けられるサービスとして開始したものの、アクセス数が伸びすぎてYouTubeから接続を遮断される事態に。その後、動画投稿サービス「SMILEVIDEO」を自社で開始し、猫が土鍋の中で眠る「ねこ鍋」や、音声合成ソフト「初音ミク」を使った楽曲など、ニコニコ動画発のヒットコンテンツも数多く生まれている。3月5日には「ニコニコ動画(SP1)」という名称に変わり、これまで会員でないと見られなかった動画も、提携サイトに掲載して誰でも見られるようにした。会員数は3月に560万人に達し、今後は、他社とは違う「明後日(あさって)の方向へ進化」すると打ち出している。 CNET Japanではニワンゴの取締役管理人であり、2ちゃんねるの管理人「ひろゆき」としても知られる西村博之

                                                                          ひろゆき氏が明かす、「ニコニコ動画が人気な理由」と「コミュニティ運営のコツ」:インタビュー - CNET Japan
                                                                        • XRと私|xyx

                                                                          VRChatは実質無料 VRChatを使用しているといつの間にかPCやVRデバイスを買っていたり、創作に目覚めてプロ向けソフトを買って数万円~数十万円が消滅する現象。私の場合、”VRChatをやっていたら転職していた件について”。 客観的にはこの記事もまたありふれた「お気持ち表明」だけど、この判断をしたことを後悔しないように、過程を公開記述しておこうと思う。もしかすると面白い読み物になるかもしれない。 端的にいうと、VRChatで出会った人たちに心動かされて、そしてVRの可能性を再び目の当たりにして、この流れにどう貢献できるかと考えた結果転職するのが最善という結論に至った。 思い返してみると、2012年に初代Oculus Rift DK1を支援した前後の数年間は、ARとVR、つまりXR全体に対してかなり色々な思いがあったはずなのに、業務でプログラムを書くようになってからは久しく忘れていた。

                                                                            XRと私|xyx
                                                                          • Siriの音声入力でWebサービスを起動する「Siriランチャー」を作ったら驚くほど便利だったので公開します - Chrome Life

                                                                            先日リリースされたiOS5.1ですが、皆さんは無事アップデートできたでしょうか? 筆者は、リリース当日は混み合っていたせいなのか分かりませんが、アップデートできずに翌日ようやくアップデートできました。 今回のアップデートでは、Siriが日本語対応したということで多くの方が試されたと思います。 最初は、面白半分でいろいろ話しかけてはみたのですが、実用的に使えそうな部分はあまりありませんでした。 筆者の感想は 音声の認識率は高めだが、音声合成がヒドすぎる! と感じました。 英語の場合の音声合成は良かったみたいですが、日本語はとても気持ち悪い機械音声なので使う気になりませんでした。 しかし、音声の認識率は優秀な方だと思います。 このSiriを導入したことで、テキストの入力がキーボードだけでなく音声でも入力できるようになっています。 この機能を見た時に、音声でいろいろ指示ができると面白いんじゃない

                                                                            • 第11回ハヤカワSFコンテスト特別賞受賞作にして、刺さる人にはこれ以上なく深く刺さる物語──『ここはすべての夜明けまえ』 - 基本読書

                                                                              ここはすべての夜明けまえ 作者:間宮 改衣早川書房Amazonこの『ここはすべての夜明けまえ』は、第11回ハヤカワSFコンテストの特別賞を受賞したSF中篇(もしくは短めの長篇といえるかぐらい)だ。特別賞は長さが短めだったり一点突破の魅力があったりで受賞する作品が多いが(たとえば過去事例で代表的なのといえば草野原々の「最後にして最初のアイドル」など)、本作も「刺さる人にはこれ以上なく深く刺さる」、2100年代を舞台にした、問題まみれの家族の物語だ。 とある理由からひらがなだらけの文章で物語が始まるので面食らうのだが、設定開示の順番は心地よく、すぐに作中世界へと入り込んでいくことができる。単行本になる前からゲラが配られたりSFマガジンに全文掲載されたりしていたのでエモいエモいと評判だけは聞いていたのだけど、実際に読んでみたらたしかにこれはエモーショナルな物語だ。しかし、ただ感動させよう、感動さ

                                                                                第11回ハヤカワSFコンテスト特別賞受賞作にして、刺さる人にはこれ以上なく深く刺さる物語──『ここはすべての夜明けまえ』 - 基本読書
                                                                              • AIの力で自分の声を好きな声にリアルタイム変換できるボイスチェンジャー「MMVC」が登場

                                                                                自分の声を美少女ボイスやイケメンボイスに変換してくれるボイスチェンジャーは、ライブ配信やムービー投稿の際にありがたい存在です。しかし、ボイスチェンジャーによって変換できる音声は固定されており、自分好みの音声に変換できるボイスチェンジャーを見つけるのは困難です。天王洲アイル氏は、この問題をAIを用いて解決する方法について解説し、さらにAIの力で自分の声を好みの声にリアルタイム変換できるボイスチェンジャー「MMVC」を公開しています。 VRChatなどの登場によって誰でも好きなアバターを使って好きなキャラクターになりきることが可能となりました。また、自分の声を美少女ボイスやイケメンボイスに変換できるボイスチェンジャーも多くの種類が存在しています。しかし、既存のボイスチェンジャーには「理想的な結果を得るためにはボイスチェンジャーに合わせた発声練習が必要」「リアルタイム変換が不可能なため、会話やラ

                                                                                  AIの力で自分の声を好きな声にリアルタイム変換できるボイスチェンジャー「MMVC」が登場
                                                                                • 「カブトクワガタ」は日本のゲームアクセシビリティの革命である

                                                                                  3行で 「カブトクワガタ」に搭載されている読み上げ機能によって、画面を見ることができない全盲のプレイヤーがゲームを楽しめるようになっています。 視覚に障害を持つプレイヤーだけでなく、未就学児や、文字を読むことに困難を抱える人など、色々な属性の人がプレイできるようになっていると思います。 システム面・技術面の両方において、「カブトクワガタ」は日本のゲームアクセシビリティに革命をもたらすポテンシャルがあり、その事実が、開発者を含めた多くの人に知られることを臨みます。 ※最終更新: 2023/07/27 カブトクワガタってなんやねん カブトクワガタ は、Nintendo Switchのゲームです。クワガタやカブトムシを育てて戦うRPGです。2023年3月15日にリリースされました。 なにがすごいのか ほぼ全ての文字を読み上げる このゲームは、画面に表示されるほぼ全ての文字を読み上げてくれます。本