タグ

ブックマーク / note.com/takahiroanno (2)

  • 30代男性の早口はどこまでMMVC1.5で変換できるのか検証してみた|Anno Takahiro

    MMVCというリアルタイムボイスチェンジャーの実験をしてみたので記録を放流する。個人的にボイチェンの進化にはすごく興味がある。今後、AIの進化によってディープフェイクが溢れるのは間違いないと思うが、音声変換は一つの重要なモーダルを担っている認識だ。ひと昔前のボイチェンはピッチとフォルマントをうまく変換するだけという印象だった(VT-4など)が、最近はなんとニューラルネットベースのボイチェンもほぼほぼリアルタイムで動くようになってきたらしい。 MMVCはIsletennos (https://twitter.com/IsleTennos) さんという方を中心に開発が進んでいるOSSのボイチェンで、ほぼリアルタイムで動かせる。モデルの学習は必要だが、変換元の音声と変換先のターゲットの音声を十分に集めれば声質を変換できる(v1.5からは読み上げ音声に対応するテキストデータすらいらなくなる、すごい

    30代男性の早口はどこまでMMVC1.5で変換できるのか検証してみた|Anno Takahiro
    sh19910711
    sh19910711 2023/04/09
    "MMVC: OSSのボイチェンで、ほぼリアルタイムで動かせる + モデルの学習は必要だが、変換元の音声と変換先のターゲットの音声を十分に集めれば声質を変換できる / v1.3はビブラートがかかってしまう不自然さがある"
  • 良い"空気"のスタートアップを作る技術|Anno Takahiro

    手前味噌だが、弊社のオフィスではそれなりに良い”空気”が漂っているのではないかと自負している。やはり働くにあたってどういう”空気”で働くかは重要だと考えている。”空気”といっても、「人々の気持ちを支配するようなその場の雰囲気」のことではない。文字通り「オフィスに充填された気体」のことを指して言っている。 なぜか弊社のCareers Deck(採用候補者向けのプレゼン資料)にも、空気に関する記載が多い。「採用候補者向けの資料に占める空気関連の記述領域の割合」は数あるスタートアップの中でも上位にい込むのではないだろうか。 働く場所における気体の”空気”を大事にする風潮は、COVID-19で「密を防ごう」という文脈から一気に加速した感じはあるものの、実はその前から割と言われるようになってきていたように思う。 リアルかオンラインかの議論以前に、CO2満載の会議室だけは撲滅したい。。あれは明確にハ

    良い"空気"のスタートアップを作る技術|Anno Takahiro
    sh19910711
    sh19910711 2022/03/28
    "空気と一言にいっても、いろいろな性質 / 推奨温度は研究によってバラバラ / 窓はほんの少しだけ開けておくことでも意味がある / 空調を『つける』か『つけない』か > 高度に政治的な判断が伴う"
  • 1