カンペ見ても「カメラ目線」へ自動補正 動画のAI吹き替えツール「Captions」にPC版、実際に試してみた:小寺信良の「プロフェッショナル×DX」(1/3 ページ) 2023年7月にiOSアプリ「Captions」を紹介した。動画をアップロードすると、指定した言語へ翻訳した字幕を付けてくれるだけでなく、なんとオリジナルの声質をまねて別言語でアフレコまでしてくれるというツールである。 昨年紹介した段階ではまだPC向けアプリは一般公開されていなかったが、まだβ版ではあるものの、その後公開が始まっている。基本的にはクラウド上で処理するので、アプリは単なるコントローラーおよびI/Oインターフェスにすぎないが、実際にコンテンツに利用するためには、スマホアプリだけではハンドリングが良くない。特に編集をデスクトップアプリで行っている場合は、デスクトップ版があってこそ、利用しやすくなる。 現在Capti
指定した USB ドライブ内で、ファイルの読み取り&書き込み を実行できないようにするソフト。 あらかじめ設定しておいた PIN(暗証番号)が入力されるまで、USB ドライブ内のファイルを “ 見えない&アクセスできない ” 状態にし、なおかつファイルの書き込みも行えない状態にすることができます。 FAT32 でフォーマットされた USB ドライブ内でしか使うことはできませんが、フォーマット等の事前準備なしですぐに使うことが可能となっています。 「USB Lockit」は、その名のとおり USB ドライブをロックすることができるソフトです※1。 1 FAT32 でフォーマットされた USB ドライブにのみ対応。 指定した USB ドライブをロックダウンし、 中身のファイルを、“ 見えない&アクセスできない ” 状態にする 対象のドライブ内に、ファイルをコピーしたりできない状態にする ことが
Dreamtonicsが開発する歌声合成ソフト、Synthesizer Vは、これまでアップデートの度に世の中に大きな衝撃を与えてきたのはみなさんもご存じのとおりですが、11月24日、また新たなバージョン、1.11.0を発表するとともに、そのβテスト版である1.11.0 Beta1が公開になりました。今年6月に登場した1.9.0ではラップを実現し、8月に登場した1.10.0では人間のフィードバックを強化学習するRLHFに対応してより上手に歌うようになったばかり。そして今回の1.11.0では歌わせるエンジン部分そのものというより、歌声合成ソフトとしてのツール部分を大きく進化させ、まさにDTM界に衝撃を与える機能を実現させたのです。 その1つ目は、人の歌声を元にスコアを作成すると同時に歌詞も入れ込んでしまうという機能の実現です。昔から鼻歌を元にスコアを作るという技術はありましたが、それらとは次
Kotlinなどの開発元として知られるJetBrainsは、テクニカルドキュメントのための一連のツールを統合したドキュメントオーサリングツール「Writerside」のプレビューリリースを発表しました。 ソフトウェア開発においては、テキストで記述されたソースコードをGitでバージョン管理し、ビルドによって複数のソースコードを1つのアプリケーションへとまとめ上げ、コンパイルし、テストをして本番環境へのデプロイによりアプリケーションを公開します。 そしてこのプロセス全体を、さまざまな機能を備えたツールチェンを用いて自動化することで、ソフトウェア開発の効率を高めています。 一方で、例えばアプリケーションのチュートリアル、SDKやAPIのリファレンスドキュメントなどのドキュメントの制作過程においては、複数のファイルをフォルダにまとめ、手作業で目次のページとリンクさせることや、ソースコードのサンプル
「仕事の大体全部をChatGPTとやっています。個人的に依存度はかなり高いですね」――ChatGPTを使い倒していると話すのは、「深津式プロンプト」などで知られる深津貴之さん(THE GUILD 代表)だ。 ChatGPTをはじめとする生成AIは、さまざまな業務や日常生活のシーンを変革する可能性があるとして、活用の道が模索されている。そんな中、ChatGPT活用の第一人者・深津さんと、AI研究の第一人者・松尾豊さん(東京大学 教授)が約1時間にわたり対談した。 2人はChatGPTをどのように活用しているのか。両者が登壇したITmedia主催のオンラインイベント「Digital Business Days -SaaS EXPO- 2023 Summer」(8月22日~9月10日)の講演の一部をお届けする。 「ボタン1つで“身代わり”が授業」 開発中のツールとは? 深津さんは、企画の立案やレ
株式会社クラウドネイティブは、Azure OpenAIで自組織専用のChatGPTの構築を支援するサービスを展開しています。ChatGPTとAzure AD OpenAI Serviceの取り組みや事例、支援… IDチームの前田です。今日は生成AI(ChatGPT)と音声認識モデル(Whisper)を利用した会議アシスタントツールに関する投稿になります。 (追記) 作ったツールはGitHub上で公開しており、Dockerを利用してすぐに試せるようになってます。 https://github.com/cloudnative-co/mtg-ai-assistant 2023年8月30日現在Azure OpenAIにてWhisperが利用出来ていないため、OpenAI Whisper APIを利用した試験段階のものになります。近日中にAzure OpenAIにてWhisperが利用出来るとアナウ
ウェブ上でリッチテキストエディタを構築するためのオープンソースのツールキットが「ProseMirror」です。商用利用可能なライセンスになっており、もともと2015年にクラウドファンディングで約790万円を超える金額を集めて開発が始まったもの。ニューヨークタイムズ・Atlassian・asana・Box・Evernoteなども継続的な開発をサポートしています。共同編集が可能な構造で、プラグイン形式によって独自の拡張を盛り込むこともできる高機能なツールキットになっており、マークダウン形式とWYSIWYMの切替、ツールチップの実装、画像のアップロード、独自メニューの構築、linterによるスキャンでエラー検出してユーザーが修正できるようにする、コンテンツ内に脚注を追加、変更履歴を保持して各ユーザーがここの変更を調べて元に戻せるようにする、などなどウェブアプリ開発で求められる機能が柔軟に追加でき
【無料配布】任意のオーディオソースをMIDIに変換できる最先端のオーディオプラグイン DamRsn「NeuralNote」がリリース&無料配布中!! 2023年5月13日土曜日 無料製品 任意のオーディオソースをMIDIに変換する最先端のオーディオプラグイン DamRsn「NeuralNote」がリリース&無料配布中となっております。 任意のオーディオソースをMIDIに変換できる最先端のオーディオプラグイン DamRsn「NeuralNote」がリリース&無料配布中となっております。 NeuralNote は、最先端のオーディオから MIDI への変換をお気に入りのデジタル オーディオ ワークステーションにもたらすオーディオ プラグインです。 あらゆる音楽器に対応 (音声を含む) ポリフォニック転写をサポート ピッチベンドをサポート 軽量で非常に高速な転写 プラグインで直接、転写された M
We’ve created GPT-4, the latest milestone in OpenAI’s effort in scaling up deep learning. GPT-4 is a large multimodal model (accepting image and text inputs, emitting text outputs) that, while less capable than humans in many real-world scenarios, exhibits human-level performance on various professional and academic benchmarks. We’ve created GPT-4, the latest milestone in OpenAI’s effort in scalin
ChatGPT Plusのメリットは以下の3点。 ピーク時のアクセス優先 レスポンス時間の短縮 新機能と改善への優先アクセス 無料版の提供は今後も続ける。OpenAIは、有料版を提供することで、より多くの人に無料版を提供できると説明した。同社のサム・アルトマンCEOはかつて、インフラのコストが非常にかさむので「どこかの段階で有料にしなければならない」と語り、1月には有料版の検討を始めたと発表している。 同社はChatGPTのAPI公開も予定している。さらに、より低コストのプラン、ビジネスプラン、データパックのオプションも検討しているという。 関連記事 OpenAI、テキストが人間によるものかどうか判定するツールを無料公開 ChatGPTを手掛けるOpenAIは、テキストがAI生成かどうかを判定するツールを無料公開した。1000文字以上の英文であれば、比較的高い精度で判定できるとしている。特
レーサー兼インディーデベロッパーのMike Bushell氏とパブリッシャーのVital Groupは、電子回路シミュレーター『CRUMB Circuit Simulator』のPC版の配信をSteamで開始しました。 本作は、回路を3Dで再現して簡単に電子回路の試作をできるようにしたシミュレーターで、iOS/Android向けに今年の8月に配信されました。ブレッドボードにコンデンサやトランジスタなどの部品を組み込んで自由に回路を作っていきます。 完成した回路はオシロスコープや解析ビューなどを用いて、電圧や電流を計測できます。部品の購入や故障を避けて回路の試作と簡単なテストができるため、基本を学びたい初心者から回路を試したい熟練者まで幅広く楽しめます。 今後もアップデートが予定されている『CRUMB Circuit Simulator』は、PC(Steam)/iOS/Android向けに配
写真に写り込んだ不要な被写体や、画像の中に含まれる邪魔な文字など、画像の一部を消したい状況は多く発生します。画像の中の不要な部分をキレイに削除できる無料ツール「Lama Cleaner」を見つけたので、PCへの導入方法や使い方をまとめてみました。 GitHub - Sanster/lama-cleaner: Image inpainting tool powered by SOTA AI Model https://github.com/Sanster/lama-cleaner Lama CleanerはPython向けのパッケージ管理システム「pip」を用いてインストールすることもできますが、今回はPythonなどの準備が整っていないPCでも一発で「Lama Cleaner」をインストールできる「Lama Cleaner One Click Installer」を使ってPCにインストール
英字新聞社ジャパンタイムズ、スタートアップメディア・テッククランチでの記者経験を経て、ダイヤモンド社のスタートアップ担当記者に。最近はフードテックやモビリティ領域に注目している。趣味はギターやシンセサイザーだが総じて下手。2020年7月よりダイヤモンド社「DIAMOND SIGNAL」記者。 From DIAMOND SIGNAL スタートアップやDX(デジタルトランスフォーメーション)を進める大企業など、テクノロジーを武器に新たな産業を生み出さんとする「挑戦者」。彼ら・彼女にフォーカスして情報を届ける媒体「DIAMOND SIGNAL」から、オススメの記事を転載します。※DIAMOND SIGNALは2024年1月をもって、ダイヤモンド・オンラインと統合いたしました。すべての記事は本連載からお読みいただけます。 バックナンバー一覧 Adobeによるコラボデザインツール運営のFigma買収
仕事用のマシンをWindows 11で新しく組むことにした。今使っているマシンのCPUは第4世代Coreなので、メモリー増設もCPU交換も限界。そもそもWindows 11ではサポートされていないため、潮時と考えた。 こういう場合は問題を引きずらないように、Windowsは新しいドライブに新規インストールすることにしている。ドライブのイメージコピー(クローン)は楽だが、潜在的なものを含めトラブルも「コピー」してしまう可能性がある。 Windows XPの頃に比べれば、システムの引っ越しはラクになったが、相変わらずアプリケーションは手作業で入れ直す必要がある。環境設定作業が面倒になるので、どうしても代替品がないときを除いて、筆者はインストール台数が制限されているアプリケーションは使わないことにしている。いきなりマシンが動かなくなった場合に、短時間で環境を再構築できない可能性があるからだ。そう
厚生労働省が公開している新型コロナウイルス接触確認アプリ(COCOA)では、新型コロナウイルス感染者との濃厚接触通知を受け取ることができます。しかし、COCOAで確認できる情報は少なく、「もっと多くの情報を知りたい」と感じたことがある人も多いはず。「COCOAログ.jp」を使えばCOCOAが記録した情報をもとに感染者が近くにいた日付や時間などの詳細情報を確認できるとのことなので、実際にCOCOAログ.jpを使う手順を確認してみました。 COCOAログを詳細分析できるツール - COCOAログ.jp https://cocoalog.jp/ COCOAログ.jpにアクセスすると、以下のような画面が表示されます。COCOAログ.jpを使うには、自身のスマートフォンにインストールしたCOCOAの情報を読み込ませる必要があるので、まずはCOCOAを起動します。 COCOAを起動したら「陽性登録者と
・cocoaアプリを開く ・「陽性登録者との接触結果を確認」押す ・「情報を保存」押す ・「コピー」を選ぶ ・コピーされたログを↑フォームに貼り付け ・分析結果が表示される。(サンプル)
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く