深津 貴之 / THE GUILD @fladdict THE GUILD。行動・認知・体験のデザイナです。 ネットを知の高速道路として復活させたい。 note.comもお手伝いしています。 書き物 → note.com/fladdict theguild.jp
MFCCとは MFCCは聴覚フィルタに基づく音響分析手法で、主に音声認識の分野で使われることが多いです。 最近だとニューラルネットワークに学習させる音声特徴量としてよく使われていますね。 2019.5.29訂正 Deep Learning for Audio Signal ProcessingによるとDeep Learningにおいては必要な情報が失われるためMFCCは使わずに、最後の計算ステップである離散コサイン変換を省いたメルスペクトラム(log-mel spectrum)が使われるそうです。MFCCは従来手法である隠れマルコフモデル、混合ガウスモデル、サポートベクターマシンで使われることが多いです。 今回はMFCC「メル周波数」や「ケプストラム」についても説明し、具体的なMFCCの実装方法も見ていきたいと思います。 メル尺度 心理学者のStanley Smith Stevensらによ
<目次> はじめに 第1回:コンピュータビジョン編 第2回:自然言語処理編 第3回:強化学習編 第4回:実務応用編 次回予告 1. はじめに GAN(敵対的生成ネットワーク)講座 現場で使える XAI(Explainable AI)講座 現場で使える自然言語処理実践講座 ディープラーニング最新論文対策講座 スキルアップAIでは、上記の4講座を始めとして、現在、そしてこれから注目されるであろう最先端の機械学習/ディープラーニング技術に関する講座を開講しております。このような講座を開講していく中で、スキルアップAIの講師陣が注目している最先端技術をぜひ知りたいというお声を多くいただきました。 そこで、自動機械学習(AutoML)を専門としICMLなどのトップカンファレンスへの論文採択経験もある斉藤と、需要予測・異常検知など様々な分野で機械学習/ディープラーニングの産業応用に取り組んできた小縣が
学習速度はなんと17倍!? StyleGANの学習速度を爆上げした論文「Projected GANs Converge Faster」解説機械学習DeepLearning論文読みGANstylegan2 はじめに 正しい情報を書くよう注意を払っていますが、間違っている可能性があります。 もし見つけた方はコメント等で教えていただけると幸いです。 3行まとめ 事前学習モデルをDiscriminatorに使用することで学習速度を17倍にした feature pyramidとrandom projectionを利用することで性能が向上した 少ない画像数でも低いFIDを実現 論文情報 NeurIPS2021 : http://www.cvlibs.net/publications/Sauer2021NEURIPS.pdf arxiv : https://arxiv.org/abs/2111.0100
顔検出の機械学習ではモデル作成も含め、OpenCVしか使ってなかったのでほかも使ってみることにした。 ということでMTCNN使ってみました。 MTCNNは裏側でtensorflow使ってるようですね。 ディープランニングに片足突っ込んでる感じでいい気分です。 準備 pip3 install cv2 pip3 install matplotlib pip3 install mtcnn pip3 install tensorflow # face detection with mtcnn on a photograph from matplotlib import pyplot from matplotlib.patches import Rectangle from matplotlib.patches import Circle from mtcnn.mtcnn import MTCNN
AIが人間の言葉ではない独自の言語を生成した──米テキサス大学オースティン校の研究チームは6月1日、そのような研究結果を示す論文を発表した。文章から画像を生成するAIが生み出す文字列は、意味不明なものであると思われていたが、それらの言葉は鳥や野菜などの意味を持つ“AI語”であったという。 論文で取り上げられたのは、米AI研究企業OpenAIが開発した「DALL-E 2」。文章から画像を生成するAIとして開発され、22年4月に発表された。その生成した画像のクオリティーの高さに「最新のAIやばすぎる」「個展開ける」など、驚きの声が上がっていた。 (関連記事:最新AIの描く絵が「ヤバすぎ」「個展開ける」と話題 文章から画像を生成する「DALL・E 2」、米OpenAIが発表) 一方「野菜と書かれた本がある」や「10カ国語で書かれた野菜という言葉」など、画像中に文言を入れるリクエストは苦手であると
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く