日本語処理にも革命!?分かち書きをせず高品質な事前学習を実現する CANINE がすごい 【論文速報】
日本語処理にも革命!?分かち書きをせず高品質な事前学習を実現する CANINE がすごい 【論文速報】
Formula E debuts Gen3 Evo race car: All-wheel drive unlocks 0-60 mph in 1.82 seconds
概要 Google翻訳APIをPythonで実行するでは、四苦八苦しながらも、Google翻訳APIにより、テキストファイルに書かれた英文を日本語に翻訳するPythonスクリプトを書いた。 元々の動機は論文の翻訳する際に、ちまちまGoogle翻訳にコピペするのが面倒くさいということであった。 そこで今回は、Pythonスクリプトを拡張し、PDFの論文を一気に翻訳するようにしたので共有したい。 そもそもなんで日本語に翻訳して論文を読むの? もちろん、細かい内容は原文を精読する必要がある。そりゃそうだ。 日本語で読む理由はなんといっても、論文の内容を俯瞰的に把握できるということに尽きる。 俯瞰的に把握できることで、以下のメリットがある。 俯瞰的に把握した上で原文を読むことになるため、より早く理解することができる。 俯瞰的に把握できるため、原文を読む前に、自分にとって読む必要がある論文かどうかか
(Image by Pixabay) 最近になって、こんな素晴らしい資料が公開されていたことを知りました。 この資料自体は著者のMoe Uchiikeさんが東大での講義に用いられたものだとのことですが、その内容の汎用性の高さから「これは全ての機械学習や統計学を実務で用いる人々が必ず読むべきドキュメント」と言っても過言ではないと思われます。 正直言ってこの資料の完成度が高過ぎるのでこんなところで僕がああだこうだ論じるまでもないと思うので、内容の詳細については皆さんご自身でまずは上記リンクから精読していただければと思います。その上で、今回の記事では「機械学習や統計学を『社会実装』する」ということがどういうことなのかについて、この資料を下敷きとした上でさらに僕自身の経験や見聞を加えて考察したことを綴ってみます。 機械学習や統計学と、社会との「ギャップ」 機械学習や統計学を、社会に「馴染ませる」
2-2.選定ポイント CPUは少しお手頃なRyzenを選択。その中でも第2世代と第3世代で悩みましたが、電力消費量など含めてコスパも良いかなと思い、第3世代で選択。CPUファンはとりあえず付属品としてCPUに付いてくるクーラーで賄いました。 GPUは20××シリーズにしたいなと思いつつ、予算の関係でコスパが良いと聞いたGTX1660を選択。 メモリは16Gだと少し不安な気がしたので32Gで良さそうなものを探しました。 SSD、HDDは特に根拠なく選択。今となっては過剰だったかなと思っています。 マザーボードはCPUに合わせて良さそうなものを探しました。 電源ユニットは、横浜Fマリノスのスポンサーというところだけでオウルテック製品を選択。GPU1枚だけしか載せない想定なので、650Wあれば十分かと思っています。 ケースはAmazonで評価高めなのをそのまま選んだ感じです。 モニターはすでに購
著者のLuke Posey氏は、機械学習エンジニアのキャリアを積んだ後にAIスタートアップSpawner.aiを創業するかたわらMediumに記事を投稿しており、AINOW翻訳記事『無闇にデータサイエンティストを雇うのをやめよう。』の著者でもあります。同氏が最近Mediumに投稿した記事『機械学習エンジニアは10年後には存在しないだろう。』では、近い将来、「機械学習エンジニア」という職種が実効的な意味を持たなくなる、と予想が論じられています。 第三次AIブーム黎明期の頃、機械学習エンジニアは数学と統計学に関する専門知識を習得しているという希少さゆえに、高く評価され高額報酬を手にしていました。この職種には、最先端の技法を製品やサービスに落とし込む「研究者兼技術者」という立ち位置が依然として求められています。 しかし、近い将来、機械学習エンジニアには研究者としての側面が求められるなくなるだろう
国立交通大学の研究チームが開発した「Adversarial Colorization Of Icons Based On Structure And Color Conditions」は、手書きのスケッチをフラットカラーイラストに変換するGAN(Generative Adversarial Network)を用いた手法だ。ユーザーが描いた輪郭画像を入力としてネットワークが受け取り、カラー化されたアイコン画像を出力する。 線画から着色する同様のアイデアは、キャラクターのカラー化にも採用されており、User-Guided Deep Anime Line Art Colorization with Conditional Adversarial Networks [Ci et al. 2018] などで実証されている。 今回提案するGANアーキテクチャは、生成器と識別器を1対1で敵対させる方式で
はじめに 申し訳ありませんが競馬用語の解説は省きます。競馬に興味がある人が読んでいると思うので。 netkeiba.comで公開されている情報(スクレイピングでとってくる情報) には血統、走破タイム、走行距離等色々あります。前提として、スクレイピングしたデータをそのままモデルに fitさせたところで何も予想してくれません。情報を選別、整理、分析していく必要があります。 データの分析の方針を決める前に、まずは仮説として、 レースが始まってから最後の直線まで色々あったが、上り3ハロンで馬は残る力全てをもって走り切り ゴールを通過した順に着順が決まる とします。当たり前だと思われるかもしれませんがこれにより考慮すべき情報が絞れます。 私が分析を進める上で使用しているデータは以下 ・ラップタイム →レース全体のペース、レースのグレードを評価 ・レースの種類芝orダート/距離 →数あるレースの種類を
はじめに 現在、機械学習エンジニアとしてお仕事をしています。 一応、会社での立ち位置は機械学習エンジニアですが、SESなので、 やることは現場によってまちまちです。今は分析をしつつ推薦ロジックをつくっています。 まだ、この職について半年、実際に業務に携わって3か月くらいの新米のぺーぺーですが、 この半年を振り返りつつ、これからしたいこと、やってきた勉強などを書いていきたいと思います。 そして、私のような経歴の方で、機械学習に挑戦したい方の参考になればと思います。 綺麗事は、書くつもりはなく、ありのままの現実を書きますので、参考にしていただければ幸いです。 これは完全なポエムとなっています。ご了承を。 あと、僕のことを知ってる身内へ。 恥ずかしいので、あまり広めないでね。 私について 私は、地方私立Fラン大学出身です。 数学とプログラミングとは無縁の生活をしていました。 勉学と無縁だったと言
【はじめに】 本記事は 「機械学習をどう学んだか by 日経 xTECH ビジネスAI② Advent Calendar 2019」 の19日目になります。 おじさんSEの私がどうやって機械学習を勉強したかを記します。 きっかけは当時抱えていた分類課題において、「機械学習が使えるんじゃね?」というところから始まりました。 闇雲にやっていたので正直記憶は曖昧です。 経歴 プログラム歴は30年近くあります。 小学生の時に覚えたMS BASICから始まり、Z80アセンブラ、MC68000アセンブラ、FORTRAN、C(UNIX)、C++(Mac)、VB、Java(Android)、VB.NET、C#と触ってきました。 いろいろな言語に触れてきましたが、どれも極めるほどガッツリやっていたわけではありません。 機械学習に関しては20年以上前、いわゆる第二次AIブームの終わり頃に卒論のテーマでニューラ
ディープラーニングで自撮り画像をアニメ画像に画風変換してみました。試した理由などは、以下ブログ記事参照下さい。この記事では、具体的な実現方法を解説していきます。 ディープラーニングでアニメドラえもんの「うそつきかがみ」を再現してみた 以下のGitHubのリポジトリにあるソフトと学習済みモデルを使うと、自撮り画像をアニメ画像に画風変換することができます。 taki0112/UGATIT 学習から推論までできる素晴らしいソフトなのですが、単純に画風変換やりたい場合、ちょっと使い方が煩雑だったり、動画に対応させたかったりしたので、以下の3点を自分用に改造しました。 セットアップを簡単にした 自動的に顔周辺の画像を抜き出し 動画に対応 改造したリポジトリは以下となります。 karaage0703/UGATIT 以下使い方を説明していきます。環境は、Mac/LinuxとJetson Nanoを想定し
<blockquote class="hatena-bookmark-comment"><a class="comment-info" href="https://b.hatena.ne.jp/entry/4664099299855939745/comment/srgy" data-user-id="srgy" data-entry-url="https://b.hatena.ne.jp/entry/s/twitter.com/usage_based/status/1091681026483544066" data-original-href="https://twitter.com/usage_based/status/1091681026483544066" data-entry-favicon="https://cdn-ak2.favicon.st-hatena.com/64?url
ソーシャルメディアに登録された女性の顔写真を収集し、顔認識テクノロジーを使ってポルノサイトの画像と照合するサービスを開発したプログラマーが非難を浴びている。危険な悪用を防ぐためにも、プライバシー保護の世界的な取り組みが必要だ。 by Angela Chen2019.06.11 26 137 53 0 ドイツを拠点に活動する中国人プログラマーが激しい怒りを買っている。女性が過去にポルノに出演していたかどうかを「特定する」ために、顔認識テクノロジーを使ったとの疑惑だ。当の本人は非難されて以来、プログラムとデータをすべて削除したと発言しているが、あまりにも身勝手な行動だ。だが、こうしたサービスは欧州のプライバシー関連法には違反しているものの、その他の地域では問題にならないだろう。 ソーシャルメディアに登録されている女性の顔写真と、「ポルノハブ(Pornhub:カナダの大手ポルノ動画サイト)」のよ
Introduction今までは主に可愛い女の子の画像(or 動画)を生成することに取り組んできましたが、画面上に映せるようになったらやはり可愛い声で話して欲しいものです。そこで今回は、別の人の声が与えられた時に美少女声へと変換するための声質変換と、テキストが与えられた時に美少女声を生成するText-to-Speech(TTS)を行なった試行結果について述べようと思います。 Voice ConversionIntroduction声質変換のデータには2種類あります。それが、パラレルデータとノンパラレルデータです。以下にそれぞれの特徴を述べていきます。 パラレルデータを用いた声質変換 同じセリフを発する2種類の声を学習データとして用います。発話内容が同じのため、言語特徴を気にせず音響特徴量の変換を行うことが可能です。しかし、話速の違い等によって言葉を発するタイミングがずれてしまうのでDyna
Microsoftは5月6日(米国時間)、「Announcing ML.NET 1.0|.NET Blog」において、.NETアプリケーションに機械学習の機能を取り込むために設計された機械学習フレームワーク「ML.NET 1.0」を発表した。 「ML.NET 1.0」はMITライセンスの下でオープンソース・ソフトウェアとして公開されている。「donet / machinelearning | GitHub」から取得可能なほか、関連するドキュメントが「ML.NET - An open source and cross-platform machine learning framework」にまとまっている。 資料: Microsoft ML.NETはクロスプラットフォームで動作する機械学習フレームワーク。開発者はML.NETを利用することで、機械学習に関する専門知識を持っていなくても、機械学
Chainer チュートリアル 数学の基礎、プログラミング言語 Python の基礎から、機械学習・ディープラーニングの理論の基礎とコーディングまでを幅広く解説 ※Chainerの開発はメンテナンスモードに入りました。詳しくはこちらをご覧ください。 何から学ぶべきか迷わない ディープラーニングを学ぶには、大学で学ぶレベルの数学や Python によるプログラミングの知識に加えて、 Chainer のようなディープラーニングフレームワークの使い方まで、幅広い知識が必要となります。 本チュートリアルは、初学者によくある「まず何を学べば良いか」が分からない、 という問題を解決するために設計されました。 初学者は「まず何を」そして「次に何を」と迷うことなく、必要な知識を順番に学習できます。 前提知識から解説 このチュートリアルは、Chainer などのディープラーニングフレームワークを使ったプログ
AI先進国といわれるアメリカや中国とは一線を画したAI戦略をとるのが、北欧フィンランドです。教育を通じて、国民全体のAIリテラシーを上げ、1人ひとりが日々の生活や仕事にAI技術をどう活用できるか自ら考えられる社会を目指しています。 教育先進国フィンランドのAI教育 フィンランドは、経済協力開発機構(OECD)が3年ごとに実施している学習到達度に関する国際調査「PISA(Programme for International Student Assessment)」で、毎回上位に位置し、その教育制度は世界中から高く評価されています。 学校などの教育機関の枠を超えた「オープン教育」など、生涯学習支援も盛んです。就労年齢人口の半数以上が成人教育に参加するなど、教育への意識が高いことがわかります。 なかでも注目したいのは、ヘルシンキ大学がオープン教育の一環として、2018年5月から一般公開を開始し
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く