日本語処理にも革命!?分かち書きをせず高品質な事前学習を実現する CANINE がすごい 【論文速報】
日本語処理にも革命!?分かち書きをせず高品質な事前学習を実現する CANINE がすごい 【論文速報】
今年の1月にこんな話題を取り上げたわけですが。 この記事の最後にちょろっと書いた通り、実際にはこういう"too good to be true"即ち「そのモデルの精度いくら何でも高過ぎるんじゃないの?」→「実は汎化性能見てませんでした」みたいなケースって、想像よりも遥かに多くこの世の中存在するみたいなんですね。ということで、それこそ『はじパタ』の2章とかPRMLの最初の方に出てくる初歩中の初歩なんですが、その辺の話を改めてだらだら書いてみようと思います。 そもそも「精度100%」とか「相関係数0.9以上」とか見たら身構えるべき 冒頭に挙げた例は、そもそも「精度100%なんておかしい」という声があちこちから挙がったことで話題になり、蓋を開けてみたらleakageはあるわ訓練誤差でしか評価してないわで散々だったわけです。 一般に、実世界のデータセットで統計モデリングにせよ機械学習にせよモデリン
「中小企業でお金もない、人もいない。ここ10年でIT化に取り組んできたが、今ある課題や業界の将来を見据え、今はAI(人工知能)を自作している」──福岡県田川市でクリーニング店を8店舗展開するエルアンドエーの田原大輔副社長はこう話す。同社はスーツやズボンなどを判別する画像認識システムなどを導入。人材が不足するクリーニング業界の中で業務効率化を図るためいち早くIT化に取り組み、いずれは無人店舗のオープンを目指す。 IT化に取り組んだ10年 電話からSkypeによるビデオチャットへ、メールからチャットワークへ、ExcelからGoogleスプレッドシートへ──2008年ごろから10年近くクリーニング業務のIT化を進め、15年11月にGoogleの機械学習用オープンソースライブラリ「TensorFlow」(テンサーフロー)が公開されてからは、AI開発にも本格的に着手。現在は(1)RPA(Roboti
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く