タグ

実装と機械学習に関するmziのブックマーク (634)

  • Bonferroni法、Holm法、False Discovery Rate | 大阪大学腎臓内科

    Clinical Journal Club 1. 多重比較 Familywise Error Rate さいころを1回振って、●が出る確率は1/6 = 0.167です。 さいころを2回振って、●が1回も出ない確率は、(5/6)2 = 0.694です。したがって、さいころを2回振って、1回でも●が出る確率は、1-(5/6)2 = 0.306です。 当然ながら、さいころを振れば振るほど、1回でも●が出る確率が上がっていきます。さいころを20回振って、一度も●が出ない確率は、わずか0.026です。 さいころを振る回数と1回でも●が出る可能性 さいころを繰り返し振るという事と、有意水準α = 0.05の検定を繰り返すという事は、確率論的には全く同じ事です。検定を繰り返せば繰り返すほど、偶然棄却される帰無仮説が増えます。複数回繰り返された検定全体において帰無仮説が棄却される可能性を、familywi

  • Bonferroniの調整(多重比較法) Bonferroni correction - 一般社団法人 日本理学療法学会連合

    多重比較法の手続きの1つです.Bonferroniの方法などと呼ばれます.ある検定で得られた有意確率p値をBonferroniの補正によって修正すると,多重比較の問題[→多重比較法を参照]を避けることができるわけです.3群以上の比較にt検定(差の検定)を行うと,t検定を3回行わなければなりません.これでは検定の繰り返しという多重比較の問題が起こりますので,t検定で得られたp値をp×3(検定の繰り返し数)と補正して,補正後のp値がp<0.05となれば有意差ありと判断します.

  • Think Stats 第2版

    「プログラミングのスキルを統計の理解に役立てよう」というコンセプトで人気を博した第1版に大幅な加筆を行い、全面的に書き換えた改訂版です。数学的な観点から語られることが多い統計について、計算処理の観点から説明。実際にPythonのコードを示し、実データを分析しながら統計の基礎を解説しています。実際に手を動かしながら統計が学べる、という第1版の長所はそのままに、Anaconda、pandas、IPython Notebookといったツールやライブラリを使った統計手法を示すほか、仮説検定、回帰、時系列分析、生存分析などについて新たな章を追加し内容を充実させました。例題、演習問題をGitHubに掲載。プログラマのための統計入門の決定版です。 正誤表 ここで紹介する正誤表には、書籍発行後に気づいた誤植や更新された情報を掲載しています。以下のリストに記載の年月は、正誤表を作成し、増刷書籍を印刷した月で

    Think Stats 第2版
  • A Tutorial on Variational Autoencoders with a Concise Keras Implementation | Louis Tiao

    Visualization of 2D manifold of MNIST digits (left) and the representation of digits in latent space colored according to their digit labels (right). Keras is awesome. It is a very well-designed library that clearly abides by its guiding principles of modularity and extensibility, enabling us to easily assemble powerful, complex models from primitive building blocks. This has been demonstrated in

    A Tutorial on Variational Autoencoders with a Concise Keras Implementation | Louis Tiao
  • 誰もがみんな数字に強くなる必要はない:AIで変わる仕事の未来

    記事の自動作成ソフトを作ったスタートアップ企業の経営者は、人間がコンピューターの言語を理解するより、コンピューターに人間の言語を理解させた方が利用しやすくなると考えている。誰もがデータ科学者になる必要はないという。 by Erin Winick2018.04.02 20 7 2 0 人工知能は、金融や製造業をはじめとしてますます多くの産業に浸透しつつある。シカゴに社を置くナラティブ・サイエンス(Narrative Science)は、人工知能AI)を使った文章の作成に成功した。ナラティブ・サイエンスは2010年に、野球のボックス・スコア(出場チームの全選手名、ポジション、試合中の守備や打撃データを符号や数字などで記入した記録)から内容を要約し、「物語」を書き出す事業のために創業され、いまや自然言語処理分野の勢力家に変貌を遂げている。 ナラティブ・サイエンスのスチュアート・フランケルCE

    誰もがみんな数字に強くなる必要はない:AIで変わる仕事の未来
    mzi
    mzi 2018/04/04
    データと会話する感じなんだよねぇ。『当社は約100社の顧客を持っていますが、それらの企業のためにやる仕事は大きく3つに分けられます。業務の効率化、カスタマーエンゲージメント、そしてコンプライアンスです。』
  • これがあればデータサイエンティストは不要? 機械学習を誰でも活かせる「DataRobot」の衝撃

    世界を代表するマイクロエレクトロニクス国際展示会「SEMICON Japan 2017」で、国内外のリーディング企業/研究機関のトップエグゼクティブや技術エキスパートが講演。データサイエンティスト、物理学博士として活躍するシバタアキラ氏が登壇したセッション「機械学習 in 製造業」では、機械学習を容易に活用できるようにするプラットフォーム「DataRobot」を紹介。製造業の現場が抱える課題を、データサイエンスの力でいかにして解決するか? DataRobotの実力をデモも交えてプレゼンテーションします。 誰でも機械学習を活用できるプラットフォーム シバタアキラ氏(以下、シバタ):おはようございます。朝早くからどうもありがとうございます。 今日はDataRobotのお話をさせていただきます。DataRobotを聞いたことある方はどれくらいいらっしゃいますか? (会場挙手) ちらほら。あまり手

    これがあればデータサイエンティストは不要? 機械学習を誰でも活かせる「DataRobot」の衝撃
    mzi
    mzi 2018/04/03
    ついにやってきたね。本格上陸かな。
  • 形態素解析とNgramを併用したハイブリッド検索をSolrで実現する方法 - ZOZO TECH BLOG

    こんにちは、バックエンドエンジニアの塩崎です。 今まではiQONの全文検索用のインデックスには形態素解析だけを用いていましたが、先日Ngramも併用することで検索を改善しました。 その結果、検索結果のヒット数が向上し、なおかつ検索ノイズの増加を軽微なものに抑えることができました。 この記事では、Ngramを併用することのメリット、およびそれをApache Solrで利用する方法について紹介します。 欲しい情報が見つからないとは そもそも、「検索したけど欲しい情報が見つからない状態」とはどのような状態でしょうか? ここではその状態を以下の2つの状態に分解して考えてみます。 欲しい情報の数が少ない 1つ目の状態は「欲しい情報が検索結果中に少ない」状態です。 例えば、旅行情報サイトで「東京」と検索した時にDBの中には数千件のデータがあるのに検索結果数がわずか数件しかないような状態です。 欲しくな

    形態素解析とNgramを併用したハイブリッド検索をSolrで実現する方法 - ZOZO TECH BLOG
  • IBMが「ワトソン」で音声アシスタントに参入、B2B向け

    IBMはシリ(Siri)やアレクサ(Alexa)のような能力をあらゆる企業の機器に吹き込むために、またもやワトソンを持ち出した。だが、それが当にユーザーにとってよいことのなのかどうかは、まだ分からない。 エンガジェット(Engadget)の記事によると、IBMがホワイトラベル型(提供を受けた企業が自社ブランドとして流通できる)のソフトウェア・サービスを提供することで、企業はホテルの部屋にあるスマート・スピーカーから高級車マセラティのダッシュボードまで、あらゆる機器に独自の音声制御機能を組み込めるようになる。この音声アシスタントでは、状況によってユーザーが入力したテキストによるチャットもできる。 興味深いのは、グーグルやアマゾンの音声ソフトウェア上で動作するアプリを開発している企業が、IBMのサービスを利用することで解放されることだ。IBMのサービスでは、各企業は独自の学習データを使って自

    IBMが「ワトソン」で音声アシスタントに参入、B2B向け
  • ディープラーニングに入門するためのリソース集と学習法(2018年版) - Qiita

    最近Bitcoinの方が流行っている印象を受けますが,ディープラーニングの勢いは依然強く,Google Trendを見ても未だに検索数は上昇傾向にあるように見えます. 実際体験してみるとわかりますが,ディープラーニングはとんでもなく強力な機械学習の手法で,うまく使いこなせれば強力な武器になります.しかし,「ディープラーニングにはPhDが必要だ」「ディープラーニングは素人には学べない」といった幻想もちらほらあり,興味はあってもなかなかこの世界に飛び込めない人も多いのではないでしょうか? この記事の目的 この記事では筆者がディープラーニングを学ぶ上で筆者が特に有効だと感じたリソースと,有効な学習法について紹介します.参考までに,筆者はディープラーニングを学び始めてまだ9ヶ月程度ですが,今となっては職場でディープラーニングを教える立場になっています.まだ筆者はディープラーニングに関しては初心者で

    ディープラーニングに入門するためのリソース集と学習法(2018年版) - Qiita
  • 無料で12億円以上の予算をかけて開発したゲームの素材データを全て提供するとEpic Gamesが発表

    2016年8月にEpic Gamesよりオープンベータ版の提供が開始されたオンラインバトルゲームの「Paragon」ですが、正式版の登場を待たずして2018年4月26日(木)にサービスの終了が決定しています。そんな悲劇のゲームParagonを生み出したEpic Gamesが、1200万ドル(約12億8000万円)の予算を投じて作られたParagonのキャラクターデータなど全ての素材データをUnreal Engine 4(UE4)の開発者向けに無料で提供すると発表しました。 Epic Games Releases $12 Million Worth of Paragon Assets for Free https://www.unrealengine.com/en-US/blog/epic-games-releases-12-million-worth-of-paragon-assets-f

    無料で12億円以上の予算をかけて開発したゲームの素材データを全て提供するとEpic Gamesが発表
    mzi
    mzi 2018/03/22
    よくわかんないことになってる。
  • ResNetの論文を読んだ - kumilog.net

    ちょくちょくResNetを用いることがあるのですが、論文を読んだことがなかったので、読んでみました。 [1512.03385] Deep Residual Learning for Image Recognition 概要 ResNetが解決する問題 Residual Learning ResNetブロック ネットワークアーキテクチャ 性能評価 Identity vs. Projection Shortcuts Deeper Bottleneck Architectures 概要 Residual Network(ResNet)はその名のとおり、残差を用いたネットワークです。ネットワークを深くすると、精度が悪くなるため、それを解決するため、ネットワークを残差関数を学習するよう再構成します。 ImageNetの分類問題のコンペ(ILSVRC 2015)でエラー率3.57%となり、1位を獲得し

    ResNetの論文を読んだ - kumilog.net
  • AWS Documentation is Now Open Source and on GitHub | Amazon Web Services

    AWS News Blog AWS Documentation is Now Open Source and on GitHub Earlier this year we made the AWS SDK developer guides available as GitHub repos (all found within the awsdocs organization) and invited interested parties to contribute changes and improvements in the form of pull requests. Today we are adding over 138 additional developer and user guides to the organization, and we are looking forw

    AWS Documentation is Now Open Source and on GitHub | Amazon Web Services
    mzi
    mzi 2018/03/19
    AWSのドキュメントってオープンソースだったのね。ユーザーさん勝手に書いてくださいってかんじ。こういう方法もあるんだねぇ。
  • https://blog.beyond-inc.jp/?p=194

    https://blog.beyond-inc.jp/?p=194
  • 世界最高レベル精度のFAQ・AIチャットボット ツール【無料】試用PoC可

    1.以下に1つでも当てはまった方に「おすすめ」です 1.お客様サポート業務を効率化、自動化したい 2.精度の高いチャットボットが欲しい 3.社内の問い合わせの工数、コストを削減したい 2.コールセンター、コンタクトセンター業務の悩み 2-1.オペレーターのコストを削減したい オペレーターの採用には、コストがかかる上に、その後の育成・教育のコスト、稼働のコストも高くつきます。 また、オペレーター人件費の高昇している傾向があります。 2-2.オペレーターの人員不足 重要KPIである、放棄呼率(応答率)を向上し、顧客満足度を上げていきたいのに、オペレーターの有効求人倍率が上がっている現状があり、採用でなかなか人を集められない場合があります。 また、アンケートからは、コールセンターはストレスが多く、働きたくないという求人者の姿勢が見受けられます。 2-3.オペレーターの顧客対応スキル不足 問い合わ

    世界最高レベル精度のFAQ・AIチャットボット ツール【無料】試用PoC可
  • 音声AIが職場にやってくる——アマゾンが企業向けアレクサを準備中

    ニューズラインエマージング・テクノロジーの最新情報をお届け。 Rahul Chakraborty | Unsplash Amazon wants to put Alexa in the workplace アマゾンの有名なパーソナル・アシスタントは、まもなく会議の調整を手伝えるようになりそうだ。 企業用ソフトウェアを音声で制御できるようにするために、アマゾンはビジネス向けアレクサ(Alexa)をリリースするつもりだ、とWebメディアのアクシオス(Axios)が伝えている。経営管理ソフトのコンカー(Concur)、顧客管理ソフトのセールスフォース(Salesforce)はすでに音声コマンドに対応した製品を開発しており、コワーキングスペースを提供しているウィワーク(WeWork)や金融のキャピタルワン(CapitalOne)といった企業が最初の導入企業となりそうだ。 企業環境で使われるようにな

    音声AIが職場にやってくる——アマゾンが企業向けアレクサを準備中
    mzi
    mzi 2018/03/15
    ビジネスむけもきた。なにすんだろう。
  • 検索エンジンの差別、 何が問題なのか?

    Meet the woman who searches out search engines’ bias against women and minorities 検索エンジンの差別、 何が問題なのか? 検索エンジンの仕事ぶりは差別のない公平なものからは程遠い。そう指摘するカリフォルニア大学ロサンゼルス校(UCLA)のサフィア・ウモジャ・ノーブル教授に問題点を聞いた。 by Jackie Snow2018.03.15 127 21 5 0 インターネットは差別や不公平のない土俵のように思われるが、そうではない。サフィア・ウモジャ・ノーブルがその事実に直面したのは、ある日検索エンジンで姪っ子たちが興味を持ちそうな話題を探していた時だった。「black girls」(黒人の女の子たち)という言葉を入力したところ、ポルノ写真で埋め尽くされたページが現れたのだ。 ノーブルはぞっとしたが、驚いたわけ

    検索エンジンの差別、 何が問題なのか?
    mzi
    mzi 2018/03/15
    個人適用や優先表示も、このように受け取られるんだね。
  • IBM Developer

    IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant technologies such as generative AI, data science, AI, and open source.

    IBM Developer
    mzi
    mzi 2018/03/10
    ありゃ、どっかとおなじことしてるなぁ。
  • 人事部の仕事を代行してくれるAI、生みの親は3人の元グーグル社員

    アプリ開発会社「アピュリファイ(Appurify)」の共同創立者たちは2014年、自分たちの会社をグーグルに売却して、グーグルで働き始めた。そのとき、何よりも感銘を受けたのはグーグルの企業文化だったという。

    人事部の仕事を代行してくれるAI、生みの親は3人の元グーグル社員
    mzi
    mzi 2018/03/09
    inB向けのチャットボット。すごい額を調達してる。
  • ローカルビジネスの活性化で日本を元気にする! 個店のマーケティングをまとめて解決するITの力|HANJO HANJO

    このドメインは お名前.com から取得されました。 お名前.com は GMOインターネットグループ(株) が運営する国内シェアNo.1のドメイン登録サービスです。 ※表示価格は、全て税込です。 ※サービス品質維持のため、一時的に対象となる料金へ一定割合の「サービス維持調整費」を加算させていただきます。 ※1 「国内シェア」は、ICANN(インターネットのドメイン名などの資源を管理する非営利団体)の公表数値をもとに集計。gTLDが集計の対象。 日のドメイン登録業者(レジストラ)(「ICANNがレジストラとして認定した企業」一覧(InterNIC提供)内に「Japan」の記載があるもの)を対象。 レジストラ「GMO Internet Group, Inc. d/b/a Onamae.com」のシェア値を集計。 2023年5月時点の調査。

    ローカルビジネスの活性化で日本を元気にする! 個店のマーケティングをまとめて解決するITの力|HANJO HANJO
    mzi
    mzi 2018/03/08
    こんなんあったんだ
  • よしDeep Learningだ←ちょっと待ってそれXGBoost使った方がいいよ!|山本一成🚗TURING

    尊敬する知人がプログラミングの勉強を始めた。彼はビジネスマンであり、社会起業家であった。英語で deep learning の講座を勉強して、今度その知識を使って金融上の課題を deep learning を使って解決したいそうだ。 ってちょっと待った!! deep learning はすごい。私もその実力には何度も何度も驚かされた。しかしこの技術使うのは相当しんどいのだ。しかも運用もしんどい。大きすぎるチカラには代償は付き物だ。 問題領域によって、最適なツールというのがあるのだ。穴を掘るのにツルハシ⛏が良い場合もあるけど、だいたいの場合はシャベルを使った方がいい場合が多いのだ。そして皆さんが使う多くの問題で deep learning が最良の選択肢であることは少ない。 そんな皆さんにぜひ使ってほしいライブラリがある。XGboostだ。画像処理に関する課題でなければ、皆さんのビジネス上の

    よしDeep Learningだ←ちょっと待ってそれXGBoost使った方がいいよ!|山本一成🚗TURING
    mzi
    mzi 2018/03/08
    だよねー。