並び順

ブックマーク数

期間指定

  • から
  • まで

281 - 320 件 / 4770件

新着順 人気順

マイニングの検索結果281 - 320 件 / 4770件

  • Googleの順位決定にGoogle Analyticsのデータが使われていたことが判明! | Web担当者Forum

    ※Web担編注 この記事で示されているようなユーザー行動は、Google Analyticsのデータを利用しなくても、Googleツールバーのデータを見たり、検索結果ページでリンクをクリックしてから戻ってきた行動を検索結果ページのJavaScriptでチェックしたりすることで判断できる。そのため、現時点でも、GoogleがGoogle Analyticsのデータを利用しているという事実は証明されていない。また、グーグルはそれらのデータを直接Google Analyticsから入手することはしないと発言している。 先日、感動的なブログを見つけた。Visioが書いた「直帰率とGoogle検索結果に関する調査データ」というタイトルのブログ記事だ。この記事は、Googleが検索エンジンのランク付けに検索者の行動データを利用していることを証明する、初めての実験を取り上げている。 GoogleはGoo

      Googleの順位決定にGoogle Analyticsのデータが使われていたことが判明! | Web担当者Forum
    • 実践! Rで学ぶ統計解析の基礎 - @IT

      Rは統計解析のブッシュナイフだ 実践! Rで学ぶ統計解析の基礎(1) オープンソースの統計処理言語・環境の「R」を使って実践的な統計解析のテクニックとリテラシーを習得しよう!

      • Googleのテスト自動化の進化 - ワザノバ | wazanova

        https://www.youtube.com/watch?v=6ZvCU0dht50 1 comment | 0 points | by WazanovaNews ■ comment by Jshiike | 約1時間前 Google Test Automation Conferenceが今年はSeattleで開催されたようです。その中で興味深いと感じた話題をいくつか拾ってみました。 1) 成長を続けるGoogle 会社の規模が大きくなり、歴史を重ねてくると、何事も非効率になりがちですが、Ankit Mehtaが紹介してくれた数字によると、Googleの開発ペースは依然として右肩あがりのようです。 コードのコミットは、1日3万チェックイン。約3秒に1回。グラフを目測した限りでは昨年から約20%増。 リリース数もこの1年でほぼ倍増。 2) テストクローラーを利用してのモバイル実機テストの

        • 開発者がビッグデータ分析にPythonを使う時によくやる間違い | POSTD

          システムの構築、新しい技術の習得、PythonやDevOpsなどに情熱を注ぐソフトウェア開発者です。現在はチューリッヒを拠点とするビッグデータのスタートアップで働いており、データ分析およびデータ管理ソリューションのためのPythonの技術を磨いています。 1 はじめに Python は開発時間を短縮できるという点で一般的に評価の高い言語です。しかし、Pythonを使って効率よくデータ分析をするには、思わぬ落とし穴があります。動的かつオープンソースのシステムであるという特徴は、初めは開発を容易にしてくれますが、大規模システムの破綻の原因になり得ます。ライブラリが複雑で実行時間が遅く、データの完全性を考慮した設計になっていないので、開発時間の短縮どころか、すぐに時間を使い果たしてしまう可能性があるのです。 この記事ではPythonやビッグデータで作業をする時に、最も時間を無駄にしがちな事柄につ

            開発者がビッグデータ分析にPythonを使う時によくやる間違い | POSTD
          • 企業における統計学入門

            経済学部1年生対象の統計学の講義で用いた資料です。統計学を学び始めた学生さんに、企業で統計学を用いるとはどういうことかを紹介し、就活や仕事でも役立つと言うことを説明しました。 学生さんの統計学を学ぶモチベーションを高められたら幸いです。

              企業における統計学入門
            • 「何が違法なのか」=摘発デザイナーが反論会見―不正マイニング(時事通信) - Yahoo!ニュース

              他人のパソコンを不正利用して仮想通貨をマイニングしたとして摘発されたウェブデザイナーの男性(30)が14日、東京都内で記者会見し、「納得できない。何が違法なのか基準を明確にしてほしい」と主張した。 男性の弁護人も「捜査で日本の技術者が萎縮すれば、国力を損なうことになる」と訴えた。 男性によると、昨年9~11月、趣味で開設していたサイトに、閲覧者のパソコンでマイニングさせるプログラム「Coinhive(コインハイブ)」を導入。計約900円分の仮想通貨「MONERO(モネロ)」を得た。今年3月に横浜簡裁で不正指令電磁的記録保管罪で罰金10万円の略式命令を受けたが、否認したため、今後横浜地裁で正式裁判が開かれる。 主任弁護人の平野敬弁護士はコインハイブについて、パソコンを壊したり情報を抜き取ったりすることはないとし、「コンピューターウイルスとは異なる」と指摘。「無罪と確信している。法解釈が定まっ

                「何が違法なのか」=摘発デザイナーが反論会見―不正マイニング(時事通信) - Yahoo!ニュース
              • PC

                便利で面白い! Linux活用法100選 AIによる画像やコードの生成を試す、Linuxデスクトップの便利ワザも 2024.01.22

                  PC
                • 自然言語処理

                  • サービス終了のお知らせ - NAVER まとめ

                    サービス終了のお知らせ NAVERまとめは2020年9月30日をもちましてサービス終了いたしました。 約11年間、NAVERまとめをご利用・ご愛顧いただき誠にありがとうございました。

                      サービス終了のお知らせ - NAVER まとめ
                    • ビル・ゲイツが「ビットコインは地球に悪影響」と発言

                      by Sam Churchill ビル・ゲイツ氏がビットコインのマイニングには多大な電力が必要であるという点に触れて、「気候的に良いとは言えない」と発言しました。 Bill Gates Says that Bitcoin is bad For the Planet https://www.technologyelevation.com/2021/03/bill-gates-says-that-bitcoin-is-bad-for.html Microsoftの共同創業者にして「世界一の大富豪」として長らく知られてきたゲイツ氏は、さまざまな慈善団体の運営を手がける世界有数の篤志家としての一面も持っています。直近では妻のメリンダ氏と創設した世界最大の慈善基金団体ビル&メリンダ・ゲイツ財団が2020年から世界的な騒動を巻き起こした新型コロナウイルス感染症に対して多大な貢献を果たしたほか、地球温暖

                        ビル・ゲイツが「ビットコインは地球に悪影響」と発言
                      • なにこれ、超楽じゃん。会議の議事録を自動でいい感じに作成するclarke.aiがイケてる | Ledge.ai

                        みなさん、会議や打ち合わせのときに議事録をとると思います。 相手との認識のズレを防いだり、決定事項を周知したりするのに非常に重要だと思います。 ただ正直、議事録とるのってめんどくさくないですか? せっかく作った議事録もあまり読まれてなかったり…なんてのもよく聞く話。 そんなめんどくさいことは機械に任せて、もっと会議に集中したいものです。 今回はまさにそんなことをしてくれる議事録自動作成AI『clarke.ai』を紹介します。 このツールは、会議の生産性を変えるかもしれません。 サマリーだけでなくToDo管理も。めちゃくちゃできる書記AI“clarke.ai” clarke.aiは会議の音声を認識・分析し、議事録を作ってくれるツールです。 しかも、ただのメモをするのではなく、会議で、何が重要で、でてきたタスクをだれがいつまでにしないといけないか、などまで整理してまとめてくれるんです! しかも

                          なにこれ、超楽じゃん。会議の議事録を自動でいい感じに作成するclarke.aiがイケてる | Ledge.ai
                        • 統計の教科書を公開 - 【小波の京女日記】(2013-03-12)

                          _ 統計の教科書を公開 2013年度の学部の講義「統計学」で使用するための教科書を公開します. http://ruby.kyoto-wu.ac.jp/~konami/Text/ このテキストは,今年度まである出版社から出してもらっていたのですが,かなりの訂正と加筆を行い,元の本からはかなり内容が離れてきてしまいました.また出版社も,売れ行きがぜんぜん悪いし,カリキュラムが変わって100人以上いた受講者が30人程度に激減して儲けのタネにならなくなり,書店から引き上げてしまったようです. そこで,思い切って改訂版はネットに公開して一般の人に自由に使ってもらい,学生が授業で使う分については,小部数印刷の業者に必要なぶんだけ印刷製本してもらうことにしました.なんと2日で製本までやってくれるということで,初回の授業で注文をとってから印刷すれば,次の講義では使えるわけです.便利な世の中です. どんな教

                          • 当社データサイエンティストがこよなく愛している『mコマンド』で数億行を高速集計する話 - ハウテレビジョンブログ

                            どうも。 1月に入社したばかりの、データ分析担当のn_maoです。 と言いながら、最近はHTMLとjsばかりいじっております。 それはそれで楽しいです。 さて今回はデータ分析のざっくりとした仕事内容と、その分析にかかる手間を省くツールをご紹介します。 データ分析の仕事 まずは私の行っているデータ分析という仕事の内容をご紹介します。 私の主な仕事は大きく分けて4つです。 売上げ、会員登録数などの簡単な集計&自動レポーティング データベースからの知識発見(いわゆるデータ分析) 分析結果をもとにした企画立案 実施された企画の効果検証 あくまで私個人の仕事内容であり、データ分析者全員に当てはまるわけではありません。 アルゴリズムの研究開発の方や、インフラ寄りの方もいらっしゃるでしょう。 ですが、同じ職種の方で業務範囲が被っている方も少なからずいらっしゃると思います。 これら4つの業務の中で一番時間

                              当社データサイエンティストがこよなく愛している『mコマンド』で数億行を高速集計する話 - ハウテレビジョンブログ
                            • 非公開サイト

                              サイトの構築。作品の販売。ブログの投稿。この他にもさまざまな機能があります。 ログイン サイトをはじめよう 非公開サイト このサイトは現在プライベート設定になっています。

                                非公開サイト
                              • 機械学習・ディープラーニング・強化学習・ベイズを学べる無料講座 - HELLO CYBERNETICS

                                はじめに ここでは、機械学習、ディープラーニング、強化学習、ベイズを無料で学ぶことのできるオンラインリソースを項目ごとにまとめておきます。 機械学習 ITについて学べるオンライン講座「Udacity」は、基本的に有料で講座を受けるのですが、中には非常に中身の詰まったコンテンツで、かつ無料の講座も存在します。 以下の講座では、機械学習の各技術に関して広くカバーしており、決定木からサポートベクターマシン、ニューラルネットワークやベイズ、強化学習まで学ぶことができます。 かなりのボリュームなので興味のあるところを学んでいく感じでも良いと思います。 www.udacity.com s0sem0y.hatenablog.com s0sem0y.hatenablog.com ディープラーニング 同じくUdacityからディープラーニングに関する講座です。 多層パーセプトロンから畳み込みニューラルネット

                                  機械学習・ディープラーニング・強化学習・ベイズを学べる無料講座 - HELLO CYBERNETICS
                                • 軽量データクラスタリングツールbayon - mixi engineer blog

                                  逆転検事を先日クリアして、久しぶりに逆転裁判1〜3をやり直そうか迷い中のfujisawaです。シンプルなデータクラスタリングツールを作成しましたので、そのご紹介をさせていただきます。 クラスタリングとは クラスタリングとは、対象のデータ集合中で似ているもの同士をまとめて、いくつかのグループにデータ集合を分割することです。データマイニングや統計分析などでよく利用され、データ集合の傾向を調べたいときなどに役に立ちます。 例えば下図の例ですと、当初はデータがゴチャゴチャと混ざっていてよく分からなかったのですが、クラスタリングすることで、実際は3つのグループのデータのみから構成されていることが分かります。 様々なクラスタリング手法がこれまでに提案されていますが、有名なところではK-means法などが挙げられます。ここでは詳細については触れませんが、クラスタリングについてより詳しく知りたい方は以下の

                                    軽量データクラスタリングツールbayon - mixi engineer blog
                                  • なぜIKEAで余計なものを買ってしまうのかという秘密を解説した「誰がIKEAで買い物を楽しんでいるのか?」

                                    IKEAに行くと、本来購入する予定ではなかったものまでついつい買ってしまいがちですが、なぜそのようなことが起きるのでしょうか? その秘密を解説したのがこの「誰がIKEAで買い物を楽しんでいるのか?(Who enjoys shopping in IKEA?)」というムービー。これはもともとユニヴァーシティ・カレッジ・ロンドンの講義としてUCLバーレット校で建築を教えているアラン・ペン教授が行ったもので、結論から言うとIKEAが採用している戦略は「Gruen Transfer」と呼ばれている手法で、これによってIKEAを訪れた人は意識を混乱させられ、本来欲しいわけではないものまで買ってしまうようになるわけです。 一体どういう店舗のデザインによって買う予定のないものを買わせることができるのかという秘密の中身は以下から。 YouTube - Who enjoys shopping in IKEA?

                                      なぜIKEAで余計なものを買ってしまうのかという秘密を解説した「誰がIKEAで買い物を楽しんでいるのか?」
                                    • Deep Learningと画像認識� �~歴史・理論・実践~

                                      SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜SSII

                                        Deep Learningと画像認識� �~歴史・理論・実践~
                                      • 第1回Webスクレイピング勉強会@東京 (全3回) - Qiita

                                        official connpass 「Webスクレイピングの基礎知識」(@nezuq) SlideShare 3つの壁を突破する 倫理 情報解析目的なら合法と解析と解釈(文化庁のQAに肯定的記述) 常識的な範囲でのアクセス障害なら過失と言える。(国立国会図書館の場合、1秒以上あけてスクレイピングなら可能) 技術 最低限でもHTMLの知識 事例(どう使うか) データジャーナリズム(データからストーリーを見つけ提供する。NHKでやってる) Data Journalism Handbook(大義がある) 「オープンデータのためのスクレイピング 〜抽出・共有・分析まで〜」(@ito_nao) SlideShare プログラミング不要でスクレイピング出来るwebサービスのご紹介 Tabula PDFからデータを抽出するツール kimono paginationが得意。 構造化されたクローリングは苦手

                                          第1回Webスクレイピング勉強会@東京 (全3回) - Qiita
                                        • これからはじめる人のための機械学習の教科書まとめ - EchizenBlog-Zwei

                                          最近では企業における機械学習の認知度も高まっていてエンジニアの求人募集でも「望ましいスキル:機械学習」というのをよく見かける。特にweb系の企業だと当たり前のように機械学習を活用した魅力的なサービスが生み出されているようだ。 そんなわけで先日書いた機械学習の入門記事もそれなりに好評で末尾の教科書リストも結構参考にしていただいた様子。ということで、これから機械学習をはじめる人のためにオススメの教科書を10冊ほどピックアップしてみた。 幸いにして機械学習の分野には良書が多い。5年前はナイーブベイズすら知らなかった私も、これらの教科書のおかげでなんとか機械学習を使えるようになりました!(個人の体験談です。効果には個人差があります) 参考: 機械学習超入門 〜そろそろナイーブベイズについてひとこと言っておくか〜 - EchizenBlog-Zwei 最初に既存の機械学習の教科書まとめを挙げておくの

                                            これからはじめる人のための機械学習の教科書まとめ - EchizenBlog-Zwei
                                          • はてブおせっかい

                                            This domain may be for sale!

                                            • ITエンジニアの『生産性』と、データ・サイエンスの微妙な関係 | タイム・コンサルタントの日誌から

                                              ある、社外の人との集まりに顔を出した時のこと。IT分野の経験を積んだ人が多く、みな一家言持っておられる。わたしは昨年後半から、久しぶりに社内のIT関連業務を見るセクションに移ったばかりなので、最近の事情に疎い。なるべく拝聴する側に回ることにした。話は業界の技術トレンドから、クラウドやビッグデータといった最新のバズワードに向かい、日本のIT業界の現状をなげく論調にうつった。日本を代表する大手SIerたちの低空飛行ぶり、技術的イノベーションの不足、そして多重下請に象徴される業界の構造的問題。追い打ちをかけるように、オフショアとの競合による単価の下落。なんだか、あんまりエンカレッジされるような話題が出てこない。 --だとすると、日本のSI業界というのは将来性があるのでしょうか? わたしは思い切って、直球ど真ん中の質問をなげてみた。しかし返ってきたのは、苦笑いするように首を横に振る姿ばかり。 「情

                                                ITエンジニアの『生産性』と、データ・サイエンスの微妙な関係 | タイム・コンサルタントの日誌から
                                              • コンビニの出店戦略を地図にしてみたら...

                                                コンビニの出店戦略の実態に関しては厳密な検証情報はなく、特定都市における出店数を比較したようなものや、単に四国にセブンイレブンが出店していないという情報を根拠にしたものが多数見られます。データが手元にあるので、このドミナント出店戦略を数値化、可視化してみます。

                                                  コンビニの出店戦略を地図にしてみたら...
                                                • データサイエンスのお奨め教科書。統計屋さん的視点から - hotokuとは

                                                  知人に、確率・統計を勉強するにはどんなん読んだら良いんかね?と聞かれたので、まとめる。 線形代数 統計を勉強しようと思ったら、先ず、線形代数を勉強するのが良いと思う。回帰分析とか主成分分析とか多次元尺度構成法とか、こういう有名ドコロが一発で分かる。線形代数を知らずに統計の本で「コレコレの計算で出てきた値が第一主成分だよ」みたいな説明を何回くり返し読んでも、多分、一生理解出来無いと思う。対称行列は直交行列で対角化出来るよね、とか、これは射影行列の形だね、とかが自然に分かるようになってから、統計の本を読むとよく理解出来る。 で、線形代数のお奨めはこれ。 プログラミングのための線形代数 作者: 平岡和幸,堀玄出版社/メーカー: オーム社発売日: 2004/10/01メディア: 単行本購入: 27人 クリック: 278回この商品を含むブログ (90件) を見るプログラミングのための…とあるんだけど

                                                    データサイエンスのお奨め教科書。統計屋さん的視点から - hotokuとは
                                                  • クックパッドとHadoop - クックパッド開発者ブログ

                                                    はじめまして。今年の5月に入社した勝間@さがすチームです。 入社してからは、なかなか大変なことも多いですが、最近はお酒好きが集まって月曜から飲み合う 「勝間会」なるものも発足して、仕事面でも仕事以外の面でも密度の高い毎日を過ごしています! さて、僕は「さがす」チーム所属ということで、普段はレシピを「さがす」ユーザの満足度を上げるために、 クックパッドの検索まわりについて、いろいろな開発を行っています。 一方で、ユーザの「さがす欲求」について深く知るために、大規模なデータ解析を行い、欲求の分析を行う機会も増えてきました。 ところが、クックパッドのログは膨大な数があるので、一口のデータ解析と言っても通常のバッチ処理だと間に合わないため、 分散処理環境の必要性が高まってきました。 そこで、まずは手軽に試せる分散処理の王道ということで、最近ではHadoopを使ったデータ解析環境を整備しています。

                                                      クックパッドとHadoop - クックパッド開発者ブログ
                                                    • 「いい店は探せない」食べログはもう破綻?!:ネットバー:オルタナティブ・ブログ

                                                      昔はおいしいお店を探す時によく利用していた食べログですが、 最近はあまり利用しなくなりました。 なぜかというと、個室や地ビールなど特定の文字で検索してもいろいろな物が 検索されるようになったこと。 そして一番の理由は、評価がほとんど3~3.5ばかりになってしまったからです。 それはそのはずで、 多くの人が利用するようになり、多くの人が評価をつけるようになった ので、良い点をつける人もいれば、悪い点を付ける人もいる。 その結果、多くの店が平均点3~3.5に近い点数になってしまったからです。 最近では4に近ければかなり良い店になっています。 僕だけの意見かと周りの人たちに聞いてみたら同じ意見で、最近は お店を探すときは人に聞いたり、ツイッターで聞いたりすることが 多くなっているようです。 では食べログのような口コミサイトはもう駄目なのでしょうか? もちろんそんな事はなく、口コミ自体は破綻はして

                                                        「いい店は探せない」食べログはもう破綻?!:ネットバー:オルタナティブ・ブログ
                                                      • クチコミポータル:SHOOTI(シューティ)

                                                        This webpage was generated by the domain owner using Sedo Domain Parking. Disclaimer: Sedo maintains no relationship with third party advertisers. Reference to any specific service or trade mark is not controlled by Sedo nor does it constitute or imply its association, endorsement or recommendation.

                                                        • 『モバゲーの大規模データマイニング基盤におけるHadoop活用』-Hadoop Conference Japan 2011- #hcj2011

                                                          『モバゲーの大規模データマイニング基盤におけるHadoop活用』-Hadoop Conference Japan 2011- #hcj2011 2011/02/22 [登壇後エントリ] :" 「モバゲーの大規模データマイニング基盤におけるHadoop活用」-Hadoop Conference Japan 2011 #hcj2011 で登壇してきました " http://d.hatena.ne.jp/hamadakoichi/20110222/p1

                                                            『モバゲーの大規模データマイニング基盤におけるHadoop活用』-Hadoop Conference Japan 2011- #hcj2011
                                                          • 【Day-23】機械学習で使う"距離"や"空間"をまとめてみた - プロクラシスト

                                                            データ分析ガチ勉強アドベントカレンダー 23日目。 ここまでデータをどういう風に処理したり、どういうタスクをこなしていくかについて勉強してきたが、 一度基礎的な事項に戻ってみたいと思う。基礎だから簡単というわけではない。基礎だからこそ難しく、また本質的な内容。 データ分析で使われている手法などをまとめて集約して、簡単な説明を付け加えていく。 しかし、このあたりの数学*1は苦手なので、なるべく直感的に自分のイメージを書いていく。 われわれが生きている空間や、距離は"正しい"のか ユークリッド空間/ユークリッド距離 点の距離 分布の距離 wasserstein計量 カーネル(再生核ヒルベルト空間) Topological Data Analysis(TDA) 次元削減/Embedding PCA(principal component analysis) t-SNE(t-Distributed

                                                              【Day-23】機械学習で使う"距離"や"空間"をまとめてみた - プロクラシスト
                                                            • 「Python」と「Google Colaboratory」で株価データ分析に挑戦

                                                              「Python」と「Google Colaboratory」で株価データ分析に挑戦:「Python」×「株価データ」で学ぶデータ分析のいろは(1) 日々変動する株価データを題材にPythonにおけるデータ分析のいろはを学んでいく本連載。第1回はPythonを実行する環境とデータの前準備について。 はじめに 連載第1回は「Google Colaboratory」でサンプルプログラムを実行するための環境を用意する方法や利用するPythonのライブラリを説明します。「Google Chrome」と「Googleアカウント」を用意して読み進めてください。 なお、連載の趣旨がデータ分析であるため、Pythonの言語仕様や文法の詳細を割愛する場合があることをご了承ください。 Google Colaboratoryの準備 Google Colaboratoryとは、Googleが提供するブラウザ上でPy

                                                                「Python」と「Google Colaboratory」で株価データ分析に挑戦
                                                              • ベイズ推定を知っているフリをするための知識

                                                                最近はベイジアンが増えてきて、実用分野での利用も進んでいるようだ。話題としては知っておきたいが、世間一般には理解に混乱を生んでいるようだ。 ベイズ推定は入門レベルの統計学の教科書ではオマケ的な扱いがされており、実際に伝統的な統計手法を拡張している面が強い。そういう意味では、誤解や混乱があっても仕方が無い。 利用する必要があるのか無いのか良く分からない点も多いのだが、知らないと告白するのも気恥ずかしいかも知れない。自分ではベイズ推定で分析を行わない人が、ベイズ信者と話をあわせるために最低限知っておくべき事をまとめてみた。 1. ベイズ推定とは何か? ベイズ推定とは、ベイズの定理を応用した推定手法だ。端的に理解するためには、最尤法に事前確率を導入している事だけ覚えれば良い。これで哲学的議論を全て回避してベイズ推定を把握することができる。 下の(1)式ではπ(θ)が事前確率、π(θ|x)が事後確

                                                                  ベイズ推定を知っているフリをするための知識
                                                                • NHK「専門家によるとマイニングのサイトにアクセスした瞬間からパソコンに負荷がかかります」→専門家「全部カットされて真逆のことを報道されました!」

                                                                  まとめ 仮想通貨をマイニングせず、無意味にCPUを使用するだけのスクリプトが公開される「風刺が効いてる」「警視庁の見解を聞き.. 特に目的もなく、ただひたすらにCPUを使われるそうです。 仮想通貨をマイニングする機能なし、ただCPU使用量がもりもり上がるだけのJavaScript公開中【やじうまWatch】 - INTERNET Watch https://internet.watch.impress.co.jp/docs/yajiuma/1127708.html への反応をまとめました。 16583 pv 65 2 users 272

                                                                    NHK「専門家によるとマイニングのサイトにアクセスした瞬間からパソコンに負荷がかかります」→専門家「全部カットされて真逆のことを報道されました!」
                                                                  • 機械学習の説明可能性(解釈性)という迷宮 - 渋谷駅前で働くデータサイエンティストのブログ

                                                                    ちょっと前に、しょうもないことを某所で放言したら思いの外拡散されてしまいました。 機械学習の説明可能性(解釈性)、大半のケースで求められているのは厳密な分類・回帰根拠ではなく受け手の「納得感」なので、特に実ビジネス上は説明可能性に長けたモデルを開発するより、納得できないお客さんを巧みに関係性構築した上で口八丁で完璧に説得できる凄腕営業ピープルを雇う方が重要— TJO (@TJO_datasci) 2019年11月23日 これ自体は与太話なので実際どうでも良い*1のですが、最近色々な研究や技術開発の進展はたまた実務家による考察などを見ていて、「機械学習の説明可能性(解釈性)というのは思った以上に複雑な迷宮だ」と感じることがままあったのでした。 ということで、今回の記事では僕のサーベイの範囲でザッと見て目についた資料などを超絶大雑把にリストアップした上で、主に実務における説明可能性とは何かとい

                                                                      機械学習の説明可能性(解釈性)という迷宮 - 渋谷駅前で働くデータサイエンティストのブログ
                                                                    • はてなブログ | 無料ブログを作成しよう

                                                                      我が家のダグウッド ダグウッドとはハナミズキのことである。昔、日本からポトマックリバーの桜の苗木を送った返礼として、アメリカから送られて来たのが日本での始まりで、アメリカ原産でアメリカヤマボウシともいうらしい。 最近では日本でも、あちこちで、街路樹であったり、庭木であっ…

                                                                        はてなブログ | 無料ブログを作成しよう
                                                                      • コインハイブ事件の有罪判決、破棄自判で「無罪」に 最高裁 - 弁護士ドットコムニュース

                                                                        自身のウェブサイト上に他人のパソコンのCPUを使って仮想通貨をマイニングする「Coinhive(コインハイブ)」を保管したなどとして、不正指令電磁的記録保管の罪(通称ウイルス罪)に問われたウェブデザイナーの男性の上告審判決が1月20日、最高裁第一小法廷(山口厚裁判長)であった。 山口裁判長は罰金10万円の支払いを命じた2審・東京高裁判決を破棄し、無罪と判断した。裁判官5人全員一致の意見。 ●最高裁の判断は 第一小法廷はマイニングによりPCの機能や情報処理に与える影響は、「サイト閲覧中に閲覧者のCPUを一定程度使用するに止まり、その仕様の程度も、閲覧者がその変化に気付くほどのものではなかった」と指摘。 ウェブサイトの運営者が閲覧を通じて利益を得る仕組みは「ウェブサイトによる情報の流通にとって重要」とし、「広告表示と比較しても影響に有意な差異は認められず、社会的に許容し得る範囲内」と述べ、「プ

                                                                          コインハイブ事件の有罪判決、破棄自判で「無罪」に 最高裁 - 弁護士ドットコムニュース
                                                                        • オープンデータで運行情報を NHKニュース

                                                                          首都圏の鉄道各社と東京都は、電車が今、どこを走っているかを示すリアルタイムの運行データの公開に乗り出すことになりました。政府が進める「オープンデータ」の取り組みの一環で、新しいサービスの開発や災害時の活用につながると期待されます。 この取り組みに参加するのは、JR東日本や東京メトロ、小田急電鉄など首都圏の鉄道12社と東京都交通局で、国土交通省や総務省、東京大学も協力します。 ここでは、これまで個別に管理され公開されていなかった、車やバスが今どこを走っているか示す位置や時刻のデータ、それに駅の混雑の情報などを、「オープンデータ」として公開していきます。 これによって、交通情報を使ったサービスを自由に開発できるようになり、例えば電車が走っている位置をスマートフォンの地図にリアルタイムで表示したり、目の不自由な人向けに運行情報を音声に変換して提供したりといった活用が期待されます。 さらに、災害な

                                                                          • 『仮説が先、データが後』がなぜ重要なのか? データがあるから規則性や現象が見つかるのではなく、まず仮説をもつことが重要という話

                                                                            松本健太郎 @matsuken0716 「仮説が先、データが後」は僕が敬愛する鈴木敏文さんの言葉です。「今あるデータから何かできないか」と問われても、何もできない最大の理由です。問題を解決する仮説が先です。しかし、大半の分析は仮説をすっ飛ばしていきなり検証から入り、かつそれを分析と言います。それはおかしい。(1/n) pic.twitter.com/5GaXebGfCM 2022-05-31 22:32:33 松本健太郎 @matsuken0716 データ分析には、仮説構築向きと仮説検証向きの2種類に分かれます。そして"仮説構築"の真意は「筋の良い可能性の選択肢を増やすこと」にあります。すなわち正解は1つでは無い、と私は考えています。分けて考えないと「正解を絞れていない」「確からしく無い」とひっちゃかめっちゃかです。(2/n) pic.twitter.com/ZifqK8q3PE 2022

                                                                              『仮説が先、データが後』がなぜ重要なのか? データがあるから規則性や現象が見つかるのではなく、まず仮説をもつことが重要という話
                                                                            • 本物そっくり「疑似個人情報」を無償提供

                                                                              People to People Communications(川崎市)は11月25日、統計データを元に作成した「疑似個人情報」の無償提供を始めた。非営利目的に限り、1人3000件まで無料でダウンロードできる。 架空の名前や住所、生年月日などで構成した個人情報リストを提供する。自治体などが公開している統計データの分布を正確に反映させており、実在の情報ではないものの「本物と区別することができないほど」そっくりだとしている。 本物の個人情報のダミーとして保管したり、システム開発でテストデータとして使ったりするのに利用されている。2月から有料で販売していたが、非営利に限って無償で提供する。

                                                                                本物そっくり「疑似個人情報」を無償提供
                                                                              • 景気の「今」を把握することは可能か? - Yahoo! JAPANビッグデータレポート

                                                                                Yahoo! JAPANトップページの機能を正しくご利用いただくには、下記の環境が必要です。パソコンでご利用のお客様 Windows:Internet Explorer 11.0以上 / Chrome 最新版 / Firefox 最新版 / Microsoft Edge macOS:Safari 9.0以上 ※Internet Explorer 11.0以上をご利用の場合は、 「Internet Explorerの互換表示について」を参考に、互換表示の無効化をお試しください。タブレットでご利用のお客様 iOS 9以降、または、Android4.0以降のOSに標準搭載されたブラウザー ※日本国内版として発売されている端末でご利用ください。

                                                                                  景気の「今」を把握することは可能か? - Yahoo! JAPANビッグデータレポート
                                                                                • 世界的な人気を誇る乙女ゲームにおける,徹底したデータドリブンによる物語構築術

                                                                                  GAMEBOOKのChief Business Development Officer,Nico Nowarra氏 日本で主に女性に人気のある,いわゆる「乙女ゲーム」というジャンルは当然ながら海外にも存在し,その一部は大きな売上を上げる巨大ジャンルとなっている。なかでも有名なのはビジュアルノベル系のゲームで,プレイヤーはゲーム内で提示される選択肢を選ぶことで異なる物語体験ができるというシステムのものだ。 日本からはあまり見えてこないタイプのゲームだが,このシステムを有するゲームを実際にどう設計し,運用するかにまで踏み込んだ講演がdevcom 2019で行われたので,レポートしたい。 必要に応じてメインプロットも変更 登壇したのはGAMEBOOKのChief Business Development Officer,Nico Nowarra氏だ。GAMEBOOKは多数の乙女ゲームを制作してい

                                                                                    世界的な人気を誇る乙女ゲームにおける,徹底したデータドリブンによる物語構築術