タグ

Big Dataに関するmedihenのブックマーク (58)

  • 総データ化時代は「統合できるデータ」が価値を生む 新型コロナが変えたデータサイエンスの常識

    AI機械学習を導入して、会社のDXを進めたい」。そのためには大量のデータが必要なことは分かっているが、実際に必要なのはどんなデータなのか、そのデータをどうやって分析すれば仕事に活用できるのかが分からなくて困っているーー。そんな悩みを抱えるビジネスパーソンを対象に、データサイエンスの教育プログラムを提供する株式会社データミックスの代表取締役・堅田洋資氏が、データ活用方法を伝えるセミナーを開催しました。データの質や量、分析者の腕前などに左右されるデータ分析には、常に「わからない」というリスクがつきまといます。新型コロナ以後、これまでのデータが使えない時代に行うべきデータサイエンスとは何かを語ります。 数字を聞くようにすれば、データを見るクセはついてくる 堅田洋資氏:さて、後半戦にいきましょう。問いの量を増やすにはどうしたらいいのか。これは精神論というわけじゃないんですけれども、マネジメント

    総データ化時代は「統合できるデータ」が価値を生む 新型コロナが変えたデータサイエンスの常識
    medihen
    medihen 2022/06/29
    "データを活用する文化をつくるには、上司から問いを出してもらう必要があるんですが、上司は「それをデータで示してほしい」と言ってもらうようにする。これが一番効果的だと思っています"
  • スシロー、20億皿分析で廃棄減 水産物の高騰に備え - 日本経済新聞

    回転ずし「スシロー」を運営するFOOD&LIFE COMPANIES(F&LC)は20年間蓄積した販売データを使って、材やすしの廃棄を減らす取り組みを始めた。約200億皿分のビッグデータのうち約20億皿分を人工知能AI)に学習させ、店舗ごとに当日の売上高や皿数を予測。適切な量の材を準備し、作りすぎを減らす。原価率を低減し、原材料価格の高騰を乗り切ろうとしている。午後2時。

    スシロー、20億皿分析で廃棄減 水産物の高騰に備え - 日本経済新聞
    medihen
    medihen 2022/06/08
    "約200億皿分のビッグデータのうち約20億皿分を人工知能(AI)に学習させ、店舗ごとに当日の売上高や皿数を予測。適切な量の食材を準備し、作りすぎを減らす。原価率を低減し、原材料価格の高騰を乗り切ろうとしている"
  • ピーター・ティールが立ち上げた謎のデータ分析企業「パランティア」の実態に迫る | 「これまでに数件のテロを未然に防いだ」

    「西側諸国を支援するために立ち上げた」 2019年秋のある晴れた火曜日の午後、パリのリュクサンブール公園でアレックス・カープ(53)が太極拳をしていた。青のナイキのスウェットパンツに、青のポロシャツ。下はオレンジで、スニーカーはチャコールグレー。赤のアクセントが入った白縁のサングラスが、彼の最大の特徴である天に向かって逆立つゴマ塩の髪を引き立てていた。 栗の木の木陰でカープは太極拳と気功の一連の優雅な動きをする。体をひねったり、向きを変えたりするたびに足元の小石や土がわずかに動いた。その姿を、近くにいた10代の若者たちが面白そうに眺める。 10分ほど、そうやって体を動かした後、カープは近くのベンチに行った。そのベンチにはボディーガードの一人が置いた楽器ケースのようなクーラーボックスがある。 ケースにはカープが愛飲するドイツのノンアルコールビールの瓶も数入っているが、いま中から取り出した

    ピーター・ティールが立ち上げた謎のデータ分析企業「パランティア」の実態に迫る | 「これまでに数件のテロを未然に防いだ」
    medihen
    medihen 2021/10/13
    "同社の主要ソフトウェアは「ゴッサム」と「ファウンドリー」の2種類だ。いずれも膨大な量のデータを集めて処理し、人間のアナリストが見落としてしまいがちなつながりやパターン、トレンドを見つけ出す"
  • 機械学習のビジネス上の価値を「効果測定」して「数値評価」する方法 - 六本木で働くデータサイエンティストのブログ - 渋谷駅前で働くデータサイエンティストのブログ

    (Image by Pixabay) 気が付けば、日における第一次データサイエンティストブームから6年、人工知能ブーム開始から3年が経ったようです。意外と言っては何ですが、これまでのところ人工知能ブームも、そしてそれにブーストされた形で起こった第二次データサイエンティストブームも、まだまだ続くどころかどんどん加速していきそうな状況です。 なのですが、これだけ統計学や機械学習のような高度なデータ分析技術がビジネスの現場に浸透するようになった現在でも、なぜかあまり多く見かけないものがあります。それは「機械学習(もしくは自動化された統計分析)によるビジネス上の成果を数値として示したもの」。意外かもしれませんが、個人的な観測範囲では例えば「Deep Learningを導入したら〇〇がXX%向上した」みたいなリリースや記事を見かけることは、正直なところ思った以上に少ないように思われます。それでも第

    機械学習のビジネス上の価値を「効果測定」して「数値評価」する方法 - 六本木で働くデータサイエンティストのブログ - 渋谷駅前で働くデータサイエンティストのブログ
    medihen
    medihen 2019/07/16
    "「効果測定」「数値評価」の方法としてどんなものがあり得るかを大雑把に論じてみよう"
  • 英国版の情報銀行構想:データトラストの法律・ガバナンス検討レポート(生貝直人) - 個人 - Yahoo!ニュース

    で情報銀行の議論が色々と盛り上がる昨今ですが、実は諸外国でも同様の検討が進められてきており。特に英国のODI(Open Data Institute)が4月に英国版の情報(信託)銀行構想である(と言っても大きくは間違っていないと思います)データトラストについての3つのパイロットプロジェクトに基づく包括的なレポートを出していて、特にそれと合わせて出されたロンドン大クイーンメアリーと法律事務所(BPE Solicitors、Pinsent Masons)による法律・ガバナンス側面の検討レポートが大変興味深かったので内容についてのメモです。 基的に日の情報銀行と発想はかなり似ていて(とはいえ僕自身日の情報銀行の現状をそんなに深くは存じ上げているわけでもないのですが)、しかしやはりGDPRの存在など法的環境の相違に起因するものはじめ、さまざま微妙に異なる点も見えてきます。 法律・ガバナン

    英国版の情報銀行構想:データトラストの法律・ガバナンス検討レポート(生貝直人) - 個人 - Yahoo!ニュース
    medihen
    medihen 2019/05/14
    信託財産の管理という文脈より、公共財の考え方をデータ資産にも広げようという動きに見える。社会背景が違うよなぁ。
  • 立ち上げたTwitterアカウント(BuzzFeed Kawaii)が1年で30万フォロワー、ノープロモで超えたので分析面でやったことをまとめた。 - ひにログ

    こんにちは、ひにしあい(@sunwest1)です。 2018年5月、3人の同僚とテストで始めたTwitterアカウントBuzzFeed Kawaiiが2019年5月、1年を待たずに30万フォロワーを超えました。 うれしい。 twitter.com 予算は0、立ち上げ当初から体のBuzzFeedJapanからのRTや誘導、キャンペーン、広告プロモーションなど一切行いませんでした。 そんな"無理ゲー"な状態でしたが、 「投稿がすごいRTされてるけどなにしたの?」 「なんでそんな急に成長したの?」 など、最近いろんな人に聞かれるので、 主に分析や数字の振り返りを担当した私の観点から、やったことやどう進めたのかをまとめました。 ※ちなみに私は分析に関しては専門家ではないです。 SEO文脈でGAなどが最低限さわれるレベルかな?くらいの人です。 そもそも、何がしたくて立ち上げたのか? BuzzFee

    立ち上げたTwitterアカウント(BuzzFeed Kawaii)が1年で30万フォロワー、ノープロモで超えたので分析面でやったことをまとめた。 - ひにログ
    medihen
    medihen 2019/05/10
    "振り返りは"仮説出しマン"育成の場", "振り返りの中で「なんでこの投稿やたら引用RTしてくれているのかなー?」とかを参加メンバーでくっちゃべりながら、仮説を立てていって翌週以降検証の投稿を繰り返すというPDCA"
  • 中国政府による社会信用システムと民間の信用スコアの違い - dataway

    中国の社会信用システムと民間の信用スコアの違い 「中国の信用スコア」について議論する際に、「中国政府の社会信用システム」と「民間企業が運営する信用スコア」は混同されることが多々ある。 両者はたしかに似ている部分もあるが、区別して理解しておく必要がある。 記事では、中国の信用システムについての議論を建設的に進めるために、中国の社会信用システムと民間の信用スコアの違いと関係性について、整理していこう。 中国の社会信用システムとは? 中国の民間の信用スコアとは? 社会信用システムと民間信用スコアの関係性は? まとめ 中国の社会信用システムとは? まず、中国の社会信用システムについて、解説していこう。 中国の社会信用システムは、「中国政府が推進している国民の評価システム」である。 2014年6月14日に、中国国家省が「社会信用制度の構築に向けた計画概要」というドキュメントを発表し、明らかになった

    中国政府による社会信用システムと民間の信用スコアの違い - dataway
    medihen
    medihen 2019/04/03
    "「中国政府の社会信用システム」と「民間企業が運営する信用スコア」は混合されることが多々ある。両者はたしかに似ている部分もあるが、区別して理解しておく必要がある"
  • 中国で浸透する「信用スコア」の活用、その笑えない実態|WIRED.jp

    medihen
    medihen 2018/06/27
    "オランダのライデン大学で中国政治と中国法を研究するロヒール・クレーマースは、新システムは現状ではまとまりのない国民一人ひとりをつなぐ「エコシステム」だと説明する"
  • データサイエンティストもしくは機械学習エンジニアになるためのスキル要件とは(2017年夏版) - 渋谷駅前で働くデータサイエンティストのブログ

    この記事は2年前の以下の記事のアップデートです。 前回はとりあえずデータサイエンティストというかデータ分析職一般としてのスキル要件として、「みどりぼん程度の統計学の知識」「はじパタ程度の機械学習の知識」「RかPythonでコードが組める」「SQLが書ける」という4点を挙げたのでした。 で、2年経ったらいよいよ統計分析メインのデータサイエンティスト(物:及びその他の統計分析職)vs. 機械学習システム実装メインの機械学習エンジニアというキャリアの分岐が如実になってきた上に、各方面で技術革新・普及が進んで来たので、上記の過去記事のスキル要件のままでは対応できない状況になってきたように見受けられます。 そこで、今回の記事では「データサイエンティスト」*1「機械学習エンジニア」のそれぞれについて、現段階で僕が個人的に考える「最低限のスキル要件」をさっくり書いてみようかと思います。最初にそれらを書

    データサイエンティストもしくは機械学習エンジニアになるためのスキル要件とは(2017年夏版) - 渋谷駅前で働くデータサイエンティストのブログ
    medihen
    medihen 2018/04/10
    "「データサイエンティスト」*1「機械学習エンジニア」のそれぞれについて、現段階で僕が個人的に考える「最低限のスキル要件」"
  • TechCrunch

    Omegle, a popular online chat service that allowed individuals to connect and chat with strangers, has shut down after 15 years citing growing misuse of the platform, including in committing “un

    TechCrunch
    medihen
    medihen 2018/04/09
    ビジネスの差異化要素としての"「データモート」(Data Moat:データの堀)"
  • トランプ「人心操縦」の黒幕

    トランプ「人心操縦」の黒幕 米大統領選と英国民投票の二大仰天劇は同じ黒衣の仕業だった。恐るべし、最先端マイクロターゲティング。 2017年3月号 BUSINESS [ SNS「ステルス」マシン] 「統計学のカリスマ」ネイト・シルバー(39)は一夜にして光を失った。2008年米大統領選で49州、12年は全50州の勝敗を的中させたが、昨年は「ドナルド・トランプ勝利」を予想できなかったからだ。 ニューヨーク・タイムズ紙を辞めてから人気政治サイト「FiveThirtyEight」(538人は大統領選の選挙人総数)を運営し、数々の賞に輝いて自著(邦訳『シグナル&ノイズ』)も売れ、政治ジャーナリズムに新風を吹きこんだ。ところが、今回は直前予想でヒラリー71・4対トランプ28・6と大外れ。「トランプはsui generis(全くの例外)で予測に主観的要素が入ってしまった」と弁解したが、もう後の祭りである

    トランプ「人心操縦」の黒幕
    medihen
    medihen 2018/04/06
    ケンブリッジ・アナリティカ&ルネッサンス・テクノロジーズ脅威論。
  • 人工知能は「出版不況」を救うか?AIによる書籍需要予測という試み(現代ビジネス編集部) @gendai_biz

    AI人工知能〉による書籍の需給予測システムの開発――。先日、国内最大の印刷会社・大日印刷株式会社が発表した新しい取り組みは、最近のAIへの関心の高さもあって新聞各社が報じるなど、注目された。 書籍の出版点数は1年に8万点近くあり、それぞれが多様な個性を持つ。単なる消費財、とは言えない文化的な側面がある商品の売り上げを、AIがどれだけ予測できるのか疑問の声もある。 はたして、AIは長引く出版不況の打開策になるのか? 担当者に話を聞いた。 取材・文/伊藤達也 の売れ方には「サイクル」がある 「現状ではここ5年分、数万冊分の売り上げデータを学習したAIが、当該の書籍がどのような売り上げの経過をたどるかを予測しています。すでに実用化のレベルにあり、グループの出版社はもちろん、グループ外の出版社数社でも導入し、成果が確認できています」 AI予測についての責任者である、大日印刷の若林尚樹氏はそ

    人工知能は「出版不況」を救うか?AIによる書籍需要予測という試み(現代ビジネス編集部) @gendai_biz
    medihen
    medihen 2018/03/27
    データ集約が軸の業務提携や業界統合になっていくのかも。→"大日本印刷が、「出版社と書店をグループ傘下とし、『串刺し』で出版業界を見ることができるようになった」"
  • Facebookの個人データの不正利用について、ようやくザッカーバーグが重い口を開いた

    medihen
    medihen 2018/03/23
    "ケンブリッジ・アナリティカは、フェイスブックが抱えるもっと根本的な問題の未完成なイメージキャラクターにすぎない。そしてこの問題は、テクノロジー業界全体の問題でもある"
  • フェイスブック・ショックの深度 - 日本経済新聞

    19日の米国株式市場は総崩れとなった。ダウ工業株30種平均は前週末比335ドル安に沈んだ。フェイスブックを巡る個人情報の不正利用問題を巡る懸念を起点に「ビッグデータ」ビジネス全体へ波紋が広がった。IT(情報技術)企業の成長に依存してきた米株市場にとって問題は根深い。発端はイギリスに社を置く政策コンサルティング会社、ケンブリッジ・アナリティカ。同社がフェイスブック上の個人情報を自らの政策アドバ

    フェイスブック・ショックの深度 - 日本経済新聞
    medihen
    medihen 2018/03/20
    "フェイスブック上で通常やり取りされているデータを規則を超えて活用した。これが問題視されると、個人のデータを分析し効率的に広告出稿するビジネスモデルそのものが危機にさらされる"
  • トランプ陣営がデータ不正入手か、フェイスブックが利用を停止

    トランプ大統領の選挙キャンペーンにデータを提供していた選挙コンサルティング会社ケンブリッジ・アナリティカ(Cambridge Analytica)のフェイスブック・アカウントが停止された。 フェイスブックの副法律顧問は、3月16日遅くにフェイスブックのニュースルームに公開された投稿で、 英国を拠点とする軍事データ分析企業ストラテジック・コミュニケーション・ラボラトリーズ(SCL)とその政治データ部門であるケンブリッジ・アナリティカに対して、フェイスブックの利用を一時停止したと発表した。 フェイスブックによると、英国ケンブリッジ大学のアレクサンドル・ コーガン教授(心理学)は約27万人が利用したフェイスブック上のアプリを通じてさまざまな個人データを収集していたという。アプリは心理学の研究アプリという名目で、フェイスブック利用者に対し、好きなコンテンツやプロフィールに掲載した居住地などの情報の

    トランプ陣営がデータ不正入手か、フェイスブックが利用を停止
  • AIとBIは何が違うのか−−DATUM STUDIO酒巻社長

    印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます ビッグデータや機械学習/ディープラーニング/人工知能AI)といった、“データ活用”に関連するキーワードが次々と話題に登るが、実際に企業のビジネスにデータを生かすとなると、何から手をつければいいか分からないことも多いのではないだろうか。 ビジネスにおけるデータ活用を専門とし、『データを活用しようとするすべての企業を、人工知能AI)を通し支援する会社』を標榜するDATUM STUDIO(データム スタジオ)の酒巻社長に、企業におけるデータ活用の基から聞いてみた。 “ビジネスのデータ”とは 学術分野のデータや統計学的なデータが「きれいなデータ」と言えるのに対し、ビジネスのデータは「汚いデータ」と言えます。学校の授業などで統計を扱う場合、

    AIとBIは何が違うのか−−DATUM STUDIO酒巻社長
    medihen
    medihen 2018/01/10
    "意味のあるデータが300件程度あれば、機械学習などを使ってそのパターンを分析するなどの解析手法がうまく働く" "“ディープラーニング”を使いたいなら、データ数は10万件以上ないとうまくいきません"
  • トランプの「秘密兵器」娘婿J・クシュナーが初めて語る、歴史的勝利の舞台裏 | Forbes JAPAN 公式サイト(フォーブス ジャパン)

    ドナルド・トランプが近代の米大統領選史に残る劇的な勝利を収めてから1週間が経ったこの日、彼の選挙対策部があるニューヨークの高層ビル「トランプ・タワー」の周辺は、次期大統領の登場を待つ報道陣や観光客でにぎわっていた。 かつてリアリティー番組「アプレンティス」で落ち目のセレブリティたちがトランプの一番弟子になろうとしのぎを削ったこのビルの26階で、トランプは今、組閣に取り組んでいる。そして、この閣僚人事をめぐる争いは、まるで彼の番組を見ているかのような展開に満ちていた。 勝者の面々は間もなく明らかになるが、この日の主役は最大の敗者となったニュージャージー州知事のクリス・クリスティーだった。政権移行チームの責任者だった彼は、激しい内紛の末に多くの取り巻きもろとも解任されたと伝えられている。だが、この騒動で最も注目を集めた人物は、トランプ・タワーにはいなかった。 その人物とは、トランプの娘婿のジ

    トランプの「秘密兵器」娘婿J・クシュナーが初めて語る、歴史的勝利の舞台裏 | Forbes JAPAN 公式サイト(フォーブス ジャパン)
    medihen
    medihen 2016/11/25
    ”「『マネーボール』と同じことをやった。選挙人獲得のための投資収益率が最も高いのはどの州か考えた。最小限のコストでこの消費者の元にトランプのメッセージを届けるのにはどうすればいいか、と”
  • トヨタ | 通れた道マップ

    直近24時間以内の通行実績を表示します。 縮尺25kmより広域の表示データは最大3時間過去の実績が表示される場合があります。 最新の情報は縮尺10kmより詳細表示してご確認ください

    トヨタ | 通れた道マップ
    medihen
    medihen 2016/04/15
    カーナビメーカーさんも頑張って!
  • コマツの“最強コンピュータ”はなぜ狂った?予測不能な新興国で需要読み違え、本社で悲鳴

    千里眼のように需要を先読みしてくれるはずだった、コマツ自慢のコンピュータ需要予測システムが狂った。 コマツは4月27日、2016年3月期連結決算は純利益が前期比10.4%減の1380億円となり、2期連続で減益になる見通しだと発表した。同社は、記者会見で2期連続減益の要因を「中国経済減速で建設・鉱山機械の市場が20~25%縮小した。新興国でも需要が減少している」と説明した。 同日に発表された15年3月期連結決算は、売上高が前期比1.3%増の1兆9787億円、営業利益が同0.7%増の2421億円、純利益が同3.5%減の1540億円だ。ほかの輸出企業と同様、円安の恩恵を十分に受けながら、売上高も営業利益も前年比横ばいを保つのがやっとだった。 同社は、12年度に策定した中期経営計画(13~15年度)で、建設・鉱山機械需要は13年度を底に徐々に回復すると予測していた。ところが、中国の経済成長減速、新

    コマツの“最強コンピュータ”はなぜ狂った?予測不能な新興国で需要読み違え、本社で悲鳴
    medihen
    medihen 2015/05/27
    この場合の「想定外」とは為替変動とのこと。→”インドネシアのように、想定外の要素が絡んでくると、いくら賢いコムトラックスでもお手上げ”
  • 実用段階に入ったソーシャルメディアでの融資判断

    印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます 米国でLending Clubが上場して以来、オルタナティブレンディングの領域が騒がしい。1つの流れは、Lending Clubのように、N:Mで個人の投資家と借り手を結びつけていくPtoPレンディングである。もう1つは、従来のように1:Nであるが、スコアリングモデルのイノベーションを通じて、これまで貸せなかった先にも貸し出しができるようにする方法だ。 Finextraによれば、クレジットレーティングの大手であるFICOは、新しいスコアリングモデルを開発し、クレジットヒストリーがない、つまり金融取引の履歴がない人たちにもクレジットスコアを提供するという。スコアの算出にあたっては、住宅の賃借料、電話料金、電気・ガス料金などの支払い履歴を参

    実用段階に入ったソーシャルメディアでの融資判断
    medihen
    medihen 2015/04/07
    "ソーシャルネットワーク上のつながり、メッセージ、ページ参照、検索、位置情報などを分析して、そのクレジットスコアを弾き出す"