並び順

ブックマーク数

期間指定

  • から
  • まで

41 - 80 件 / 161件

新着順 人気順

bigdataの検索結果41 - 80 件 / 161件

  • 「ETC2.0」がサーバに送信している速度や位置情報、民間活用の動き始まる トラック運行情報や保険にも

    「ETC2.0」がサーバに送信している速度や位置情報、民間活用の動き始まる トラック運行情報や保険にも(1/3 ページ) 高速道路の料金を無線通信で支払えるETCは、1日あたりの利用台数が780万台を超え93.9%が利用するまで普及した。そして次世代版であるETC2.0も、2015年に始まって以来835万台に搭載され、利用率で見ると28.7%を占めるに至っている。高速道路を走っているクルマの4台に1台はETC2.0を使っているわけだ。 しかしETC2.0が、クルマの位置情報や速度などを、国土交通省のサーバに随時アップロードしていることは意外と知られていない。

      「ETC2.0」がサーバに送信している速度や位置情報、民間活用の動き始まる トラック運行情報や保険にも
    • データサイエンティストがやらかしがちな過ちトップ10(海外記事紹介) - 渋谷駅前で働くデータサイエンティストのブログ

      (Image by Pixabay) "Top 10 Statistics Mistakes Made by Data Scientists"という刺激的なタイトルの記事が出ているのをKDnuggets経由で知りました。「データサイエンティストがやらかしがちな統計学的な誤りトップ10」ということで、いかにもなあるある事例が色々載っていて面白いです。 ということで、今回はこの記事を全訳にならない範囲で抄訳して、その内容を吟味してみようと思います(直訳しても意味が取りづらい箇所が多かったためかなりの部分を抄訳ながら意訳しています:こういう訳の方が良いなどのコメントあれば是非お寄せください)。言わずもがなですが、こういう海外記事紹介をやる時はネタ切れということです、悪しからず。。。 元記事の内容 1. Not fully understand objective function(目的関数が何か

        データサイエンティストがやらかしがちな過ちトップ10(海外記事紹介) - 渋谷駅前で働くデータサイエンティストのブログ
      • デジタルを問う 欧州からの報告:民主主義を破滅させる巨大IT企業による「監視資本主義」 | 毎日新聞

        膨大な個人データを収益化する巨大IT企業のビジネスモデルを、自著で「監視資本主義」と名付けたショシャナ・ズボフ米ハーバード大経営大学院名誉教授が、毎日新聞のオンライン取材に応じた。ズボフ氏はインターネット空間を支配するこのビジネスモデルは「民主主義にとって破滅的なもの」で、法律によるルール作りが不可欠だと主張。欧州連合(EU)が進める巨大IT規制を、変革に向けた「新たな局面」をもたらす動きだとして高く評価した。 現在のネット空間では、人々がパソコンやスマートフォンで情報を検索したり、ネット交流サービス(SNS)などを使ったりするたびに、利用履歴など個々人に関するデータが収集される仕組みになっている。ズボフ氏はグーグルやフェイスブック(FB、現メタ)などの巨大ITがこれらのデータを事実上無断で利用し、人々がどんな行動をとるのか予測して広告主などに販売する、新たな市場を構築したと指摘する。そし

          デジタルを問う 欧州からの報告:民主主義を破滅させる巨大IT企業による「監視資本主義」 | 毎日新聞
        • データ指向アプリケーションデザイン

          AmazonでMartin Kleppmann, 斉藤 太郎, 玉川 竜司のデータ指向アプリケーションデザイン ―信頼性、拡張性、保守性の高い分散システム設計の原理。アマゾンならポイント還元本が多数。Martin Kleppmann… 手軽に扱えるデータの量や種類が増える一方、CPUの性能はムーアの法則通りには成長しなくなり、大規模データ処理では、多数のマシンを活用する分散処理が欠かせなくなってきました。クラウドの普及とともに多数のマシンを自ら調達せずとも分散システムを構築できるようにもなっています。 しかし驚くべきことに、今までこの分野に入門するための定番の書籍がありませんでした。分散処理にデータ処理が加わる融合分野である上、オープンソースプロジェクトの進化も速く、専門家同士でも共通の理解を構築するのが非常に難しかった分野です。この本を上手に使うと、既存のOSSプロジェクトの位置付けや、

            データ指向アプリケーションデザイン
          • 勃起ペニスの長さが30年間で24%も増加していると判明! - ナゾロジー

            勃起ペニスの長さが30年間で24%も増加していると判明! / Credit:Canva . ナゾロジー編集部「精子の数が年々低下している」というニュースを聞いたことがある人は多いでしょう。 恐ろしいことに、これは事実です。 男性の生殖にかかわるデータによると、53カ国に住む5万7000人の男性の精子を調べたところ、過去46年間で1mlあたりの精子数が1億400万個から4900万個に、実に50%以上(年率にすると1.2%)減少していたことが報告されています。 さらに精子の減少速度は加速しており、2000年から2018年までの毎年の減少率は2.6%にも及んで切ることが示されました。 受精に必要な精子は1つです。 しかし、膣から子宮への旅を乗り切れる精子は極めて少なく、子供をつくるには1mlあたり4000万個の濃さが必要とされています。 このしきい値を下回る場合、それだけ自然な受精は困難になって

              勃起ペニスの長さが30年間で24%も増加していると判明! - ナゾロジー
            • 聞けば聞くほど納得しかない……。世界最大のIT企業・テンセント、ゲーム業界制覇への道筋──日本でのヒットこそが、世界的ヒットへの試金石になる!?

              日本と中国、両国での実績からテンセントへ──今回の取材の趣旨として、テンセントという企業がゲーム業界において世界的にも非常に重要な企業であるにも関わらず、その実態が知られていなかった、それ故に憶測で語られる部分もあったかと思うのですが、改めて当事者の言葉を聞かせていただきたいと。 レオ氏: よろしくお願いします。僕も日本と中国のゲーム業界で十数年仕事した経験があり、双方の市場を客観的に見てきた立場として共有できることも色々あるかと思いますので、何でも聞いてください。 ──ではさっそく。レオさんがテンセントジャパンに入社されたのは、ちょうどテンセントが日本での展開を本格化するタイミングだったと聞いていますが、それまでの経歴をお教えください。 レオ氏: 初めて来日したのは20年前、早稲田大学の大学院に入った時ですね。それからNTTデータ、次にD2C、DeNA、Bytedance Japan、そ

                聞けば聞くほど納得しかない……。世界最大のIT企業・テンセント、ゲーム業界制覇への道筋──日本でのヒットこそが、世界的ヒットへの試金石になる!?
              • Delta Lake とは何か - connecting the dots

                はじめに 環境情報 Delta Lake (デルタレイク) とは Delta Lake の実体 Delta Lake の構造 Parquet と Delta の相違点 Parquetとは何か Parquetの構造 Parquet と Delta の違い Delta Lake が生まれた経緯: データレイクと Delta Lake の違い データレイクのメリット データレイクの課題 *Parquetで構築した場合 Delta Lake の特徴 ACIDトランザクションの担保 スケーラブルなメタデータ管理 バッチとストリーミングワークロードの統合 タイムトラベル (バージョン管理) CONSTRAINT句のサポート DML (データ操作言語) のフルサポート UPDATE DELETE MERGE 柔軟なスキーマ管理 1. スキーマ エンフォースメント 2. スキーマ エボリューション ストレ

                  Delta Lake とは何か - connecting the dots
                • 高性能分散SQLエンジン「Trino」最速ガイド - NTT Communications Engineers' Blog

                  こんにちは。なんの因果かNTTコミュニケーションズのエバンジェリストをやっている西塚です。 この記事は、NTT Communications Advent Calendar 2021 22日目の記事です。 5分でわかる「Trino」 「Trino」は、異なるデータソースに対しても高速でインタラクティブに分析ができる高性能分散SQLエンジンです。 以下の特徴を持っており、ビッグデータ分析を支える重要なOSS(オープンソースソフトウェア)の1つです。 SQL-on-Anything: Hadoopだけでなく従来のRDBMS(リレーショナルデータベース)やNoSQLまで、標準SQL(ANSI SQL)に準拠したアクセスをワンストップに提供 並列処理でビッグデータに対して容易にスケールアップ しかも高速(hiveの数十倍) Netflix, LinkedIn, Salesforce, Shopif

                    高性能分散SQLエンジン「Trino」最速ガイド - NTT Communications Engineers' Blog
                  • Big Data is Dead

                    For more than a decade now, the fact that people have a hard time gaining actionable insights from their data has been blamed on its size. “Your data is too big for your puny systems,” was the diagnosis, and the cure was to buy some new fancy technology that can handle massive scale. Of course, after the Big Data task force purchased all new tooling and migrated from Legacy systems, people found t

                      Big Data is Dead
                    • ビジネス特集 さよならプライバシー あなたの恋愛も懐事情も丸裸!? | NHKニュース

                      「あなたの住所や家族構成、家族や身の回りの人も知らないあなたの趣味や収入まで丸裸にできますよ」 初対面の人にこんなことを言われたら、どう感じるだろうか。実は、スマホの利用履歴のデータを使えば、そんな占い師のようなことができてしまうということが今回、NHKとIT企業が行った実験で明らかになった。あらゆるものがデータ化され、AIで解析され便利なサービスや製品の開発につながる現代社会。「もはやプライバシーは本人のものではなくなっている」という指摘さえ出ている。あなたが今、何気なく使っているスマホから、いったいどれだけのデータが発信されているだろうか。(経済部記者 伊賀亮人/政経・国際番組部ディレクター 青木康祐)

                        ビジネス特集 さよならプライバシー あなたの恋愛も懐事情も丸裸!? | NHKニュース
                      • COVID‑19 - Mobility Trends Reports - Apple

                        As of April 14, 2022, Apple is no longer providing COVID-19 mobility trends reports.

                          COVID‑19 - Mobility Trends Reports - Apple
                        • RDBMSの苦手なことを 如何に乗り越えていくか / challenge-to-rdbms

                          # 参考資料 - イミュータブルデータモデル(入門編) - https://www.slideshare.net/kawasima/ss-40471672 - イミュータブルデータモデル(世代編) - https://www.slideshare.net/kawasima/ss-44958468 - スタースキーマ(基礎) - https://zenn.dev/pei0804/articles/star-schema-design - ディメンション・モデリング - https://zenn.dev/pei0804/articles/dimensional-modeling - 失敗から学ぶRDBの正しい歩き方 - https://amzn.to/3vfD5nJ

                            RDBMSの苦手なことを 如何に乗り越えていくか / challenge-to-rdbms
                          • コロナ禍「結婚危機」深刻 戦後最悪レベル…昨年、10月まで13%減(1/2ページ)

                            新型コロナウイルスの影響で結婚する人が減っている。厚生労働省の人口動態統計(速報値)によると、令和2年1~10月の婚姻数は42万4343件で前年同期(48万9301件)比13.3%ダウンした。11、12月も同様であれば、昨年は戦後最悪の昭和25年(15%減)に次ぐ下落幅となる。婚姻数の低下は出生率にも響くとみられ、少子化対策を重点課題と位置付ける菅義偉(すが・よしひで)政権にとって「結婚対策」が急務となっている。 ■想定以上…少子化対策に影響か 戦後で記録が残る昭和22年以降、対前年比で婚姻数の下落幅が2桁を超えたのは24、25年のみ。令和元年は改元に合わせた「令和婚」が件数を押し上げて前年比3.3%増だったため、2年は一定程度落ち込む可能性があったが、想定以上の下落幅となる見通しだ。 政府の少子化対策担当者は「新型コロナの影響で結婚につながる出会いが少なく、結婚式も行いにくい状況があるの

                              コロナ禍「結婚危機」深刻 戦後最悪レベル…昨年、10月まで13%減(1/2ページ)
                            • Launchableからこんにちは - 川口耕介のブログ

                              2020年は僕にとって転機の年になります。というのも、今月末でJenkinsプロジェクトからは一歩退き、CloudBeesでは顧問に退き、そして新しい会社Launchableを始めるからです。 思えばJenkinsは色々な人のおかげで言い出しっぺの僕の予想を遥かに超えた大掛かりなプロジェクトに成長しました。本当に子供の成長を見るような思いです。だから、いつからか、僕としては後をどうやって引き継ぐかを考えるようになりました。今日、コミュニティとCloudBeesのおかげで、新しいボードメンバー達であったりJenkins Xであったり、コミュニティに新しいリーダーが育っています。なので、安心して彼らに今後を託す事が出来ます。実際の所、2019年中から徐々にプロジェクトから手を引き始めて色々な事を色々な人に任せてきたので、この発表で何かが突然大きく変わるということはありません。引き続きJenki

                                Launchableからこんにちは - 川口耕介のブログ
                              • ZOZOTOWNの事業を支えるBigQueryの話 / BigQuery behind ZOZOTOWN

                                タイムトラベルはじめました 〜時をかけるBigQuery〜 / Now serving Time Machine 〜BigQuery Which Leapt Through Time〜

                                  ZOZOTOWNの事業を支えるBigQueryの話 / BigQuery behind ZOZOTOWN
                                • PyTorch/TensorFlow/Keras/scikit-learnライブラリ内蔵のデータセット一覧

                                  PyTorch/TensorFlow/Keras/scikit-learnライブラリ内蔵のデータセット一覧:AI・機械学習のデータセット辞典 機械学習やディープラーニング用の主要ライブラリが提供する「画像/音声/テキストなどのデータセット」の名前とリンクを表にまとめ、典型的な使い方を簡単に紹介する。 連載目次 本連載「AI・機械学習のデータセット辞典」では、ここまで主に、scikit-learnやKeras/TensorFlow(tf.keras)、TensorFlow Datasets、PyTorchといった主要なPythonライブラリに共通的に含まれる代表的なデータセットを紹介し、各ライブラリでの典型的な実装コード例を示してきた。しかし、これらの全ライブラリに共通的に含まれているデータセットはまれで非常に少ない。よってこれからは、個々のライブラリに1つしか含まれていないようなこまごまと

                                    PyTorch/TensorFlow/Keras/scikit-learnライブラリ内蔵のデータセット一覧
                                  • データサイエンティストが今すぐ「アルキメデスの大戦」を見るべき理由

                                    自称“AI(人工知能)ベンチャーで働きながら、情報発信するマスクマン”こと、マスクド・アナライズさんが、AIをめぐる現状について、たっぷりの愛情とちょっぴり刺激的な毒を織り交ぜてお伝えします。お問い合わせのメールは info@maskedanl.com まで。Twitter:@maskedanl (編集:ITmedia村上) 時は太平洋戦争が近づく1933年(昭和8年)、日本海軍における軍艦建造計画が舞台となります。海軍上層部の間では、強力な大砲を搭載した「戦艦派」と、戦闘機を搭載する「空母派」で意見が分かれています。 意思決定を下す大臣のためにお互いが建造費を提示するものの、戦艦の建造費が不自然に安いことが明らかになりました。そこで空母派は戦艦の正確な建造費を算出するため、天才数学者である主人公を軍にスカウトするのです。 現代に置き換えれば、企業における買収案件で不当な評価額を根拠にする

                                      データサイエンティストが今すぐ「アルキメデスの大戦」を見るべき理由
                                    • あのハーバード大学で最も人気を集める「ビッグデータについての講義」がネットで無料公開中

                                      アメリカのマサチューセッツ州にあるハーバード大学は、各種大学ランキングの最上位に位置するアメリカ屈指の名門校であるとともに、イギリス植民地時代の1636年に創設されたアメリカ最古の大学でもあります。そんなハーバード大学が2017年からビッグデータを扱うコースを創設、2019年春には同校で最も人気のある講義になりました。 Big Data to Solve Economic and Social Problems | Opportunity Insights https://opportunityinsights.org/course/ Raj Chetty’s plan to change how Harvard teaches economics - Vox https://www.vox.com/the-highlight/2019/5/14/18520783/harvard-econ

                                        あのハーバード大学で最も人気を集める「ビッグデータについての講義」がネットで無料公開中
                                      • 統計学とはそもそも「無作為抽出された少量のデータ」を分析するためのものであった - 渋谷駅前で働くデータサイエンティストのブログ

                                        しばらく前にQuoraにこんなアンサーを書いたことを思い出したので、ついでにリブログ記事として転載の上加筆修正したものを用意してみました。僕にしては珍しくコッテコテの頻度主義的な話題である上に、「p値なんか使うのはやめてしまえ」という記事を以前に書いておきながらこんな議論をするのは自己矛盾かもしれませんが(笑)、これまでの統計学の歴史を紐解くことで、温故知新ということで新たに理解されることもあるのかなと思っています。 小標本のための統計学と、「スチューデント」ことゴセットの話 補足 小標本のための統計学と、「スチューデント」ことゴセットの話 近代統計学とは、「無作為抽出によって得られた小標本を分析することで、その背後にある母集団の性質を推定する」ために改良が積み重ねられてきた営みです。すなわち、統計学は「少量のデータを扱う学問」そのものだとも言えます。 (Skbkekas - 投稿者自身に

                                          統計学とはそもそも「無作為抽出された少量のデータ」を分析するためのものであった - 渋谷駅前で働くデータサイエンティストのブログ
                                        • データレイク構築後の四方山話 #DPM / 20190905

                                          Data Platform Meetup の登壇資料です。 https://data-platform-meetup.connpass.com/event/142822/

                                            データレイク構築後の四方山話 #DPM / 20190905
                                          • データデータデータデータデータデータって聞き飽きたのでなんとかしたい|松本健太郎

                                            数ヶ月ほど前、東京都内某所で開催された飲み会での出来事です。 横に座ったオッサンに職業を問われたので「データサイエンスを少し」と答えたら、大げさに「凄いねぇ!」と返され、羨ましそうに言われました。 「データサイエンティストなら、色んなデータ集めて、タピオカの次に何が流行るか分かるでしょ! いーねぇ、楽できて! 稼ぎ放題だ!」 冗談で言ったつもりかもしれません。それでも、オッサンの頭皮に、桃屋のラー油を染み込ませてやろうかと思うほどのイラつきを覚えました。辛そうで辛くないけど少し辛いらしいし。 「ハッハッハッ、冗談が過ぎます。データに幻想を持ち過ぎですよ!」 なんて言い返せれば良かったのですが、まだまだ人間ができていませんね。押し黙ってしまいました。そして睨んでしまった。 それにしても、なぜこんな発言が出るのでしょうか。オッサンはそれなりのキャリアを持つ人で、日経新聞も読み、社会情勢には詳し

                                              データデータデータデータデータデータって聞き飽きたのでなんとかしたい|松本健太郎
                                            • 「アコム」に迫る勢いのLINEポケットマネー “10代とやり取り多い40代”は延滞リスクが低い?

                                              「アコム」に迫る勢いのLINEポケットマネー “10代とやり取り多い40代”は延滞リスクが低い?:金融ディスラプション(1/3 ページ) スマートフォンを使い、個人向けに与信から貸し出しまでを行う、LINEポケットマネー(LINEクレジット運営)が好調だ。2019年8月のサービス開始から、22年3月末で申込件数が累計100万件を突破した。累計貸付実行額も500億円を超えている。 LINEクレジットサービス企画部の山岡巧部長は、「消費者金融大手に匹敵する件数」だと話す。大手消費者金融アコムの場合、年間の新規申し込み数が60万件程度。2年半で100万件のLINEポケットマネーの規模感が分かる。 キャッシュレス特化の利用体験 LINEポケットマネーの特徴は大きく2つある。1つは、キャッシュレスに特化した利用体験を提供している点だ。これまでの消費者向けローンは、申し込むと銀行口座に入金され、ATM

                                                「アコム」に迫る勢いのLINEポケットマネー “10代とやり取り多い40代”は延滞リスクが低い?
                                              • 改めて、汎化性能と交差検証のはなし - 渋谷駅前で働くデータサイエンティストのブログ

                                                追記 再現性をチェックする実験を後日実施しています。併せてお読みください。 以前こんな記事を書きました。 この辺の話はとっくの昔に常識になっていると思っていたのですが、昨今様々な「モデル」が提唱されて公の場で喧伝されることが増えてきており、その中には明らかにこれらの記事で指摘されている問題に引っかかっているものがあるようなので、注意喚起も兼ねて改めてブログ記事として書いてみようと思います。 追記 (May 08, 2020) 本文中にも記事公開当初の初稿の時点でいくつか但し書きを入れてありますが、この記事で最も強調したかったことは「時系列データに対して多項式フィッティングを行うという本来あり得ないモデリングのやり方であっても、交差検証を行えば短期的な予測性能(汎化性能)を改善することができる」ということです。データセットにランダムウォークを選択したのは、単に極値が2つ以上ある時系列を生成し

                                                  改めて、汎化性能と交差検証のはなし - 渋谷駅前で働くデータサイエンティストのブログ
                                                • 「台湾の天才」オードリー・タンが語った「私はなぜスマホをつかわないか」(語り)オードリー・タン,構成)クーリエ・ジャポン)

                                                  「台湾の天才」オードリー・タンが語った「私はなぜスマホをつかわないか」 オードリー・タン 自由への手紙(1)プロローグ前編 オードリー・タン。 新型コロナウィルスが蔓延する台湾で、マスク在庫がリアルタイムで確認できるアプリ「マスクマップ」を開発し、その対応が絶賛されたことで名前を知った人も多いことだろう。 彼女(氏によれば「性別なし」なのだが、ここでは便宜的にそう呼ばせていただく)は2016年、35歳という若さで蔡英文政権に入閣、デジタル担当政務委員(大臣)に就任。 そんな彼女が語った、このデジタル時代に「自由になる」ということ、貴重なインタビューを『オードリー・タン 自由への手紙』より全14回でお届けします。>今までの連載はこちら! 「ネガティブ・フリーダム」とは、既存のルールや常識、これまでとらわれていたことから解放され、自由になること。「個人として何かから自由になること」と言ってもい

                                                    「台湾の天才」オードリー・タンが語った「私はなぜスマホをつかわないか」(語り)オードリー・タン,構成)クーリエ・ジャポン)
                                                  • LINEの大規模なData PlatformにData Lineageを導入した話

                                                    LINE株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。 LINEヤフー Tech Blog はじめに こんにちは、Data Platform室IU Devチームの島村です。 Data Platform室では、約400ペタバイトのデータ分析基盤を運用しております。このData Platformは、「Information Universe」(以下、IU) と呼ばれており、LINEの様々なアプリケーションから生成されるデータをLINE社員が活用できるように、データの収集、処理、分析、可視化を提供しています。私が所属するIU Devチームでは、「IU Web」を開発しています IU Webは、IUのデータを安全にかつ効率的に活用できるようにするData Catalog機能を提供しており、LINEグループのあらゆるサービスか

                                                      LINEの大規模なData PlatformにData Lineageを導入した話
                                                    • [動画公開] データ分析を支える技術 データモデリング再入門 #devio2022 | DevelopersIO

                                                      データアナリティクス事業本部のコンサルティングチームの石川です。クラスメソッド主催のオンラインカンファレンス、Developers.IO 2022にて「データ分析を支える技術 データモデリング再入門」というテーマにてセッション動画と資料を公開いたしました。 セッション概要 「仏作って魂入れず」ということわざがありますが、データモデリングせずにDWHという「器」を導入しただけでは、データ分析は捗りません。 データモデリングを考えずに導入したデータ分析基盤は、データマートの乱立、もしくは、データが分かりにくく、分析に手間がかかるため、あまり使われなくなってしまったり、分析に適さないテーブル構造や構成による性能低下、オーバープロビジョニングによるコスト上昇などの問題が考えられます。 DWH(データウェアハウス)のデータモデリングとは何か、代表的なDWHのデータモデリング手法の紹介と、長所・短所、

                                                        [動画公開] データ分析を支える技術 データモデリング再入門 #devio2022 | DevelopersIO
                                                      • 安心して使えるデータ基盤を作る

                                                        From Cloud-Native Java and Quarkus 3 with Love @ DevoxxUK 2023 London

                                                          安心して使えるデータ基盤を作る
                                                        • データ基盤のメタデータを継続的に管理できる仕組みを作る(ペパボ編) / pepabohatena

                                                          ペパボ・はてな技術大会〜@オンライン https://pepabo.connpass.com/event/174331/

                                                            データ基盤のメタデータを継続的に管理できる仕組みを作る(ペパボ編) / pepabohatena
                                                          • 大規模データ活用向けストレージレイヤソフトのこれまでとこれから(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/0…

                                                            大規模データ活用向けストレージレイヤソフトのこれまでとこれから(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)

                                                              大規模データ活用向けストレージレイヤソフトのこれまでとこれから(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/0…
                                                            • [動画公開] データ分析を支える技術 データ分析基盤 再入門 #devio2021 | DevelopersIO

                                                              データアナリティクス事業本部のコンサルティングチームの石川です。先週より開催しているクラスメソッド主催のオンラインカンファレンス、Developers.IO 2021 DECADEにて「データ分析を支える技術 データ分析基盤 再入門」というテーマにてセッション動画と資料を公開いたしました。 セッション概要 本セッションでは、データ分析基盤を理解するのに必要となる基礎的な要素技術とDX(Digital Transformation)推進において必要とされるデータ管理について解説します。データ分析基盤をこれから導入したい、すでに導入しているデータ分析基盤を改善したいという方には最適なセッションです。 アジェンダ データ分析基盤入門 データ分析基盤の構成要素 データ分析基盤のデータ処理 データ分析基盤のデータ管理 データ分析基盤の今後 まとめ セッション動画(約18分) セッション資料 まとめ

                                                                [動画公開] データ分析を支える技術 データ分析基盤 再入門 #devio2021 | DevelopersIO
                                                              • Google、COVID-19に関するデータを無償公開

                                                                  Google、COVID-19に関するデータを無償公開
                                                                • BigQuery のスーパーパワーを引き出す 10 個の重要なヒント | Google Cloud 公式ブログ

                                                                  ※この投稿は米国時間 2020 年 1 月 29 日に、Google Cloud blog に投稿されたものの抄訳です。 私たち開発者の多くは、日中仕事をしているときはテクノロジーのヒーローといえます。たとえば SQL について知っているなら、あなたはデータをインサイトに変換できる能力を持ったヒーローです。困っている人が助けを求めてきたら、ビジネス提案書に載せるべき魔法の数字を教えて窮地から救ってあげることができます。データレイクを調べて見つけたパターンで同僚を驚かせることも。 Google Cloud のエンタープライズ データ ウェアハウスである BigQuery を使用すれば、すぐにスーパーヒーローになれます。他の誰よりも速くクエリを実行でき、テーブル全体のスキャンだって恐くありません。データセットを高度に利用可能な状態にできるので、メンテナンスの時間枠におびえる必要もなくなります。

                                                                    BigQuery のスーパーパワーを引き出す 10 個の重要なヒント | Google Cloud 公式ブログ
                                                                  • BigQueryで行う、 機械学習のための データ前処理

                                                                    【Oracle Cloud ウェビナー】Oracle Databaseはクラウドに移行するべきか否か 全10ケースをご紹介 (2023年5月24日)

                                                                      BigQueryで行う、 機械学習のための データ前処理
                                                                    • 県内バス全無料化「1世帯月1000円負担で可能」 熊本で1日やってわかったこと | 乗りものニュース

                                                                      熊本県内全域で実施された「県内バス・電車無料の日」により、公共交通の利用者は普段の2.5倍増、市街地の渋滞長は半減するという結果になりました。1世帯あたり月1000円負担すれば、通年の実施も可能という試算も出ています。 「県内バス・電車無料」、対象は4694便にも 2019年9月14日(土)、熊本県で「県内バス・電車無料の日」が実施されました。県内の路線バス、市電などを(JRなど一部の鉄道と、高速バスなど一部のバス路線は対象外)、誰でも1日無料で乗車できるというもので、県内最大のバス事業者である九州産交グループが企画したものです。 計4694便が対象という類を見ない大掛かりな企画で、熊本電鉄など九州産交以外の事業者の運賃減収分も、九州産交グループが負担しました。この日に九州産交グループは、国内最大級のバスターミナルだった熊本交通センターの跡地に、商業施設「SAKURA MACHI Kuma

                                                                        県内バス全無料化「1世帯月1000円負担で可能」 熊本で1日やってわかったこと | 乗りものニュース
                                                                      • Google、病院グループ大手Ascensionの数千万人の患者データに合法的にアクセス

                                                                        Googleが米医療グループ大手のAscensionと提携し、数千万人の患者データに合法的にアクセスしているとWall Street Journalが報じた。報道後、両社はプレスリリースで、提携について発表した。 米Googleが、「Project Nightingale(プロジェクト・ナイチンゲール)」というコード名の下、米国の数千万人もの患者データにアクセスしていると、米Wall Street Journalが11月11日(現地時間)、独自に入手した文書に基づいてそう報じた。 同メディアによると、Googleは2018年、米国で2番目の規模の医療団体Ascensionと契約し、このプロジェクトを開始したという。 Googleがアクセスするデータには、患者の検査結果、診断内容、入院記録、患者名や生年月日などが含まれ、少なくとも150人のGoogleの従業員が数千万人の患者のデータにアクセ

                                                                          Google、病院グループ大手Ascensionの数千万人の患者データに合法的にアクセス
                                                                        • 学習コンテンツ | ビッグデータ・ポータル

                                                                          概要 ・データの活用方法や統計に関する知識をいつでも学べる学習サイトです。 ・「ビジネスに役立つ統計講座」、「プレゼングラフ作成のポイント」のほか、「データサイエンス・オンライン講座」や「統計データ分析コンペティション」の開講状況等を案内しています。 概要 統計リテラシー向上の取組として、“データサイエンス”力の高い人材育成のため、「社会人のためのデータサイエンス入門」「社会人のためのデータサイエンス演習」「誰でも使える統計オープンデータ」の3つのデータサイエンス・オンライン講座を開講しています。 概要 ・こどもたちに、なるほど統計学園を通じて、日々の出来事の中で統計を意識してもらうとともに、統計データの見方や基礎的な統計の知識のほか、統計の有用性、統計調査の仕組みなどについて学んでもらうことを目的としています。 ・初級編、上級編、参考の3つのカテゴリに分けられ、初級編は小学校高学年から中

                                                                            学習コンテンツ | ビッグデータ・ポータル
                                                                          • 日本におけるデータエンジニアリングのこれまでとこれから

                                                                            2024/04/16(火) に行われた イベントの登壇資料です 先達エンジニアに学ぶ 思考の現在地 Online Conferencehttps://findy.connpass.com/event/313119/

                                                                              日本におけるデータエンジニアリングのこれまでとこれから
                                                                            • スパイスカレーが大人気なので社内データを片っ端から分析したら次に食べるべきカレーが決まった - ぐるなび みんなのごはん

                                                                              はじめまして。ぐるなびデータライブラリ編集部です。 ぐるなびデータライブラリ編集部では、ぐるなびのデータサービス「ぐるなびデータライブラリ」のデータを元に、トレンド予想やメニューの分析を行っております。 ©ぐるなびデータライブラリ みなさんは、カレーはお好きでしょうか?私も大好きで、暇さえあればスパイスカレーを作っています。 昔から日本人の国民食として定着しているカレーですが、近年改めてカレー界隈が盛り上がっていることを感じている方も多いのではないでしょうか。 最近では、テレビのグルメ特集では常連メニューとなっていますし、夏にはカレー特集の雑誌が多く発売されています。 その中でも頻繁に登場するのが「スパイスカレー」。スパイスカレーが牽引する、この空前のカレーブームに裏付けはあるのか、スパイスカレーの流れを受け今後どんなカレーが流行るのかを、ぐるなび所有のデータで分析をしていきたいと思います

                                                                                スパイスカレーが大人気なので社内データを片っ端から分析したら次に食べるべきカレーが決まった - ぐるなび みんなのごはん
                                                                              • Google、「差分プライバシーライブラリ」をGitHubで公開

                                                                                米Googleは9月5日(現地時間)、自社サービスの強化に使っている「differential privacy library」(差分プライバシーライブラリ)のオープンソース版をGitHubで公開した。 差分プライバシーを使うデータ分析は、個人データが識別されないようにしながら大規模なデータセットから学習できるようにするアプローチ。分析の結果から個人データを再識別することもできないよう保護できる。例えばヘルスケア分野で、様々な病院の患者の入院平均時間を比較したい場合、患者を個人として特定できない状態でデータを利用できる。 ライブラリはほとんどの一般的なデータサイエンス操作をサポートし、プライバシー保護を確実にするための「確率的差分プライバシーモデルチェッカーライブラリ」を含み、集約機能、プライバシー予算管理などの拡張用モジュールもある。 Googleは、例えばGoogleマップで検索したレ

                                                                                  Google、「差分プライバシーライブラリ」をGitHubで公開
                                                                                • トレジャーデータはなぜシリコンバレーで創業したのか

                                                                                  米シリコンバレーの地でトレジャーデータを起業して10年。2018年に英Arm(アーム)に買収されましたが再び独立。現在、私はトレジャーデータの取締役会長を務めています。 「どうしてシリコンバレーで創業したのか?」。しばしば、こう尋ねられます。基本的には米国を拠点として活動しているため、日本のメディアでお話しする機会はあまり多くありませんでした。この連載では、あえて日本国外からの視点をもって、日本の読者の皆さまへ、何かしらの気付きになるようなことをつづっていければと思っています。 先の問いにお答えする前に、簡単に「私の履歴書」をご紹介させてください。 作家志望なのにオープンソースソフトウエアの世界へ 私のキャリアは、大学在学中、オープンソースのOS(基本ソフト)である「Linux」の商用パッケージを展開していた米Red Hat(レッドハット)の日本拠点でアルバイトをしたことから始まります。い

                                                                                    トレジャーデータはなぜシリコンバレーで創業したのか