並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 19 件 / 19件

新着順 人気順

データサイエンスの検索結果1 - 19 件 / 19件

  • 複数の企業でデータエンジニアとして求められたスキル - yasuhisa's blog

    最近「ああ、これ前職でも前々職でもやったことあるなぁ」という仕事があった。データエンジニア(やその関連職種)として働き始めて約5年、3社でフルタイムとして働いてきて「このスキルは業界や組織規模が変わってもデータエンジニアとしてスキルを求められることが多いな」と感じたものをまとめてみることにした。棚卸し的な意味はあるが、特に転職用などではないです。 前提 どこでも必要とされたスキル データマネジメントに関する概要レベルの知識と実行力 セキュリティや法令に関する知識 事業ドメインに関する興味関心 他職種とのコミュニケーション能力 コスト管理 / コスト削減のスキル ソフトウェアエンジニアとしてのスキル DataOpsやアラートのハンドリング能力 分析用のSQLを書く力 古いテーブルやデータパイプラインを置き換えていくスキルや胆力 あるとやりやすいスキル 関連部署の動きを何となく把握しておく力

      複数の企業でデータエンジニアとして求められたスキル - yasuhisa's blog
    • サブクエリの書き方を2万文字弱かけてすべて解説する

      これはなに ども、レバテック開発部のもりたです。 今回はSQLのサブクエリについてまとめます。仕事でクエリを書く際、サブクエリは頻出の構文だと思うんですが、同時にサブクエリの書き方を完全に理解しているよという人は案外少ないのではないでしょうか?[1] 実際、MySQLの公式ドキュメントを見ると12ページくらいを割かれており、意外と奥深いのがサブクエリです。使いこなせると便利ですし、何よりちょっとSQLのコツみたいなのがわかって面白いよ、ということで記事にしてみました。 前提 この記事は以下の前提を含んでいます。 環境 MySQL8.0系 読者の知識 なんとなくサブクエリが書ける けど相関サブクエリとかになると「あーっ」つってGoogle meetを閉じてしまうくらいのレベル感 記事のボリューム 18,000文字 おれの卒論が20,000文字だった マサカリ 間違ってたら投げてくれ〜〜 それ

        サブクエリの書き方を2万文字弱かけてすべて解説する
      • 『因果推論』(金本拓:オーム社)は因果推論に留まらず現代的なマーケティング分析手法まで網羅したバイブル - 渋谷駅前で働くデータサイエンティストのブログ

        因果推論: 基礎から機械学習・時系列解析・因果探索を用いた意思決定のアプローチ 作者:金本 拓オーム社Amazon 著者の金本さんからご指名でご恵贈いただいたのが、こちらの『因果推論 ―基礎から機械学習・時系列解析・因果探索を用いた意思決定のアプローチ―』です。正直に白状しますと、因果推論とタイトルにつく技術書はここ数年でゴマンと出版されており、本書も紙冊子で頂戴したものの僕はあまり期待せずにページをめくり始めたのでした(ごめんなさい)。 ところが、ほんの数ページめくっただけでその内容に僕は仰天しました。グラフィカルで実務家にとっての分かりやすさを重視した因果推論の解説と実践にとどまらず、現代的なマーケティング分析では必須の種々の手法についてまで懇切丁寧に解説とPythonによる実践例が付された本書は、文字通り「マーケティング分析実務家にとってのバイブル」になり得る素晴らしい一冊だと直感し

          『因果推論』(金本拓:オーム社)は因果推論に留まらず現代的なマーケティング分析手法まで網羅したバイブル - 渋谷駅前で働くデータサイエンティストのブログ
        • 総務省、6月11日開講の「社会人のためのデータサイエンス入門」受講生募集を開始

          CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

            総務省、6月11日開講の「社会人のためのデータサイエンス入門」受講生募集を開始
          • ベイズ統計学を勉強する参考書のフロー - Qiita

            慶應義塾大学・株式会社Nospareの菅澤です. 今回はベイズ統計学を勉強するための参考書の順番 (私見) について紹介していきます. 3年ほど前に『日本語で学べるベイズ統計学の教科書10冊』を紹介しましたが,今回は「どのような順番でどの参考書を読んでいくと比較的スムーズに勉強が進められるのか」に焦点を当て,比較的最近の書籍や英語の書籍まで含めて紹介していきます. まずは全体的なフローのイメージを提示しておきます. 今回の記事では,「ベイズ統計学を勉強すること」のスタートとゴールを以下のように定めます. (スタート) 統計学の基礎的な内容 (統計検定2級程度の内容) は身についている (ゴール) ベイズモデリングに関する最新の論文がある程度理解して読め,自力でモデルを組んだり実装することができる また,このゴールへの道のりとして,大きく2通りのルートを想定します. (ルートA: フルスクラ

              ベイズ統計学を勉強する参考書のフロー - Qiita
            • MySQLのSQLクエリチューニングの要所を掴む勉強会を開催しました! - ANDPAD Tech Blog

              こんにちは!DBREの福間(fkm_y)です。先月、弊社でデータベースの技術顧問をして頂いてる三谷(mita2)さんに開発本部向けの「MySQL SQLチューニング」勉強会を実施していただきました。 今回はMySQLの得意不得意なことの説明やSQLチューニングの流れ、具体的な事例を元にした対応例、また最近話題のHTAPな製品も紹介していただきとても参考になったのでポイントをおさえてレポートをお伝えします! 開催背景 本編 MySQL の得意なこと、苦手なこと データベースのチューニング手段と特徴 SQLチューニングの流れ インデックス SQLチューニング例 インデックスフルスキャンとカバーリングインデックス ソート まとめ 当日の資料 さいごに 過去開催されたデータベース勉強会レポート 開催背景 弊社では三谷さんによるデータベース勉強会を定期的に開催しています。数年前にも同じテーマで勉強会

                MySQLのSQLクエリチューニングの要所を掴む勉強会を開催しました! - ANDPAD Tech Blog
              • Excelで学ぶ、やさしいデータ分析

                データ分析に興味はあるけれど、どこから手を付けていいか分からない……そんなあなたにぴったりなのが、この無料の電子書籍『Excelで学ぶ、やさしいデータ分析』です。ここから、データ分析の第一歩を気軽に踏み出してみましょう! この電子書籍は、「Microsoft Excel」「Googleスプレッドシート」など日常的に触れる表計算ソフトウェアを使って、自分の手で体験しながら段階的に学べるように設計されています。概念や手順は誰でも理解できるように丁寧に易しく説明されており、数学やプログラミングの前提知識も必要ありません。 本書は、データ分析を初歩から学びたい方々に向けた「包括的な教科書」として、データの取り扱い方から基本的な分析方法まで、幅広いテーマを網羅しています。具体的には、以下の全16回で構成されています。 データ分析の基礎: 第1回 データ分析を学ぶべき理由と連載概要 第2回 前提基礎:

                  Excelで学ぶ、やさしいデータ分析
                • 情報処理学会 情報入試委員会 - 情報科全教科書用語リスト

                  情報処理学会情報入試委員会は、高等学校情報科において現在までに出版された検定済教科書すべての索引に現れる用語を整理した用語集[1](論文[2]が刊行された時点のもの)を基に、用語のカテゴリづけや、要約説明文づけ等の手を加え、再構成した「情報科全教科書用語リスト」を作成しました。 ここに広く、CC 4.0 BY-SA ライセンスを利用して、公開します。 https://docs.google.com/spreadsheets/d/1FYsq1-ZmwrovR1j8_Q_M5QmSlj6NIZdy/view 高等学校の情報科は2003年から実施されており、20年以上の歴史があります。しかし、他の教科と比較すると歴史は浅く、情報科についての共通認識は広まっているわけではありません。 情報科の検定済み教科書は既に100冊以上出版されており、そこには様々な情報科に関連する用語が含まれています。これら

                    情報処理学会 情報入試委員会 - 情報科全教科書用語リスト
                  • PandasからPolarsへ移行した方がいいのか - Qiita

                    なぜこの記事を書くのか 皆さん、データ解析を行う際にどのようなライブラリを用いているでしょうか。 おそらく大半の人はpandasを使っているのではないでしょうか。 私もpandas使ってます。簡単だよね(´・ω・`) しかし、業務でバカクソでけえデータを読み込もうとしたときに、読み込み時間がとんでもなくかかったり、メモリ不足でそもそも読み込めもしないことが起きていました。 読み込みにメモリ食われすぎて他の作業ができずに待機した挙句、燃え尽きたかのようにノーパソのファンが止まると同時にメモリ不足のエラーが出たときには切れ散らかします。 (画像元:葬送のフリーレン公式Xアカウントのポストより) そんなこともあり、AWSなどのクラウドサービスでメモリに余裕を持たせるためにめちゃくちゃ良いインスタンスを使用していましたが、コストの問題で断念しました。 しかし、どうしても読み込みたいということもあり

                      PandasからPolarsへ移行した方がいいのか - Qiita
                    • はじめての「相関と因果とエビデンス」入門:“動機づけられた推論” に抗うために

                      人文系大学生〜学部卒の方々を念頭に置いた講演でのスライドです。Enjoy! *書籍:林岳彦著『はじめての統計的因果推論』(岩波書店)の情報はこちら→ https://www.iwanami.co.jp/book/b639904.html

                        はじめての「相関と因果とエビデンス」入門:“動機づけられた推論” に抗うために
                      • 【特別取材】「ストリーミングで日本の音楽市場はまだ伸びる」日本上陸したBelieveシルヴァン・ドランジェ氏が語る | Musicman

                        世界の音楽市場でDXを進めてきたBelieveが日本に上陸した。TuneCoreの親会社でもあるBelieveはフランスに本社を置き、パリのユーロネクストに上場している世界有数のデジタル音楽企業だ。年間1400億円 (8億8000万ユーロ) 以上の売上を持ち、国によっては世界的なメジャー企業に比肩、あるいはそれ以上の売上シェアを達成している。 アジア太平洋地域を統括するシルヴァン・ドランジェ氏にインタビューしたが、今や同社はアーティスト育成とデジタル・マーケティングの専門家へと変貌を遂げ、音楽産業の成長に欠かせない存在になりつつあるのが見えてきた。 (インタビュアー:Musicman編集長 榎本幹朗 取材日:2024年3月13日) シルヴァン・ドランジェ(Sylvain Delange) Believeアジア太平洋地区社長。フランス生まれ。2013年初めにBelieveに入社して以来、アジ

                          【特別取材】「ストリーミングで日本の音楽市場はまだ伸びる」日本上陸したBelieveシルヴァン・ドランジェ氏が語る | Musicman
                        • scikit-learn入門&使い方 ― 機械学習の流れを学ぼう

                          連載目次 前回は、機械学習の基礎と、主要なPythonライブラリの概要を説明しました。 今回は、Pythonを使った機械学習プログラミングの基本的な流れを、実際にコードを書きながら体験的に学んでいきましょう。具体的には、データの読み込みと加工から、グラフによる可視化、統計的な数値計算、そして簡単な機械学習モデルの構築まで、基本的な一連の流れを体験できます(図1)。 今回で学べること 図1の通り、機械学習プログラミングの基本的な流れに沿って進めると、第1回で紹介した主要なPythonライブラリ(pandas、NumPy、Matplotlib、seaborn、scikit-learnなど)を各場面で使い分けることになります。 各ライブラリを深く理解して使いこなすためには、個別に詳しく学ぶことが必要です。ただし本連載では、詳細には触れず、実践で役立つ基本的な使用例に絞って説明します。もっと深く掘

                            scikit-learn入門&使い方 ― 機械学習の流れを学ぼう
                          • やさしいデータ分析【確率分布編】 新連載開始!

                            この連載は、データをさまざまな角度から分析し、その背後にある有益な情報を取り出す方法を学ぶ『社会人1年生から学ぶ、やさしいデータ分析』連載(記述統計と回帰分析編)の続編で、確率分布に焦点を当てています。 この確率分布編では、推測統計の基礎となるさまざまな確率分布の特徴や応用例を説明します。身近に使える表計算ソフト(Microsoft ExcelやGoogleスプレッドシート)を使いながら具体的に事例を見ていきます。 必要に応じて、Pythonのプログラムや統計ソフト「R」などでの作成例にも触れることにします。 数学などの前提知識は特に問いません。中学・高校の教科書レベルの数式が登場するかもしれませんが、必要に応じて説明を付け加えるのでご心配なく。肩の力を抜いてぜひとも気楽に読み進めてください。 筆者紹介: IT系ライターの傍ら、非常勤講師として東大で情報・プログラミング関連の授業を、一橋大

                              やさしいデータ分析【確率分布編】 新連載開始!
                            • 3兆円企業「シーイン」がブチ壊した世界のアパレル会社の常識…「デザインから生産完了まで3日」衝撃の製造プロセスはなぜ成り立つ? | 集英社オンライン | ニュースを本気で噛み砕け

                              どのようにして、「シーイン」は3兆円企業に急成長したのか?この章の最後に、米国企業ではありませんが、3兆円を超える売上のほとんどを米国内で稼いでいる企業を取り上げたいと思います。 ファストファッションを手掛けるオンライン小売り大手シーイン(SHEIN/米国人の発音だとシェインに聞こえます)です。中国発の企業ですが、現在、本社をシンガポールに移しています。 2022年の売上高は290億ドル(日本円で3兆円以上)、純利益は10億ドル(同1000億円超)。ちなみに、ユニクロを展開するファーストリテイリングの売上は2兆7665億円、当期利益2962億円(2023年8月期)です。 米国内では、このシーインがいつ米国で上場するかに注目が集まっており、まもなく上場すると言われています。 シーインは3000万人近いインスタグラムのフォロワー(2023年7月時点で2945万人)を抱え、ティックトックやユーチ

                                3兆円企業「シーイン」がブチ壊した世界のアパレル会社の常識…「デザインから生産完了まで3日」衝撃の製造プロセスはなぜ成り立つ? | 集英社オンライン | ニュースを本気で噛み砕け
                              • 成果に直結するデータ分析とは?現役データサイエンティストが解説

                                『MarkeZine』が主催するマーケティング・イベント『MarkeZine Day』『MarkeZine Academy』『MarkeZine プレミアムセミナー』の 最新情報をはじめ、様々なイベント情報をまとめてご紹介します。 MarkeZine Day

                                  成果に直結するデータ分析とは?現役データサイエンティストが解説
                                • 2024年も無料で学べる 総務省が「社会人のためのデータサイエンス入門」を開講

                                  受講するには総務省のWebサイトへの登録が必要だが、登録料や受講料は無料だ。ドコモgaccoが運営するオンライン講座プラットフォーム「gacco」で受講できる。 講座は1回当たり10分程度 社会人のためのデータサイエンス入門は、社会人や大学生を対象とした、統計データ分析の基本的な知識を学べる入門編講座で総務省は「統計学の基礎や統計データの見方などを学習し、身近なデータの活用に役立てられる」としている。2015年3月に開講し、これまで延べ約19万2000人が受講した。 関連記事 密ベクトル(Dense Vector)とは? 疎ベクトル(Sparse Vector)との違い 全てまたはほとんどの成分が0以外の数値を持つベクトルを「密ベクトル」と呼び、その代表例にはテキストなどのEmbedding(埋め込み表現)がある。また、大部分の成分が0で、一部のみが0以外の数値を持つベクトルを「疎ベクトル

                                    2024年も無料で学べる 総務省が「社会人のためのデータサイエンス入門」を開講
                                  • 【選考直結型】RECRUIT INTERNSHIP for Data Specialists 2024 | EVENT | Engineering at Recruit

                                    ※上記事例は全て社内セキュリティレベルと同様の環境下にて運用を行い、ご参加いただく学生の皆さんと機密保持に関する誓約を締結し、契約期間のみデータに触れることができる形で情報管理をしております。 過去の参加者の声 ・リクルートのデータスペシャリストとして1ヶ月半インターンシップに参加しました! ・【リクルートインターン参加記】BigQueryの全社的なスロット利用状況を可視化するツールの制作 ・VertexAIを利用した機械学習モデルにおける評価・分析パイプラインの構築 こんな方にオススメ ・国内最大級の膨大なデータを扱い、プロダクトを改善するための施策立案〜推進、新たな機能の拡充・開発、中長期を見据えた事業戦略の提案など、データを使用した専門スキルをベースに新たな価値の創造に貢献したい方。 必須スキル・経験 ※下記のスキルのうちどれか一つ有している方を対象としています。 ・数理統計学/解析

                                      【選考直結型】RECRUIT INTERNSHIP for Data Specialists 2024 | EVENT | Engineering at Recruit
                                    • PythonとGoogle Cloud, Spreadsheetで「自分のためのスポーツ観戦DX」をプロダクト化して実現した話. - Lean Baseball

                                      プログラミングとプロダクト作りは楽しいよ, っていう「個人開発ネタ」の話です. スポーツ観戦, 具体的には野球のデータ分析DX(Digital transformation)*1を実現しました. 記事の前半はプロダクト企画とアーキテクチャ, 後半はDash(Python)を使ったマルチページ・データ・アプリケーション開発の話となります. TL;DR SpreadsheetとPythonのアプリケーションでいつでもメジャーリーガー(全選手)のパフォーマンスを好きな条件で可視化できるようにしたら野球が面白くなりました. https://example.com/batter/ohtani-shohei/2024-03-20/2024-04-28?cache=false みたいなURLを開くと, オオタニサンのパフォーマンス(現地時間2024/4/28までの数字) 以下の成績をいい感じにグラフ・可

                                        PythonとGoogle Cloud, Spreadsheetで「自分のためのスポーツ観戦DX」をプロダクト化して実現した話. - Lean Baseball
                                      • 「問題」と「課題」の違いを理解しているか 連載『データ分析・AIを実務に活かす データドリブン思考』 第2回 | データ経営|DIAMOND ハーバード・ビジネス・レビュー

                                        サマリー:データ分析をしていると、「データから新たな気付きを得た」「高精度な予測モデルを作った」「施策の効果を厳密に検証した」といったことに達成感を感じるのではないか。しかし、これらはいずれも「役立つ」データ分... もっと見る析とは言えない。第2回では、データ分析がビジネスへの貢献に失敗した5つのケースについて、「問題」と「課題」の観点から考えていく。本稿は、データ分析の第一人者である河本薫氏による『データ分析・AIを実務に活かす データドリブン思考』(ダイヤモンド社)の一部を抜粋し、紹介したものである。 閉じる 5つのケースから考える「問題」と「課題」の違い 言葉だけではなかなか実感を持ってもらえないと思いますので、データ分析をして「分かる」ことに成功したが「役立つ」ことには失敗したケースを2つ挙げましょう。いずれも架空の話ですが、実際の企業でもこれに類似した失敗談はよくあります。

                                          「問題」と「課題」の違いを理解しているか 連載『データ分析・AIを実務に活かす データドリブン思考』 第2回 | データ経営|DIAMOND ハーバード・ビジネス・レビュー
                                        1