並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 1212件

新着順 人気順

データサイエンスの検索結果1 - 40 件 / 1212件

  • やさしいデータ分析【確率分布編】 新連載開始!

    この連載は、データをさまざまな角度から分析し、その背後にある有益な情報を取り出す方法を学ぶ『社会人1年生から学ぶ、やさしいデータ分析』連載(記述統計と回帰分析編)の続編で、確率分布に焦点を当てています。 この確率分布編では、推測統計の基礎となるさまざまな確率分布の特徴や応用例を説明します。身近に使える表計算ソフト(Microsoft ExcelやGoogleスプレッドシート)を使いながら具体的に事例を見ていきます。 必要に応じて、Pythonのプログラムや統計ソフト「R」などでの作成例にも触れることにします。 数学などの前提知識は特に問いません。中学・高校の教科書レベルの数式が登場するかもしれませんが、必要に応じて説明を付け加えるのでご心配なく。肩の力を抜いてぜひとも気楽に読み進めてください。 筆者紹介: IT系ライターの傍ら、非常勤講師として東大で情報・プログラミング関連の授業を、一橋大

      やさしいデータ分析【確率分布編】 新連載開始!
    • 成果に直結するデータ分析とは?現役データサイエンティストが解説

      『MarkeZine』が主催するマーケティング・イベント『MarkeZine Day』『MarkeZine Academy』『MarkeZine プレミアムセミナー』の 最新情報をはじめ、様々なイベント情報をまとめてご紹介します。 MarkeZine Day

        成果に直結するデータ分析とは?現役データサイエンティストが解説
      • PythonとGoogle Cloud, Spreadsheetで「自分のためのスポーツ観戦DX」をプロダクト化して実現した話. - Lean Baseball

        プログラミングとプロダクト作りは楽しいよ, っていう「個人開発ネタ」の話です. スポーツ観戦, 具体的には野球のデータ分析DX(Digital transformation)*1を実現しました. 記事の前半はプロダクト企画とアーキテクチャ, 後半はDash(Python)を使ったマルチページ・データ・アプリケーション開発の話となります. TL;DR SpreadsheetとPythonのアプリケーションでいつでもメジャーリーガー(全選手)のパフォーマンスを好きな条件で可視化できるようにしたら野球が面白くなりました. https://example.com/batter/ohtani-shohei/2024-03-20/2024-04-28?cache=false みたいなURLを開くと, オオタニサンのパフォーマンス(現地時間2024/4/28までの数字) 以下の成績をいい感じにグラフ・可

          PythonとGoogle Cloud, Spreadsheetで「自分のためのスポーツ観戦DX」をプロダクト化して実現した話. - Lean Baseball
        • サブクエリの書き方を2万文字弱かけてすべて解説する

          これはなに ども、レバテック開発部のもりたです。 今回はSQLのサブクエリについてまとめます。仕事でクエリを書く際、サブクエリは頻出の構文だと思うんですが、同時にサブクエリの書き方を完全に理解しているよという人は案外少ないのではないでしょうか?[1] 実際、MySQLの公式ドキュメントを見ると12ページくらいを割かれており、意外と奥深いのがサブクエリです。使いこなせると便利ですし、何よりちょっとSQLのコツみたいなのがわかって面白いよ、ということで記事にしてみました。 前提 この記事は以下の前提を含んでいます。 環境 MySQL8.0系 読者の知識 なんとなくサブクエリが書ける けど相関サブクエリとかになると「あーっ」つってGoogle meetを閉じてしまうくらいのレベル感 記事のボリューム 18,000文字 おれの卒論が20,000文字だった マサカリ 間違ってたら投げてくれ〜〜 それ

            サブクエリの書き方を2万文字弱かけてすべて解説する
          • 複数の企業でデータエンジニアとして求められたスキル - yasuhisa's blog

            最近「ああ、これ前職でも前々職でもやったことあるなぁ」という仕事があった。データエンジニア(やその関連職種)として働き始めて約5年、3社でフルタイムとして働いてきて「このスキルは業界や組織規模が変わってもデータエンジニアとしてスキルを求められることが多いな」と感じたものをまとめてみることにした。棚卸し的な意味はあるが、特に転職用などではないです。 前提 どこでも必要とされたスキル データマネジメントに関する概要レベルの知識と実行力 セキュリティや法令に関する知識 事業ドメインに関する興味関心 他職種とのコミュニケーション能力 コスト管理 / コスト削減のスキル ソフトウェアエンジニアとしてのスキル DataOpsやアラートのハンドリング能力 分析用のSQLを書く力 古いテーブルやデータパイプラインを置き換えていくスキルや胆力 あるとやりやすいスキル 関連部署の動きを何となく把握しておく力

              複数の企業でデータエンジニアとして求められたスキル - yasuhisa's blog
            • はじめての「相関と因果とエビデンス」入門:“動機づけられた推論” に抗うために

              人文系大学生〜学部卒の方々を念頭に置いた講演でのスライドです。Enjoy! *書籍:林岳彦著『はじめての統計的因果推論』(岩波書店)の情報はこちら→ https://www.iwanami.co.jp/book/b639904.html

                はじめての「相関と因果とエビデンス」入門:“動機づけられた推論” に抗うために
              • Excelで学ぶ、やさしいデータ分析

                データ分析に興味はあるけれど、どこから手を付けていいか分からない……そんなあなたにぴったりなのが、この無料の電子書籍『Excelで学ぶ、やさしいデータ分析』です。ここから、データ分析の第一歩を気軽に踏み出してみましょう! この電子書籍は、「Microsoft Excel」「Googleスプレッドシート」など日常的に触れる表計算ソフトウェアを使って、自分の手で体験しながら段階的に学べるように設計されています。概念や手順は誰でも理解できるように丁寧に易しく説明されており、数学やプログラミングの前提知識も必要ありません。 本書は、データ分析を初歩から学びたい方々に向けた「包括的な教科書」として、データの取り扱い方から基本的な分析方法まで、幅広いテーマを網羅しています。具体的には、以下の全16回で構成されています。 データ分析の基礎: 第1回 データ分析を学ぶべき理由と連載概要 第2回 前提基礎:

                  Excelで学ぶ、やさしいデータ分析
                • 【特別取材】「ストリーミングで日本の音楽市場はまだ伸びる」日本上陸したBelieveシルヴァン・ドランジェ氏が語る | Musicman

                  世界の音楽市場でDXを進めてきたBelieveが日本に上陸した。TuneCoreの親会社でもあるBelieveはフランスに本社を置き、パリのユーロネクストに上場している世界有数のデジタル音楽企業だ。年間1400億円 (8億8000万ユーロ) 以上の売上を持ち、国によっては世界的なメジャー企業に比肩、あるいはそれ以上の売上シェアを達成している。 アジア太平洋地域を統括するシルヴァン・ドランジェ氏にインタビューしたが、今や同社はアーティスト育成とデジタル・マーケティングの専門家へと変貌を遂げ、音楽産業の成長に欠かせない存在になりつつあるのが見えてきた。 (インタビュアー:Musicman編集長 榎本幹朗 取材日:2024年3月13日) シルヴァン・ドランジェ(Sylvain Delange) Believeアジア太平洋地区社長。フランス生まれ。2013年初めにBelieveに入社して以来、アジ

                    【特別取材】「ストリーミングで日本の音楽市場はまだ伸びる」日本上陸したBelieveシルヴァン・ドランジェ氏が語る | Musicman
                  • 3兆円企業「シーイン」がブチ壊した世界のアパレル会社の常識…「デザインから生産完了まで3日」衝撃の製造プロセスはなぜ成り立つ? | 集英社オンライン | ニュースを本気で噛み砕け

                    どのようにして、「シーイン」は3兆円企業に急成長したのか?この章の最後に、米国企業ではありませんが、3兆円を超える売上のほとんどを米国内で稼いでいる企業を取り上げたいと思います。 ファストファッションを手掛けるオンライン小売り大手シーイン(SHEIN/米国人の発音だとシェインに聞こえます)です。中国発の企業ですが、現在、本社をシンガポールに移しています。 2022年の売上高は290億ドル(日本円で3兆円以上)、純利益は10億ドル(同1000億円超)。ちなみに、ユニクロを展開するファーストリテイリングの売上は2兆7665億円、当期利益2962億円(2023年8月期)です。 米国内では、このシーインがいつ米国で上場するかに注目が集まっており、まもなく上場すると言われています。 シーインは3000万人近いインスタグラムのフォロワー(2023年7月時点で2945万人)を抱え、ティックトックやユーチ

                      3兆円企業「シーイン」がブチ壊した世界のアパレル会社の常識…「デザインから生産完了まで3日」衝撃の製造プロセスはなぜ成り立つ? | 集英社オンライン | ニュースを本気で噛み砕け
                    • 『因果推論』(金本拓:オーム社)は因果推論に留まらず現代的なマーケティング分析手法まで網羅したバイブル - 渋谷駅前で働くデータサイエンティストのブログ

                      因果推論: 基礎から機械学習・時系列解析・因果探索を用いた意思決定のアプローチ 作者:金本 拓オーム社Amazon 著者の金本さんからご指名でご恵贈いただいたのが、こちらの『因果推論 ―基礎から機械学習・時系列解析・因果探索を用いた意思決定のアプローチ―』です。正直に白状しますと、因果推論とタイトルにつく技術書はここ数年でゴマンと出版されており、本書も紙冊子で頂戴したものの僕はあまり期待せずにページをめくり始めたのでした(ごめんなさい)。 ところが、ほんの数ページめくっただけでその内容に僕は仰天しました。グラフィカルで実務家にとっての分かりやすさを重視した因果推論の解説と実践にとどまらず、現代的なマーケティング分析では必須の種々の手法についてまで懇切丁寧に解説とPythonによる実践例が付された本書は、文字通り「マーケティング分析実務家にとってのバイブル」になり得る素晴らしい一冊だと直感し

                        『因果推論』(金本拓:オーム社)は因果推論に留まらず現代的なマーケティング分析手法まで網羅したバイブル - 渋谷駅前で働くデータサイエンティストのブログ
                      • 【選考直結型】RECRUIT INTERNSHIP for Data Specialists 2024 | EVENT | Engineering at Recruit

                        ※上記事例は全て社内セキュリティレベルと同様の環境下にて運用を行い、ご参加いただく学生の皆さんと機密保持に関する誓約を締結し、契約期間のみデータに触れることができる形で情報管理をしております。 過去の参加者の声 ・リクルートのデータスペシャリストとして1ヶ月半インターンシップに参加しました! ・【リクルートインターン参加記】BigQueryの全社的なスロット利用状況を可視化するツールの制作 ・VertexAIを利用した機械学習モデルにおける評価・分析パイプラインの構築 こんな方にオススメ ・国内最大級の膨大なデータを扱い、プロダクトを改善するための施策立案〜推進、新たな機能の拡充・開発、中長期を見据えた事業戦略の提案など、データを使用した専門スキルをベースに新たな価値の創造に貢献したい方。 必須スキル・経験 ※下記のスキルのうちどれか一つ有している方を対象としています。 ・数理統計学/解析

                          【選考直結型】RECRUIT INTERNSHIP for Data Specialists 2024 | EVENT | Engineering at Recruit
                        • MySQLのSQLクエリチューニングの要所を掴む勉強会を開催しました! - ANDPAD Tech Blog

                          こんにちは!DBREの福間(fkm_y)です。先月、弊社でデータベースの技術顧問をして頂いてる三谷(mita2)さんに開発本部向けの「MySQL SQLチューニング」勉強会を実施していただきました。 今回はMySQLの得意不得意なことの説明やSQLチューニングの流れ、具体的な事例を元にした対応例、また最近話題のHTAPな製品も紹介していただきとても参考になったのでポイントをおさえてレポートをお伝えします! 開催背景 本編 MySQL の得意なこと、苦手なこと データベースのチューニング手段と特徴 SQLチューニングの流れ インデックス SQLチューニング例 インデックスフルスキャンとカバーリングインデックス ソート まとめ 当日の資料 さいごに 過去開催されたデータベース勉強会レポート 開催背景 弊社では三谷さんによるデータベース勉強会を定期的に開催しています。数年前にも同じテーマで勉強会

                            MySQLのSQLクエリチューニングの要所を掴む勉強会を開催しました! - ANDPAD Tech Blog
                          • ベイズ統計学を勉強する参考書のフロー - Qiita

                            慶應義塾大学・株式会社Nospareの菅澤です. 今回はベイズ統計学を勉強するための参考書の順番 (私見) について紹介していきます. 3年ほど前に『日本語で学べるベイズ統計学の教科書10冊』を紹介しましたが,今回は「どのような順番でどの参考書を読んでいくと比較的スムーズに勉強が進められるのか」に焦点を当て,比較的最近の書籍や英語の書籍まで含めて紹介していきます. まずは全体的なフローのイメージを提示しておきます. 今回の記事では,「ベイズ統計学を勉強すること」のスタートとゴールを以下のように定めます. (スタート) 統計学の基礎的な内容 (統計検定2級程度の内容) は身についている (ゴール) ベイズモデリングに関する最新の論文がある程度理解して読め,自力でモデルを組んだり実装することができる また,このゴールへの道のりとして,大きく2通りのルートを想定します. (ルートA: フルスクラ

                              ベイズ統計学を勉強する参考書のフロー - Qiita
                            • PandasからPolarsへ移行した方がいいのか - Qiita

                              なぜこの記事を書くのか 皆さん、データ解析を行う際にどのようなライブラリを用いているでしょうか。 おそらく大半の人はpandasを使っているのではないでしょうか。 私もpandas使ってます。簡単だよね(´・ω・`) しかし、業務でバカクソでけえデータを読み込もうとしたときに、読み込み時間がとんでもなくかかったり、メモリ不足でそもそも読み込めもしないことが起きていました。 読み込みにメモリ食われすぎて他の作業ができずに待機した挙句、燃え尽きたかのようにノーパソのファンが止まると同時にメモリ不足のエラーが出たときには切れ散らかします。 (画像元:葬送のフリーレン公式Xアカウントのポストより) そんなこともあり、AWSなどのクラウドサービスでメモリに余裕を持たせるためにめちゃくちゃ良いインスタンスを使用していましたが、コストの問題で断念しました。 しかし、どうしても読み込みたいということもあり

                                PandasからPolarsへ移行した方がいいのか - Qiita
                              • 総務省、6月11日開講の「社会人のためのデータサイエンス入門」受講生募集を開始

                                CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

                                  総務省、6月11日開講の「社会人のためのデータサイエンス入門」受講生募集を開始
                                • 情報処理学会 情報入試委員会 - 情報科全教科書用語リスト

                                  情報処理学会情報入試委員会は、高等学校情報科において現在までに出版された検定済教科書すべての索引に現れる用語を整理した用語集[1](論文[2]が刊行された時点のもの)を基に、用語のカテゴリづけや、要約説明文づけ等の手を加え、再構成した「情報科全教科書用語リスト」を作成しました。 ここに広く、CC 4.0 BY-SA ライセンスを利用して、公開します。 https://docs.google.com/spreadsheets/d/1FYsq1-ZmwrovR1j8_Q_M5QmSlj6NIZdy/view 高等学校の情報科は2003年から実施されており、20年以上の歴史があります。しかし、他の教科と比較すると歴史は浅く、情報科についての共通認識は広まっているわけではありません。 情報科の検定済み教科書は既に100冊以上出版されており、そこには様々な情報科に関連する用語が含まれています。これら

                                    情報処理学会 情報入試委員会 - 情報科全教科書用語リスト
                                  • 2024年も無料で学べる 総務省が「社会人のためのデータサイエンス入門」を開講

                                    受講するには総務省のWebサイトへの登録が必要だが、登録料や受講料は無料だ。ドコモgaccoが運営するオンライン講座プラットフォーム「gacco」で受講できる。 講座は1回当たり10分程度 社会人のためのデータサイエンス入門は、社会人や大学生を対象とした、統計データ分析の基本的な知識を学べる入門編講座で総務省は「統計学の基礎や統計データの見方などを学習し、身近なデータの活用に役立てられる」としている。2015年3月に開講し、これまで延べ約19万2000人が受講した。 関連記事 密ベクトル(Dense Vector)とは? 疎ベクトル(Sparse Vector)との違い 全てまたはほとんどの成分が0以外の数値を持つベクトルを「密ベクトル」と呼び、その代表例にはテキストなどのEmbedding(埋め込み表現)がある。また、大部分の成分が0で、一部のみが0以外の数値を持つベクトルを「疎ベクトル

                                      2024年も無料で学べる 総務省が「社会人のためのデータサイエンス入門」を開講
                                    • scikit-learn入門&使い方 ― 機械学習の流れを学ぼう

                                      連載目次 前回は、機械学習の基礎と、主要なPythonライブラリの概要を説明しました。 今回は、Pythonを使った機械学習プログラミングの基本的な流れを、実際にコードを書きながら体験的に学んでいきましょう。具体的には、データの読み込みと加工から、グラフによる可視化、統計的な数値計算、そして簡単な機械学習モデルの構築まで、基本的な一連の流れを体験できます(図1)。 今回で学べること 図1の通り、機械学習プログラミングの基本的な流れに沿って進めると、第1回で紹介した主要なPythonライブラリ(pandas、NumPy、Matplotlib、seaborn、scikit-learnなど)を各場面で使い分けることになります。 各ライブラリを深く理解して使いこなすためには、個別に詳しく学ぶことが必要です。ただし本連載では、詳細には触れず、実践で役立つ基本的な使用例に絞って説明します。もっと深く掘

                                        scikit-learn入門&使い方 ― 機械学習の流れを学ぼう
                                      • 「問題」と「課題」の違いを理解しているか 連載『データ分析・AIを実務に活かす データドリブン思考』 第2回 | データ経営|DIAMOND ハーバード・ビジネス・レビュー

                                        サマリー:データ分析をしていると、「データから新たな気付きを得た」「高精度な予測モデルを作った」「施策の効果を厳密に検証した」といったことに達成感を感じるのではないか。しかし、これらはいずれも「役立つ」データ分... もっと見る析とは言えない。第2回では、データ分析がビジネスへの貢献に失敗した5つのケースについて、「問題」と「課題」の観点から考えていく。本稿は、データ分析の第一人者である河本薫氏による『データ分析・AIを実務に活かす データドリブン思考』(ダイヤモンド社)の一部を抜粋し、紹介したものである。 閉じる 5つのケースから考える「問題」と「課題」の違い 言葉だけではなかなか実感を持ってもらえないと思いますので、データ分析をして「分かる」ことに成功したが「役立つ」ことには失敗したケースを2つ挙げましょう。いずれも架空の話ですが、実際の企業でもこれに類似した失敗談はよくあります。

                                          「問題」と「課題」の違いを理解しているか 連載『データ分析・AIを実務に活かす データドリブン思考』 第2回 | データ経営|DIAMOND ハーバード・ビジネス・レビュー
                                        • ITスキルロードマップ roadmap.sh がすごい。AI and Data Scientist について対応する本をまとめた - Qiita

                                          ITスキルロードマップ roadmap.sh がすごい。AI and Data Scientist について対応する本をまとめた機械学習データ分析キャリアデータサイエンスデータサイエンティスト Developer Roadmapsというサイトがすごいです。ITエンジニアの分野別にスキルアップのロードマップが示されています。 言語、基盤、アプリ、かなり網羅されています。 その中のAI and Data Scientist Roadmapについての推薦図書まとめです。 雑感 これだけ学んでいれば「こいつ知ってるな」感がありますね。ただ気になる点としては ビジネス、ドメイン知識や分析目的定義などのスキルについて言及がないのは残念。 いきなり数学から入るコースになってますが、一旦は飛ばしてコード写経してから戻ってきても良いと思います。ここで挫折すると勿体無いので。 計量経済学重視の観点はいいですね

                                            ITスキルロードマップ roadmap.sh がすごい。AI and Data Scientist について対応する本をまとめた - Qiita
                                          • [pandas超入門]Pythonでデータ分析を始めよう! データの読み書き方法

                                            連載目次 本シリーズと本連載について 本シリーズ「Pythonデータ処理入門」は、Pythonの基礎をマスターした人を対象に以下のような、Pythonを使ってデータを処理しようというときに便利に使えるツールやライブラリ、フレームワークの使い方の基礎を説明するものです。 Pythonだけを覚えれば何でもできるわけではない、というのはハードルが高く感じられるかもしれません。それでもプログラミング言語に関する基礎が身に付いたら、後は各種のツールを使いながら、言語とツールに対する理解を少しずつ、しっかりと深めていくことで自分がやれることも増えていきます。そのお手伝いをできたらいいな、というのが本シリーズの目的とするところです。 なお、本連載では以下のバージョンを使用しています。 Python 3.12 pandas 2.2.1 pandasとは pandasはデータ分析やデータ操作を高速かつ柔軟に

                                              [pandas超入門]Pythonでデータ分析を始めよう! データの読み書き方法
                                            • 不登校になりそうな児童生徒をAIが予測、戸田市の教育データ活用実証が示したこと

                                              不登校をAI(人工知能)で予測する――。こんな取り組みが2024年3月末まで埼玉県の戸田市で行われていた。2023年11月に戸田市内のパイロット校で試行を始め、同年12月から同市内の公立小学校12校、同中学校6校の計約1万2000人の児童生徒のデータを分析対象に、「不登校予測モデル」構築の実証をした。事業はこども家庭庁の「こどもデータ連携実証事業」として戸田市が受託し、内田洋行、PKSHA Technologyグループとともに進めたものだ。 不登校リスクモデルの目的は学校現場での「プッシュ型支援」につなげること。いち早く不登校の兆候がある児童生徒を把握し、教員が事前に支援する。自らSOSを発信できない児童生徒に対しても、先手を打って手を差し伸べる。経験の浅い教員でも支援のきっかけを得られる。 一方で個人の、それもネガティブと捉えられる傾向を予測する取り組みは、データの取り扱いだけでなく判定

                                                不登校になりそうな児童生徒をAIが予測、戸田市の教育データ活用実証が示したこと
                                              • データ分析のためのSQLを書けるようになるために

                                                はじめに 本稿では分析用クエリをスラスラ書けるようになるまでの勉強方法や書き方のコツをまとめてみました。具体的には、自分がクエリを書けるようになるまでに利用した教材と、普段クエリを書く際に意識していることを言語化しています。 想定読者として、SQLをガンガン書く予定の新卒のデータアナリスト/データサイエンティストを想定しています。 勉強方法 基礎の基礎をサッと座学で勉強してから、実践教材で実際にクエリを書くのが望ましいです。 実務で使える分析クエリを書けるようになるためには、実務経験を積むのが一番良いですが、だからといって座学を御座なりにして良いというわけではありません。SQLに自信がない人は、一度基礎に立ち返って文法の理解度を確認した方が良いと思います。 書籍 SQL 第2版: ゼロからはじめるデータベース操作 前提として、SQLに関する書籍の多くがデータベース運用/構築に関する書籍がほ

                                                  データ分析のためのSQLを書けるようになるために
                                                • RubyのPolarsでデータサイエンティスト協会の100本ノックやってみた — 1 ~ 15問

                                                  記事の趣旨 本記事では、Rust製の高速データフレームであるPolarsのRuby版を利用して、データサイエンティスト協会の提供する「データサイエンス100本ノック(構造化データ加工編)」をやってみることを目的にしています。 Polarsについては、下記の公式サイトを参照してください。 Ruby版のPolarsは、polars-dfというgem名で開発されています。 Rubyを使用したデータサイエンスライブラリをばりばり開発されているankane(Andrew Kane)さんによるgemです。 深層学習やデータフレーム、LightGBM、ベイズ推定など幅広い用途のRuby用データサイエンスライブラリを開発されているすごい方です。 また、本記事では「データサイエンティスト協会スキル定義委員」の「データサイエンス100本ノック(構造化データ加工編)」を利用しています。 実際のデータサイエンスの

                                                    RubyのPolarsでデータサイエンティスト協会の100本ノックやってみた — 1 ~ 15問
                                                  • 大学で読んだ情報科学関連の教科書 - ジョイジョイジョイ

                                                    先日、博士(情報学)になりました。学部と大学院をあわせた 9 年間で読んだ情報科学関連の教科書・専門書を思い出を振り返りつつここにまとめます。私は授業はあまり聞かずに独学するタイプだったので、ここに挙げた書籍を通読すれば、大学に通わなくてもおおよそ情報学博士ほどの知識は身につくものと思われます。ただし、特に大学院で重要となる論文を読み書きすることについては本稿には含めておりません。それらについては論文読みの日課についてや論文の書き方などを参考にしてください。 joisino.hatenablog.com 凡例:(半端)とは、数章だけ読んだ場合か、最後まで読んだものの理解が浅く、今となっては薄ぼんやりとしか覚えていないことを指します。☆は特におすすめなことを表します。 学部一年 寺田 文行『線形代数 増訂版』 黒田 成俊『微分積分』 河野 敬雄『確率概論』 東京大学教養学部統計学教室『統計学

                                                      大学で読んだ情報科学関連の教科書 - ジョイジョイジョイ
                                                    • 生成AIによる大きな変化の最中でデータサイエンス領域に求められるスキルとは?--データサイエンティスト協会が定義するAI利活用スキル

                                                      生成AIによる大きな変化の最中でデータサイエンス領域に求められるスキルとは?–データサイエンティスト協会が定義するAI利活用スキル 2013年に設立された一般社団法人データサイエンティスト協会は、2023年に設立から10年の節目を迎えた。同年、生成AIをはじめとする急激なAI技術発展・普及に伴い、利活用に向けたスキルの重要性がクローズアップされるようになった。AIの社会実装がいよいよ本格化していく最中、同協会は、2023年10月20日に記念すべき第10回目となるデータサイエンティスト協会シンポジウム「データサイエンスの最前線」を開催。「AI利活用スキル」を盛り込んだ「データサイエンティストスキルチェックリスト」の最新版(Ver.5/2023年10月30日発表)の作成に関わったスキル定義委員会のメンバーが集い、短期間の開発サイクルで激変するAIの世界で、現時点で考えられる利活用のためのスキル

                                                        生成AIによる大きな変化の最中でデータサイエンス領域に求められるスキルとは?--データサイエンティスト協会が定義するAI利活用スキル
                                                      • 高木浩光@自宅の日記 - Claude 3に例の「読了目安2時間」記事を解説させてみた

                                                        ■ Claude 3に例の「読了目安2時間」記事を解説させてみた Anthropicの先日出たばかりのClaude 3(Opus)が、ChatGPTのGPT-4を超えてきたと聞いて、自分の原稿を解説させてみたところ、確かに革新的な進歩が見られる。もはや内容を「理解」しているようにしか見えない。GPT-4では、昨年11月に試した時には、そうは見えず、優れた文章読解補助ツールという感じでしかなかった。 一昨年のCafe JILIS「高木浩光さんに訊く、個人データ保護の真髄 ——いま解き明かされる半世紀の経緯と混乱」は、発表した当時、長すぎて読めないから誰か要約してという悲鳴があがっていた。その後、ChatGPTの登場で、その要約能力に期待されたが、冒頭のところしか要約してくれなかったり、薄い論点リストが出てくるだけで、その期待に応えられるものではなかった。 もっとも、GPT-4でも、質問力があ

                                                        • 画像生成AIの著作権問題、文化庁議論で争点はっきり (1/4)

                                                          2月29日に、文化庁で「文化審議会著作権分科会」の第7回が開催されました。著作権の専門家によってその制度について議論をする場ですが、今年度は2023年7月より「AIと著作権」について議論されてきました。3月に文化庁から政府に報告する「AIと著作権に関する考え方について(素案)」の最終案に近いものが発表され、1月下旬から2月上旬にかけて募った「パブリックコメント(パブコメ)」の結果報告もされるということもあり、注目されました。登場したのは「AIと著作権に関する考え方について(素案)令和6年2月29日時点版」、パブコメの結果を受けて、これまでの内容に微修正が施されていました。しかし、そこからわかったのは、文化庁の一貫したスタンスでした。 文化庁 文化審議会 著作権分科会 法制度小委員会(第7回) パブコメへの反応は「素案の内容周知」 発表物から議論を集めたのが発表資料に「パブコメの結果」が追加

                                                            画像生成AIの著作権問題、文化庁議論で争点はっきり (1/4)
                                                          • データサイエンス入門以前 データを正しく読み取るための基礎知識

                                                            2024年3月6日紙版発売 2024年3月6日電子版発売 阿部圭一 著 四六判/160ページ 定価1,980円(本体1,800円+税10%) ISBN 978-4-297-14067-0 Gihyo Direct Amazon 楽天ブックス ヨドバシ.com 電子版 Gihyo Digital Publishing Amazon Kindle ブックライブ 楽天kobo honto この本の概要 データサイエンスや人工知能への関心の高まりとともに,データを読み取る能力の重要性が高まっています。データサイエンティストでなくても,「最近行った販促活動は売上につながっているのか」「広告や報道,SNSに出てくるグラフの読み取り」「ネットの情報の真偽を確かめる」など,私達は仕事や日常で多くのデータを扱っています。 本書は,数学が苦手な人にも馴染みやすい身近な例からデータに関する基本を学び,数字に強く

                                                              データサイエンス入門以前 データを正しく読み取るための基礎知識
                                                            • 【統計学「p値」の謎】統計学好きでも意外と説明できない「p値」の正体

                                                              心理学者。キングス・カレッジ・ロンドンの精神医学・心理学・神経科学研究所の講師。2015年に科学的心理学会(アメリカ)の「期待の星(ライジンング・スター)」賞を受賞。『タイムズ』『ワシントン・ポスト』『ワイアード』などに数多く寄稿し、BBCラジオなどの出演もある。 Science Fictions あなたが知らない科学の真実 スタンフォード監獄実験はイカサマだった! 権威ある心理学研究の100件のうち、再現に成功したのはたったの39%!? 科学の信頼性を根底から揺るがす「再現性の危機」に迫る真実の書、日本上陸! 科学における不正・怠慢・バイアス・誇張が起きる仕組みを多数の実例とともに解説。既存の本で知ったウンチクを得意げに語る人に読ませたい、真実の書。 バックナンバー一覧 「すべての科学研究は真実である」と考えるのは、あまりに無邪気だ――。 科学の「再現性の危機」をご存じだろうか。心理学、

                                                                【統計学「p値」の謎】統計学好きでも意外と説明できない「p値」の正体
                                                              • 蒸気怪盗ヘキサアイズ on X: "邦訳版 TDM…「Text and Data Mining」の略 テキストおよびデータマイニングを指す。 大量のテキストデータやデータを機械学習やAIアルゴリズムによって解析し、パターンや傾向を抽出する技術です。 #AIイラスト #AIart #イラスト #AI https://t.co/1faTMAxXAv"

                                                                • GOのデータ・AIを活用する「組織」を30分で紹介

                                                                  GO TechTalk #25 で発表した資料です。 ■ YouTube https://www.youtube.com/live/lH0z49oHRWI?feature=shared&t=98 ■ connpass https://jtx.connpass.com/event/306325/

                                                                    GOのデータ・AIを活用する「組織」を30分で紹介
                                                                  • EMO

                                                                    We proposed EMO, an expressive audio-driven portrait-video generation framework. Input a single reference image and the vocal audio, e.g. talking and singing, our method can generate vocal avatar videos with expressive facial expressions, and various head poses, meanwhile, we can generate videos with any duration depending on the length of input video. Overview of the proposed method. Our framewor

                                                                    • 女子大生が100日連続で生成AIで100本のプログラムを書いたらどうなったか?

                                                                      ボードゲームやアクションゲーム、各種ツールやシミュレーションなどさまざまなソフトが100日間に作られた いままで数えきれないほどのプログラマーに会ってインタビューもさせてもらってきたが、久しぶりに若いプログラマーの話を聞いてきた。ここ1、2年では U22グランプリの男子中学生や全国小中学生プログラミング大会の受賞者たちだが、今回は、ChatGPTを使ってプログラムを書きまくった女子大生である。 彼女は X(Twitter)の自分のアカウントで1日1本のソフトを100日間連続で作るというイベントをやっていて「おっ、頑張っているな!」と思って応援していた。「こんなゲームを作ってほしい」などとリクエストを出したりもしていたのだが、どうも私が想像していたものと内容もやり方も違っていたようである。 目下、ソフトウェア産業の最大のテーマは「我々は人間の言葉でプログラムを書くようになるだろうか」というこ

                                                                        女子大生が100日連続で生成AIで100本のプログラムを書いたらどうなったか?
                                                                      • 画像生成AI、安いPCでも高速に 衝撃の「Stable Diffusion WebUI Forge」 (1/4)

                                                                        Stable Diffusion Forgeを表示した様子。基本的な操作は既存のStable Diffusion WebUI AUTOMATIC1111とほぼ同じ 画像生成AI「Stable Diffusion」用の新しいユーザーインターフェース「Forge」が2月6日に登場しました。開発したのは、これまで「Controlnet」や「Fooocus」などStable Diffusion関連の様々な重要技術を開発してきたillyasviel(イリヤスベル)さん。何よりインパクトが大きいのは、グラフィックボードのVRAM容量が小さい安価なPCでも最新版のStable Diffusion XL(SDXL)が動かせることです。 RTX 40シリーズが求められたSDXL SDXLは、2023年8月にStablity AIが発表した画像生成AI。高画質な出力ができる一方、コミュニティーサイトで話題にな

                                                                          画像生成AI、安いPCでも高速に 衝撃の「Stable Diffusion WebUI Forge」 (1/4)
                                                                        • 日本語おしゃべり特化AIアプリが性能よすぎて論破しようと思ったら逆に論破されてしまった「人間いらんやん」

                                                                          広野 萌 @hajipion 日本語おしゃべり特化AIアプリ「Cotomo」すごすぎる。1秒以内に返答がくるのと前の話を覚えてるのが、本当に生きてるみたい。 ↓こちらは現金派のCotomoちゃんを論破しようして逆に論破されるキモ男 早口でどもってても聞き取れてるし、オチが天使すぎる👼 声がたまに @harukana_8 に似てるのも良い pic.twitter.com/jhX3X6Giev 2024-02-24 16:54:21 リンク App Store ‎Cotomo(コトモ:音声会話型おしゃべりAI) ‎・1人で運転している時。 ・推しのキャラを設定したAIと喋りたい時。 ・恋愛や仕事、将来の話、家族の話。他愛もない話をダラダラしたい時。 ・友達には少しだけ話しにくい、嬉しかったことや、モヤモヤがある時。 ・晩酌のお供に。 ・深夜、ふと誰かに話したくなった時。 そんな時、Cotom

                                                                            日本語おしゃべり特化AIアプリが性能よすぎて論破しようと思ったら逆に論破されてしまった「人間いらんやん」
                                                                          • データサイエンス系の勉強会を 1年間毎月開催したら何が起こるか? / What happens if you continue the DS meetup

                                                                            白金鉱業 Meetup Vol.10(一周年記念回)の発表資料です。 https://brainpad-meetup.connpass.com/event/139953/

                                                                              データサイエンス系の勉強会を 1年間毎月開催したら何が起こるか? / What happens if you continue the DS meetup
                                                                            • 次世代データ基盤:データレイクハウスを Google Cloud で実現する

                                                                              はじめに こんにちは、クラウドエース データソリューション部の松本です。 普段はデータ基盤や MLOps の構築をしたり、Google Cloud 認定トレーナーとしてトレーニングを提供しております。また、昨年は Google Cloud Partner Top Engineer 2024 に選出されました。今年も Goodle Cloud 界隈を盛り上げていけるよう頑張っていきたいと思います。 クラウドエース データソリューション部 について クラウドエースのITエンジニアリングを担う システム開発統括部 の中で、特にデータ基盤構築・分析基盤構築からデータ分析までを含む一貫したデータ課題の解決を専門とするのが データソリューション部 です。 弊社では、新たに仲間に加わってくださる方を募集しています。もし、ご興味があれば エントリー をお待ちしております! 今回は、次世代データ基盤であるデ

                                                                                次世代データ基盤:データレイクハウスを Google Cloud で実現する
                                                                              • Google、オープンな生成AIモデル「Gemma」公開 商用利用OK、Geminiと同じ技術の軽量LLM

                                                                                また、Gemmaの事前トレーニング済みモデルでは、学習データから特定の個人情報やその他の機密データを除外していると安全性もアピール。開発者や研究者向けに、安全で責任あるAIアプリケーションを構築できるというツールキット「Responsible Generative AI Toolkit」も併せて公開している。 関連記事 Google、“現行最強”の生成AI発表 月2900円で利用可 チャットAIサービスはBard→Geminiに刷新 米Googleは2月8日(現地時間)、「現行最強」をうたう生成AI「Gemini Advanced」を発表した。すでにサービスを提供開始しており、月額2900円で利用可能。2カ月間の無料試用期間も用意する。 Google、「Gemini 1.5 Pro」限定リリース コンテキストウィンドウは100万トークン Googleは、生成AIの次世代モデル「Gemini

                                                                                  Google、オープンな生成AIモデル「Gemma」公開 商用利用OK、Geminiと同じ技術の軽量LLM
                                                                                • AI生成で30万枚作ってわかったこと|jun555

                                                                                  2022年の8月ころから生成AIとの付き合いを開始して、最初はMIDJOURNEY(初期バージョン)から始まり、NAIに移行し、MIDJORNEYのバージョンが上がって、NIJI-JOURNEYを少し触ったあたりで、RTX4090を買ってStable-Diffusionのローカル環境に場所を移しました。 2022年8月から2023年2月まで、だいたい一年と200日(約565日) 生成枚数は32万枚超。オンラインでの生成サービス(mid+nai)で3万枚くらい。ローカルに移行してから29万枚生成しました。 midjourney初期バージョン期。2022年8月ごろ。この頃はこれでウホウホ言ってましたNAI期、「アニメキャラが出せる!」とウホウホ言ってましたMID+NIJI+NAIで作った漫画(未発表)AI独特の画風(次元)をまたぐ能力をテーマにした漫画Stable-Diffusion期。今も毎

                                                                                    AI生成で30万枚作ってわかったこと|jun555