皆様こんにちは。AWS の パートナーソリューションアーキテクトの 宇賀神みずき こと しょぼちむ(@syobochim) です。9 月に入りましたが皆さまいかがお過ごしでしょうか ? この記事を書いている数日間は、めちゃくちゃ暑い日々が続いています。外に出るとジリジリと肌が焼ける感覚がします。暑い。皆さまも体調にはお気をつけください。 本連載では「チーム開発を意識した Git の使い方」をデータサイエンティストの方に向けてご紹介します。 初回の記事 では、Git のクローンやコミットなど基本的な操作をご紹介しました。今回は、チームでの開発に不可欠なブランチの作成やマージ、プルリクエストの作り方をご紹介します。 初回の記事と同じように、Git の操作には Amazon SageMaker Studio Lab (以降、 Studio Lab) を利用します。 Studio Lab はデータ
Amazon Web Services ブログ データサイエンス100本ノックが SageMaker Studio Lab からすぐに学べるようになりました 2022 年夏の甲子園は、決勝で満塁ホームランが出る記録的な試合となりました。球児が野球のノックを受けるのなら、エンジニアが受けるノックは何でしょう ? 本記事では「データサイエンス 100 本ノック(構造化データ加工編)」を Amazon SageMaker Studio Lab で簡単に学ぶ方法をご紹介します。データサイエンス 100 本ノックは、データベースのテーブルや CSV ファイルといった表形式のデータから欲しいデータを取り出す方法を学べる教材です。 GitHub で公開されており、 2022 年 8 月時点で 1,800 を超える Star がつけられています。 データサイエンス 100 本ノック(構造化データ加工編)ト
データに関係するビジネスはもはや存在しないと言える今、エンジニアであればたとえ専門領域でなくてもデータサイエンスの基本は知っておきたいところです。今回はその入門書『図解まるわかり データサイエンスのしくみ』(翔泳社)から、データと情報の違いやアルゴリズム、さらにデータ分析を楽しく学ぶ方法が解説されている「第1章 データサイエンスを支える技術~需要が高まる未来の必修科目~」を紹介します。 本記事は『図解まるわかり データサイエンスのしくみ』の「第1章 データサイエンスを支える技術~需要が高まる未来の必修科目~」から一部を抜粋したものです。掲載にあたって編集しています。 21世紀の資源 データと情報の違いとは? 私たちの生活の中では、「予測」や「見積もり」が必要な場面がたくさんあります(図1-1)。このとき、経験や勘に頼る方法もありますが、過去のデータを探したり、アンケートやインターネットなど
(Image by Wokandapix from Pixabay) 個人的な観測範囲での話ですが、データサイエンティストという職業は「21世紀で最もセクシーな職業」として刹那的な注目を集めた第一次ブーム、人工知能ブームに煽られて火がついた第二次ブーム、そして「未経験から3ヶ月で人生逆転」ムーブメントと折からのDXブームに煽られる形で沸き起こった第三次ブームを経て、何だかんだで社会に定着してきた感があります。 で、このブログを始めた頃からの連綿と続くテーマになっていますが、いつの時代も話題になるのが「データサイエンティスト(になるに)は何を勉強すべきか」ということ。7年前から恒例にしてきた「スキル要件」記事では、基本的には「どれも必要な知識(学識)」であるという前提で分野・領域・項目を挙げてきました。少なくとも、最初の3回ぐらいはそういう認識でスキル要件記事を書いていた気がします。 ところ
データアナリティクス事業本部の鈴木です。 私は業務でデータ分析や機械学習システムの開発のご支援をさせて頂いておりますが、その中で、こういう点に気を付けておくと、依頼側・分析者・開発者それぞれで準備がしやすいだろうなと思うポイントをまとめてみました。 はじめに この記事で準備ポイントを押さえることで、ご依頼頂いた際にプロジェクトをスムーズに立ち上げ、より良い結果をご一緒に出せるようにしたい思いがあります。 今回は以下の4つの観点をまとめてみました。 目標設定のポイント:プロジェクトを進めていく上での観点です。 データ作成のポイント:特に検証を始める際に準備しておくデータについての観点です。 データの種類について:データ作成の前提に関する観点です。 検証・運用場所について:検証や運用開始後の環境に関する観点です。 以下、各観点について説明していきます。 目標設定のポイント 1. 解決したい課題
ちなみにDXという略語では、「Transformation」が「X」と略されている。Transformationには「cross」、つまり「×」という意味が含有されているためだ。 DXへの3段階のステップ 図1から分かるように、DXの実現に至るまでには、基本的に下記の3段階のステップが必要とされている。 デジタイゼーション(Digitization): アナログ情報をデジタルデータへ変換すること。例えばタクシーの位置情報をリアルタイムなGPSデータにするなど デジタライゼーション(Digitalization): そのデジタルデータとデジタル技術を活用して、既存の業務プロセスやワークフローをコンピュータ上に実現することで効率化すること。例えばタクシーの位置データをクラウドで管理してリアルタイムに地図に表示し、人のオペレーターがタクシーの配車をより効率的に管理するなど DX: さらにAIやデ
電気通信大学は2023年度からデータサイエンス(DS)・人工知能(AI)でトップクラスの教育プログラムを始める計画だ。データ分析結果を踏まえた新サービスの実装や、AIの競技会「カグル」マスター取得など学部・大学院の6年一貫で手がける。10数社との産学連携に加え、世界的な実力を持つ実務家が指導に加わる。また1学年45人のうち、約5人の女子推薦枠を設定する。国立大学の女子枠は東日本で初めて。 電気通信大学は量子×AIの基礎を全1年生が学ぶなど、同分野の人材育成を強化している。今回は社会変革に向けたデザイン思考や、科学的な意思決定のシミュレーションなども折り込み、エキスパートレベルの実践教育に乗り出す。 DSでは企業課題の分析結果を生かしたソフトウエアの開発・実装まで手がける。AIの機械学習コンペティションのカグルに関わる講義や、米国電子電気技術者協会(IEEE)のDSカンファレンスへの参加を、
こんにちは、Wantedlyでデータサイエンティストをしている樋口です! 先日会社で買ってもらったデータビジュアライゼーションの基礎を読みました。データ可視化について網羅的にわかりやすく書かれており参考になったため、記事にまとめてみました。書籍の英語版は無料で公開されているため、よければこちらも参考にしてみてください。 データビジュアライゼーションの知識を学ぶことで、科学的に誤った表現をせずに、芸術的に美しい表現ができ、明確で明瞭かつ魅力的にデータから得られる示唆を伝えることができる様になります。📊 本記事では、特定のライブラリや描画手段によらないデータ可視化の基礎について紹介します。 分量が多くなってしまったので、本記事ではデータビジュアライゼーションの”グラフ"にのみ着目しています。グラフ以外の構成要素(色、タイトル、テキスト、etc.)については別途記事にしたいと思います。 本記事
総務省は2022年7月12日、「社会人のためのデータサイエンス演習」を同年10月4日にリニューアル開講すると発表した。この講座はデータサイエンス力の高い人材育成を目的としたオンライン講座。 すでに受講者を募集している。開講期間は、2022年10月4日~2022年12月13日の予定。学習時間は1回当たり10分程度で、1週間当たり5~7回受講することで約5週間で修了することを想定している。Webページから受講登録が必要だが、登録料や受講料は無料だ。 「データサイエンス」「予測と分析」「ビジネスでの利用」を更新 各週のテーマは以下の通り。 関連記事 Diabetes Dataset:糖尿病(年齢/血圧/血糖値などの10項目)の表形式データセット データセット「Diabetes」について説明。442件の糖尿病の「表形式データ(年齢/血圧/血糖値などの10項目)」+「ラベル(1年後の糖尿病進行度)」
■ 内容 ・未来の車両状況を考慮した効率的なマッチングの実現(織田) ・MoT におけるデータ分析業務のフロー(老木) ・機械学習モデルによるAI予約のユーザ体験の改善(宇都) ■ スライド内リンク集 p. 24 Google Cloud Day 2021 https://services.google.com/fh/files/events/d1-da-07.pdf p. 55 https://www.kaggle.com/kuto0633 p. 63 DeNA TechCon2021 https://speakerdeck.com/mot_ai_tech/takusiwo-xi-wang-falseri-shi-nihu-bu-bigqueryniyoruaitoapiinhura?slide=8 p. 68 MoT TechTalk #12 https://speakerdeck.c
全体の170科目 履修・修了証申請のための要件 [対象] 学部後期課程の学生(3~4年生)が対象ですが、大学院学生も各研究科の規則の範囲で履修できます。 [履修] 合計で12単位以上を取得した学生に修了証を交付します。個別の科目のみを履修することも歓迎します。 [分野と志向] 多くの科目の中から履修科目を適切に選択するための2つの指標が示してあります。 分野区分 : A=数理科目、B=統計・データサイエンス科目、C=情報・プログラミング科目 志向区分 : I=一般科目、II=アドバンスト科目、III=目的志向科目(専門性が高い科目) 注意事項: (1)本プログラムは学部後期課程科目にのみ適用されます。教養学部前期課程における科目は対象とはなりません。 (2)2019年から本プログラムに多くの科目が加わりました。それらのいくつかは、2018年にも開設されていますが、本教育プログラムの対象科目
「AIや機械学習を導入して、会社のDXを進めたい」。そのためには大量のデータが必要なことは分かっているが、実際に必要なのはどんなデータなのか、そのデータをどうやって分析すれば仕事に活用できるのかが分からなくて困っているーー。そんな悩みを抱えるビジネスパーソンを対象に、データサイエンスの教育プログラムを提供する株式会社データミックスの代表取締役・堅田洋資氏が、データ活用方法を伝えるセミナーを開催しました。データの質や量、分析者の腕前などに左右されるデータ分析には、常に「わからない」というリスクがつきまといます。新型コロナ以後、これまでのデータが使えない時代に行うべきデータサイエンスとは何かを語ります。 数字を聞くようにすれば、データを見るクセはついてくる 堅田洋資氏:さて、後半戦にいきましょう。問いの量を増やすにはどうしたらいいのか。これは精神論というわけじゃないんですけれども、マネジメント
「AIや機械学習を導入して、会社のDXを進めたい」。そのためには大量のデータが必要なことは分かっているが、実際に必要なのはどんなデータなのか、そのデータをどうやって分析すれば仕事に活用できるのかが分からなくて困っているーー。そんな悩みを抱えるビジネスパーソンを対象に、データサイエンスの教育プログラムを提供する株式会社データミックスの代表取締役・堅田洋資氏が、データ活用方法を伝えるセミナーを開催しました。映画『マネーボール』で立てられた問い「出塁率の最大化」をヒントに、良い問いとはなにかについて、マーケティングツールなどを使いながら詳しく解説します。 映画『マネーボール』に学ぶ、良質な問いの立て方 堅田洋資氏:それでは「問いの質を上げるにはどうするのか」「どうやって問いの量を増やすのか」、そして「データで競争優位をどう築くか」の3つについて、これから話をしていきます。 まず、問いの質を上げる
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く