並び順

ブックマーク数

期間指定

  • から
  • まで

81 - 120 件 / 80597件

新着順 人気順

データの検索結果81 - 120 件 / 80597件

  • SQLをはじめよう - 初心者でもわかる、構文とデータ取得の基本 - エンジニアHub|Webエンジニアのキャリアを考える!

    SQLをはじめよう - 初心者でもわかる、構文とデータ取得の基本 リレーショナルデータベース管理システム(RDBMS)において、データの操作や定義を行うためのデータベース言語であるSQL。“データ”の重要性が謳われるようになった昨今において、この言語はより重要性を増しています。本稿では日本MySQLユーザ会の副代表であり、データベースを中心とした業務システムの設計・コンサルティングを手掛ける坂井恵さんが、「SQLを学びはじめたばかりの若手IT技術者」や「社内のデータを利用したい非IT技術者」に向けて、SQLによるデータ操作の基礎を解説します。 企業活動において、近年ますます、蓄積されたデータの活用が重要になっています。自社の持つ大量のデータの中から必要なデータを抽出・集計するという操作は、以前はITエンジニアが用意した画面を通して限定的にのみ行うことができるのが一般的でした。 しかし最近は

      SQLをはじめよう - 初心者でもわかる、構文とデータ取得の基本 - エンジニアHub|Webエンジニアのキャリアを考える!
    • NTTデータ子会社のクラウドが壊滅、ストレージのバグで戸籍や税務などのデータ全消失 : 痛いニュース(ノ∀`)

      NTTデータ子会社のクラウドが壊滅、ストレージのバグで戸籍や税務などのデータ全消失 1 名前:ベスタ(茸) [US]:2019/12/05(木) 17:18:57.47 ID:yztuQHN80 日本電子計算株式会社(通称:JIP)とは、NTTデータの子会社、いわゆる「デー子」である。 概要 1962年に日本証券金融株式会社の電算室が独立し「日本電子計算」として分社化するかたちで設立された。 2012年にNTTデータにより公開買付(TOB)が行われ約100億円で買収された。 この買収は「NTTデータは銀行業には強いが証券業には弱い」というのを補うためだとしている。 2019年12月4日午前11時ごろ、同社が運営するクラウドサービスが吹っ飛び、その上で動く全国の自治体システムも吹っ飛び、全国約50の自治体で戸籍管理や税務処理、医療保険、図書館などのデータが消失した。 2019年12月4日午後

        NTTデータ子会社のクラウドが壊滅、ストレージのバグで戸籍や税務などのデータ全消失 : 痛いニュース(ノ∀`)
      • 新しいiPhoneにデータ移行するとプライベートアドレスも移植される厄介な仕様があった「一般人がこの原因にたどり着けるわけがない」

        ブッダスティック / ひゅでポン @Buddha_s_Stick 最近のiPhoneの不具合?仕様?で1番厄介だなぁと思ったのは 新しいiPhone買ったときに指示通りにデータ移行すると「プライベートアドレス」機能で使われるMACアドレスも移植されて、両方のiPhoneで同じWi-Fiに繋いでたら一部のサイトが接続不可になること 一般人がこの原因に辿り着ける訳がないだろ 2021-11-27 10:17:35 リンク 広島大学情報メディア教育研究センター MACアドレスの確認方法 | 広島大学情報メディア教育研究センター MACアドレスとは、そのコンピュータ機器のネットワークインターフェイスが持つ、ハードウエア固有の番号のことです。16進数で表記され、0から9の数字およびAからFまでの12個の文字で表されます。機器によっては「物理アドレス」「ethernetアドレス」などと表記されているこ

          新しいiPhoneにデータ移行するとプライベートアドレスも移植される厄介な仕様があった「一般人がこの原因にたどり着けるわけがない」
        • 食べログの得点計算についてのポジティブな可能性を考えるー操作されたデータを検証する難しさー(井上明人) - エキスパート - Yahoo!ニュース

          久しぶりのyahoo個人への投稿となりますが、この記事を公開するのは、正直、気が重いな、と思いつつ、公開します。 というのも、今、食べログに対して非常にネガティブな解釈が広がっているわけですが、何かしらポジティブな材料を提供するとなると、確実にいろいろ言われるだろうなあと思って気が重くて仕方がないのですが、ただ、人生の一時期、食べログにハマっていた人間として、論点として提供されるべきポイントが、提供されていないと感じましたので、本記事を公開する次第です。 ◆食べログの評価点数分布の「不自然さ」 さて、近年、食べログの点数評価アルゴリズムは、頻繁にその不正を疑われ議論になっています。 2016年には、評価アルゴリズムのリセットがあった際には、いくつかの店舗がいきなり3.0の点数にリセットされるなどといったことがあり、記事にもなりました。 そして10月8日に、藍屋えんさんという方が、ご自身のブ

            食べログの得点計算についてのポジティブな可能性を考えるー操作されたデータを検証する難しさー(井上明人) - エキスパート - Yahoo!ニュース
          • タレントに貸したMacBook Proが「データ全削除」状態で返却され関係者が苦言|ガジェット通信 GetNews

            タレントに貸したパソコンが返却された際、パソコン内部に入っていたデータがすべて削除されていることが判明し、関係者が苦言を呈しています。 MacBook Proデータ全削除で返却 関係者は「提携タレントに貸与していたMacBook Proがデータ全削除された状態で返ってきました」とコメントしていることから、単に記録されたファイルが消されたのではなく、初期化またはそれに近い状態で返却されたと推測されます。 名前は不明だが女性である可能性が高い このタレントが誰なのか不明ですが、関係者は「国民的アイドルグループのプロデューサーが関与している新規アイドルユニットへの加入も決まっていました」ともコメントしていることから、女性である可能性が高いかもしれません。 <タレントの関係者のコメント> 「提携タレントに貸与していたMacBook Proがデータ全削除された状態で返ってきました。データは会社の財産

              タレントに貸したMacBook Proが「データ全削除」状態で返却され関係者が苦言|ガジェット通信 GetNews
            • Appleの移動データを加工したらわかった東京の厳しい現実 - Qiita

              こんにちは、Exploratoryの白戸です。 Appleは新型コロナウイルスの対策支援として、Appleマップでの経路検索をもとにした移動傾向のデータを公開しています。ところが、残念ながらこのデータはそのままでは簡単に可視化できるようなフォーマットになっておらず、ちょっとした加工を行う必要があります。 しかし逆に、加工の仕方さえわかってしまえばそれぞれの都市や地域の移動データを可視化することで、恐怖を煽るばかりのマスコミからは見えてこない現状を理解することができるようになります。 今回はこのAppleの移動傾向データを簡単に可視化できるようにするための基本的な加工方法を、みなさんと共有させていただければと思います。 データはこちらからダウンロードすることができます。 以下は「モダンでシンプルなUIを使ってデータサイエンスができる」Exploratoryを使って、「日本で最も自粛している都

                Appleの移動データを加工したらわかった東京の厳しい現実 - Qiita
              • データ分析のための統計学入門.pdf

                • 行動経済学論文のデータ捏造を暴いた記事の大意を和訳してお届けします|瀬川知己のノート

                  昨日Twitterを眺めていたら、衝撃的な論文が飛び込んできた。「行動経済学」に関する論文で取り扱われたデータが捏造だったのではないか、と疑義を投げかける論文である。そこで今回は、この論文の論証の大意を日本語でお届けしたい。また、その前後に、行動経済学とは、また、行動経済学の今後は、等についても、簡単に触れてみたい。 そもそも行動経済学とは 行動経済学を一言で表すなら、「経済学と心理学の融合」とでもいえばいいだろうか。そもそも従来の経済学では、人は「合理的に判断する」生き物として描かれていた。ありとあらゆる便益を計算し、比較し、より便益が大きい選択肢をとるその様は、「ホモ・エコノミクス(合理的経済人)」と(しばしば揶揄の意味をこめて)呼ばれてきた。 行動経済学は、それに対して、「人々の心理的な側面」をより重要視したアプローチをとる。仮定する人々を、より現実の人々が下す価値判断に近い行動をと

                    行動経済学論文のデータ捏造を暴いた記事の大意を和訳してお届けします|瀬川知己のノート
                  • データ視覚化のプロが選ぶデータ分析のオススメ本32選

                    データ分析&データ視覚化のコンサルティングをしております、永田ゆかりと申します。 これまで2000人以上の方にデータ分析や活用の研修・トレーニング講師、企業への分析コンサルティングをさせていただいており、仕事をさせていただく中で必要な本を読み続けているうちに、気がついたらデータ分析領域の本を200冊以上読んでいました。 中でもデータビジュアライゼーション・視覚化の領域に関しては私自身の得意領域ということもあり、数多く読み込んでいます。 本記事では数多くのクライアントの方々との問題解決に役立った知識・ノウハウが書かれている良書をご紹介させていただきますので、是非最後までご覧ください。 データ可視化そのものについて知りたいたは、こちらの記事からどうぞ。 データ可視化とは?その重要性や手法、よくある課題と解決策を解説 データ分析における視覚化(ビジュアライゼーション)系のおすすめの本17選1 S

                      データ視覚化のプロが選ぶデータ分析のオススメ本32選
                    • 【特集】 不要になったHDDを手放す場合の処理方法まとめ。譲渡に際してのデータ完全消去から物理的な破壊まで

                        【特集】 不要になったHDDを手放す場合の処理方法まとめ。譲渡に際してのデータ完全消去から物理的な破壊まで
                      • 「年収300万円の男性の63%が子どもを持たずに生涯を終える」交際への興味、性経験がない人の衝撃データ 未婚率の上昇は"若者の恋愛離れ"が原因ではない

                        少子化の原因として未婚化、ひいては若者の恋愛離れが問題視されがちだ。本当にそうなのか。東京財団政策研究所主任研究員の坂元晴香さんは「交際相手がなく異性との交際に興味がないと答えた男性の内訳を見ると、年収300万未満で75%を占めており、年収800万円以上は0.1%しかいない。実際、年収300万円の男性が生涯子どもを持たない割合は62.8%。少子化の原因が若者の価値観の変化ではないことは明らかだ」という――。 少子化の原因は「若者の価値観の変化」ではない 2022年に我が国で生まれた日本人の子どもの数(出生数)は77万747人で、統計を開始した1899年以降最も少ない数となり、初めて80万人台を下回った。政府も「異次元の少子化対策」を打ち出すなど、止まらない少子化をいかにくいとめるかが喫緊の課題となっているが、残念ながら現在のところ出生数が回復基調に戻る兆しはない。 そもそも、少子化対策を実

                          「年収300万円の男性の63%が子どもを持たずに生涯を終える」交際への興味、性経験がない人の衝撃データ 未婚率の上昇は"若者の恋愛離れ"が原因ではない
                        • データ分析の初心者はExcelを使い、中級者はR, Python, SAS, SPSSなどを使い、上級者は「Excel」に戻っていく「Excelに始まりExcelに終わる」

                          naki @naki_mk 私のツール遍歴 新社会人「Excelの機能たくさん覚えて市場価値アップだ!まずはショートカットっと」 2年目「BIツール超便利じゃん…Excelとか必要なくね…スクショ貼リ付ケ-」 3年目「BIツールだけだと何かと不便…Python覚えるか…」 6年目「誰でも使えるように設計されてるExcelが便利すぎる…」 2022-08-19 09:58:41

                            データ分析の初心者はExcelを使い、中級者はR, Python, SAS, SPSSなどを使い、上級者は「Excel」に戻っていく「Excelに始まりExcelに終わる」
                          • PHPとPythonとRubyの連想配列のデータ構造が同時期に同じ方針で性能改善されてた話 - hnwの日記

                            PHPとPythonとRubyの連想配列のデータ構造がそれぞれ4〜5年ほど前に見直され、ベンチマークテストによっては倍以上速くなったということがありました。具体的には以下のバージョンで実装の大変更がありました。 PHP 7.0.0 HashTable高速化 (2015/11) Python 3.6.0 dictobject高速化 (2016/12) Ruby 2.4.0 st_table高速化 (2016/12) これらのデータ構造はユーザーの利用する連想配列だけでなく言語のコアでも利用されているので、言語全体の性能改善に貢献しています1。 スクリプト言語3つが同時期に同じデータ構造の改善に取り組んだだけでも面白い現象ですが、さらに面白いことに各実装の方針は非常に似ています。独立に改善に取り組んだのに同じ結論に至ったとすれば興味深い偶然と言えるでしょう2。 本稿では3言語の連想配列の従来実

                              PHPとPythonとRubyの連想配列のデータ構造が同時期に同じ方針で性能改善されてた話 - hnwの日記
                            • 音楽データからボーカル・ドラム・ベースの音を個別に抽出できる「spleeter」

                              ボーカルや複数の楽器で構成された音楽データを、機械学習を用いてそれぞれの音に分類したファイルとして出力する「spleeter」がGitHubで公開されています。ボーカルの声や伴奏の部分だけを抽出できるとのことで、実際に使ってみました。 deezer/spleeter: Deezer source separation library including pretrained models. https://github.com/deezer/spleeter 以下のURLにアクセスすれば、spleeterでサンプルの楽曲を分離することができます。 spleeter.ipynb - Colaboratory https://colab.research.google.com/github/deezer/spleeter/blob/master/spleeter.ipynb#scrollTo=

                                音楽データからボーカル・ドラム・ベースの音を個別に抽出できる「spleeter」
                              • 無料の統計学講座が開講、多変量データの解析法を学べる | Ledge.ai

                                画像は『「統計学Ⅲ:多変量データ解析法」講座PV ~ gacco:無料で学べる大学講座』より オンライン講座サイト「gacco(ガッコ)」では2021年1月14日から、日本統計学会と日本行動計量学会の協力のもとに作成した「統計学Ⅲ:多変量データ解析法」が開講される。受講料は無料。 『「統計学Ⅲ:多変量データ解析法」講座PV ~ gacco:無料で学べる大学講座』より 実際のデータは複数個の測定項目からなる多変量データであることが多く、そのようなデータの統計解析手法の学習は、統計手法の現実問題への応用で極めて重要なものと言える。本講座では、多変量解析法を実際のデータに適用する際の注意点や実際の応用例を中心に学習できる。 『「統計学Ⅲ:多変量データ解析法」講座PV ~ gacco:無料で学べる大学講座』より 講師は、横浜市立大学データサイエンス学部教授の岩崎学氏、大阪大学大学院人間科学研究科

                                  無料の統計学講座が開講、多変量データの解析法を学べる | Ledge.ai
                                • 神戸市がやってくれました! 全国規模の人口移動・就業状況の「ダッシュボード」、全国の誰にでも無料公開。Tableau使いの市職員が作成、オープンデータの可視化・活用方法として提案【地図と位置情報】

                                    神戸市がやってくれました! 全国規模の人口移動・就業状況の「ダッシュボード」、全国の誰にでも無料公開。Tableau使いの市職員が作成、オープンデータの可視化・活用方法として提案【地図と位置情報】
                                  • はじめに — マンガと学ぶデータビジュアライゼーション

                                    はじめに# データビジュアライゼーションとは,数値や文章などのデータに基づいた情報を,人間が理解しやすい形に視覚化する技術を指します. このサイトは,文化庁のメディア芸術データベース・ラボ(MADB Lab)で公開されている四大少年誌( 週刊少年サンデー, 週刊少年ジャンプ, 週刊少年チャンピオン, 週刊少年マガジン )のデータを用いて,データビジュアライゼーションの学習を手助けすることを目指しています. データビジュアライゼーション(に限らずデータ分析全般)の学習において重要なのは,分析対象のデータに興味を持てるかどうかです. 本書では約47年の四大少年誌のマンガ作品データを採用しているため,モチベーションを保ちつつ学習を進めることが可能です.

                                    • HPEのサーバー向けSAS SSD、稼働32,768時間超えでデータ喪失。復旧も不可

                                        HPEのサーバー向けSAS SSD、稼働32,768時間超えでデータ喪失。復旧も不可
                                      • 40ギガのピカチュウ画像をやりとり、社内データはテラバイト級――ポケモン社が「Box」「Googleドライブ」を使い分ける理由

                                        40ギガのピカチュウ画像をやりとり、社内データはテラバイト級――ポケモン社が「Box」「Googleドライブ」を使い分ける理由(1/2 ページ) 「ポケットモンスター」シリーズの版権管理を手掛ける「株式会社ポケモン」(以下「ポケモン社」)。ピカチュウなどおなじみのキャラクターが米Nianticの「Pokemon GO」など他社のゲームに登場するのは、ポケモン社がIPを提供しているためだ。同社は他にも多様なパートナー企業と組み、ポケモンを起用した商品・サービスの展開を支援している。だが、保有するポケモンの画像・動画のデータ量が膨大であるため、共有や管理に苦労する場合が多いという。 40GBのピカチュウ画像をやりとり ポケモン社テクニカルディレクターの関剛さんは、Box Japanがこのほど開いた年次カンファレンス「Box World Tour Tokyo 2019」に登壇し、「キャラクターご

                                          40ギガのピカチュウ画像をやりとり、社内データはテラバイト級――ポケモン社が「Box」「Googleドライブ」を使い分ける理由
                                        • アイコンを見るだけでデータが破壊されるNTFSの脆弱性

                                            アイコンを見るだけでデータが破壊されるNTFSの脆弱性
                                          • タダで学べるデータサイエンス名著5冊 【日本書は高額でも英語ができれば怖くない】 - Qiita

                                            この時期だからこそ自学しよう 海外って太っ腹な組織が多いのか、無料で読める専門書がすごく多い。 これ系のまとめ記事は他にもありますが、 翻訳済の日本の本と、原著を並べて表示していきたいと思います。 特にデータサイエンス分野に限って紹介。 お高いあの名著も実は原著なら無料かも? (2020年5月時点) 続編、データサイエンスの名大学講座 を書きました (2020年8月) 1冊目 邦題 : 統計的学習の基礎(1万5千円) 俗に言う「カステラ本」です。 日本では2014年に翻訳されましたが、原著は2001年と今から約20年前に出版されました。 内容からしても、当時は体系的に理論学習ができる刷新的な一冊だったのでしょう。 まさに「アルゴリズム・理論の辞書」。 年代的に古い感じはしますが、基礎はいつだって大切です。 数字に強くないと絶対読み切れない。。。 原著 : The Elements of S

                                              タダで学べるデータサイエンス名著5冊 【日本書は高額でも英語ができれば怖くない】 - Qiita
                                            • バンナム、約42万フレーム分のモーションデータ無償公開 歩行、格闘、ダンスなど 研究用に

                                              ライセンスは「CC BY-NC-ND 4.0」で、利用の際にクレジットを表示すること、非営利でのみ利用すること、内容を改変しないことを求めている。 バンダイナムコは、メタバースやXR技術が広まる中、コンテンツ規模が拡大すると従来のモーション制作過程では限界を迎えると予想。AIを活用したキャラクターのモーションを生成する研究を行っている。 一方、AIによるモーション研究はデータセットの入手が難しいため研究開発が進んでいないとして、自社で使っているデータの一部を提供することにしたという。 関連記事 実在しない顔の画像3000点を無償配布、AI学習用データセットに 法人向け・商用利用可 AI活用のコンサルティング事業を手掛けるAPTOなど2社が、AIの学習データとして利用できる、実在しない男女の顔写真3000枚の無償配布を始めた。法人を対象に11月30日までの期間限定で提供し、商用利用も認める。

                                                バンナム、約42万フレーム分のモーションデータ無償公開 歩行、格闘、ダンスなど 研究用に
                                              • 何故データサイエンティストになりたかったら、きちんと体系立てて学ばなければならないのか - 渋谷駅前で働くデータサイエンティストのブログ

                                                先日、Quora日本語版でこんなやり取りがありました。 基本的にはここで述べた通りの話なのですが、折角なのでブログの方でも記事としてちょっとまとめておこうと思います。題して「何故データサイエンティストになりたかったら、きちんと体系立てて学ばなければならないのか」というお話です。 問題意識としては毎回引き合いに出しているこちらの過去記事で論じられているような「ワナビーデータサイエンティスト」たちをどう導くべきかという議論が以前から各所であり、それらを念頭に置いています。なお毎度のことで恐縮ですが、僕も基本的には独学一本の素人ですので以下の記述に誤りや説明不足の点などあればご指摘くださると幸いです。 一般的なソフトウェア開発と、統計分析や機械学習との違い 統計分析や機械学習を仕事にするなら、その「振る舞い」を体系立てて学ぶ必要がある きちんと体系立てて学ばなかった結果として陥りがちな罠 余談

                                                  何故データサイエンティストになりたかったら、きちんと体系立てて学ばなければならないのか - 渋谷駅前で働くデータサイエンティストのブログ
                                                • データ変更を伴うバッチ処理を書く時に考慮していること - shallowな暮らし

                                                  こんにちは、id:shallow1729です。最近はインフラ寄りなお仕事をよくやっていますがこれまでにいくつかデータ移行やデータ基盤構築などのバッチ処理のお仕事をしてきました。以前にも一度そういった経験を元に記事を書いたのですが、MySQLやシステムに関する知識が以前よりも増えた今もう一度書き直したいなと思いました。 なので今回はバッチ処理を書く時のテクニック2022版という感じです。今の仕事の関係でMySQLやrailsを前提にしている話が多いですが、おそらく他のデータベースを使っている人にも役に立つ話が多いのではないかと思います。ただ、今回の記事は経験に基づくものが多く、あまりよくないアイデアもあるかもしれません。改善点や間違いなどあればご指摘ください。 冪等性を持つように 冪等性とは端的に言えばある操作を複数回実行しても一回しか実行しなかった時と同じ結果になる性質の事です。長時間かか

                                                    データ変更を伴うバッチ処理を書く時に考慮していること - shallowな暮らし
                                                  • ひろゆき氏「20〜30代が全員投票に行っても、40代以上が40%投票するだけで同数、若者が選挙に行けば変わると言っている人は嘘つき。データを見ればわかる」→「40代以上が老人?」「どのみち選挙には行く」

                                                    カトオX @ktsn0 ひろゆき(@hiroyuki_ni )氏が「若者が選挙に行けば政治が変わると言ってる人は全て嘘つき。2〜30代の投票率が100%になっても40代以上が40%投票するだけで同数。40代以上の投票率は常に50%近い。これは僕の考えとかじゃなくて単に事実」と言っていたので調べたらマジだったのでご査収ください。 pic.twitter.com/RKkp4hEuAH 2019-07-16 11:25:48 カトオX @ktsn0 とはいえ、選挙は若者vs高齢者の戦いではなく政党の戦いですし、40代以上でも若者の未来を考えて投票に行く人もいますので、若者は投票に行ってもいいんじゃないかなと思います。一番無駄なのはTwitterで政権批判を繰り返し、クソリプバトルをすることです。意見は選挙箱へどうぞ。 2019-07-16 12:25:25 カトオX @ktsn0 「若者よ、選挙

                                                      ひろゆき氏「20〜30代が全員投票に行っても、40代以上が40%投票するだけで同数、若者が選挙に行けば変わると言っている人は嘘つき。データを見ればわかる」→「40代以上が老人?」「どのみち選挙には行く」
                                                    • 要 友紀子☂️SWASH on Twitter: "犯罪件数は場所ごとに統計データがあります。ラブホテル、ビジネスホテルを含む宿泊施設においては、風営法改正前も改正後も、凶悪犯罪事件はあまり経年変化なく継続的に起きてます。けれど、風俗店という場所では凶悪犯罪はほぼ起こってません。つ… https://t.co/qynLNvV77x"

                                                      犯罪件数は場所ごとに統計データがあります。ラブホテル、ビジネスホテルを含む宿泊施設においては、風営法改正前も改正後も、凶悪犯罪事件はあまり経年変化なく継続的に起きてます。けれど、風俗店という場所では凶悪犯罪はほぼ起こってません。つ… https://t.co/qynLNvV77x

                                                        要 友紀子☂️SWASH on Twitter: "犯罪件数は場所ごとに統計データがあります。ラブホテル、ビジネスホテルを含む宿泊施設においては、風営法改正前も改正後も、凶悪犯罪事件はあまり経年変化なく継続的に起きてます。けれど、風俗店という場所では凶悪犯罪はほぼ起こってません。つ… https://t.co/qynLNvV77x"
                                                      • NHKが持っているデータをオープンに 1人のエンジニアの熱がオールドメディアを根幹から変えるかもしれないよ|NHK取材ノート

                                                        毎日めまぐるしく変わる新型コロナウイルスのデータを、24時間いつでも、誰にでも、わかりやすく伝えることは簡単ではありません。 NHKの新型コロナウイルス特設サイトの担当エンジニアとして奮闘しているのがこの「ジャージ男」。テクニカルディレクターの斉藤一成くんです。サッカー好きの彼のことをここでは「カズ」と呼ばせてもらいます。 NHKのエンジニアのほとんどは「放送」に関わる仕事をしていますが、そのなかでカズはウェブ周りのシステムの設計から開発、運用までを手がけるいわゆる「フルスタック」のエンジニアとして異彩を放ちまくっています。 「できるものはすべてオープンにしたい」というカズの提案で去年12月に始まったのが、NHKのサイトにある新型コロナ感染者のデータを誰でも自由にダウンロードできる取り組みです。 下のページにアクセスするとグラフの下に「データーのダウンロードはこちら」というリンクがあるのが

                                                          NHKが持っているデータをオープンに 1人のエンジニアの熱がオールドメディアを根幹から変えるかもしれないよ|NHK取材ノート
                                                        • ChatGPTに自社データを組み込んで新しい検索体験を模索してみました|masa_kazama

                                                          イントロChatGPTやBing、NotionAIなどの大規模自然言語モデル(LLM)を活用したサービスが注目を集めています。対話、要約、翻訳、アイデア生成などの多様なタスクにおいて、とても性能が高いです。ただ、ChatGPTでは、ときどき嘘が混じっていたり、文献が捏造されたりすることがあります。 ChatGPTとの対話画面(結果の書籍は存在しない)それを防ぐために、BingやPerplexityでは、文献を引用した上で、なるべく嘘が紛れ込まない形で回答してくれます。 Perplexityでは引用もつけてくれるしかし、これらのAIは、Web上の公開されている一部のデータを元に学習しているので、公開されてないデータに対しては当然ながら、正しく回答できません。 そこで、この記事では、自社が保有しているデータをChatGPTに組み込んで、自社オリジナルのPerplexityのようなシステムを作る

                                                            ChatGPTに自社データを組み込んで新しい検索体験を模索してみました|masa_kazama
                                                          • 『鬼滅の刃』大ヒットの背景には、既存のアニメ業界の常識を覆す「視聴の最大化」という流通戦略があった! 1兆円規模の「鬼滅経済圏」が成立した要因を、データから分析する

                                                            『鬼滅の刃』大ヒットの背景には、既存のアニメ業界の常識を覆す「視聴の最大化」という流通戦略があった! 1兆円規模の「鬼滅経済圏」が成立した要因を、データから分析する 興行収入400億円超えと、空前の大ヒットとなった『鬼滅の刃』の劇場版『無限列車編』や、リリースから3か月で約300億円の売上をあげた『ウマ娘 プリティーダービー』。栄枯盛衰の激しいコンテンツ業界の中にあって、なぜこれらのタイトルが爆発的なヒットを成し得たのか? 2021年10月14日に発売された『推しエコノミー 「仮想一等地」が変えるエンタメの未来』は、そうした疑問を考えていくうえで非常に参考になる一冊である。 本著は、バンダイナムコにてコンテンツビジネスに実際に従事した経験を持ち、現在でもブシロードの顧問などを務める中山淳雄氏が、実務で得た経験をベースにしつつも、半ばライフワークとして調べ上げた詳細な分析内容を、まとめ上げた

                                                              『鬼滅の刃』大ヒットの背景には、既存のアニメ業界の常識を覆す「視聴の最大化」という流通戦略があった! 1兆円規模の「鬼滅経済圏」が成立した要因を、データから分析する
                                                            • 『みんなのデータ構造』でデータ構造の基礎を学んだ - valid,invalid

                                                              データ構造とアルゴリズムの学習の一環として『みんなのデータ構造』を読んだ。これまでで最も良いデータ構造の学習になった。 みんなのデータ構造 作者:Pat Morin発売日: 2018/07/20メディア: 単行本(ソフトカバー) 日本語訳がWebで公開されているので気になる方は無料で読める。が、著者や訳者や出版社応援の意味も込めて購入すると良いと思います。また、ラムダノート社のサイトから買うと紙書籍と電子書籍のセットがお得。 内容 データ構造とアルゴリズムに関連する本はアルゴリズム寄りのものが多いが、データ構造に焦点を当て続けていることが本書の特色。 内容の依存関係 p.21より 大学の教科書のように、正確性を優先したハードコアな内容。 アルゴリズムの内容も少しだがある。「11章 整列アルゴリズム」ではそれまでの章で学んだデータ構造がどのように使われるかを一瞥でき、「12章 グラフ」では深

                                                                『みんなのデータ構造』でデータ構造の基礎を学んだ - valid,invalid
                                                              • 大澤昇平🇺🇳 on Twitter: "[Apology] この度は当職による行き過ぎた言動が、皆様方にご迷惑、不快感を与えた点について、深く陳謝します。 ①一連のツイートの中で当職が言及した、特定国籍の人々の能力に関する当社の判断は、限られたデータにAIが適合し過ぎた結果である「過学習」によるものです。"

                                                                [Apology] この度は当職による行き過ぎた言動が、皆様方にご迷惑、不快感を与えた点について、深く陳謝します。 ①一連のツイートの中で当職が言及した、特定国籍の人々の能力に関する当社の判断は、限られたデータにAIが適合し過ぎた結果である「過学習」によるものです。

                                                                  大澤昇平🇺🇳 on Twitter: "[Apology] この度は当職による行き過ぎた言動が、皆様方にご迷惑、不快感を与えた点について、深く陳謝します。 ①一連のツイートの中で当職が言及した、特定国籍の人々の能力に関する当社の判断は、限られたデータにAIが適合し過ぎた結果である「過学習」によるものです。"
                                                                • データサイエンス教育用の講義資料1000ページ、教員向けに無償公開 NVIDIAと滋賀大が連携

                                                                  NVIDIAと滋賀大学は9月8日、データサイエンス教育用の講義資料「DLI データサイエンス教育キット」の日本語版の無償提供を始めた。同資料はNVIDIAのデジタルスキル育成プログラム「Deep Learning Institute」(DLI)の講義資料で、滋賀大学が日本語に翻訳したもの。教育機関の教員向けに提供する。利用にはNVIDIAの開発者アカウントが必要。 講義資料では「データサイエンスとRAPIDSの入門」「データ収集と前処理(ETL)」「データセットにおけるデータ倫理とバイアス」「データ統合と分析」「データビジュアライゼーション」「Hadoop、Hive、SparkとHBaseによるスケールと分散コンピューティング」「機械学習(分類)」「機械学習(クラスタリング、次元削減)」「ニューラルネットワーク」などの分野を取り上げる。 資料の元になった「DLI データサイエンス教育キット

                                                                    データサイエンス教育用の講義資料1000ページ、教員向けに無償公開 NVIDIAと滋賀大が連携
                                                                  • 高齢者は朝のドラッグストアへ本当に「殺到」したか 購買データで解明

                                                                    新型コロナウイルスの感染食い止めのため、小売りでの来店客の密集防止が叫ばれている。政府などが必要に応じた入場制限を呼び掛けているスーパーと並び、焦点となっているのがドラッグストアだ。在宅勤務などで消費が増えた日用品を買いに訪れる人を減らすのは、容易ではない。加えて、マスクやトイレットペーパーを買うための早朝の行列も問題になった。 では、実際にドラッグストアに実際に「殺到」しているのはどの年代で、時間帯はいつ頃なのか。「高齢者は~」「若者だから」などとどうしても印象論で語られやすいこうした消費者行動や世代差の実像について、購買データによる独自分析で迫った。 「トイレットペーパー騒動」時、特に50~60代急増 分析は、ビッグデータによるマーケティング分析を手掛けるTrue Data(東京・港)が、全国のスーパーやドラッグストアにおける延べ約5000万人の購買情報を活用。レシートに加えてポイント

                                                                      高齢者は朝のドラッグストアへ本当に「殺到」したか 購買データで解明
                                                                    • コンピュータサイエンスで1冊ずつ本を上げるとしたら何になりますか?就職前にバイブル的な本を勉強したいと思いました。 -コンピュータアーキテクチャ -データベース -os -アルゴリズムとデータ構造 -セキュリティ -ネットワーク -プログラミング -仮想化技術 | mond

                                                                      大学の情報工学科に入学時に教科書として指定されたいわゆるパタへネを推します。 コンピュータの構成と設計 第5版 CPUの構造と基本は現代ではかなり複雑になりましたがこの本に書かれている基本を知っているかどうかで込み入った問題にぶち当たった場合の解像度が違います。 由緒正しいDBの読本というとオンラインで読めるRedbookとなりそうですがここは敢えて データ指向アプリケーションデザイン いわゆるイノシシ本を推します。名前からしてアプリケーションの話のように見えますし、分散システムに関する話が多いのですが最終章まで通して読むと「アプリケーションとデータベースの境界とは本来存在せず、入力されたデータを『いつ』『いかに』『安全に』加工・保存・出力するかがアプリケーションであり、その目的に対する最善手をフラットに考えるとある意味でアプリケーション全体が既にひとつのデータベースであってその仕事の一部

                                                                        コンピュータサイエンスで1冊ずつ本を上げるとしたら何になりますか?就職前にバイブル的な本を勉強したいと思いました。 -コンピュータアーキテクチャ -データベース -os -アルゴリズムとデータ構造 -セキュリティ -ネットワーク -プログラミング -仮想化技術 | mond
                                                                      • ChatGPTで独自データを学習させて回答してもらう方法 - Qiita

                                                                        ChatGPT,使っていますか? ChatGPTは文章を要約したり、プログラム作ってくれたり、一緒にブレストしてくれたりして本当に便利なのですが、社内情報などの独自データに関する情報については回答してくれません。 プロンプトに情報を記述して、そこに書かれている情報から回答してもらう方法もありますが、最大トークン4000の壁がありますので、限界があるかと思います。 この課題についてなんとかならないかと考えて色々と調べて見たところ、解決する方法が見つかり、いろいろと検証をして見ましたのでその結果をシェアしたいと思います。 サンプルコード(GoogleColab) 百聞は一見にしかずということで、実際に試したサンプルは以下にありますので、まずは動かしてみることをお勧めします。 このコードを上から順番に動かすと、実際にインターネット上から取得したPDFファイルに関する内容をChatGPTが回答して

                                                                          ChatGPTで独自データを学習させて回答してもらう方法 - Qiita
                                                                        • Dr Rennick 🇯🇵在住🇦🇺人医師 on Twitter: "イギリスのオミクロン株の大規模のデータがいよいよ発表されました。これでやっとオミクロン株の脅威をきちんと評価できるようになりました。 非常に重要なデータなので、連続ツイートで細かく紹介します。 引用: https://t.co/Zp8x9SwM6k https://t.co/8jphy2Dqvl"

                                                                            Dr Rennick 🇯🇵在住🇦🇺人医師 on Twitter: "イギリスのオミクロン株の大規模のデータがいよいよ発表されました。これでやっとオミクロン株の脅威をきちんと評価できるようになりました。 非常に重要なデータなので、連続ツイートで細かく紹介します。 引用: https://t.co/Zp8x9SwM6k https://t.co/8jphy2Dqvl"
                                                                          • 消費者操る「ダークパターン」 国内サイト6割該当 【イブニングスクープ】データの世紀 - 日本経済新聞

                                                                            ネット通販などのサイトで、消費者のスキを突いて余分な注文などを促す仕掛けが横行している。「ダークパターン」と呼ばれ欧米で規制が進むが、日本では大半が合法とされ対応が遅れている。日本経済新聞の調査で国内主要サイトの6割でダークパターンが確認された。デジタル技術の進化に、消費者保護ルールが追いついていない。「違法なダークパターンの疑いがある」。政府系のノルウェー消費者評議会は1月、米アマゾン・ドッ

                                                                              消費者操る「ダークパターン」 国内サイト6割該当 【イブニングスクープ】データの世紀 - 日本経済新聞
                                                                            • 「Amazon Forecast」が正式リリース。過去の時系列データを与えるだけで機械学習による予測をしてくれる、専門知識不要のサービス

                                                                              「Amazon Forecast」が正式リリース。過去の時系列データを与えるだけで機械学習による予測をしてくれる、専門知識不要のサービス Amazon Forecastは、なんらかの時系列データおよびその時系列データに影響を与えたであろう周辺情報、例えばある店舗の売り上げの時系列データおよび、その店舗の場所の天候、気温、交通量、曜日や祝祭日など売り上げに影響すると思われる周辺情報を与えると、予測に必要な機械学習モデルの構築、アルゴリズムの選定、モデルの正確性の検証や改善などを全て自動で実行し、売り上げに関する予測のデータを出力してくれるというサービスです。 一般に、機械学習を活用するには、学習用のデータと検証用のデータを用意し、学習用のデータから求められた予測結果を検証用データで検証して正確性を評価し、より適切なモデルやアルゴリズムを選択する、といった作業が発生します。 Amazon Fo

                                                                                「Amazon Forecast」が正式リリース。過去の時系列データを与えるだけで機械学習による予測をしてくれる、専門知識不要のサービス
                                                                              • データに質量はありますか?たとえば全く使用していないコンピュータを2台用意して、片方のコンピュータはデータが空の状態、もう片方はデータがフルの状態で2台の重量を計った場合、ほんのわずかでも重量に差が出るようなことはありませんか? | mond

                                                                                mondでこの質問への回答を読んでみましょう

                                                                                  データに質量はありますか?たとえば全く使用していないコンピュータを2台用意して、片方のコンピュータはデータが空の状態、もう片方はデータがフルの状態で2台の重量を計った場合、ほんのわずかでも重量に差が出るようなことはありませんか? | mond
                                                                                • フツーの会社でフツーに働く人にオススメするAI・データサイエンティスト本12選|マスクドアナライズ

                                                                                  ここ数年「もう終わりだろう」と言われ続けたAIブームは、コロナウイルスによってタピオカ屋を巻き込んでトドメを刺された。自宅作業を「WFH」と呼び、同僚や取引先とはZoomでコミュニケーションを取っている。息抜きにNetflixやYoutubeを見て、「AIは『テレワーク』と『DX』に話題も予算も奪われたな」と思ったりする。だがこれは、IT業界で働く人間の姿だ。 一方で自宅で仕事ができない方々も多く、否応なく出勤する光景は日常となった。仕事から帰って息抜きにテレビをつければ「スーパー派遣社員とAIでリストラ」なドラマや、倍返しの人がITリテラシーとコンプライアンスを無視した銀行で歌舞伎役者による顔芸勝負を見て、「月曜日なんてなければいいのに」と思っている。 つまりIT業界のイキリツイッタラーである我々と、現場で働きながら社会を動かす皆様では、住む世界も見ている光景も異なる。むしろ「当然のよう

                                                                                    フツーの会社でフツーに働く人にオススメするAI・データサイエンティスト本12選|マスクドアナライズ