タグ

データに関するturu_craneのブックマーク (42)

  • 総務省|報道資料|ヤフー株式会社に対する行政指導

    総務省は、日、ヤフー株式会社(代表取締役社長 小澤 隆生)に対して、検索関連データの提供に関する利用者周知及び安全管理措置の実施について、文書により行政指導を行いました。 ヤフー株式会社(以下「ヤフー社」といいます。)は、Yahoo!JAPANの検索エンジン技術の開発・検証の観点から、NAVER Corporation(以下「NAVER社」といいます。)に対して、令和5年5月18日(木)から同年7月26日(水)までの間の検索関連データの提供を試験的に行っており、その際、慎重な取扱いが求められる情報である位置情報等(約756万のユニークブラウザ分の検索クエリ等(うち、位置情報は約410万のユニークブラウザ分))を利用者に対して事前の十分な周知を行うことなく、NAVER社へ提供し利用させていたほか、当該位置情報等について十分な安全管理措置がとられていなかったことが判明しました。

    総務省|報道資料|ヤフー株式会社に対する行政指導
  • 基本4情報での名寄せは難しい|MORIDaisuke

    先日は住所の件でお楽しみでしたね。 私も楽しくなってしょうもないツイートをしたところ、@masanorkさんから有用な情報をいただいてしまいました。 異体字に加えて外字も根深いですし、日付型に収まらない住基の生年月日とか、屋号を含んだ個人事業主の口座名義とか、外国人氏名における住民登録のアルファベットと口座名義のカタカナとの解離とか、旧姓併記の例外処理とか、文字列型に刻まれたバッドノウハウの塊ですね https://t.co/GOaytijfst — Masanori Kusunoki / 楠 正憲 (@masanork) June 6, 2023 このとき、私はごく簡単な「名寄せの難しさ」の社内研修資料を作っている最中だったのですが、この情報が大変参考になりました。 一方、私だけが得をしているのがなんとなくムズムズしてきたので、ここにアウトプットしてスッキリしようと思います。 なお、住所

    基本4情報での名寄せは難しい|MORIDaisuke
  • onedriveが原因でデスクトップのデータが消えた

    いや、お前データを守る側ちゃうんか。 なんでお前に大事なデータ消されなきゃならんのよ。 調べてみたらひどいクソ仕様だったので、同じ轍ふまないように知見共有します。 なお、消えてしまったデータは息子の卒業式の動画データ。復元不能。 ダメージでかすぎで立ち直れないかもしれない。 リテラシーの話にしたくないので、一応くわしい状況を説明。 興味ない人は読み飛ばしOK ストレージは壊れるものという前提は理解しているつもりなので、状況ごとにいくつかのバックアップ体制は取ってある。 なのでデスクトップは基的に一時的なデータしか置かない。 そのため、今回の被害は当に息子の卒業式の動画データだけ。 安くなったとは言えすべてのストレージをSSD化するには至っていない。 そのため、OSやソフトウェアなんかはSSDにインストール、写真や動画などのサイズがでかいデータはRaid HDDでミラーリングして格納する

    onedriveが原因でデスクトップのデータが消えた
  • 食事記録が120日以上続いた、継続するための技術 - 本しゃぶり

    全ての事を記録する。 それは挫折しない。 継続するためにやっている措置を紹介する。 事記録継続120日を突破 4ヶ月前、こんな記事を書いた。 年々体重と体脂肪率が増加している。そこで事を見直すために「あすけん」を始めたというものだ。改善したければ、計測するのが手っ取り早い。栄養バランスの観点から事の現状と理想を認識するのだ。 だがあすけんを始めるにあたって懸念事項が一つあった。それは「継続できるか」である。先の記事のトップブコメがこれだった。 体重増加をい止めるべく未来を攻略する - しゃぶり 毎記録するのが面倒で、あすけんの女とつきあってはすぐ飽きて別れて、またしばらくするとよりを戻すみたいなクズ男ムーブをしてしまう2022/09/20 05:15 あすけんは全ての事を記録してこそ意味がある。できる限り細かく、毎きちんとつけなければいけない。管理対象はカロリーだけでなく

    食事記録が120日以上続いた、継続するための技術 - 本しゃぶり
  • 江戸マップβ版

    なお、地名数がゼロの地図は他の地図の拡大版のため、今のところ作業予定はありません。 データセット 江戸マップデータセット 江戸マップβ版の地名をまとめて利用するためのデータセットです。 江戸マップデータセット 江戸マップ「れきちず」データセット 江戸マップβ版から抽出したデータを「れきちず」に統合するためのデータセットです。 江戸マップ「れきちず」データセット 参考文献 北 朝展, 鈴木 親彦, 寺尾 承子, 堀井 美里, 堀井 洋, "地理的史料を対象とした歴史地名の構造化と統合に基づく江戸ビッグデータの構築", 人文科学とコンピュータシンポジウム じんもんこん2020論文集, pp. 171-178, 2020年12月 [ Paper ] 更新情報 2024-05-01 江戸マップ「れきちず」データセットを公開しました。 2023-10-20 既存の地名を2件修正しました。 2023

    江戸マップβ版
  • 「スマホゲーム四半期報告書」第4回を掲載。2021年上半期は「ウマ娘 プリティーダービー」が圧倒的な強さを見せる

    「スマホゲーム四半期報告書」第4回を掲載。2021年上半期は「ウマ娘 プリティーダービー」が圧倒的な強さを見せる ライター:日影耕造(フラー) 幅広い年代にスマートフォンが普及した結果,スマホアプリの利用動向は今や世の中の“映し鏡”になっている。新型コロナウイルス感染症(COVID-19)の拡大で人々の生活様式が大きく変わり,オンラインでの消費やコミュニケーションの移行も進む中,スマホゲームをはじめとするアプリのユーザー像をデータから捉え,顧客との接点や新たなビジネスの創出を図る動きも活発化している。 筆者が所属するフラーでは,ユーザーから許諾を得たうえで匿名化したアプリの利用データを独自に蓄積し,サブスクリプション型のスマホアプリ分析ツール「App Ape(アップ・エイプ)」などを提供している。このデータからスマホゲームにまつわるさまざまな動きを分析・解説するのが,連載「スマホゲーム

    「スマホゲーム四半期報告書」第4回を掲載。2021年上半期は「ウマ娘 プリティーダービー」が圧倒的な強さを見せる
  • データで振り返る桐生ココのキセキ|おあ

    2019年末にデビューし、2021年7月1日に卒業することとなったホロライブ所属の桐生ココ。その話題性に富む活動内容は数々のメディアで注目を集め、ホロライブの躍進に貢献してきた人物(ドラゴン)である。今回はそんな桐生ココがホロライブ在籍中に残した軌跡をデータで振り返ってみよう。 ※追記: 7/1の卒業ライブを終えて、少しデータを追加しました。 ※登録者数のデータはSocialBlade.comから取得 ※配信動画のデータはYoutube Data APIから取得 ※スーパーチャットおよびチャットのデータはチャットログ取得システムにて取得 ※2021/6/28までのデータを利用 ※スパチャの為替レートは6月末時点のものを適用デビューから卒業までのチャンネル登録者数まずはホロライブ全体のチャンネル登録者数の推移を振り返ってみよう。 見ての通り、2020年に入ってからの伸びが凄まじいことがわかる

    データで振り返る桐生ココのキセキ|おあ
  • 総務省|報道資料|統計表における機械判読可能なデータの表記方法の統一ルールの策定

    連絡先 (ルールの内容について) 統計局統計情報システム管理官 澤田、鮒田 電話:03-5273-1007 E-mail:stat_saitekika_atmark_soumu.go.jp (制度について) 政策統括官(統計基準担当)統計企画管理官室 赤谷 電話:03-5273-1142 E-mail:s-soukatsu_atmark_soumu.go.jp (スパムメール防止のため「@」を「_atmark_」に換えて表記しています。)

    総務省|報道資料|統計表における機械判読可能なデータの表記方法の統一ルールの策定
  • はてなブックマーク経由PV黄金時代とFACTFULNESS - 本しゃぶり

    質問 はてなブックマーク経由のPV/ブクマ数の比率は、3年前と比べてどうなっているでしょう? A 減少している B 変わらない C 増加している 3年前はすごかった説 この記事に気になることが書いてあった。 それでも3年前なら150ブクマもついてたらさすがに5000pv~10000pvくらいは「はてブからだけで」流入があったりしたものです。 ところが、昨日書いた記事、内容の是非はともかくとして、はてなブックマークが150以上ついているのも関わらず、はてブ経由でのPVはわずか2000でした。 ブコメを見ても人が減っていることについて同意が多く、限界集落はてな村だから仕方ないといった雰囲気である。かつてあった、はてな黄金時代と比べて見る影もない、と。 黄金時代には、人間は神々と共に住み生きていた。「世の中」は調和と平和に満ち溢れて、争いも犯罪もなかった。あらゆるコンテンツが自動的に生成され、手

    はてなブックマーク経由PV黄金時代とFACTFULNESS - 本しゃぶり
  • 民間の立場から、中野区のオープンデータ推進に取り組んでみた話|watambo

    こんにちは、@watamboです。業では人材系企業に所属しており、プライベートは主に子育てと、行政データを整備・活用する「キカク」という会社をやっています。 今年の7月頃にこんなツイートをし、その結果多くの人にRTやFavをいただいたことがありました。 行政が保有するオープンデータを整備し、使いやすくする会社をやっていて、今は許認可に関するデータを集める取り組みをしています。1都3県については、データベース運用を開始できているのですが、中野区だけデータの提供に180万円ほどかかると言われてしまい、まだデータをもらえていない状況です。 pic.twitter.com/XfSTci1tyM — 渡邊 亮輔 (@watambo) July 13, 2020 実はこの件、去年の11月頃に始まったことです・・・。 ただ、1年かけて、ようやく解決の糸口が見えてきました。今日はこれまで取り組んだことを

    民間の立場から、中野区のオープンデータ推進に取り組んでみた話|watambo
  • 無料で使える「住所マスターデータ」公開、表記統一や緯度経度への変換に活用可能 全国の町丁目レベル18万9540件の住所データを記録

    無料で使える「住所マスターデータ」公開、表記統一や緯度経度への変換に活用可能 全国の町丁目レベル18万9540件の住所データを記録
  • 総務省|平成30年版 情報通信白書|放送系コンテンツの市場動向

    (4)放送系コンテンツの市場動向 ●制作している放送番組の種類は「情報番組(パブリシティ含む)」が72.9%と最も高い 制作している放送番組の種類の割合は、「情報番組(パブリシティ含む)」が72.9%(前年度差4.6ポイント上昇)と最も高く、次いで「CM」66.4%(前年度差6.2ポイント上昇)、「バラエティ」47.8%(前年度差3.7ポイント上昇)となっている(図表5-1-8-9)。

  • 東洋経済COVID-19ダッシュボード制作メモ(1)コンセプトと配色|荻原 和樹 / Kazuki OGIWARA

    2月27日、東洋経済オンラインにて新型コロナウイルス感染症(COVID-19)のデータを一覧できる特設ページ「新型コロナウイルス 国内感染の状況」を公開しました。 ありがたいことに「わかりやすい」「毎日見ている」という反応を多数の方からいただいています。2年ほど前から東洋経済オンラインでデータビジュアライゼーション(データ可視化)作品を発表していますが、今回はちょっと驚くほどの反響がありました。 日々のデータ更新、改修やデータ追加などの要望対応、問い合わせや取材依頼など、いまだに落ち着いたとは言えない状況ですが、合間合間に書きためた技術やデザインの趣旨を忘れないうちに記録しておきます。制作メモのようなものとお考えください。 最もストレートな読者対象は「マスに向けてデータビジュアライゼーション作品を公開している個人」となりますが、あまり該当者は多くないと思いますので、たとえば社内向けのダッシ

    東洋経済COVID-19ダッシュボード制作メモ(1)コンセプトと配色|荻原 和樹 / Kazuki OGIWARA
  • PDFからテキストを抽出するのはなぜ難しいのか?

    PDFファイルは、どんな環境のPCでもテキストや画像の表示を崩すことなく見られるデータ形式です。しかし、PDFからテキストデータをコピーしようとすると、うまく選択できなかったり、テキストの内容がおかしくなってしまったりすることがあります。なぜPDFファイルからのテキスト抽出が難しいのかを、PDFファイルのテキスト化およびデータベース作成を行う団体、FilingDBが報告しています。 PDF text extraction | FilingDB https://www.filingdb.com/pdf-text-extraction ◆読み取り保護 PDFファイルの中には内容が保護されているものが存在します。テキスト自体は正しく表示されていても、テキストをコピーしようとすると「Copying text was denied (テキストのコピーが拒否されました)」といった内容が表示され、テキス

    PDFからテキストを抽出するのはなぜ難しいのか?
  • 2019年は本当に“鬼滅の年“だったのか?検索・投稿・閲覧タグで見るpixivのトレンド

    2019年もいろいろな作品がpixivに投稿され、検索され、閲覧されました。 今年はどんな作品が人気だったのでしょうか。検索、投稿、閲覧されたタグについて、pixivでデータを用いてトレンドやユーザー分析を行っている社員、吉田、山口の2名に聞きました。 あわせて海外のトレンドも聞いているので、ワールドワイドに2019年のトレンドを総ざらいしましょう!

    2019年は本当に“鬼滅の年“だったのか?検索・投稿・閲覧タグで見るpixivのトレンド
  • Google、病院グループ大手Ascensionの数千万人の患者データに合法的にアクセス

    Googleが米医療グループ大手のAscensionと提携し、数千万人の患者データに合法的にアクセスしているとWall Street Journalが報じた。報道後、両社はプレスリリースで、提携について発表した。 米Googleが、「Project Nightingale(プロジェクト・ナイチンゲール)」というコード名の下、米国の数千万人もの患者データにアクセスしていると、米Wall Street Journalが11月11日(現地時間)、独自に入手した文書に基づいてそう報じた。 同メディアによると、Googleは2018年、米国で2番目の規模の医療団体Ascensionと契約し、このプロジェクトを開始したという。 Googleがアクセスするデータには、患者の検査結果、診断内容、入院記録、患者名や生年月日などが含まれ、少なくとも150人のGoogleの従業員が数千万人の患者のデータにアクセ

    Google、病院グループ大手Ascensionの数千万人の患者データに合法的にアクセス
  • 文系記者が「データサイエンティスト育成スクール」に通った結果

    AI担当の記者が「データサイエンティスト育成スクール」に半年間の体験取材。未経験の文系記者はデータサイエンティストになれるのか。 企業が持つビッグデータを分析し、ビジネス課題の解決に役立てる「データサイエンティスト」の需要が高まっている。近年のAIブームもあり、データサイエンティストへのキャリアチェンジを考えている人も多いのではないだろうか。実際、データサイエンティストの採用、育成に関する記事は読者からの反響が大きい。 SEからデータサイエンティストに転身 「考え方が全く違う」NEC社員が味わった苦労 未経験からデータサイエンティストになれる? 「死の谷」を越えた独学プログラマーが伝えたいこと 「僕と契約してデータサイエンティストになってよ!」 分析少女ありさ☆アリスの悲劇 年収180%アップも 「データサイエンティスト」注目される理由 専門家が”必要なスキル”解説 「データサイエンティス

    文系記者が「データサイエンティスト育成スクール」に通った結果
  • TechCrunch

    Induction cooking has the potential to liberate us to rethink the kitchen, but new designs have been slow to arrive.

    TechCrunch
  • 「漫画村」月間売上は6000万前後、利用者データを販売? サイトブロッキングシンポで調査結果が発表される

    日4月22日13時~17時まで、千代田区一ツ橋の学術総合センターで、「著作権侵害サイトのブロッキング要請に関する緊急提言シンポジウム」が開催されています。この中でブロガー、著作家の山一郎さんが登壇し、海賊版漫画サイトの「漫画村」についての調査結果を語りました。 以下、やまもといちろうさんによるスライド 山一郎さんによると、「漫画村」は2017年11月時点で月間6000万円前後の売上があったと推測。収入源の1つはサイトに掲載されている広告で、最も売上として大きかったのは“大手アダルトサイトD社”(山一郎さんいわく「アダルト系でDがつく会社というとあまり多くはないと思われますが」とのこと)からの月間売上約350万円。掲載頻度が20%に設定されており、アドネットワークでの月間売上はおよそ1900万円とのこと。 海賊版サイトの主な収入について 「漫画村」の場合。月間6000万円前後の売り上

    「漫画村」月間売上は6000万前後、利用者データを販売? サイトブロッキングシンポで調査結果が発表される
  • ドコモのビッグデータビジネスはJR東日本のそれと何が違うのか(山本一郎) - 個人 - Yahoo!ニュース