タグ

*dataと研究に関するsh19910711のブックマーク (17)

  • 第1回 Science of science研究会に参加しました|VALUENEX【公式】

    はじめにこんにちは、VALUENEX・先進情報学研究所の林 尚芳です。 2024年3月16日・17日に、東京大学・郷キャンパスで開催された第1回 Science of science研究会に参加しました。私はポスター発表&ライトニングトークを行い、VALUENEXとしてはスポンサー&ブース出展を行いました。 今回のnoteでは、この研究会の様子を紹介しています。多くの方にScience of scienceという面白い分野を知ってもらえたら嬉しいです。 Science of science研究会Science of scienceとは、主にビッグデータや情報処理技術を用いて、科学を取り巻くメカニズムを明らかにする学際的な分野です。2022年からは、「ICSSI:INTERNATIONAL CONFERENCE ON SCIENCE OF SCIENCE AND INNOVATION」とい

    第1回 Science of science研究会に参加しました|VALUENEX【公式】
    sh19910711
    sh19910711 2024/04/06
    "OpenAlex: オープンな論文データベース + Science of science研究でよく使われている / scisciJP2024_tutorial: Pythonを用いて、ネットワーク可視化・クラスタリング、Disruptive指標の計算、被引用数予測など"
  • 博士課程のリアルが分かる——「博士人材追跡調査」報告書の有用さ|Colorless Green Ideas

    はじめに 博士課程に進むべきか、あるいは進むべきでないか。こんな問いに悩んでいる人は決して少なくないだろう。また、すでに博士課程に進んでいる場合には、これから自分がどうなるのかという問いに悩まされることがあるだろう。 そこでカギとなるのが情報だ。博士課程の実情(リアル)や博士課程修了後の進路の情報が重要になるのだ。もちろん、情報があるからといってすぐに問題が解決するわけではない。しかし、適切な情報は、悩みを解きほぐすのにだいぶ役に立つ。 「博士人材追跡調査」という調査があることを知っているだろうか。この調査の報告書には、博士課程に進む前に知っておきたい情報や、博士課程修了後の進路に関するに情報がたくさん掲載されている。また、博士課程修了者による自由記述回答も載っており、そこから修了者のリアルな声を知ることができるのだ。 この調査の報告書はウェブ上で公開されていて、誰でも読むことができる。も

    博士課程のリアルが分かる——「博士人材追跡調査」報告書の有用さ|Colorless Green Ideas
    sh19910711
    sh19910711 2023/04/22
    "「追跡」と名が付いていることからも分かるように、博士課程を修了してからある程度経った段階の状況を追跡 / ある年度に博士課程を修了した人に対し1.5年後・3.5年後・6.5年後といった感じで時期を変えて状況を調査"
  • 若者の有意性検定離れ|Yuki Yamada

    っていうニュースがいつか出るのかな。 日,Natureに以下のような意見が出ました。 Scientists rise up against statistical significance これについてのエディトリアルも。 It’s time to talk about ditching statistical significance 52カ国,854人の賛同者が署名しており,私もしました。 簡単に言うと,有意性検定やめようぜということです("Retire Statistical Significance")。そもそもこの問題については以前より脈々と議論が続いてきており,2016年のアメリカ統計学会 (ASA) の声明を皮切りに,有意水準を0.005にしようぜ,いやいやそれ質的な解決にならんて (私はこちら側),などのやり取りが起こり,今回の意見に至りました。まあ言ってることはASA

    若者の有意性検定離れ|Yuki Yamada
    sh19910711
    sh19910711 2023/02/19
    2019 / "p値を使うなと言っているわけではないことに注意 / ある閾値を設けて二分法でその上下だから結論がこれキマリ!だとする考え方自体をやめよう / 0.005 vs. 0.05の勝負はどちらも二分法の時点でいかんということ"
  • 【論文メモ】29組のデータアナリストに同じデータセットと同じ質問を与えても、分析結果がバラバラだったという研究 - u++の備忘録

    どんなもの? 29グループ(計61人)のデータアナリストに、同じデータセットと同じ質問を与えたときの分析アプローチのバラツキを分析。質問は「サッカーの主審は、肌の白い選手に比べて肌の黒い選手にレッドカードを与える可能性が高いですか?」。 分析アプローチはチーム間で大きく異なり、オッズ比で0.89から2.93の範囲だった(中央値は1.31)。20チーム(69%)が統計的に有意な正の結果を示した一方で、9チーム(31%)は有意な関係を示さなかった。 これらの知見は、たとえ真摯な専門家集団であっても、複雑なデータの分析結果に主観的な要素が入り込むのは避け難いことを示唆している。 分析を透明化する手段として、同じ研究課題を同時に調査するために多数の研究チームを採用する「クラウドソーシング」が有用であると提言している。 論文リンク http://journals.sagepub.com/doi/10

    【論文メモ】29組のデータアナリストに同じデータセットと同じ質問を与えても、分析結果がバラバラだったという研究 - u++の備忘録
    sh19910711
    sh19910711 2022/12/07
    2018 / "同じデータセットと同じ質問を与えたときの分析アプローチのバラツキ / 完全に「客観的」はあり得ないので、その中でどうやって意思決定に値する分析をしていくかを考えさせられる論文 / doi/10.1177/2515245917747646"
  • Rによる社会調査データ分析の手引き

    Rによる社会調査データ分析の手引き 麦山 亮太(学習院大学法学部政治学科)/ Ryota Mugiyama (Department of Political Studies, Gakushuin University) Last update: 2022-10-09 まえがき 資料は麦山が担当する学習院大学法学部政治学科「社会学演習(社会的不平等に関する実証研究)」、同大学院政治学研究科「統計解析I」「公共秩序の数理モデル(社会調査データの計量分析)」の授業で使用する資料です。その他の授業でも活用することがあります。授業では適宜口頭で説明を補いながら使うことを想定しているため説明を簡単に済ませているところもありますが、どなたでも参照できるかと思います。分かりやすさを重視しているため、厳密性には欠けるところがあるかもしれません。 タイトルに示されているとおり、資料の目的はとくに社会調査の

    sh19910711
    sh19910711 2022/05/04
    "社会調査の個票データを分析するうえで必要となるR/RStudioの使い方、そしてその前後に研究計画の立て方と論文のまとめかたを置き、一通り社会調査データの分析のための作法を整理"
  • 科学技術情報データベースを知ろう! - Microsoft Academic Graph & Lens編|VALUENEX【公式】

    科学技術情報データベースを知ろう! - Microsoft Academic Graph & Lens編 はじめまして、林 尚芳 (はやし たかよし)と申します。先進情報学研究所に所属するデータアナリストです。日々、クライアントの方々と調査・データ分析プロジェクトに取り組んでいます。 早速ですが、皆さん、論文情報を分析したことはありますか?その時、どのようなデータベースを使っていますか?今回は、皆さんの科学技術情報分析に役に立つかもしれないデータベースを紹介したいと思います。 学術論文の有償・無償データベース 学術論文の有償データベースであれば、Scopus(Elsevier社)やWeb of Science(Clarivate社)が有名かと思います。一方で、世の中、無償データベースも豊富です。例えば、Microsoft Academic Graph(MAG)は有名ですが、残念ながら202

    科学技術情報データベースを知ろう! - Microsoft Academic Graph & Lens編|VALUENEX【公式】
    sh19910711
    sh19910711 2022/04/19
    "科学技術情報分析に役に立つかもしれないデータベース / Microsoft Academic Graph(MAG)は有名ですが、残念ながら2021年12月末で終了 / 米国・非営利団体であるOurResearchが、MAGの後継版として「OpenAlex」を開発しています"
  • Introduction to Modern Analytical DB

    [db tech showcase Sapporo 2015] B16:ビッグデータには、なぜ列指向が有効なのか? by 日ヒューレット・パッカード株式...Insight Technology, Inc.

    Introduction to Modern Analytical DB
    sh19910711
    sh19910711 2022/02/11
    2012.11 / "Column-Stores vs. Raw-Stores [Dan08] / 性能差を起こす本質的な違いは何か > 列志向化によるI/O削減は本質的な理由ではなく、compression/late materialization/join optimization等のプラン最適化が性能向上の鍵"
  • 英語論文執筆のために arXiv からの例文検索サービスを作った話

    arXiv の論文から例文を検索する Hyper Collocation というサービスを公開しました. 以下はあまり整理されていない製作の記録です. 英語論文執筆用の例文検索サービス 英語での論文執筆の際に,専門用語を含む例文や言い回しのパターンを知りたいことが多々あります.有用なサービスとしては ライフサイエンス辞書のコーパス検索 Springer Exemplar (2018/2/1頃に終了) がありますが, データがライフサイエンス系の論文に限られている(ライフサイエンス辞書) ソートの基準が頻度順ではないため典型的な例文が上位にこない ストップワードに近い頻出語を検索した際の 検索が重い(Springer Exemplar) 表示可能な検索結果が偏る(ライフサイエンス辞書) という不満点があったので,並行して個人的な資料から検索を行うプログラムを作って使っていました. しかし,個

    英語論文執筆のために arXiv からの例文検索サービスを作った話
    sh19910711
    sh19910711 2021/06/13
    "arXiv が Bulk Data Access という全論文のデータを一括ダウンロードできるサービスを提供していることに気が付き / S3 で Requester Pays Buckets として行われており700GBくらいのデータなので全部ダウンロードすると8000円くらい"
  • 【つながりに効く、ネットワーク研究小話】vol.12 強いつながりの条件 - Sansan Tech Blog

    Sansan DSOC研究員の前嶋です。「つながりに効く、ネットワーク研究小話」の第12回です。静電気が怖いので、オフィスでは放電のためにを履かずに過ごしているのですが、気を抜くとすぐに”””バチッ”””ときます。とても悲しいです。おすすめの対策法があれば教えてください。 この連載の第1回目「切れやすいつながりの見つけ方」では、「橋渡し的なつながりは消失しやすい」という研究を紹介しましたが、今回は逆に、「強いつながりとは何か?」という問いに対して、現在のネットワーク研究で分かっていることを紹介しようと思います。 古典的な理解 社会学者のマーク・グラノヴェッターは、かの有名な「弱い紐帯の強さ」論文の中で、「強いつながり」の条件を4つ提示しています。曰く、つながりの強さは「時間」「感情的な強さ」「親密さ」「相互的サービス」という4つの要素の組み合わせから構成されます(Granovetter

    【つながりに効く、ネットワーク研究小話】vol.12 強いつながりの条件 - Sansan Tech Blog
    sh19910711
    sh19910711 2021/05/10
    "Granovetter 1973 / Marsden and Campbell 1984 / Feld 1997 / Burt 2002 / Haythornthwaite 2002 / Hristova et al. 2014 / Navarro et al. 2017"
  • SILO再考〜次世代DBのアーキテクチャとして - 急がば回れ、選ぶなら近道

    大分たってしまったけど、ようやく時間が空いたので、db tech showcase Tokyo 2016 http://enterprisezine.jp/dbonline/detail/8466 で話した内容を記録的に書いておく。あとはSILOの解説を特に自分用に論文の4章を中心に整理しておく。あとはついでに自分の思うところも記す。 ・SILO 元論文はこちら、執筆陣はMITのLiskov一派とEddie Kohler 現在のDB研究の第一線のメンバー。 http://people.csail.mit.edu/stephentu/papers/silo.pdf SILO以降、大きくDBベースのアーキテクチャの考え方は変わりました。ほとんど全ての分散系OLTPはSILOを程度の大小はあるとはいえ、意識していると言っても過言ではないでしょう。前世代ではほぼ「空想か?」ぐらいの扱いだった分散t

    SILO再考〜次世代DBのアーキテクチャとして - 急がば回れ、選ぶなら近道
  • 心理学における「再現性」の問題とBayes Factor

    2. 自己紹介 • 難波修史 @Nsushi • 広島のバイキンマンです • 広島大学教育学研究科心理学専攻D1 • 専門:顔、感情、ド文系 • 興味:ベイズ、ラブライブ(にこまき • 使用言語:Python, R • R歴:初心者

    心理学における「再現性」の問題とBayes Factor
  • Pythonによるソーシャルデータ分析―わたしはこうやって修士号を取得しました―

    Social network analysis & Big Data - Telecommunications and moreWael Elrifai

    Pythonによるソーシャルデータ分析―わたしはこうやって修士号を取得しました―
  • 人工知能学会全国大会2017のWebマーケティングで参考になりそうな研究9選 – かものはしの分析ブログ

    都内の事業会社で分析やWebマーケティングの仕事をしています。大学・大学院では経済学を通じて統計解析を行うなどしておりました。企業に勤めてからは、機械学習やテキストマイニング、クローリング技術などに関心を持っています。 Twitterアカウント Mr_Sakaue( SKUE ) GitHub 読書メーター ほしいものリスト はじめに 今更ではありますが、2017年5月に開かれた人工知能学会全国大会2017の公開資料の中から、私の業であるWebマーケティングで役に立ちそうな研究を独断と偏見で9ほど集めてみました。思っていたよりもWebマーケティングぽい領域が多かったので、社内での分析業務におけるアイデアに直結しそうな気がしています。 ちなみに、全ての資料はこちらにあります。 基的に各研究ごとに ・目的と結果 ・対象となるデータ ・手法の概要 ・PDFのリンク について記していきます。

    人工知能学会全国大会2017のWebマーケティングで参考になりそうな研究9選 – かものはしの分析ブログ
  • “データ分析の主要な国際会議の日程”と“論文投稿のデットライン”が分かるカレンダーをシェア|ホットピ|ホットリンク

    最終更新日:2023年6月12日 開発部研究開発グループR&Dチーム マネージャーの榊です。 さて、今回のテックブログでは、2017年になったということで、データ分析に関連した国際会議の論文投稿のDeadlineと会議自体の日程をまとめたカレンダーを作ったので共有します。また、その副産物であるSpreadsheetにまとめた内容からカレンダーを自動生成するスクリプトも共有します。 弊社が取り組んでいる研究領域において、最先端研究を知るためには、研究領域に関連する国際会議の論文を調査することが必要不可欠です。さらに学術コミュニティにインパクトを与えるためには、それらの国際会議に論文を投稿し、採択されることが重要となります。 そこでまずは、2017年の論文投稿計画を作成する上で主要な国際会議の日程をまとめる必要があると考え、下記のようなスプレッドシートとカレンダーを作成しました。ただ、社内に

    “データ分析の主要な国際会議の日程”と“論文投稿のデットライン”が分かるカレンダーをシェア|ホットピ|ホットリンク
  • Stack Overflowのデータサイエンティストとしての1年間 | POSTD

    2013年1月のある日、気が付くと私はインターネットで時間を無駄遣いしていました。 これは、残念な発見でした。博士課程の2年半は、みんな忙しくなります。私もそうでした。酵母遺伝学の研究発表が控えていましたし、ニューヨーク大学との共同研究の論文は数カ月遅れていました。しかも学部での研究が残っていて、それはさらに滞っていました。また、プライベートも忙しく、イスラエル旅行から帰国してブラジルの柔術とジョギングを再開したばかりでした。 しかし、そんな日々の中で、 知らない人からのベータ分布に関する質問 に答えて時間を無駄にしていたのです。質問はCross Validatedというサイトに寄せられたものでした。これは開発者向けのQ&Aサイト「Stack Overflow」の統計学版姉妹サイトです。その時までの約1年間、私はStack Overflowでは積極的に回答していましたが、Cross Val

    Stack Overflowのデータサイエンティストとしての1年間 | POSTD
  • PyConJP2016: 週末サイエンティストのススメ

    7 plugins de la communauté à ne pas manquer ! - Liferay France Symposium 2016Sébastien Le Marchand

    PyConJP2016: 週末サイエンティストのススメ
  • 1