[B! 機械学習] nakag0711のブックマーク

https://www.jstage.jst.go.jp/article/jscc1971b/27/1/27_21/_pdf

nakag0711 2024/03/08

リンク

データセットの本質的な性質を踏まえないデータ分析には、大抵何の意味もない - 渋谷駅前で働くデータサイエンティストのブログ

前回のブログ記事は、論文紹介という地味なテーマだったにしてはだいぶ話題を呼んだ*1ようで、個人的にはちょっと意外な感があったのでした。確かに、今をときめくTransf ormerにも苦手なものがあるという指摘は、NN一強の現代にあってはセンセーショナルなものと受け止められても不思議はなかったかと思います。しかし、それは同時に「データセットが持つ本質的な性質」と「データ分析手法の性質」とのミスマッチと、それが引き起こす問題とについてこれまであまり関心を持ってこなかった人が多いということなのかもしれません。そして、そのミスマッチは冗談でなく古来からある程度定まった類型があり、データ分析業界の古参なら「そんなの常識だよ」というものばかりだったりします。ところが、最近僕の周囲でもそういうミスマッチが深刻な実問題を招いているケースが散見され、思ったよりもそれは常識ではないのかな？と思わされることが

nakag0711 2023/11/12

説明変数が過去の自分自身のみとする典型的な時系列モデルは、自分自身の影響しか受けないと仮定していることになる。でも例えば株価は株価の値動き自身からも影響されるけどそういうテクニカル要因だけではない

機械学習

リンク

「機械学習で時系列予測はできるのか」論議がTransformerと共に帰ってきた - 渋谷駅前で働くデータサイエンティストのブログ

先日、こちらのポストをお見かけしました。 AI 技術開発部の高橋が社内勉強会の資料「時系列予測にTransf ormerを使うのは有効か？」を公開しました。論文Are Transf ormers Effective for Time Series Forecastingの紹介を中心に、時系列予測について解説しています。ぜひご覧ください。https://t.co/LplxTT8b1d pic.twitter.com/nUXb4bGiQ3— GO Inc. AI Tech (@goinc_ai_tech) 2023年9月28日なるほど、NN全盛というかNN一択の時代にあっては時系列予測もNNでやるのが当たり前になったのだなという感想でした。大昔「沖本本」で古典的な計量時系列分析を一通り学んだ身としては隔世の感がありますが、これもまたNN時代の趨勢なのでしょう。なお、元論文2点は上記リンクから辿

nakag0711 2023/10/22

時系列そのものだけ見て予測という考え自体が根本的に問題ある。物理の波動現象みたいに現象そのものが自分自身の過去から決まるようになっている場合以外には無理がある

機械学習

リンク

明らかになったGPT-4の秘密 | AI専門ニュースメディア AINOW

著者のアルベルト・ロメロ（Alberto Romero）氏はスペイン在住のAI 技術批評家で、AINOWでは同氏の記事を多数紹介して来ました。同氏がMediumに投稿した記事『明らかになったGPT-4の秘密』では、OpenAIがGPT-4のアーキテクチャおよび詳細を非公開にしたビジネス上のメリットが解説されています。「競争と安全上の理由から」学習データやアーキテクチャが非公開だったGPT-4について、2023年6月になってリークがありました。そのリーク内容とは、同モデルは2,200億パラメータの専門家モデルが8つ連結された「専門家混合モデル」だったというものです。このアーキテクチャ自体は、Googleが2021年に発表している何ら革新性のないものです。実際には既存技術を活用して開発していたGPT-4の詳細を非公開としたOpenAIのビジネス戦略について、ロメロ氏は以下のような3つのメリッ

nakag0711 2023/09/22

こういうのもアンサンブルというのだろうか

機械学習

リンク

性能劣化は本当なのか？ChatGPTの性能を検証した3本の論文を解説 | AI専門ニュースメディア AINOW

はじめに ChatGPTが公開されて半年以上が経過し、そのユーザは急激に増えて世界的に普及しましたが、その一方でユーザの一部からは「ChatGPTは性能劣化したのではないか」という疑問が出てきました。同AIの性能に関しては、生成された回答と人間が作成したそれとの違い、さらには政治的トピックに対する回答の党派性などといった疑問も生じます。最近、以上のような疑問について調査した論文が発表されました。それらは、以下のような3つの問題を論じています。疑問1：ChatGPTの性能は、経年変化しているのか。疑問2：（Stack OverFlowに掲載された質問に対する回答のような）特定のトピックに関するChatGPTの回答はどのような特徴を持っており、人間が作成したそれとどのような違いがあるのか。疑問3：ChatGPTを含めた言語モデルは、政治経済的トピックに関して何らかの党派性をもった回答を

nakag0711 2023/09/22

機械学習

リンク

【新卒研修資料】基礎統計学 / Basic of statistics

株式会社ブレインパッドの2023年新卒研修資料です。基礎統計学について扱っています。

nakag0711 2023/09/15

統計の入門書程度の内容がまとまっている。統計検定2級くらい?本当に勉強するなら東大教養学部の定番入門書も買った方がいいと思うけど

機械学習

リンク

Python Data Science Handbook | Python Data Science Handbook

This website contains the full text of the Python Data Science Handbook by Jake VanderPlas; the content is available on GitHub in the form of Jupyter notebooks. The text is released under the CC-BY-NC-ND license, and code is released under the MIT license. If you find this content useful, please consider supporting the work by buying the book!

nakag0711 2023/08/28

『Pythonデータサイエンスハンドブック』英語版

機械学習

リンク

(PDF) Natural Language Processing with Python

Background Preventatives measures to combat the spread of COVID− 19 have introduced social isolation, loneliness and financial stress. This study aims to identify whether the COVID-19 pandemic is related to changes in suicide-related probl ems for help seekers on a suicide prevention helpline. Methods A retrospective cohort study was conducted using chat data from a suicide prevention helpline in t

nakag0711 2023/08/28

『入門自然言語処理』英語版は無料公開

機械学習

リンク

Python for Data Analysis, 3E

About the Open Edition The 3rd edition of Python for Data Analysis is now available as an “Open Access” HTML version on this site https://wesmckinney.com/book in addition to the usual print and e-book formats. This edition was initially published in August 2022 and will have errata fixed periodically over the coming months and years. If you encounter any errata, please report them here. In general

nakag0711 2023/08/28

『Pythonによるデータ分析入門第3版』英語版は無料公開

機械学習

リンク

予測: 原理と実践 (第3版)

nakag0711 2023/08/10

リンク

8.3 季節性のある手法 | 予測: 原理と実践 (第3版)

nakag0711 2023/08/10

リンク

Forecast Evaluation using Theil’s Inequality Coefficients

nakag0711 2023/08/05

リンク

Mean absolute scaled error - Wikipedia

In statistics, the mean absolute scaled error (MASE) is a measure of the accuracy of forecasts. It is the mean absolute error of the forecast values, divided by the mean absolute error of the in-sample one-step naive forecast. It was proposed in 2005 by statistician Rob J. Hyndman and Professor of Decision Sciences Anne B. Koehler, who described it as a "generally applicable measurement of forecas

nakag0711 2023/08/05

リンク

U Statistic: Definition, Different Types; Theil's U

nakag0711 2023/08/05

リンク

Interpretation of mean absolute scaled error (MASE)

nakag0711 2023/08/05

MASEについて

リンク

Interpretation of Theil's U2 Statistic - "Forecasting Methods and Applications" book

nakag0711 2023/08/05

Theil's U-statisticsについて。MASEについても言及あり

リンク

https://www.jstage.jst.go.jp/article/sjpr/61/1/61_101/_pdf

nakag0711 2023/07/31

ベイズファクターによる心理学的仮説・モデルの評価

機械学習

リンク

RMSE vs. Coefficient of Determination

nakag0711 2023/07/29

リンク

応用音響学

応用音響学第4回 (5/ 1) 亀岡弘和東京大学大学院情報理工学系研究科システム情報学専攻 kameoka@hil.t.u-tokyo.ac.jp 東京大学工学部 4年生夏学期 [03-501130] 講義スケジュール前半（亀岡担当）  4/08: 第1回  4/15: 第2回  4/22: 第3回  4/29: 休日  5/01(木): 第4回  5/06: 休日  5/13: 第5回  5/20: 第6回  5/27: 第7回後半（牧野担当）  6/03: 第8回  6/10: 第9回  6/17: 第10回  6/24: 第11回  7/01: 第12回  7/08: 第13回  7/15: 第14回  7/22: 学期末試験講義資料と成績評価 講義資料  http://hil.t.u-tokyo.ac.jp/~kameoka/aa

nakag0711 2023/07/03

リンク

エンジニア・データ分析職の方々にお薦めしたい、LLM時代に不可欠な教養が身に付くテキスト3選 - 渋谷駅前で働くデータサイエンティストのブログ

（『IT Text 自然語処理の基礎』より） 3ヶ月ほど前に空前のLLMブームについて概観する記事を書きましたが、それ以降も世間のLLMに対する狂騒ぶりは収まるどころかますます拍車がかかるという有様で、あまつさえ僕自身の仕事における日常業務にもじわじわと影響が及びつつあり、今後も良きにつけ悪しきにつけLLMと共生し続ける必要がありそうだと感じている今日この頃です。そんな猫も杓子もLLMに群がるが如き空前のブームを受けて、エンジニアやデータ分析職の方々の中には「LLMに興味はあるんだけど世の中にあまりにも多くのLLM関連コンテンツが溢れ返っていて何から手をつけたら良いのか分からない」という向きもあるように見受けられます。そこで、僕も断じてLLM以下生成AIの専門家などではないのですが、個人的に「このテキストを読めばLLM時代を生き抜くことが出来そうだ」と感じた書籍を、全くの独断と偏見で3冊

nakag0711 2023/07/03

機械学習

リンク

はてなブックマーク

タグ

関連タグで絞り込む (11)

機械学習に関するnakag0711のブックマーク (105)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第1週）

月間はてなブックマーク数ランキング（2024年4月）

今週のはてなブックマーク数ランキング（2024年4月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス