【良質の独学サイト】分野は、数学、統計学、コンピュータ言語、英語、金融・経済など分野は問いません。【eラーニング】 以下の条件にあうサイトを沢山教えて下さい。 ・完全に無料であること。 ・講義資料だけでなく、演習問題などもあり、十分独学できること。 ・良質であれば、英語サイトでも良いこと。 ・内容は、大学の講義資料・宿題資料が公開されているなど、大人向けの内容であること。 できれば、実際にこのサイトでこの内容を学習・マスターできたという実体験の伴うものがベストですね。
【良質の独学サイト】分野は、数学、統計学、コンピュータ言語、英語、金融・経済など分野は問いません。【eラーニング】 以下の条件にあうサイトを沢山教えて下さい。 ・完全に無料であること。 ・講義資料だけでなく、演習問題などもあり、十分独学できること。 ・良質であれば、英語サイトでも良いこと。 ・内容は、大学の講義資料・宿題資料が公開されているなど、大人向けの内容であること。 できれば、実際にこのサイトでこの内容を学習・マスターできたという実体験の伴うものがベストですね。
「わたしが知らないスゴ本は、きっとあなたが読んでいる」の中の人、Dainと申します。 今回はお金で買うことのできる一生モノの自己投資になる本をご紹介したい。 現金や不動産、貴金属からビットコインまで、財産は盗られたり目減りしたりする恐れがある。だが、頭の中の財産は、誰も奪うことができない。すなわち、知や教養は、いったん頭に蓄えたら、一生涯あなたのものとなるのだ。 ここでは、あなたの知となり教養となる入口として、お薦めの本を選んでみよう。とはいっても、ただ選ぶだけでは面白くない。だから、日本の知を担う大学の最高峰、東京大学に務める教師が選んだ「アンケート・東大教師が新入生にすすめる本」から、合計1万円で買えるものをピックアップした。 「アンケート・東大教師が新入生にすすめる本」*1では、東京大学で毎年春に行われる新入生のためのブックガイドとして、エンタメから啓蒙書まで多種多様な本が紹介されて
最も高く、7割近くが病院で亡くなる日本や韓国。一方、オランダやノルウェーでは病院死は3割以下。新型コロナの影響だけでなく、日本を含む多くの国で病院死は低下傾向。
静岡理工科大学情報学部コンピュータシステム学科菅沼研究室のページです.主として,プログラミング言語( HTML,C/C++, Java, JavaScript, PHP, HTML,VB,C# ),及び,システムエンジニアとしての基礎知識(数学,オペレーションズ・リサーチやシステム工学関連の手法)を扱っています.
先日、twitter上で食べログの星の数について、 ある問題が話題になりました。 食べログの闇として話題になったその問題とは、 「評価3.8以上は年会費を払わなければ3.6に下げられる」 というものです。 食べログは飲食店についての口コミを集めるサイトで、 その評価は実際のユーザーによって形成されるものとして広く認知されています。 専門的なグルメリポーターでもなく、 一般の人々の素直な感想を集めることで、 その飲食店のリアルな価値が知れると期待して、 利用しているユーザーも多いでしょう。 それだけに、 「食べログが評価を恣意的に操作しているかもしれない」という話は、 瞬く間にネットで話題となりました。 さて、この話は実際に行われていることなのでしょうか。 食べログでは、当然評価点は公開されているので、 このような恣意的な操作があれば、 何らかの形で偏りが見つかるはずです。 ということで、食
さて、改めて今回の目的を確認しておくと、機械学習を使って東京都23区のお買い得賃貸物件を発見しよう、というものです。前回までの記事で、お買い得賃貸物件を発見するためのデータを収集し、分析にかけられるよう前処理してきました。 www.analyze-world.com www.analyze-world.com 今回の記事では、いよいよ機械学習を使って分析していきましょう。前回まではPythonを使っていましたが、この分析ではRを用いています。なお、コードはGitHub(https://github.com/ShoKosaka/Suumo)に上げておきますので興味ある方は参照ください。 最初に、データの中身をざっくり見ていきます。具体的には、分析のキーになるポイントをグラフにしながら、賃貸物件の現状や変数同士の関係性を把握していきます。 データ探索 まず、23区の中でどこが物件数が多いのかを
googleさんやマイクロソフトさんは「次の10年で熱い職業は統計学」と言っているようです。またIBMは分析ができる人材を4,000人増やすと言っています(同記事)。しかし分析をするときの基礎的な学問は統計学ですが、いざ統計学を勉強しようとしてもどこから取りかかればいいか分からなかくて困るという話をよく聞きます。それに機械学習系の本は最近増えてきましたが、統計学自体が基礎から学べる本はまだあまり見かけないです。 そこで今回は、統計学を初めて勉強するときに知っておいた方が良い10ポイントを紹介したいと思います。 1. 同じ手法なのに違う呼び名が付いている 別の人が違う分野で提案した手法が、実は全く同じだったということがあります。良く聞くのは、数量化理論や分散分析についてです。 数量化理論 数量化I類 = ダミー変数による線形回帰 数量化II類 = ダミー変数による判別分析 数量化III類 =
23歳、公務員です。今度お金を借りようと思っているのですが、それについて少し反対意見ももらっているので、それについてお聞きしたい事があります。 私の今回お金を借りる理由というのが、やむを得ない場合というよりも娯楽目的であるというのが正しい表現となります。娯楽という事ではっきり言ってしまえば、最悪お金を借りないとあっても別に生活が脅かされる事もありません。娯楽というのはあくまで余暇を楽しむ為のものですので、人生まで賭けるほどというわけではありません。 だから、娯楽の為にお金を借りると言うと身の回りの人は多くが反対するので、正直ちょっと迷い始めています…私としては自分で借りて自分で返済していくのだから、別にいいじゃないかというのが本音です。でも周りはそうは思ってくれないし…ここまで反対されるというのなら、止めるべきなのでしょうか?意志が弱い質問となり申し訳ないですが、ご意見をお聞かせ願えるでし
僕は #詐欺グラフ が何よりの大好物で、ネットやテレビで変なグラフを見かけるたびにニヤニヤしながらフォルダに保存しています。保存先のフォルダ名はズバリ「#詐欺グラフ」。 そんな詐欺グラフの世界を皆さんに共有したいと思い、筆をとりました。(2024/2/6 update) ネタ記事として、順次、ツッコミながら読んでいただければと思いますが、同僚や上司部下、取引先の「詐欺グラフ」に気づけるようにもなるため「ビジネススキルUP」にもつながるおトクな記事としても読むことができます 詐欺グラフとは詐欺グラフとは、一般的なグラフの作り方とは異なる「演出」を加えることによって意図的に錯誤を狙うグラフ のことを指しています。本来、単なる羅列では直感的に理解しづらい数値等を分かりやすく表現するものがグラフであるわけですから、自分の主張を誇大に伝えるために読み手を誤解させる詐欺グラフはとても悪質なものと言える
TopHatenarは、ブログを「購読者数」と「ブックマーク数」の2つの指標から分析することができるランキングサイトです。 [もっと詳しく]
仕事でExcelを使っていて、「もっと早く見栄えの良い資料を作れたらなぁ」と思っていませんか?Excel(エクセル)の便利な使い方が分かる記事まとめ でも、もう大丈夫! 本日は、 絶対に知っておくべきExcelの便利ワザ効率UPに必須の時短ワザデータの見栄えを良くする小ワザこんなことまでできるの?!という上級ワザ など、知っていると驚くほど差がつくExcelの技をすべてご紹介します。 数あるExcel記事の中から使える記事を厳選したので、是非参考にしてみてください。 1. 知っていると絶対便利なExcelの技 簡単なのに、知っていると作業時間が驚くほど短縮できる技を紹介している良記事を厳選しました。どれも一つ一つの技は簡単なので、必ず今日から使えます! ① Do you know these Double-click Tricks in Excel? (あなたは知ってる?ダブルクリックだけ
サービス終了のお知らせ NAVERまとめは2020年9月30日をもちましてサービス終了いたしました。 約11年間、NAVERまとめをご利用・ご愛顧いただき誠にありがとうございました。
2010年03月13日 22:01 カテゴリ事業家養成講座 素人の僕が、データ分析に自信を持つようになったある発見 Posted by fukuidayo Tweet 僕は1999年に就職活動をしました。会社は全部で8社ぐらい?受けたのかな。 受かった会社の選考よりも、落ちた会社の選考のほうが覚えているもので、あるシンクタンクを受けたときに提出したレポートの出来の悪さと、あるコンサルティング会社を受けたときに出たケーススタディーの答案を前に、頭が真っ白になったときのことは、今でもたまに思い出します。 どうやって分析し、自分の見解を示せば良いのか、まるでわからなかったのです。 それから数年がたち、僕はケーススタディーを受ける側ではなく、つくる側になりました。 データの見方を教え、伝える側になったのです。 そうなれたのは、データを分析する。ということに関して、助言を与え続けてくれた先輩・上司が
多少ネタ臭がするかもしれないけど、意外とまじめに選んでみた。文系・理系は特に意識してない。あとプログラム方面の話とかExcelのtipsみたいな分野も選んでない。 追記:いただいたコメント等について(1/2) - I 慣性という名の惰性 I 「産業構造」というものを理解するための本 自分のいる業界とか、自分の部署がやっている仕事とかを理解しようとするときの土台になる考え方を身に付けるために読む本。この土台部分がないまま日経新聞とか日経ビジネスとかを読んでも無駄無駄無駄無駄無駄無駄。業界分析本とかも同様。 自分の所属する産業が現在どういうステージにあって(成長とか衰退とか)、そのなかで自社はどういうポジション(業界のリーダーなのか泡沫なのか先行者なのか追随者なのかとか)にあるのかを把握することがまずは大事。まあ本当ならエントリーシート書く前にちゃんとやっとけという話ではある。 上司にこの手の
2006年のデータマイニング学会、IEEE ICDMで選ばれた「データマイニングで使われるトップ10アルゴリズム」に沿って機械学習の手法を紹介します(この論文は@doryokujin君のポストで知りました、ありがとうございます!)。 必ずしも論文の内容には沿っておらず個人的な私見も入っていますので、詳細は原論文をご確認下さい。また、データマイニングの全体観をサーベイしたスライド資料がありますので、こちらも併せてご覧下さい。 データマイニングの基礎 View more presentations from Issei Kurahashi 1. C4.5 C4.5はCLSやID3といったアルゴリズムを改良してできたもので、決定木を使って分類器を作ります。決定木といえばCARTが良く使われますが、CARTとの違いは以下のとおりです。 CARTは2分岐しかできないがC4.5は3分岐以上もできる C
OpenAIのWhisper文字起こし25MB制限を解決するPHP, Laravel, ffmpegを使ったファイル分割の例 OpenAIのAPIを使った音声の文字起こしは、今や多くのアプリケーションで利用されています。この記事では、特にWhisper文字起こしの25MB制限に焦点を当て、PHP, Laravel, ffmpeg, PHP-FFMpegなどの技術を使用したファイル分割について詳しく解説します。 OpenAI APIについて OpenAI API We're releasing an API for accessing new AI models developed by OpenAI.openai.com OpenAI APIは、AIを活用した多岐にわたるサービスを提 …
前回の「ゲームプログラマからデータサイエンティストに転職しました」 の記事でもお話したとおり、5月からデータ解析する人になりました。 とはいえ、データ解析に関しては未経験。 少しでも不安を減らすために、4月の有給消化期間は統計学のお勉強しました。 今回はおすすめしてもらった中で読んで良かった本の紹介、そして読んだ本の簡単なまとめを書いて行きたいと思います。 ※前提: 4月時点の自分の知識に関して 自分は大学は情報科学を専攻していたが、難しい数式は苦手 統計学は1コマ分受講していたが、単語を覚えている程度でかなりあやうい まず一番最初に読みたい本 「完全独習 統計学入門」 「簡単に統計学の全体像がつかめる入門書はないか」とTwitterで相談したら、こちらの本を数名の方が薦めて下さった。 完全独習 統計学入門 作者: 小島寛之出版社/メーカー: ダイヤモンド社発売日: 2006/09/28メ
皆大好き自分も大好きな二十歳街道まっしぐらにはネタ帳という記事が定期的に挙がります。自分も普段記事にするネタをあれこれ自力で探している訳ですが、カメきちさんのネタ放出はかなり美味しい。という訳で有り難くご相伴に預り、 【ネタ帳】bitlyで短縮されたURLから動画だけを抜き取ったサイト「bitly.tv」 + 25記事*二十歳街道まっしぐらより拝借。 元々の絵は当然英語(YjWta.jpg (1024×767))なんだけど、ちょいと単語が分かりにくいので自分なりに妥当な用語をあてて日本語化してみました。 とってもひどい蛇足 まあ、普通にグラフ作ってるだけなら棒グラフ、線グラフと円グラフがあれば足りると思います。組成分析のためにウオーターフォール使うあたりになるとパレート分析やマトリクス分析に手が出始めて多分こういった図にまとめると言うのは厳しいかと(^^;; 後ですね、散布図が右にも左にも
尾野(しっぽ) @tail_y かーずSPの人が完全にガチャコンプの罠にはまってる・・・。最初の3枚と後の3枚は確率が全然違うんだよ。 http://t.co/trgIxCvs 2012-02-09 22:14:44 尾野(しっぽ) @tail_y モバイルSNSゲームが儲かっている理由は色々挙げられてて、コミュニケーションだのグラフィックが綺麗だの、演出だの、オタを取り込むだの、ライトユーザーに対する配慮だの、タスクの消化だの、調節のシステムだの、チュートリアルが上手いだの、色々言われている。 2012-02-09 22:45:53 尾野(しっぽ) @tail_y で、それらが嘘だと思わないし、それぞれに価値があって、そういうの作れる人が儲かるのは正しいと思う。でも、これらは今のモバイルSNS業界が大儲けしている理由を、ちゃんと説明していない。だから、こういうの読んだ人が首をかしげながら
はじめに 統計解析の手法を学ぶのに、教科書を読むのは素晴らしい学習方法です。 しかし、教科書で理論的なことを学んだだけでは、統計手法を使いこなせるようにはなりません。 統計解析手法を身につけるには、実際のデータについて手法を適用し、パラメータを変えるなどの試行錯誤を行い、結果を考察するというような経験を積むことが大切です。 それでは実際のデータをどうやって手に入れましょうか? 実験や調査をして実際のデータを得るのは大変でお金もかかります。 幸運なことに、世の中には適度なサイズの自由に使えるデータがたくさん存在します。 例えば、統計言語 R には、100以上ものデータセットがデフォルトで付属しています。 ただし、不幸なことに、それらのほとんどは英語で説明が書かれています。 英語は、いつかは乗り越えなければならない壁ですが、最初のうちはちょっと避けて通りたいところです。 というわけで、今日は、
世界の見方が変わる地図たち 今回は、world mapper.com を紹介するよ。 このサイトでは、世界各国の人口、輸出入品目、平均寿命などのさまざまな統計を、世界地図の形で視覚的に表しているんだ。きっと世界の見方が変わると思うよ(ミシガン大学とシェフィールド大学の研究者が作成していて、ソースが示されているから信頼性もあるよ。統計の基準年は断りのない限り2002年だよ) クリエイティブ・コモンズ・ライセンス表示 © Copyright SASI Group (University of Sheffield) and Mark Newman (University of Michigan). -------- まずは面積 メルカトル図法にだまされてたけど、実は日本ってそれほど小さくないよね? これを人口比に対応させると うわ、中国が広がるのは予想してたけど、インドも大きいね!そしてロシアが
追記(2017年7月) こちらのスキル要件ですが、2017年版を新たに書きましたので是非そちらをご覧ください。 「データサイエンティストというかデータ分析職に就くためのスキル要件」という話題が某所であったんですが、僕にとって馴染みのあるTokyoR界隈で実際に企業のデータ分析職で活躍している人たちのスキルを眺めてみるに、 みどりぼん程度の統計学の知識 はじパタ程度の機械学習の知識 RかPythonでコードが組める SQLが書ける というのが全員の最大公約数=下限ラインかなぁと。そんなわけで、ちょろっと色々与太話を書いてみます。なお僕の周りの半径5mに限った真実かもしれませんので、皆さん自身がどこかのデータサイエンティスト()募集に応募して蹴られたとしても何の保証もいたしかねますので悪しからず。 統計学の知識は「みどりぼん以上」 データ解析のための統計モデリング入門――一般化線形モデル・階層
失敗知識データベースは、科学技術分野の事故や失敗の事例を分析し、得られる教訓とともにデータベース化したもので、科学技術振興機構(JST)が無料で提供しています。
どもっす。林岳彦です。ファミコンソフトの中で一番好きなのは『ソロモンの鍵』です*1。 さて。 今回は、因果関係と相関関係について書いていきたいと思います。「因果関係と相関関係は違う」というのはみなさまご存知かと思われますが、そこをまともに論じていくとけっこう入り組んだ議論となります。 「そもそも因果とは」とか「因果は不可知なのか」のような点について論じるとヒュームから分析哲学(様相論理)へと語る流れ(ここのスライド前半参照)になりますし、統計学的に因果をフォーマルに扱おうとするとRubinの潜在反応モデルやPearlのdo演算子やバックドア基準(ここのスライド後半参照)の説明が必要になってきます。 その辺りのガッツリした説明も徐々に書いていきたいとは考えておりますが(予告)、まあ、その辺りをいちどきに説明しようというのは正直なかなか大変です。 なので今回は、あまり細かくて遭難しそうな話には
データサイエンティストによる統計入門 ― k平均法でデータをクラスタリングしてみよう! ビッグデータ、データサイエンス、人工知能など、統計学を主軸においた分野が隆盛ですが、統計学には高いハードルを感じる方も少なくないでしょう。k平均法を実際に手を動かしながら理解することで、データ分析を身近に感じることができます。 はじめまして、藤井健人(@studies)と申します。イタンジ株式会社でデータ基盤周りの運用を担当しています。 「ビッグデータ」「データサイエンス」「人工知能」といったバズワードに代表されるように、統計学を主軸においた分野の隆盛が日常となって久しいです。 しかし「統計学は学問的な要素があり難しい」という印象を持たれやすく、「実務に活かすのはハードルが高い、怖い」と感じる方も少なくないのではないでしょうか。 そういった方を対象に、今回は統計学の手法の一つであるk平均法を学んでいただ
東京の多摩川沿いの浸水リスクがある地域で、「なぜか人口が増えている」ことをデータ分析ソフトを使って明らかにして、その背景を探りました。 次にこんな記事も書きました。 南海トラフ巨大地震によって津波の浸水が想定されている区域で、高齢者の施設がすごく増えていることを示した記事です。 どちらの記事も、誰もが入手できる「オープンデータ」と、後述する「GIS」という分析システムを使って隠れた事実を浮き彫りにした、データジャーナリズムのお手本などと紹介されたこともあります。 そしてつい最近手がけたのがNHKスペシャル「〝津波浸水域〟の高齢者施設」。蓄積してきた分析のノウハウを注ぎ込んだ番組です。 「データ分析」というと専門的で、すごく難しく思う方もいるかもしれません。しかし最初に述べたように私は数年前までは、パソコンを満足に使えない、データ分析とは無縁の「ガラケー記者」だったのです。本当に。 そんな私
様々な都道府県別統計データを単位人口あたりの数値で比較。県民性を数字で表します。あなたの出身地は何位?チェーン店第二弾はセブンイレブン。日本最大のコンビニチェーンだが、一地域に集中的に店舗展開する方針のため、地図にも濃淡がはっきり現れている。 [続きを読む]
グロースハックを本格的にしようとすると、統計学が出来ると凄く便利!今回は、この記事を見ておけば今からでも統計学を使いこなせるようになる記事をピックアップしましたので、ご覧下さい! ハンバーガーショップで学ぶ楽しい統計学 本にもなっている統計学の入門には最適な決定版サイト。広く使われている統計手法について分かりやすく解説されています。 オンラインで無料で読める統計書22冊 Web上で閲覧可能な統計書がまとめられている超お得な情報が詰まっている記事。 WEBで読める統計関係の良質な資料 統計に関する良質な資料がまとめられている記事。 統計屋による新社会人のための統計系入門書お薦め一覧 統計について学べる入門書についてまとめられている記事。 統計学を勉強するときに知っておきたい7つのポイント 統計学を学ぶ上で、重要なポイントが整理されている記事。 統計学を勉強するときに知っておきたい
「目に見えて明らかなことが常に解決策であるとは限らず、どれだけ不思議に見えても事実は事実に過ぎない」ということに気づかされたとして、ウォータールー大学でコンピューターサイエンスを研究するスティーブン・マン教授が不思議なエピソードを紹介しています。 Car allergic to vanilla ice cream http://www.cgl.uwaterloo.ca/smann/IceCream/humor.html ある日、自動車メーカー・ゼネラルモーターズ(GM)のポンティアック開発部に以下のような内容の苦情が寄せられました。 「私がGMに苦情を書いたのはこれで2回目です。私にもおかしな話に思えるので、返事がなくても責めるつもりはありません。私たちの家族はいつも夕食後のデザートにアイスクリームを食べています。毎晩、食事後に家族全員がどの種類のアイスクリームを食べるべきかを投票し、私が
本で読んだ知識をドヤ顔で紹介したら、その実験には再現性がありませんでした。 そんな恥ずかしい記事を書いたブロガーは誰でしょう? そう、私です。 ステレオタイプ脅威はありますん ちょっと前に「ステレオタイプ脅威」の記事が話題になっていた*1。 世の中には「女性は数学に弱い」というような負のステレオタイプがある。自分のアイデンティティがそれに該当していると意識してしまうと、実際にパフォーマンスが落ちるというものだ。これは様々な実験の結果によって示されている。というのが記事で紹介されていた話だった。 ところが現在、その「実験結果」は再現性が無いと言われている。ステレオタイプ脅威の根拠は実験結果にあるというのに、その土台は不確かなものであるのだ。 とくに、最近の研究ではほとんど再現性がないとされている「ステレオタイプ脅威」について、リベラルバイアスにも言及しながら議論しているのが印象的。 日本では
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く