タグ

dataとbasicに関するko-ya-maのブックマーク (4)

  • Airbnb製のCaravel改めSupersetを使ってデータ可視化を試してみた。 - Qiita

    この記事はOrigami Advent Calendarの8日目の記事です。 Origamiでは現在、re:dashというBIツールを使っているのですが、最近airbnb製のsupersetというツールにも興味が湧いたので開発用に使っているDBを対象にして環境構築からデータ可視化までの一連を試してみたのと、普段使っているredashとの比較をしてみました。 環境 公式のドキュメンテーションに沿って構築します。サーバーはEC2のt2.micro、OSはubuntuを使っています。 dockerの環境がある場合は、dockerhubにあるimageを使うと楽です。 扱う前の事前準備 データソースの設定及びsupersetを扱う前に抑えておきたい4つの概念を紹介します Source(Database) Source(Table) Dashboard Slice Source(Dtabase) こ

    Airbnb製のCaravel改めSupersetを使ってデータ可視化を試してみた。 - Qiita
  • リレーショナルデータベースの仕組み (1/3) | POSTD

    リレーショナルデータベースが話題に挙がるとき、私は何かが足りないと思わずにはいられません。データベースはあらゆるところで使われており、その種類も、小規模で便利なSQLiteからパワフルなTeradataまで様々です。しかし、それがどういう仕組みで機能しているかを説明したものとなると、その数はごくわずかではないでしょうか。例えば「リレーショナルデータベース 仕組み」などで検索してみてください。ヒット数の少なさを実感できると思います。さらにそれらの記事は短いものがほとんどです。逆に、近年流行している技術(ビッグデータ、NoSQLJavaScriptなど)を検索した場合、それらの機能を詳しく説明した記事はたくさん見つかると思います。 リレーショナルデータベースは、もはや大学の授業や研究論文、専門書などでしか扱われないような古くて退屈な技術なのでしょうか? 私は開発者として、理解していないものを

    リレーショナルデータベースの仕組み (1/3) | POSTD
  • 統計的消去で擬似相関を見抜こう! - ほくそ笑む

    今日は初心者向け記事です。 はじめに ある範囲の年齢の小学生32人を無作為に選び、算数のテストを受けてもらい、さらにその身長を測定しました。 身長に対する算数の点数のグラフは次のようになりました。 なんと、身長の高い子供の方が、算数の点数が高いという結果になりました! 身長が算数の能力に関係しているなんて、すごい発見です! しかしながら、結論から言うと、この結果は間違っています。 なぜなら、抽出したのは「ある範囲の年齢の小学生」であり、年齢の高い子も低い子も含まれているからです。 年齢が高いほど算数能力は高くなり、年齢が高いほど身長も高くなることは容易に推測できます。 この関係を図で表すと次のようになります。 つまり、年齢と算数能力に相関があり、年齢と身長にも相関があるため、身長と算数能力にも見かけ上の相関が見えているのです。 このような相関を擬似相関と言います。 統計解析では、このような

    統計的消去で擬似相関を見抜こう! - ほくそ笑む
  • YAML - Wikipedia

    YAML(ヤメル[1][2]、ヤムル[3])とは、構造化データやオブジェクトを文字列にシリアライズ(直列化)するためのデータ形式の一種。 特徴[編集] テキストのため可読である。その概念はXMLやプログラミング言語であるC、PythonPerlからきている。YAMLの原案はクラーク・エバンス[4]、ブライアン・インガーソン[5]、オーレン・ベンキク[6]が共同で出した。 YAMLは再帰的に定義された頭字語でありその語源は「YAML Ain't a Markup Language.」(→YAMLはマークアップ言語じゃない)である。初期には「Yet Another Markup Language」(→もうひとつ別のマークアップ言語)と言われていたが、マークアップよりもデータ重視を目的としていたために後付されてできた名前である。しかしながら XML(当のマークアップ言語)がデータシリアライズ

    YAML - Wikipedia
    ko-ya-ma
    ko-ya-ma 2013/05/17
    再帰的定義された頭文字の例でもある
  • 1