light940のブックマーク - はてなブックマーク

SQL滅ぶべし | ドクセル

SQL • リレーショナルデータベースシステムと会話するための言語 • 1970年 Codd が RDB モデルと同時に提案 (Alpha言語) • 1974年 Chamberlin と Boyce が改良 • 元々は SEQUEL (Structured English Query Language) だったが、商標登録されていた • 読み方はエスキューエルとそのまま読む (Glliespie 2012)

light940 2024/05/07

SQL

リンク

Python Dashによりデータ分析結果の共有を効率化する取り組み - ZOZO TECH BLOG

はじめにこんにちは、検索基盤部の伊澤です。検索基盤部では普段から、ZOZOTOWNの検索機能に関するデータ分析や、データ分析を踏まえた検索性能の改善に取り組んでいます。検索に関するデータ分析では、検索クエリの傾向把握や課題のあるクエリの特定のために、検索クエリごとの検索結果のクリック率やコンバージョン率といったパフォーマンス指標を評価しています。本記事では、検索クエリごとのデータ分析に関する情報共有を効率化するため、ウェブフレームワークの「Dash」で開発したダッシュボードを活用した事例を紹介します。目次はじめに目次検索クエリごとのデータ分析の重要性分析結果のチーム内共有時の課題 Dashを用いたダッシュボードの開発 Dashとは Dashを選定した理由検索クエリごとのパフォーマンス指標のダッシュボード 1. 検索クエリごとのパフォーマンス指標のテーブル 2. 検索クエリ

light940 2024/05/07

リンク

もう人間がクエリを書く時代じゃない！SQLクエリの組み立てを自動化するSlack botを開発・導入しました - Pepabo Tech Portal

こんにちは。SUZURI事業部の@kromiiiと申します。私のメインの業務はWebアプリケーションの開発ですが、大学院時代のスキルを活かして並行してデータ分析業務も行っています。データ分析業務ではデータベースのクエリを書くことが多いのですが、私自身SUZURI事業部に配属されたばかりで、テーブルの名前やリレーションを覚えるのが大変でした。そこでクエリの設計を自動化するツールをSlackに導入しました。その名も tbls-ask bot です。どのようなものか先に見てみましょう。ユーザーはSlackでメンションする形で、どのようなクエリを実行したいのか自然言語で入力します。メンションされるとSlack botが起動し、どのDBスキーマを利用するかを尋ねます。ユーザーがDBスキーマを選択すると、自然言語からSQLクエリを生成し、Slackに返答します。今回はパブリックに公開する

light940 2024/05/04

slack
SQL

リンク

サブクエリの書き方を2万文字弱かけてすべて解説する

これはなにども、レバテック開発部のもりたです。今回はSQLのサブクエリについてまとめます。仕事でクエリを書く際、サブクエリは頻出の構文だと思うんですが、同時にサブクエリの書き方を完全に理解しているよという人は案外少ないのではないでしょうか？[1] 実際、MySQLの公式ドキュメントを見ると12ページくらいを割かれており、意外と奥深いのがサブクエリです。使いこなせると便利ですし、何よりちょっとSQLのコツみたいなのがわかって面白いよ、ということで記事にしてみました。前提この記事は以下の前提を含んでいます。環境 MySQL8.0系読者の知識なんとなくサブクエリが書けるけど相関サブクエリとかになると「あーっ」つってGoogle meetを閉じてしまうくらいのレベル感記事のボリューム 18,000文字おれの卒論が20,000文字だったマサカリ間違ってたら投げてくれ〜〜それ

light940 2024/05/03

SQL
MySQL

リンク

無料で商用利用可能なSQL生成・コーディング・命令フォローなどのエンタープライズタスクに最適化された大規模言語モデル「Snowflake Arctic」が登場

クラウドベースのデータウェアハウスサービスを展開する企業のSnowflakeが、トップレベルのエンタープライズ向け大規模言語モデル(LLM)として「Snowflake Arctic」をリリースしました。Apacheライセンスバージョン2.0で提供されるオープンなモデルとなっており、無料で商用利用も可能です。 Snowflake Arctic - LLM for Enterprise AI https://www.snowflake.com/blog/arctic-open-efficient-foundation-language-models-snowflake/ Snowflakeの調査では、企業ユーザーはAIを使用して主にデータ支援やコード支援、検索拡張生成(RAG)を行うチャットボットを作成したい場合が多いとのこと。そこで、Snowflakeは「コーディング能力」「SQL生成能力

light940 2024/04/27

SQL

リンク

BigQuery クエリ - pokutuna

BigQuery 関連: Colaboratory 標準 SQL 語彙の構造 | BigQuery | Google Cloud リテラル等の仕様その場でデータを作ってクエリする動作確認に便利 code:struct.sql SELECT MIN(status) FROM UNNEST([ STRUCT('unexamined' AS status), STRUCT('unexamined' AS status), STRUCT('ng' AS status) ]) 型ほしい時は型を書く code:complex_struct.sql SELECT * FROM UNNEST( ARRAY<STRUCT<count INT64, time TIMESTAMP>>[ STRUCT(3, TIMESTAMP "2020-07-01 10:00:00"), STRUCT(5, TIM

light940 2024/04/24

BigQuery
SQL

リンク

Stable Diffusionの文字がちゃんと描ける新バージョン「SD3」、APIを組み込んで検証した | テクノエッジ TechnoEdge

Stability AIからStable Diffusionの新しいバージョン「Stable Diffusion 3」がAPI限定で公開されました。アプリケーションに組み込んで特徴やコストなどを確認しました。

light940 2024/04/23

AI
画像

リンク

OpenAI、GPT-4の「日本語特化モデル」発表--処理速度3倍に

OpenAIは4月15日、アジア初の拠点となる東京オフィスの開設に合わせ、AIモデル「GPT-4」の日本語特化版「GPT-4 Customized for Japanese」を発表した。すでに早期アクセスが可能で、数ヶ月以内に広くAPIを公開予定。GPT-4 Turboに比べて日本語の処理速度が「3倍」としている。 GPT-4 Customized for Japaneseでは、日本語の文字を読み取る能力を向上させたほか、トレーニング中に「この情報は重要」「この情報は重要ではない」という「アテンションシフト」という手法を取り入れ、さらなる能力向上を図った。 OpenAIは今回の東京オフィスの設置によって、細かなニュアンスや文化的背景の理解を含めた日本語能力のさらなる向上を図るほか、法人向けに「ChatGPT Enterprise」を販売する。従業員は年内に十数人を採用する計画だ。

light940 2024/04/16

リンク

総務省、6月11日開講の「社会人のためのデータサイエンス入門」受講生募集を開始

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

light940 2024/04/16

データサイエンス

リンク

NewSQLはデータベースに革命を起こすか - NetflixにおけるCockroachDBのユースケース｜ミック

近年のデータベースの新潮流にNewSQLと呼ばれる一群のデータベース製品群の登場がある。そのコンセプトを一言でいうと、RDBとNoSQLのいいとこどりである。SQLインタフェースと強いデータ一貫性（ACID）というRDBの利点と水平方向のスケーラビリティというNoSQLの長所を兼ね備えた夢のようなデータベースである。下図に見られるように、RDBとNoSQLが鋭いトレードオフを発生させていたのに対して、NewSQLではそれが解消されているのが分かる。 RDB vs NoSQL vs NewSQL 本当にそのような夢の実現に成功しているか、というのはまだ議論が続いているが（クエリのスループットを出すためにレイテンシを犠牲にしているので本当にトレードオフを解消はしていない、などの問題が指摘されている）、商用でも利用可能な製品としてGoogle Spanner、TiDB、YugabyteDB、Coc

light940 2024/04/15

リンク

「SQL」の読み方論争に決着？「しーくぇる」vs「えすきゅーえる」にPostgreSQLがケリ／冠詞にはくれぐれも注意【やじうまの杜】

light940 2024/04/11

SQL

リンク

エクセル経営からPython活用へ！ワークマンがデータ分析を高度化させるねらいとやり方とは _流通・小売業界ニュースサイト【ダイヤモンド・チェーンストアオンライン】

作業服チェーンの「WORKMAN（ワークマン）」やアウトドア・アスレジャーなどの機能性ウエアをも取り扱う「WORKMAN Plus（ワークマンプラス）」などを展開するワークマン（群馬県／小濱英之社長）。これまでエクセルを用いたデータ経営を推進してきたが、2021年から「AI Ready企業」を標ぼうし、プログラミング言語「Python（パイソン）」の活用により、データ分析をより高度化しようとしている。データドリブン企業として成功を収めている同社の現在地について専務取締役の土屋哲雄氏に話を聞いた。「AI Ready企業」を掲げ社員のPython習得を推進 ──土屋専務はワークマン入社後、表計算ソフト「Excel」を用いて各従業員が販売や店舗運営に関するデータ分析・活用を行う「エクセル経営」を推進してきました。まずはその背景と意図について聞かせてください。土屋哲雄（つちや・てつお） ●19

light940 2024/04/03

リンク

データ分析のためのSQLを書けるようになるために

はじめに本稿では分析用クエリをスラスラ書けるようになるまでの勉強方法や書き方のコツをまとめてみました。具体的には、自分がクエリを書けるようになるまでに利用した教材と、普段クエリを書く際に意識していることを言語化しています。想定読者として、SQLをガンガン書く予定の新卒のデータアナリスト/データサイエンティストを想定しています。勉強方法基礎の基礎をサッと座学で勉強してから、実践教材で実際にクエリを書くのが望ましいです。実務で使える分析クエリを書けるようになるためには、実務経験を積むのが一番良いですが、だからといって座学を御座なりにして良いというわけではありません。SQLに自信がない人は、一度基礎に立ち返って文法の理解度を確認した方が良いと思います。書籍 SQL 第2版: ゼロからはじめるデータベース操作前提として、SQLに関する書籍の多くがデータベース運用/構築に関する書籍がほ

light940 2024/04/02

リンク

静的サイトジェネレーター「VitePress 1.0」正式リリース。VueとViteを採用し、高速なWebサイトを構築

静的サイトジェネレーター「VitePress 1.0」が正式リリースされた。UIフレームワークのVueと高速なバンドラであるViteを基盤に、MarkdownのコンテンツからSPAなWebサイトを構築できる。オープンソースとして開発されている静的サイトジェネレーターの「VitePress 1.0」正式版がリリースされました。 VitePressは、Markdownで記述されたコンテンツを静的で美しい外見を持つWebサイトへと高速に変換する機能を備えたフレームワークです。デフォルトでテクニカルドキュメントに適したテーマが用意されており、すでにVite、Rollup、Pinia、VueUse、Vitest、D3、UnoCSS、IconifyなどのWebサイトのドキュメント部分に使われているとのことです。 VitePressは、同じく静的サイトジェネレーターである「VuePress」のモダン

light940 2024/03/27

リンク

データ分析プロジェクトを外注する際に失敗しないための5つのポイント | DOORS DX

システムエンジニアとしてITベンチャー企業と金融系企業に勤めた後、2019年にデータサイエンティストとしてブレインパッドに入社。需要予測に関するプロジェクトに多く従事し、モデル構築から運用保守まで一貫して経験。LLMを活用したプロジェクトにも携わる。 Kaggle Competition Master。 ①プロジェクトの目的を明確にするまず初めに、プロジェクトの目的を明確にすることが重要になります。これはデータ分析プロジェクト以外にも共通する部分ですが、プロジェクトとは「特定の目的を達成するために行われる期限のある活動」です。まずデータ分析プロジェクトの目的（=ゴール）を明確にし、発注側と受注側で共通認識を持つことが、プロジェクト成功に向けた第一歩となります。「目的を明確にするなんて当たり前。意識しなくてもできる」と思われるかもしれません。しかし、私の経験上、目的が曖昧で関係者の認識

light940 2024/03/21

リンク

データ分析基盤まとめ（随時更新）

はじめにデータ分析基盤の資料を力尽きるまで追記していきます。構成図にあるアイコンや記事の内容から技術要素を調べて記載していますが、不明分は未記載にしています。修正のコメント頂ければ助かります。あと、この記事追加してっていう要望も歓迎いたします。テンプレート記事公開日 : 会社名（サービス名）データソース : データ処理 : アウトプット : 画像 URL 2025年 2024/03/14 : 株式会社エス・エム・エス（カイポケ）データソース : Amazon Aurora データ処理 : Datastream、BigQuery、dbt アウトプット : Looker Studio 2024/03/12 : 株式会社マイナビデータソース : SQL Server、Amazon S3 データ処理 : Embulk、Amazon MWAA、Apache Airflow、Snowf

light940 2024/03/17

リンク

データ分析のためのSQL勉強会〜実践編〜

ビジネスとコード品質の接合点そしてコード品質がそこに及ぼす影響 / The Intersections of Business and Engineering, and The Impact of Code Quality There

light940 2024/03/06

リンク

『データ分析のためのSQL勉強会〜実践編〜』資料公開｜高橋光 | 著書『データ分析力を高めるビジネスパーソンのためのSQL入門』

はじめにこんにちは。高橋です。本業はコンサルとしてデータ分析を活用したデジタルマーケティング支援などをしており、副業ではデータ分析支援やデータ分析コーチングなどもやっております。以前noteで『データ分析のためのSQL勉強会』資料を公開しました。そこからさらにデータ分析で使うSQLを学びたいビジネスパーソン向けの書籍も出版して、より体系的にデータ分析で使うSQLを学ぶ教材をまとめました。

light940 2024/03/05

リンク

2024年版：独断と偏見で選ぶ、データ分析職の方々にお薦めしたいホットトピックス＆定番の書籍リスト - 渋谷駅前で働くデータサイエンティストのブログ

毎年四の五の言いながら書いている推薦書籍リスト記事ですが、何だかんだで今年も書くことにしました。なお昨年度版の記事を上にリンクしておきましたので、以前のバージョンを読まれたい方はそちらをお読みください。今回のバージョンでは、趣向をちょっと変えて「定番」と「注目分野」というように分けました。何故こうしたかというと、平たく言って「初級＆中級向け」推薦書籍リストは定番化していて毎年あまり変更点がない逆に直近のホットトピックスに関するテキストは毎年入れ替わりが激し過ぎて網羅しづらいという課題があり、特に2点目についてはあまりにもデータサイエンス関連書籍の新規刊行が多過ぎる＆僕自身がその流れについていけておらず完全に浦島太郎状態ですので、万人向けに等しくウケるようなリストを作るのは今回をもって完全に諦めたというのが実態です。その上で、前回まで踏襲されていた定番書籍リストはバルクで提示すると