タグ

tgkのブックマーク (4,429)

  • Snowflake を使うときに初心者に気をつけてほしいこと - Qiita

    この記事はSnowflakeアドベントカレンダーの10日目の記事です。 今日は私が Snowflake を使いはじめて失敗したことを中心に、不幸な事故を繰り返さないために初心者の方に気をつけてほしいことを書こうと思います。 スピル見てない Snowflake ってとっても高速にクエリを実行してくれるので、ついついプロファイルを見るのをサボったりしてしまいますよね? これは架空の話なんですが… あるとき、めっちゃクエリが遅かったんです。 あー、遅いねーって思ってた。 よーく、プロファイルを見ると、スピルの数字がめっちゃ増えていたわけですよ。 うーん?スピルってなんだっけ? When Snowflake cannot fit an operation in memory, it starts spilling data first to disk, and then to remote sto

    Snowflake を使うときに初心者に気をつけてほしいこと - Qiita
  • https://twitter.com/Knjshiraishi/status/1622709014068072449

    https://twitter.com/Knjshiraishi/status/1622709014068072449
    tgk
    tgk 2023/03/26
  • ザ・キンクス - 榎本俊二 / 第1話 うれいらずたのぼー | コミックDAYS

    ザ・キンクス 榎俊二 令和日のとある地方都市に暮らす4人家族、錦久家。彼らの平凡日常イベントを、エノモトならではのとことん素敵で豪快な切り取り方で非凡異常事態として読ませる作者渾身の野心作。「真実は細君に宿る」(作者談)

    ザ・キンクス - 榎本俊二 / 第1話 うれいらずたのぼー | コミックDAYS
    tgk
    tgk 2023/03/26
    すごい
  • 減点主義の完璧主義の毒親かよ まず治安維持に実際に貢献してるおとなしく..

    減点主義の完璧主義の毒親かよ まず治安維持に実際に貢献してるおとなしくかしこい日人男性を褒めろよ 治安っていう成果出してるのに褒めないんだったら、わずかばかりの自尊心を保つために自分で自分褒めるしかねーだろ 馬鹿じゃねーのか 毒親か 俺は別に日ホルホルをめっちゃ好きではないし、むしろ嫌いだが、とはいえお前みたいなのがいるから日ホルホルが流行るんだわ たとえばだよ 日くんの治安はテストで90点相当だとする。満点100点。確かに満点ではない 世界の治安の平均は50点とする。イギリス君は70点くらいだとする 50点しか取れてない同級生や、70点のイギリス君に比べれば、40ないし20点分の才能ないし努力ないし運があるのは間違いない。 俺なら日くんには「平均が50なのに90点も取れたの?凄いね!」と言うだろうが お前は「満点に10点足りん。そんな点数誇るな。90点程度で誇る態度なさけない。

    減点主義の完璧主義の毒親かよ まず治安維持に実際に貢献してるおとなしく..
    tgk
    tgk 2023/03/19
    「まず治安維持に実際に貢献してるおとなしくかしこい日本人男性を褒めろよ」そこ褒められるのは職場でオナニーしない・路上で排便しないことを褒められるのと同じ気分。馬鹿にすんなと
  • 『【Excel】パスワードロックを強制的に解除する方法』へのコメント

    そういや昔、埋め込まれているパスワード部分がハッシュ化されてるが、固定長だから自分で用意したデータに置き換えて開けるみたいなやつもあった記憶

    『【Excel】パスワードロックを強制的に解除する方法』へのコメント
    tgk
    tgk 2023/03/18
  • 行政の統計資料のような非構造化データをGPTで構造化データに変換する|mah_lab / 西見 公宏

    今朝方GPT-4が発表されて、みなさん死ぬほど盛り上がってますねー。 GPT-4を使えば一発でできそうなネタではありますが、GPT-4 APIのお値段は3.5よりもお高めの設定なので、これからはどのように上手くGPTのバージョンを使い分けていくかが問われていくと思います。 というわけで今日は非構造化データを構造化データに変換する話です。 問題の背景行政が定期的に公開している統計資料をご覧になったことはありますでしょうか。ディスる訳ではないですが、以下に示すのは私が住んでいる富士吉田市の統計資料です。 統計ふじよしだ令和元年度版 - 商業 このように分かりやすい表で情報を提供してくれるのはありがたいのですが、数値データにはなっていないので分析に活用することができません。 GPTのパワーを使って、このような非構造化データを構造化データに変換できないか?というのが日のお題になります。 コードP

    行政の統計資料のような非構造化データをGPTで構造化データに変換する|mah_lab / 西見 公宏
    tgk
    tgk 2023/03/16
  • やはりお前らの「公開鍵暗号」はまちがっている。

    ※タイトルの元ネタは以下の作品です。 はじめに この記事は、公開鍵暗号の全体感を正しく理解するためのものです。数学的な部分や具体的なアルゴリズムは説明しません。気になる方は最後に紹介するオススメ書籍をご覧ください。 少し長いですが、図が多いだけで文字数はそこまで多くありません。また、専門的な言葉はなるべく使わないようにしています。 ただしSSHやTLSといった通信プロトコルの名称が登場します。知らない方は、通信内容の暗号化や通信相手の認証(人確認)をするためのプロトコルだと理解して読み進めてください。 公開鍵暗号の前に:暗号技術とは 公開鍵暗号は暗号技術の一部です。暗号と聞くと、以下のようなものを想像するかもしれません。 これは情報の機密性を守るための「暗号化」という技術ですが、実は「暗号技術」と言った場合にはもっと広い意味を持ちます。まずはこれを受けて入れてください。 念のため補足して

    やはりお前らの「公開鍵暗号」はまちがっている。
    tgk
    tgk 2023/03/06
  • OpenSSL gives "iv undefined" for AES-256-ECB

    tgk
    tgk 2023/03/02
    "iv undefined"で怒られたら、-v 0 -p で iv =00000000000000000000000000000000 を指定したことになる模様
  • Teradataの文字コード(Unicode)でのコードページの違いに注意: ITコンサルとは名ばかりのエンジニアのブログ

    Teradata DBMSでの文字コードの取り扱い、ひと癖あり少々ハマりました。 インサート/ロード時にUTF16セッション、エクスポート時にKANJISJISセッションとすると、以下の文字について変換不能となる様子。 UTF8/UTF16 セッションでInsertした場合、格納コードはMS932ベースのエンコーディングに、 KANJISJIS_0SセッションでInsertした場合、格納コードはCP943ベースのエンコーディングになるため、 このため、異なるソースから取り込んだデータをごっちゃにして取り出せなくなりました。 異なる文字コードリスト [S_JIS] 0x5C (\) [CP932] 0x005C (REVERSE SOLIDUS) [CP943] 0x00A5 (YEN SIGN) [S_JIS] 0x7E (~) [CP932] 0x007E(TILDE) [CP943]

    tgk
    tgk 2023/02/26
    「セッション文字セット=KANJISJIS_0Sのときに WHEREWHERE c1 like '%~%' という条件にhitするレコードが0件になるなあ」と思ったら、チルダが0x007e(TILDE)ではなく0x203e(OVERLINE)で保存されてしまうとのこと
  • 日記/2017/10/09/MSYS2,MinGW64,Cygwinの違い - Glamenv-Septzen.net

    id: 1422 所有者: msakamoto-sf 作成日: 2017-10-09 21:51:48 カテゴリ: Cygwin MSYS,MSYS2,MinGW,MinGW64 会社のPCを入れ替えることになり、Windows上のunixツール環境、今度はどうしようかと考えた。 今まではCygwin使いだったが、apt-cygの動向があるのと、QiitaなどでMSYS2の記事が増えてるので、MSYS2に乗り換えてみようか、とも思う。 実は一度新PCにMSYS2とCygwinを入れてみたのだが、MSYS2はそもそもスタートアップメニューのショートカットがMSYS2とMinGW64/32で分かれてるのがそもそも理解不能だったし、Cygwinのsetup-x86_64.exeの使い勝手も相変わらず悪かった。 とはいえ、apt-cygが一向に公式に取り入れられないなどCygwinに頼り切るのはど

    tgk
    tgk 2023/02/26
    「MSYS2とMinGW64の最大の違いは、POSIXエミュレーションを介しているか否か」「MinGW64のexeは単体でWindowsアプリとして実行可能となっている。コマンドプロンプトからも利用可能」
  • 上野家のホームページ - 資料室 : PC/Windows/WindowsのバッチファイルでECHOを改行なしで出力WindowsのバッチファイルでECHOを改行なしで出力

    何をしているかというと,環境変数Xに対し,「テスト」というプロンプトを表示してユーザに入力をさせるのだが,入力はNULデバイスから行う事により,来,プロンプトを表示し入力待ちとなるところを,プロンプトの表示だけさせるという,こんなので良いのか・・・っていうような方法。 出力をリダイレクトによりファイルに書き出せば,改行が入らないで出力させることが出来ます。 関係ないけど,空行を出力するには,

    tgk
    tgk 2023/02/23
    Windowsのechoコマンドは改行なしの出力ができない模様。代わりにset /p ... <NULが使える
  • BigQuery で ROW_NUMBER(), RANK() を使うな!

    どういうことか たとえば created_at が最も新しいレコード 1 件だけ取ってきたいとか、成績のよいレコード上位 5 件を取ってきたいといったとき、よくある方法として RANK() や ROW_NUMBER() のような番号付け関数を使う方法が思い浮かぶと思いますが、BigQuery ではこれらの関数ではなく ARRAY_AGG() 集計分析関数を使うことが推奨されています。 先に結論を ARRAY_AGG() を使うことでクエリの計算を最適化でき、スロット使用量(計算量)が少なく済みます。スロット使用量の上限を定めている場合、非効率なクエリがいくつも実行されるとキューイングされる可能性があるため理由がなければ ARRAY_AGG() を使いましょう。 ドキュメントによれば ORDER BY 句が各 GROUP BY 句のトップレコードを除くすべてを捨てることができるため効率がいい

    BigQuery で ROW_NUMBER(), RANK() を使うな!
    tgk
    tgk 2023/02/20
  • Snowflakeに中森明菜データレイク(通称NADL)を構築しました | DevelopersIO

    大阪オフィスの玉井です。 題名の通り、極めて先進的な(?)データレイクの構築に成功したので、当記事にて詳細をお伝え致します。 概要説明 NADL(Nakamori Akina Data Lake)とは? 日が誇る歌姫である中森明菜氏の(ほぼ)全ての楽曲に関するデータを保存したデータレイクです。 SnowflakeはDWHのイメージが強いですが、データレイクを構築・運用する機能を備えています。今回、Snowflakeのデータレイク周りの機能を活用して、NADLを構築しました。 構築作業の流れ SpotifyのAPIから中森明菜の楽曲データを取得する 楽曲データの取得には Get Track’s Audio Analysisを使用 取得した楽曲データをGoogle Cloud Storage(GCS)にアップロードする 上記のGCS(のバケット)をSnowflakeの外部ステージとして連携す

    Snowflakeに中森明菜データレイク(通称NADL)を構築しました | DevelopersIO
  • カメに「変身」した官僚 恥を捨てて訴えたかった命のはなし | 毎日新聞

    顔にアカミミガメを模したペイントを施し、新たな外来種規制について説明する環境省の奥田直久・自然環境局長=環境省の公式ユーチューブチャンネルから 環境省の公式ユーチューブチャンネルに、顔を緑、耳などを赤くペイントした省幹部が登場する動画がある。人は「恥ずかしいという思いもあった」と話すが、そうまでして画面に出たのは「新たな外来種規制をより多くの人に知ってもらわなければ」という思いからだった。 「ミドリガメ」ペイントで新規制を解説 「法律がどう変わったか、解説してくれるのがこちらの局長」。司会役の環境系ユーチューバー、WoWキツネザルさんの紹介を受けて登場したのは、同省で外来種規制を担当する部局のトップ、奥田直久・環境省自然環境局長(60)だ。 顔や耳のペイントは「アカミミガメ(ミドリガメ)」を模したもの。WoWキツネザルさんが物に似せて、しま模様も丁寧に描き込み、30分ほどかけて仕上げた

    カメに「変身」した官僚 恥を捨てて訴えたかった命のはなし | 毎日新聞
    tgk
    tgk 2023/02/06
  • Teradata: Split String into table rows

    tgk
    tgk 2023/01/30
    STRTOK_SPLIT_TO_TABLE関数には、テーブル全件を渡すことになるので、フィルタをかけたい時はwith句/CTEを使うしかない
  • - How to add CRLF (carriage return line feed) character at the end of each record in tpt exported data file? - Community

    tgk
    tgk 2023/01/24
    TPTでexportするファイルの改行文字はプラットフォームで固定されている。WindowsでLF改行のファイルを出力する方法はない、とFredが回答している
  • How can I escape an exclamation mark ! in cmd scripts?

    tgk
    tgk 2023/01/23
    バッチファイルの中の!をエスケープする方法。^!でエスケープになるが、全体を""でクォートしなくてはならない。""で括らないなら、^^!でも機能するらしい
  • - Utility Session Management - It's Inside the Database in Teradata 13.10! (UPDATED) - Customer Support

    tgk
    tgk 2023/01/23
    Fatstload/Multiloadの接続セッション数が、スクリプトで指定した値が無視されてデフォルト値で上書きされる理由。セッション数を減らしたいならSET QUERY_BAND = 'UtilityDataSize=SMALL;' UPDATE for session;する
  • [正規表現] .*?は最短マッチではない - Qiita

    # Ruby 2.4.2 "<<<hoge>>>".match(/<.*?>/)[0] #=> "<<<hoge>" なぜこうなるのか .*?は、 最短マッチ 最左マッチ の2つの原則に従い、しかも最左マッチの原則の方が優先順位としては高いからである。 より嚙み砕いて言うと <.*?>は先頭の<がマッチした後に、そこからマッチする部分をできるだけ最小化しようと試みる。 <<<hoge>>>に対して<.*?>をパターンマッチさせる際に行われる実際の処理の流れは、次のようなイメージになるだろう。 < # <までマッチ << # <>のマッチに失敗、.の数を増やしてリトライ << # <.までマッチ <<< # <.>のマッチに失敗、.の数を増やしてリトライ <<< # <..までマッチ <<<h # <..>のマッチに失敗、.の数を増やしてリトライ <<<h # <...までマッチ <<<ho

    [正規表現] .*?は最短マッチではない - Qiita
    tgk
    tgk 2023/01/22
    ?は結果の右側をカットするが左は縮めてくれない。最左マッチと思えばよい
  • mklink - Windowsコマンド虎の巻

    解説 mklinkコマンドは、シンボリックリンク(ショートカット)を作成します。 構文 (構文) MKLINK [オプション] <リンク名> <ターゲット> 【オプション】 オプション説明

    tgk
    tgk 2023/01/22
    Windowsでシンボリックリンクを作る方法。ln -sとは引数が逆順になっている