hatakazu93のブックマーク - はてなブックマーク

サブクエリの書き方を2万文字弱かけてすべて解説する

これはなにども、レバテック開発部のもりたです。今回はSQLのサブクエリについてまとめます。仕事でクエリを書く際、サブクエリは頻出の構文だと思うんですが、同時にサブクエリの書き方を完全に理解しているよという人は案外少ないのではないでしょうか？[1] 実際、MySQLの公式ドキュメントを見ると12ページくらいを割かれており、意外と奥深いのがサブクエリです。使いこなせると便利ですし、何よりちょっとSQLのコツみたいなのがわかって面白いよ、ということで記事にしてみました。前提この記事は以下の前提を含んでいます。環境 MySQL8.0系読者の知識なんとなくサブクエリが書けるけど相関サブクエリとかになると「あーっ」つってGoogle meetを閉じてしまうくらいのレベル感記事のボリューム 18,000文字おれの卒論が20,000文字だったマサカリ間違ってたら投げてくれ〜〜それ

hatakazu93 2024/05/03

リンク

Pythonでリトライ処理を簡単に追加できる「tenacity」を使ってみる | DevelopersIO

今回はPythonで簡単にリトライ処理を追加できる「tenacity」を使ってみます。デコレータ形式で簡単にリトライ処理を追加できるので便利です。 tenacityについてプログラムを書いていて、HTTPの通信などでリトライ処理を実装する機会は多いと思います。今回はそんなリトライ処理を簡潔に書けるtenacityの使い方を説明します。インストールインストールはpipで可能です。インストール pip install tenacity 使い方シンプルな例シンプルな例 import random from tenacity import retry @retry def random_error(): num = random.randint(0, 10) if num > 4: print(f"Error: num={num}") raise Exception("Error!

hatakazu93 2024/05/02

リンク

Python 3.12で増えた並列処理と、これまでの並列処理の挙動を比べてみる - Qiita

この記事ですることを3行で Pythonの標準ライブラリでできる並列実行を、あらためて総当たりで速度比較しようウォーターフォールチャートで、それぞれの並列処理の処理時間の特徴を可視化しよう boto3の実行をモデルケースにして、どの並列処理が一番早いのかを調べようこの記事の結論を先に Python 3.12から本格的に使えるようになったサブインタープリターは、CPUで実行する処理について言えば、従来のサブプロセスよりも高速 boto3の実行は、サブインタープリターよりも署名付きURLの非同期実行のほうが速い → S3からの10ファイルの取得であれば、実行時間を90%削減できます → Bedrockの3回実行であれば、実行時間を60%削減できます今回使ったソースコードはこちらに置いています。お手持ちの環境で再実行できるようにしていますので、気になる方はぜひ。どうしてこの記事を書くの

hatakazu93 2024/05/02

リンク

日本語辞書ありキーワード抽出器からの多言語辞書なしキーワード抽出器の Distillation - Beatrust techBlog

Beatrust の tatsuya（白川）です。Beatrust は人々の経験や強みを可視化して、自由に繋がり、協業・共創できる環境を作るという Mission を達成するためのサービスづくりとお客様への提供・活用促進活動を行っています。 beatrust.com キーワード抽出は Beatrust の基礎技術のひとつなのですが、これまで Beatrust で開発していたキーワード抽出器は辞書を用いたルールベースのものだったので、辞書外のキーワードを抽出できないというデメリットがありました。Beatrust のお客様は様々な業界に渡っており、それぞれ固有の専門用語や社内でのみ通用する社内用語なども多く、辞書ベースの方法ではそれらのキーワードを抽出することは現実的に不可能でした。今回そんな状況を鑑みて、辞書ベースのキーワード抽出器を用いて、辞書なしのキーワード抽出器を学習するというチ

hatakazu93 2024/04/30

リンク

Arxiv RAGによる論文サーベイの自動生成 | Shikoan's ML Blog

2.2k{icon} {views} 複数のLLM（GPT/Claude3）とArxivの検索APIをRAGで統合し、論文サーベイの自動生成を作りました。検索結果の前処理や、サーベイ特有のプロンプトエンジニアリングやソートが重要で、最適化手法として古くからある巡回セールスマン問題（TSP）が有効に機能しました。また、生成部分ではGPTよりClaude3の明確な有効性を確認できました。できたもの Arxivの検索APIを使って検索拡張生成（RAG）したらサーベイを自動生成できたやっていること Arxivの検索ワードをGPT-4-Turboで生成 ArxivのAPIを叩いてヒューリスティックでフィルタリング OpenAIのEmbedding APIを叩く Embeddingに対して巡回セールスマン問題（TSP）を解いてソートをかける論文の要旨をGPT-3.5-Turboで要約ソートした

hatakazu93 2024/04/28

リンク

【初心者向け】機械学習におけるクラス分類の評価指標の解説 - OPTiM TECH BLOG

こんにちは。R&Dチームの河野です。主な担当業務は機械学習モデルの開発です。タイから日本に留学し、卒業後日本企業に就職していました。データ分析・機械学習の業務経験が3年程度で、R&Dチーム唯一の女性かつ外国人のメンバーです。直近の仕事はディープラーニングによるクラス分類モデルの開発を担当しており、今回はモデル精度評価によく使われる評価指標について初心者向け説明させて頂きたいと思います。機械学習モデルの精度改善には課題に適切な評価指標の選択がすごく重要のため、各評価指標の理解が必要になります。分類モデル開発に興味を持っている方・挑戦してみたい方にご参考になれば幸いです。基本的な用語ポジティブとネガティブクラス混合行列評価指標正解率（Accuracy）適合率（Precision）再現率（Recall） F値（F1-score）しきい値とprecision-recallのトレ

hatakazu93 2024/04/28

“迷惑メールではないものの誤検知”

リンク

Web記事をDeBERTaで自動タグ付けしてNotionに保存するスクリプトを作った

TL;DR TwitterのDM(自分宛て)にストックしたいWeb記事のURLを貼り付けると、URLから記事情報を取得・DeBERTaでタグ付けしてNotionのデータベースに記事を保存するスクリプトを作った。これはその導入方法を説明する記事。はじめにこんにちは。なんかです。 TwitterやRSSフィードを眺めていると、毎日有用なWeb記事が目くるめくスピードで流れてきます。しかし、そういった全ての有用情報をその場で閲覧して記憶することは現実的ではないので、あとで読むために、もしくは記事が消えた後も読めるようにするために、記事を自分用のデータベースに保存しておきたい機会は無限にあります。そういった需要に応える記事の保存ツールとしてPocketやNotion Webクリッパー、または単純にブラウザのリーディングリストといったサービスが存在し、各々最強の有用記事データベースを作ってい

hatakazu93 2024/04/28

リンク

これからのプロジェクトマネジメントに大事なのは「結果にコミットしない」こと　クリエイティブな仕事に求められる“アジャイル思考”

不確実さが増す世界のプロジェクトマネジメントとはとういうものか倉貫義人氏：そんな不確実さが増す世界のプロジェクトマネジメントはどういうものなのか。（スライドを示して）プロジェクトがうまくいかない（理由）というのは、このあたりを見てもらうと胃が痛くなりそうな言葉がいっぱい書いてあると思います。想定よりコストがかかるとか、作ったものを直せないとか。（スライドを示して）これに対してどうすればいいかというと、「こうすればうまくいくのかな？」と考えがちですよね。「遅いからプレッシャーをかけようか」とか「少し遅れているので人を増やそうかな」とか「一気に作ったほうがいいんじゃないの？」とか「属人性を排除しましょう」とかと言いがちですよね。これらはけっこう言いがちですが、全部失敗するやつです。これを全部やってみたら困ったことにプロジェクトが大変なことになるので、ぜひやってみたらいいと思います。（会

hatakazu93 2024/04/24

リンク

AIは“作業”はできるが“仕事”はできない　不確実さが増す世界で増加している「ナレッジワーカー」の仕事

AIは“作業”はできるが“仕事”はできない不確実さが増す世界で増加している「ナレッジワーカー」の仕事不確実な世界で成果をあげる〜変化を抱擁するアジャイル思考 #1/2 プロジェクトマネジメントはなかなかうまくいかない倉貫義人氏：今日は「不確実な世界で成果を上げる」というテーマで話をしたいと思っています。私の簡単な自己紹介ですが、倉貫と申します。ソニックガーデンとクラシコムという、2つの会社で経営をしている人間です。ソニックガーデンが自分で創業した会社ですね。クラシコムは2018年から社外取締役で入らせてもらっています。もともとのバックグラウンドはエンジニアです。いわゆるソフトウェアエンジニア、プログラマーということで、子どもの時代からプログラミングをずっとやっていて、プログラミング畑で学生、社会人になりました。今回のテーマがプロジェクトマネジメントということですが、システム開発

hatakazu93 2024/04/24

リンク

レベルアップしたい人必見　Qiita記事43選 - Qiita

はじめに本記事ではレベルアップしたいエンジニアが読んでおくべきQiita記事を紹介します。厳選に厳選を重ねた43記事です。全ての記事を読んでおく必要はありませんが、ちょっとでも「分からないな」「興味あるな」など思ったタイトルがあれば読んでみてください。次の4種類に分類して紹介しています。参考にしてください。フロントエンドバックエンドインフラ・Linux周りの知識その他それでは、早速紹介していきます！弊社Nucoでは、他にも様々なお役立ち記事を公開しています。よかったら、Organizationのページも覗いてみてください。また、Nucoでは一緒に働く仲間も募集しています！興味をお持ちいただける方は、こちらまで。フロントエンドまず最初はフロントエンドエンジニアに読んでおくべきとおすすめできるQiita記事を11個選びました！フロントエンドエンジニアとしての基礎が身に付く

hatakazu93 2024/04/23

リンク

JMOOC - 無料で学べる日本最大のオンライン大学講座（MOOC）

まずはJMOOCにログイン JMOOCにログインするとお気に入りの講座をリストに登録して通知を受け取ったり、JMOOCのメールマガジンを受け取ることができます。 Google ID,Facebook ID共に所有していない場合、各プラットフォーム（gacco,Open Learning,Japan）にて個別に受講登録をして頂ければ受講できます。 ※すでに各プラットフォーム（gacco、OpenLearning,Japan）でアカウント登録している場合は、登録済みのものと同様のIDで登録いただくことで、将来的にシングルサインオンのシステム構築が完了した際に、共通IDによる受講情報の一元管理が可能になります。現在FaceBookIDでのログインは、一時的ではございますが、ご利用になれません。

hatakazu93 2024/04/23

リンク

Postmanを使い始めた時に知っておきたかった地味に便利な機能10選 - Qiita

普段何気に使っているPostman。最近まで「手軽にGUIで疎通を試せて、設定を共有できてべんり〜」くらいで使っていました。けどふと「実はもっと便利な機能があるのでは？」と思って調べてみたところ、色々出てきたのでせっかくなのでシェアしたいと思います。たまたまですがちょうど10選！地味に便利な機能10選 VSCode拡張 PostmanにはVSCode 拡張機能があります。インストールするだけで、VSCodeのサイドバーから利用可能です。日本語設定日本人なので日本語で使いたい。右上の歯車→Settingsから以下の通り選択することで日本語化が可能です。変数の定義複数のAPIで同じ値を使いたい場合があるとします。例えばテスト用のユーザーIDなどです。 Postmanではそんな値をAPIファイルに逐一ハードコードする必要はなく、変数に保存することが可能です。 Postman Ec

hatakazu93 2024/04/22

リンク

いちばんやさしいローカル LLM｜ぬこぬこ

概要ローカル LLM 初めましての方でも動かせるチュートリアル最近の公開されている大規模言語モデルの性能向上がすごい Ollama を使えば簡単に LLM をローカル環境で動かせる Enchanted や Open WebUI を使えばローカル LLM を ChatGPT を使う感覚で使うことができる quantkit を使えば簡単に LLM を量子化でき、ローカルでも実行可能なサイズに小さくできる 1. はじめに大規模言語モデル（LLM）の数は数年前と比べてたくさん増えました。有名な LLM を使ったチャットサービスとして、OpenAI の ChatGPT や Anthropic の Claude、Google の Gemini などがありますが、これらのサービスの中で利用されている大規模言語モデルは公開されていません。現状、様々な評価指標により LLM の性能が測定されていますが、

hatakazu93 2024/04/21

リンク

ベイズ統計学を勉強する参考書のフロー - Qiita

慶應義塾大学・株式会社Nospareの菅澤です．今回はベイズ統計学を勉強するための参考書の順番 (私見) について紹介していきます． 3年ほど前に『日本語で学べるベイズ統計学の教科書10冊』を紹介しましたが，今回は「どのような順番でどの参考書を読んでいくと比較的スムーズに勉強が進められるのか」に焦点を当て，比較的最近の書籍や英語の書籍まで含めて紹介していきます．まずは全体的なフローのイメージを提示しておきます．今回の記事では，「ベイズ統計学を勉強すること」のスタートとゴールを以下のように定めます． (スタート) 統計学の基礎的な内容 (統計検定2級程度の内容) は身についている (ゴール) ベイズモデリングに関する最新の論文がある程度理解して読め，自力でモデルを組んだり実装することができるまた，このゴールへの道のりとして，大きく2通りのルートを想定します． (ルートA: フルスクラ

hatakazu93 2024/04/20

リンク

Readable

DeepL Pro をお使いの方は ~20 ページを目安に利用してください。 DeepL Free をお使いの方は 1 ページずつ利用してください。

hatakazu93 2024/04/18

リンク

RAGを複雑な質問に強くする手法「CoA」について

本記事では、「Chain-of-Abstraction (CoA) Reasoning」についてざっくり理解します。軽めの記事です。株式会社ナレッジセンスでは普段の業務で、生成AIやRAGシステムを活用したサービスを開発しています。この記事は何この記事は、最近聞くようになった「Chain-of-Abstraction (CoA) Reasoning」の論文[1]について、日本語で簡単にまとめたものです。今回も「そもそもRAGとは？」については、知っている前提で進みます。確認する場合は以下の記事もご参考下さい。本題ざっくりサマリー LLMが外部ツールを使って回答を生成するときの、回答精度を高める手法についての論文です。Metaの研究者らによって2024年1月に提案されました。「Chain-of-Abstraction (CoA)」という手法を使うメリットは、RAGに応用することで

hatakazu93 2024/04/18

リンク

生成AIによるプロダクトと生産性向上の舞台裏@2024.04.16

2024.04.16「先達エンジニアに学ぶ思考の現在地 Online Conference」での登壇スライドです event link: https://findy.connpass.com/event/313119/ 生成AIを使ってプロダクト作りをしていたり、社内の生産性向上をチャレンジしてる方に少しでも参考になれば幸いです。

hatakazu93 2024/04/17

リンク

コードを書く隙間を見つけて生きていく技術/Findy 思考の現在地

先達エンジニアに学ぶ思考の現在地 Online Conference の発表資料です https://findy-code.io/events/v7KebEabaBDzh?fr=event_20240416

hatakazu93 2024/04/17

リンク

ChatGPTなど数々の高性能AIを生み出した仕組み「Attention」についての丁寧な解説ムービーが公開される

さまざまな数学的トピックをムービー形式で解説するサイト「3Blue1Brown」において、ChatGPTに代表されるAIを形作っている「Transf ormer」構造の心臓部「Attention(アテンション)」についての解説が行われています。 3Blue1Brown - Visualizing Attention, a Transf ormer's Heart | Chapter 6, Deep Learning https://www.3blue1brown.com/lessons/attention AIの中身と言える大規模言語モデルのベースとなる仕事は「文章を読んで次に続く単語を予測する」というものです。文章は「トークン」という単位に分解され、大規模言語モデルではこのトークン単位で処理を行います。実際には単語ごとに1トークンという訳ではありませんが、3Blue1Brownは単純化して

hatakazu93 2024/04/17

リンク

優秀と噂なCohere社のCommand R+でRAGチャットボットを簡単に構築して体験しよう！ - Qiita

1. はじめに Cohere社が最近リリースしたLLMのCommand R+がGPT4に迫る性能を発揮していたり、RAG利用での性能で話題となっています。そのCommand R+でRAGを体験できるチャットアプリの実装がLightningAIにてチュートリアルが公開(CC-BY-4.0ライセンスとして)されています。これを身近な環境で動かしてみたいと思います。このチャットボットでCohere社の以下のモデルが使われています LLM: Command R+ Embed: embed-english-v3.0 / embed-multilingual-v3.0 Reranker: rerank-english-v3.0 / rerank-multilingual-v3.0 以下の動画のようにブラウザでPDFファイルをアップロードしてチャットで問い合わせができます。 2. 必要なもの以下

hatakazu93 2024/04/15

リンク

はてなブックマーク

hatakazu93のブックマーク (4,216)

お知らせ

月間はてなブックマーク数ランキング（2024年4月）

今週のはてなブックマーク数ランキング（2024年4月第4週）

今週のはてなブックマーク数ランキング（2024年4月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス