DB／ストレージの人気記事 54件 - はてなブックマーク

1 - 40 件 / 54件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

DB／ストレージの検索結果1 - 40 件 / 54件

DB／ストレージに関するエントリは54件あります。 database、 DB、データベースなどが関連タグです。人気エントリには『リレーショナル・データベースの世界』などがあります。

リレーショナル・データベースの世界
- 2044 users
- mickindex.sakura.ne.jp
- テクノロジー
- 2023/01/13
序文私の仕事は、DBエンジニアです。といっても別に望んでデータベースの世界へきたわけではなく、当初、私はこの分野が面白くありませんでした。「Web系は花形、データベースは日陰」という言葉も囁かれていました。今でも囁かれているかもしれません。ですが、しばらくデータベースを触っているうちに、私はこの世界にとても興味深いテーマが多くあることを知りました。なぜもっと早く気づかなかったのか、後悔することしきりです。もちろん、自分の不明が最大の原因ですが、この世界に足を踏み入れた当時、先生も、導きの書となる入門書もなかったことも事実です。今でこそバイブルと仰ぐ『プログラマのためのSQL 第2版』も新入社員には敷居が高すぎました (2015年2月追記：その後、自分で第4版を訳出できたのだから、人生は何があるか分からないものです)。そこで、です。このサイトの目的は、データベースの世界に足を踏み
- データベース
- SQL
- DB
- あとで読む
- database
- プログラミング
- 設計
- programming
- 技術
- 資料
ゼロから作る時系列データベースエンジン
- 506 users
- zenn.dev/nakabonne
- テクノロジー
- 2021/06/30
軽量な時系列データベースエンジンをスクラッチで開発する機会があったので、どのように実装したのかを必要知識の解説を交えながらまとめていきます。実装はGo言語によるものですが、本記事のほとんどは言語非依存な内容となっています。モチベーション筆者は時系列データを扱うツールをいくつか開発しています。その中の一つであるAliは負荷テスト用のcliツールで、メトリクスをクライアント側でリアルタイム描画できるのが特徴です。リクエスト毎にレイテンシーなどの計測結果が際限なく書き込まれてくる中、同時に一定のクエリパフォーマンスが求められます。これは言ってしまえば、簡易クエリ機能付きのpush型モニタリングシステムを単一ホストで実現するようなものです。以前までの実装ではヒープ上の可変長配列にデータポイントを追加していくだけだったので、当然ながら時間の経過とともにメモリ使用量が増加していく問題を抱えて
- データベース
- あとで読む
- DB
- database
- tsdb
- golang
- go
- メモリ
- データ
- 時系列データ
誰でもわかる全文検索入門
- 496 users
- zenn.dev/segavvy
- テクノロジー
- 2020/12/20
全文検索エンジンも、事前に検索対象のデータを調べてこのような索引を作っておくことで、高速な検索を実現しています。インターネット検索の例たとえばインターネット検索の場合、まず各サイトからデータを収集して、その中から索引に載せる単語を選んで索引を作ります。索引のデータは下の図の右側のような表になっています。各単語と、それがどのサイトのどこにあったのかを記録しておく形です。検索の時は、この索引データを調べます。例えば利用者が「理解」という言葉で検索したら、索引の「理解」のところを調べます。そうすると「サイトAの8文字目と18文字目、サイトGの……」と出現場所がわかるので、すぐに結果を返せます。なお、この図では索引の単語の並び方が適当ですが、実際には本と同じように「あいうえお順」などに並べておいて、すぐに単語を見つけられるようにしてあります。索引にない単語この仕組みの場合、索引にある単
- 全文検索
- あとで読む
- 検索
- 入門
- 検索エンジン
- 開発
- 自然言語処理
- nlp
- 技術
- search
SQL Tutorial
- 247 users
- speakerdeck.com/nrslib
- テクノロジー
- 2020/04/03
グループ合同の新卒研修で行った SQL 入門向けの解説 + ワークショップです。基本的な部分の解説のみで、一部触れていない構文もございます。ご了承ください。 KKK: 価格, TNK: 単価, MST: マスタ, IDX: インデックス # URL HomePage: https://nrslib.com Twitter: https://twitter.com/nrslib
- sql
- あとで読む
- 研修
- 入門
- tutorial
- slide
- チュートリアル
- database

「ベクトル検索 vs 全文検索」〜Amazon Bedrockの埋め込みモデルを用いたプロトタイピング〜 - コネヒト開発者ブログ
- 204 users
- tech.connehito.com
- テクノロジー
- 2023/12/09
※ この記事は、AWS (Amazon Web Services) の技術支援を受けて執筆しています。はじめにこの記事はコネヒトアドベントカレンダー 8日目の記事です。コネヒト Advent Calendar 2023って？コネヒトのエンジニアやデザイナーやPdMがお送りするアドベントカレンダーです。コネヒトは「家族像」というテーマを取りまく様々な課題の解決を目指す会社で、ママの一歩を支えるアプリ「ママリ」などを運営しています。 adventar.org こんにちは！コネヒトの機械学習エンジニア y.ikenoueです。突然ですがみなさん、Amazon Bedrockをご存知でしょうか。 aws.amazon.com Amazon Bedrock(以下、Bedrock)は、テキスト生成AIをはじめとする基盤モデル (Foundation Model)*1を提供するAWS
- aws
- あとで読む
- 検索
- 開発
- AI
- rag
- Generative AI
- LLM
- amazon
SQLiteでベクトル検索ができる拡張sqlite-vssを試す｜mah_lab / 西見公宏
- 153 users
- note.com/mahlab
- テクノロジー
- 2023/06/08
SQLiteでベクトル検索を可能にするsqlite-vssそんなポータブルで便利なSQLiteですが、そのSQLiteでベクトル検索ができるとなるとより夢が広がります。 SQLite自体はファイルベースなので、あらかじめベクトルデータを設定したSQLiteデータベースファイルをアプリに組み込んで配布しても良いわけです。そうすればデータベースサーバを用意しなくて済む分コストも圧縮されますし、組み込みなのでアプリからは軽量に動作します。ホスティングする場合でもFly.ioのようにボリュームイメージを利用できるPaaSを利用すれば、問題なく運用が可能です。前置きが長くなりましたが、このような夢を叶えてくれる拡張がsqlite-vssです。ベクトル検索はFaissベースで実装されています。とっても良さげではあるのですが、実際に組み込んでみた場合のコード例が見つからなかったので、手を動かして試
- sqlite
- 機械学習
- あとで読む
- 自然言語処理
- DB
- AI
- データ
- 検索
- SQL
- database
分析用SQLを書くときの思考回路について｜だみ〜
- 134 users
- note.com/genuinedammy
- テクノロジー
- 2020/08/19
本稿では、分析用のSQLを書くときに則っている思考回路について述べて行こうと思います。この言語化はあまりきちんとされている印象が無いので、自分がそこそこ初めての言語化だと思って頑張ってやってみようと思います。言い換えれば、私はこういう思考回路でSQLを書きますが、みなさんどうですか、という話でもあります。あとは、前提として、現代的な分析用の分散エンジンにSQLを投げるときを考えています。それ以外の場合はむしろ非効率になることも多いかもしれません。 0.問題設定今回の題材は、待てばチケットが復活する無料単話があり、有料で無料単話も買える、そして単行本購買もできる、というマンガサービスとしましょう。このサービスの企画者から、チケットで無料単話だけ読むユーザが、もし有料で単話を買うようになったらどれくらい売上が伸びるのか教えてほしい、という依頼が来たとします。これを仮説形式に直すと、
- SQL
- あとで読む
- 分析
- techfeed
- ログ
- 考え方
- データ
- 仕事
［速報］Google、PostgreSQLにAI対応を組み込んだ「AlloyDB AI」発表、オンプレミスでも他社クラウドでも利用可能に。Google Cloud Next '23
- 129 users
- www.publickey1.jp
- テクノロジー
- 2023/08/29
［速報］Google、PostgreSQLにAI対応を組み込んだ「AlloyDB AI」発表、オンプレミスでも他社クラウドでも利用可能に。Google Cloud Next '23 Googleは、8月29日（日本時間の30日未明）から米サンフランシスコで開催中のイベント「Google Cloud Next '23」で、同社が提供するPostgreSQL互換のデータベース「AlloyDB」にAI対応機能を組み込んだ「AlloyDB AI」を発表しました。 AlloyDB AIは、データベース内に保存されているデータをAIと組み合わせて利用しやすくする機能を搭載しており、企業などが持つ商品データや顧客データなどをAIで活用するアプリケーション構築を容易にします。一般に、企業がAIや機械学習を利用したアプリケーションを開発する場合、既存の大規模言語モデルなどをそのまま利用するのではなく、自社
- AI
- postgresql
- あとで読む
- google
- データベース
- cloud
- gcp
- sql
- 人工知能
ベクトルデータベースとは何かを解説、生成AIで「必須の存在」はどんな役割を担うのか
- 126 users
- www.sbbit.jp
- テクノロジー
- 2024/01/25
生成AIの可能性を広げる「ベクトルデータベース」への関心が急速に高まっている。ベクトルデータベースとは、生成AIが扱う非構造化データの格納・管理・照会で利用されるデータベースのこと。ここではベクトルデータベースの基本をわかりやすく解説するとともに、生成AIの普及において、どのような役割を果たすのか、注目される理由などと合わせて紹介しよう。バークリー音大提携校で2年間ジャズ／音楽理論を学ぶ。その後、通訳・翻訳者を経て24歳で大学入学。学部では国際関係、修士では英大学院で経済・政治・哲学を専攻。国内コンサルティング会社、シンガポールの日系通信社を経てLivit参画。興味分野は、メディアテクノロジーの進化と社会変化。2014〜15年頃テックメディアの立ち上げにあたり、ドローンの可能性を模索。ドローンレース・ドバイ世界大会に選手として出場。現在、音楽制作ソフト、3Dソフト、ゲームエンジンを活用し
ChatGPTを使ってDDLからER図をすばやく作成する - Taste of Tech Topics
- 113 users
- acro-engineer.hatenablog.com
- テクノロジー
- 2023/08/29
最近、酢を飲むと健康に良いという話を聞き、頑張って毎日飲んでいるkonnoです。何となくですが、朝の目覚めは良くなっている気がしますよ！今回はデータベース設計に欠かせないER図を、ChatGPTを使ってDDL（Data Definition Language：SQLのデータ定義言語）から簡単に作成できるのか試してみたいと思います。サンプルとなるDDLを用意 DDLのサンプルとして、以下のMySQL公式サイトで公開されている従業員データベースを利用します。 dev.mysql.com 従業員データベースに必要なファイル類一式は、上記サイトで紹介されている以下のGithubリポジトリから、 "test_db-master.zip"としてダウンロードできます。 github.com ダウンロードしたtest_db-master.zipには、従業員データベースを設定するために必要なDDLとし
Amazon Timestream 所感 - moznion
- 112 users
- scrapbox.io/moznion
- テクノロジー
- 2020/10/05
Amazon Timestreamを使ってみたという話．Amazon Timestreamは昨日 (2020-10-01) にGAになったTime Series DB．
- aws
- あとで読む
- timestream
- amazon
- パフォーマンス
- sql
- db
Textdb
- 104 users
- textdb.dev
- テクノロジー
- 2020/07/25
TextDB A simple way to share small amounts of data Let's name your data aa680af1-98e8-436f-91c7-4fdefab23ff5 Update your data with curl -d "hello world" -H "content-type: text/plain" https://textdb.dev/api/data/aa680af1-98e8-436f-91c7-4fdefab23ff5 Access your data with curl https://textdb.dev/api/data/aa680af1-98e8-436f-91c7-4fdefab23ff5 Or view it with live updates at https://textdb.dev/data/aa68
- JSON
- database
- あとで読む
- データベース
- DB
- cURL
- api
- web
An in-process SQL OLAP database management system
- 91 users
- duckdb.org
- テクノロジー
- 2020/05/24
DuckDB is a fast in-process analytical database DuckDB supports a feature-rich SQL dialect complemented with deep integrations into client APIs Installation Documentation -- Get the top-3 busiest train stations SELECT station_name, count(*) AS num_services FROM train_services GROUP BY ALL ORDER BY num_services DESC LIMIT 3;
- database
- sql
- db
- olap
- analytics
- データベース
- sqlite
- あとで読む
［速報］マイクロソフトとオラクル、「Oracle Database@Azure」発表。共同でAzure上でのOracle Exadataベースのマネージドサービスを提供
- 87 users
- www.publickey1.jp
- テクノロジー
- 2023/09/15
［速報］マイクロソフトとオラクル、「Oracle Database@Azure」発表。共同でAzure上でのOracle Exadataベースのマネージドサービスを提供マイクロソフトとオラクルは14日（日本時間15日午前5時）、クラウドにおける協力関係を強化し、両社が共同でMicrosoft Azure上でOracle Exadataをベースとしたデータベースを提供する「Oracle Database@Azure」を発表しました（マイクロソフトの発表、オラクルの発表）。エリソン氏はレドモンドのマイクロソフトにはじめて訪問したと発言して場を盛り上げた上で、Oracle Database@Azureは、Oracle Cloudで展開しているソフトウェアとハードウェアを文字通りAzureへ持ち込んで提供するものであり、顧客はオラクルのテクノロジーとマイクロソフトのテクノロジーによる業界最高の
- Oracle
- Azure
- あとで読む
- Microsoft
- software
- ビジネス
AWS、Redisをフォークした「Valkey」を、同社サービスのElastiCacheとMemoryDBで採用すると明らかに
- 80 users
- www.publickey1.jp
- テクノロジー
- 2024/04/07
AWS、Redisをフォークした「Valkey」を、同社サービスのElastiCacheとMemoryDBで採用すると明らかに Amazon Web Servicesは、同社のマネージドサービスとして提供しているAmazon ElasticCacheとAmazon MemoryDBで、インメモリデータストアのRedisをフォークした「Valkey」を採用すると、同社のブログに投稿した記事「Why AWS Supports Valkey」で明らかにしました。 Why #AWS Supports #Valkey. https://t.co/PMXv0Zv8B4 — Werner Vogels (@Werner) April 5, 2024 Valkeyの採用について、上記のブログで次のように記されています。 AWS is committed to supporting open source
- AWS
- redis
- あとで読む
- oss
- service
- network
- software
Redis、クラウドベンダなどによる商用サービスを制限するライセンス変更を発表。今後はRedis社とのライセンス契約が必須に
- 73 users
- www.publickey1.jp
- テクノロジー
- 2024/03/22
インメモリデータストアRedisの開発元であるRedis社は、これまでオープンソースとして開発してきたRedis 7.4ソースコードのライセンスを、Redis Source Available License (RSALv2)とServer Side Public License (SSPLv1)のデュアルライセンスに変更すると発表しました。このライセンス変更により、同社の許可なくRedisを用いたマネージドサービスなどを提供することができなくなります。下記はライセンス変更を発表した同社ブログ「Redis Adopts Dual Source-Available Licensing」からの引用です。 Under the new license, cloud service providers hosting Redis offerings will no longer be permi
- redis
- business
- oss
- AWS
- あとで読む
- software
- IT
MySQLで全文検索機能を使う際のパフォーマンスについて調査してみた - iimon tech blog
- 59 users
- tech.iimon.co.jp
- テクノロジー
- 2023/12/01
こんにちは、CTOの森です。iimonは今回が初のアドベントカレンダー参加です！本記事はiimonアドベントカレンダー1日目の記事となります。はじめに検証した環境 MySQL/mecabのインストール大量のデータを入れる 1レコードのINSERTにかかった時間検索してみる検索文字列が「出来事」の場合インデックスなし N-gram(bi-gram) IN NATURAL LANGUAGE MODE IN BOOLEAN MODE MeCab IN NATURAL LANGUAGE MODE IN BOOLEAN MODE 検索文字列が「チューリングはロンドンのリッチモンドに住み」の場合まとめ参照したサイト最後にはじめに今回はMySQLで全文検索機能を使う際のパフォーマンスについて書こうと思います！全文検索をちゃんと使うのであればElasticsearchやSolrな
Redisをフォークした「Valkey 7.2.5」安定版が早くも登場。AWS、Google、Oracle、Heroku、Alibaba Cloudなど賛同が広がる
- 57 users
- www.publickey1.jp
- テクノロジー
- 2024/04/22
Redisをフォークした「Valkey 7.2.5」安定版が早くも登場。AWS、Google、Oracle、Heroku、Alibaba Cloudなど賛同が広がる RedisをフォークしたValkeyが早くも安定版「Valkey 7.2.5」をリリース。Valkeyブランドのためのコードの変更が行われた。AWS主導で始まったが、Google CloudやOracle、Heroku、Alibaba Cloudなど賛同が広がっている。 Valkey 7.2.5のリリースノートによると、このバージョンはフォーク元であるRedis 7.2.4からブランド名をValkeyへ変更するための変更をソースコードに対して行ったものであり、Redis 7.2.4からプロトコル、API、リターン値、データファイルフォーマットなどの変更は行われていないと説明されています。 ValkeyはRedisをフォークした
- Redis
- あとで読む
- publickey
- Amazon Web Services
- Heroku
- techfeed
- aws
- cloud
- software
書籍紹介：大規模データ管理(エンタープライズアーキテクチャのベストプラクティス) | フューチャー技術ブログ
- 57 users
- future-architect.github.io
- テクノロジー
- 2023/05/29
最近読んだ書籍の中で非常に良質な内容でしたので紹介したいと思います。少しでも多くの方に興味を持ってもらえることを期待しています。 O’Reilly Japan はじめに私自身がデータ管理（データマネージメント）という観点でここ数年様々な検討を行ってきていますので前提としてその背景について簡単にまとめてみます。かつてオンプレミスで運用を行っていた時は企業内のデータは完全に管理されていました。データウェアハウスを導入してデータの集約・加工は行われていましたが、専門チームがデータ仕様確認やデータ提供までもすべての責任を担っていました。品質は高いのですが利用者からの要望（新しいデータの提供、仕様の変更）の対応についてはスピード大きな制約がありました。また大規模なデータを扱うためには多大なコストが必要という制約もあります。クラウド技術による「スモールスタートを可能とするインフラ」「大規模なデータ
［速報］AWS、従来のAmazon S3より最大10倍高速な「Amazon S3 Express One Zone」発表。AWS re:Invent 2023
- 56 users
- www.publickey1.jp
- テクノロジー
- 2023/11/29
Amazon Web Services（AWS）は、ラスベガスで開催中のイベント「AWS re:Invent 2023」の基調講演で、従来のAmazon S3 Standardストレージクラスより最大10倍高速な「Amazon S3 Express One Zone」ストレージクラスを発表しました。 Need low latency & high performance? Accelerate workloads with #AWS Amazon #S3 Express One Zone delivers the fastest data access in the cloud with the lowest-latency cloud #Storage. Speed up data processing & cross the finish with time to spare. htt
- AWS
- あとで読む
- storage
- techfeed
- amazon
開発効率を計測するデータ基盤の管理にDataformを使ってみた - yasuhisa's blog
- 56 users
- www.yasuhisay.info
- テクノロジー
- 2021/01/23
Dataformを初めて使ってみたので、雑に感想を書いておきます。結構よかった。使ってみようとした背景 Dataformについて試してみてどうだったかよかったまだまだこれからっぽいところ & 気になり参考使ってみようとした背景今週、社内の開発合宿に参加していた。変更のリードタイムやデプロイ頻度などのFour Keysにあるような指標を計測できるデータ基盤を作るのが目標。様々なチームの開発のパフォーマンスをトラッキングしやすくして、うまくできているチームがなぜうまくいっているのかを明らかにしたり、改善施策を行なった結果指標も改善しているか定量的に確認できるようにして、開発効率を上げる土台を作るというのが目的。この辺の詳しいことは後々別のエントリで書かれると思う。自分のチームは3人構成で、在宅のオンラインでやっていた。 id:shiba_yu36さん Mackerelチームでも
DuckDBでお手軽！データフェデレーション - Techtouch Developers Blog
- 54 users
- tech.techtouch.jp
- テクノロジー
- 2024/05/20
tl;dr はじめに DuckDB とは DuckDB では何が読めるのか使ってみる S3 上のJSON を読んでみるリレーショナルデータベース他ツールではなく DuckDB を使うメリットしくじりポイント（特にリリースされたばかりの）バージョンには気をつける S3 のオブジェクト数が多い場合不都合がありがちスレッドの調整が必要な場合も Redshift には未対応終わりに付録 MySQL のデータを読み込む例の MySQL 側の準備 tl;dr DuckDB 便利だよ。分析以外でも使えるよ色々な場所のデータを閲覧・結合できるよ。標準SQLも使えるよただし、細かい落とし穴は色々あるので気をつけてねはじめに2023年4月にデータエンジニアとして入社したmin（@not_rogue）です。暖かくなるにつれ、YouTube で見た南伊豆ロングトレイル | 松崎町に行く機運が
- DB
- MySQL
- あとで読む
- database
- tech
- web
時系列特化データベースの Amazon Timestream が一般公開（GA）しました！！　時系列データの保存・検索・分析にピッタリ！ | DevelopersIO
- 47 users
- dev.classmethod.jp
- テクノロジー
- 2020/10/01
約2年を経て、ついに、ついに、ついに、Amazon Timestreamが一般公開になりました！！ Amazon Timestreamを使えば、IoT機器などから収集した時系列データの保存や分析が簡単にできるようになります。一言で言えば、時系列データに特化したデータベースです！ Amazon Timestreamとは Amazon Timestream は、IoT および運用アプリケーションに適した、高速でスケーラブルな完全マネージド型の時系列データベースサービスです。1 日あたり数兆規模のイベントを、リレーショナルデータベースの 1/10 のコストで簡単に保存および分析できます。IoT デバイスや IT システムの普及や、産業機器のスマート化により、時系列データ (時間の経過に伴うモノの変化を記録したデータ) は、急速に増加しているデータ型の 1 つです。 Timestream は、時
Linux Foundation Launches Open Source Valkey Community
- 45 users
- www.linuxfoundation.org
- テクノロジー
- 2024/03/29
6 MIN READ Linux Foundation Launches Open Source Valkey Community The Linux Foundation | 28 March 2024 Community maintainers, contributors, and users will continue collaborative development of an open source, in-memory data store under the new Valkey name. SAN FRANCISCO – MARCH 28, 2024 – Today, the Linux Foundation announced its intent to form Valkey, an open source alternative to the Redis in-me
- redis
- OSS
- AWS
- Linux
Redis Adopts Dual Source-Available Licensing | Redis
- 45 users
- redis.com
- テクノロジー
- 2024/03/21
- redis
- license
- OpenSource
- oss
- あとで読む
- licensing
「Valkey」がRedisを急速に置き換えつつあるーバックエンドエンジニアは地殻変動に備えよう
- 44 users
- techfeed.io
- テクノロジー
- 2024/04/22
4月20日、DevOps.comが「Valkeyが急速にRedisを置き換えつつある（Valkey is Rapidly Overtaking Redis）」と題した記事を公開した。この記事では、Redisのソース利用可能なライセンスへの移行と、その結果として生じたValkeyへの大規模な移行について詳しく紹介されている。以下に、ポイントを絞って内容を紹介する。 Redisのライセンス変更による影響ちょうど一ヶ月ほど前（3/20）、 RedisがBSD 3-clauseライセンスからRedis Source Available License (RSALv2)およびServer Side Public License (SSPLv1)へとライセンスを変更した。 BSD 3-clauseライセンスは非常に寛容なオープンソースライセンスで、著作権表示と免責事項の維持が含まれるが、商用利用
Microsoft、次世代高速キャッシュストアシステム「Garnet」をオープンソースとして公開 | gihyo.jp
- 44 users
- gihyo.jp
- テクノロジー
- 2024/03/19
Microsoft⁠⁠、次世代高速キャッシュストアシステム「Garnet」をオープンソースとして公開 Microsoftは2024年3月18日、同社の研究所が開発を進めてきた次世代の高速キャッシュシステム「Garnet」をGitHub上でオープンソースとして公開した。 Introducing Garnet – an open-source, next-generation, faster cache-store for accelerating applications and services -Microsoft Research Blog Garnet is a cache-store system that addresses growing demand for data storage to support interactive web applications and se
- cache
- microsoft
- redis
- キャッシュ
- ストレージ
- OSS
- あとで読む
- システム
- software
GitHub - nalgeon/redka: Redis re-implemented with SQLite
- 41 users
- github.com/nalgeon
- テクノロジー
- 2024/04/15
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
- Redis
- SQLite
- あとで読む
- github
ベクトル検索（Vector Search）とは？　キーワード検索との違い
- 41 users
- atmarkit.itmedia.co.jp
- テクノロジー
- 2024/02/07
ベクトル検索（Vector Search）とは？　キーワード検索との違い：AI・機械学習の用語辞典用語「ベクトル検索」について説明。テキストなどのデータを数値ベクトル（埋め込み）として表現し、それらのベクトル間の類似度を計算することで、関連する情報を見つけ出す検索方法を指す。Azure OpenAI Serviceの独自データ追加機能で利用可能な「キーワード検索」「ベクトル検索」「ハイブリッド検索」「セマンティック検索」という検索手法の違いについても言及する。連載目次用語解説 AI／機械学習／自然言語処理におけるベクトル検索（Vector Search：ベクター検索）とは、テキストや画像などのデータを数値ベクトルとして表現し、それらのベクトル間の類似度（主にコサイン類似度）を計算することで、関連する情報を見つけ出す検索方法のこと、またその方法による検索のことである。なお、数値ベクトル
Linux Foundation、Redisをフォークした「Valkey」プロジェクトを始動 ―BSDライセンスでオープンソースとして提供 | gihyo.jp
- 39 users
- gihyo.jp
- テクノロジー
- 2024/03/29
Linux Foundation⁠⁠、Redisをフォークした「Valkey」プロジェクトを始動 ―BSDライセンスでオープンソースとして提供 Linux Foundationは2024年3月28日、Redisに代わるオープンソースの新しいインメモリキャッシュストアシステム「Valkey」のコミュニティを立ち上げ、開発を行うことを発表した。 Linux Foundation Launches Open Source Valkey Community -linuxfoundation.org valkey : A new project to resume development on the formerly open-source Redis project. We're calling it Valkey, like a Valkyrie. -GitHub We are excited
- BSD
- あとで読む
- Software
- cloud
- aws
Cognitive Searchの生成AI用ベクトルDBの構築手順書 - Qiita
- 38 users
- qiita.com/tmiyata25
- テクノロジー
- 2023/08/04
はじめにこの記事は、現在（2023年8月4日時点）パブリックプレビュー中のCognitive Searchのベクトル検索機能について、ベクトルDBの構築手順を解説する記事です。公式ドキュメントにはクイックスタート記事も公開されており、こちらのブログで日本語で丁寧に解説してくれています。公式ドキュメントのクイックスタートを読んでいると、下記の課題に遭遇します。 PDFなどのドキュメントはどのように扱えばいいか？チャンク分割やベクトル生成は具体的にどのように行えばよいか？言語アナライザーを日本にするにはどこを変えればよいか？インデックスを自動更新するにはどうすれば良いか？このような課題に対して、Azure公式のGitHubリポジトリにあるcognitive-search-vector-prにあるインデックス作成ツール(azure-search-vector-ingestion-py
- OpenAI
- Azure
- AI
- あとで読む
- 人工知能
LLMの普及で、ますます重要となるベクトルデータの活用　シチュエーション別「Pinecone」の3つのプラクティス
- 34 users
- logmi.jp
- テクノロジー
- 2023/08/21
「ChatGPT Meetup」は、プロンプティングからOpenAI API、さらには周辺のライブラリやHubのエコシステムまで広く活用の助けになる知見を共有し、みんなで手を動かして楽しむためのコミュニティです。1回目に登壇したのは、株式会社フィードフォースの八百俊哉氏。ベクトルデータベース「Pinecone」の概要とプラクティスについて発表しました。自己紹介とアジェンダ紹介八百俊哉氏：では、最後の発表です。「Pineconeの重要性とプラクティス」というところでお話をしようと思います。よろしくお願いします。まず自己紹介です。名前は、「やお」と読みます。八百俊哉です。大学で機械学習を専攻しており、画像処理や自然言語処理の概要はそこで学びました。 2020年に新卒で株式会社フィードフォースに入社して、入社時からデータサイエンティストとして、社内のデータ分析を中心に業務を担っています。
PostgreSQL を使用して生成 AI アプリケーションを構築するための AlloyDB AI を発表 | Google Cloud 公式ブログ
- 28 users
- cloud.google.com
- テクノロジー
- 2023/09/15
※この投稿は米国時間 2023 年 8 月 30 日に、Google Cloud blog に投稿されたものの抄訳です。生成 AI は数え切れないほどの方法で私たちの想像力を捉えてきました。それは、人間のような反応をする chatbot だけでなく、まったく新しいユーザーエクスペリエンスを引き出してくれます。さらに、追加の専門的なスキルを必要とする従来の AI ワークロードとは異なり、これらの新しい生成 AI ワークロードは、デベロッパーコミュニティのより多くの開発者が利用できます。アプリケーションデベロッパーが生成 AI アプリケーションの構築に本格的に取り組む際、イノベーションの鍵はモデルそのものだけでなく、その使用方法やモデルの基盤にあるデータにもあります。このたび、Google は、Google Cloud Next において、運用データを使用したパフォーマンスとスケーラ
GitHub - unum-cloud/usearch: Fast Open-Source Search & Clustering engine × for Vectors & 🔜 Strings × in C++, C, Python, JavaScript, Rust, Java, Objective-C, Swift, C#, GoLang, and Wolfram 🔍
- 25 users
- github.com/unum-cloud
- テクノロジー
- 2023/08/17
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
- Search
- Python
- oss
GitHub - valkey-io/valkey: A new project to resume development on the formerly open-source Redis project. We're calling it Valkey, since it's a twist on the key-value datastore.
- 21 users
- github.com/valkey-io
- テクノロジー
- 2024/03/29
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
- redis
- DB
- github
- Software
- あとで読む
「Amazon Redshift ML」プレビュー公開、SQLで機械学習モデルの作成・トレーニング・デプロイが可能に
- 18 users
- codezine.jp
- テクノロジー
- 2020/12/17
Amazon Redshift MLを使用することで、データウェアハウスユーザーが使い慣れたSQLコマンドで機械学習モデルを作成、トレーニング、デプロイ可能で、データの移動や新たなスキルの習得なしで、SQLによってAmazon SageMakerを活用できる。 Amazon Redshift MLを用いて、SQLで作成・トレーニングされたモデルは、クエリやレポートで直接チャーン予測や不正リスクスコアリングなどが可能で、Amazon SageMaker Autopilotでトレーニングデータに基づき、回帰、バイナリ、マルチクラス分類、線型モデルの中から最適なモデルを自動検出して調整を行う。ほかにも、Xtreme Gradient Boosted tree（XGBoost）などのモデルタイプ、回帰や分類などの問題タイプ、プリプロセッサやハイパーパラメータを選択でき、パラメータを使用して、Am
- AWS
- あとで読む
最小限のデバイス開発でデータをAmazon Timestreamに送るSORACOMとAWSの構成 - SORACOM公式ブログ
- 17 users
- blog.soracom.com
- テクノロジー
- 2020/10/06
こんにちは、ソリューションアーキテクトのtakiponeこと大瀧です。時系列データベースサービス Amazon Timestream が、先日正式リリースされました。 Timestream は従来のリレーショナルデータベースやNoSQLデータベースと比べ、データベース容量の上限が無いスケール性と時系列データの分析を柔軟に行えるSQLライクなクエリサポートなど、IoTの膨大なテレメトリデータの格納に最適な、先進的なサービスです。AWSの他のサービスと組み合わせて、例えば Timestream にある IoT データを Amazon QuickSight で可視化したり、 Amazon SageMaker で機械学習処理を行うことができます。本ブログでは、SORACOMからAmazon Timestreamにデータを送る構成パターンとおすすめの構成、設定時のポイントをご紹介します。 SOR
- IoT
- あとで読む
- データ
- aws
- amazon
- development
- 開発
- ブログ
ベクトルデータベース（Vector Database）／ベクトルストア（Vector Store）とは？
- 17 users
- atmarkit.itmedia.co.jp
- テクノロジー
- 2024/02/29
ベクトルデータベース（Vector Database）／ベクトルストア（Vector Store）とは？：AI・機械学習の用語辞典ベクトルデータベースとは、テキストなどのデータを数値ベクトル（埋め込み）として保存するデータベースを指す。「ベクトルストア」とも呼ばれる。ベクトル検索により、意味的に類似する情報を探せるのが特徴で、チャットAIのRAG構築に役立つ。本稿ではベクトル検索の機能を持つ代表的な製品の概要もそれぞれ簡単に紹介する。連載目次用語解説生成系AI／自然言語処理におけるベクトルデータベース（Vector Database、ベクターデータベース、ベクトルDB）とは、主に単語や文章（テキスト）、画像、音声などの複雑なデータを、AI／機械学習／言語モデルが処理しやすい数値ベクトル表現として保存するデータベースのことである。この数値ベクトル表現は「埋め込み表現（Embeddin
- 人工知能
- database
Google Cloud、AIワークロードに特化したストレージ「Hyperdisk ML」発表　AWSやAzureの高速ストレージより100倍高速と説明
- 17 users
- www.itmedia.co.jp
- テクノロジー
- 2024/04/11
この記事は新野淳一氏のブログ「Publickey」に掲載された「Google Cloud、AIワークロードに特化したストレージ「Hyperdisk ML」発表。競合となるAWSやAzureの高速ストレージより100倍高速と説明。Google Cloud Next '24」（2024年4月11日掲載）を、ITmedia NEWS編集部で一部編集し、転載したものです。米Google Cloudは日本時間4月10日未明から開催中のイベント「Google Cloud Next '24」で、AIの推論やサービングのワークロード向けに最適化されたブロックストレージサービス「Hyperdisk ML」を発表しました。説明によると、Hyperdisk MLは一般的なストレージサービスと比較して、AIモデルの読み込み時間を最大12倍高速化し、最大で2500インスタンスが同じボリュームにアクセスでき、
- 人工知能
- あとで読む
- techfeed
- AI
- Google
Building a recommendation engine inside... | Crunchy Data Blog
- 15 users
- www.crunchydata.com
- テクノロジー
- 2021/10/27
I'm a big fan of data in general. Data can tell you a lot about what users are doing and can help you gain all sorts of insights. One such aspect is in making recommendations based on past history or others that have made similar choices. In fact, years ago I wrote a small app to see if I could recommend wines based on how other ones were rated. It was a small app that I shared among just a handfu