タグ

tgkのブックマーク (4,429)

  • 【ChatGPT】ファインチューニングをわかりやすく解説 - Qiita

    記事は日オラクルが運営する下記Meetupで発表予定の内容になります。発表までに今後、内容は予告なく変更される可能性があることをあらかじめご了承ください。当日は記事内容以外にデモンストレーションも実施する予定です。 以下の記事内容とセットで実施する予定です。以下の記事がメインでこちらの記事がサブというアジェンダとなります。 はじめに 2022年暮れ、ChatGPTの登場以降、あらゆる企業がDXの在り方を問われはじめ、大規模言語モデルの仕組みをどのように業務に取り入れるかを検討されていると思います。 その検討の一つとして、「GPT(LLM)が学習していない企業内のデータや最新のデータも有効活用すべき」 という点は非常に大きな論点なのではないでしょうか。 ご存じの通り、LLMとはインターネット上に存在するドキュメントデータをクローリングにより大量に収集し、それを学習データとして機械学習にか

    【ChatGPT】ファインチューニングをわかりやすく解説 - Qiita
    tgk
    tgk 2024/01/04
  • 駅の改札口で「88万円なんて払えない!」と泣いている人を見かけたが、どうやら夫の定期券を1日借りたペナルティらしい

    JA811A @jtt17643 改札口で… 泣いてる女性が 旦那の定期券 通勤6ヶ月9月初めから使用開始を 今日借りて出かけたそう。 帰りに改札で引っかかり 駅員に呼び止められ発覚 定期券の区間が片道1280円だったようで、Suica定期券は没収 増運賃は…。 88万円なんて払えない!! 今日だけ借りて東京に行っただけなのに。 と。 pic.twitter.com/yJMmlPJfFj 2023-12-25 23:11:07 JA811A @jtt17643 警察来てたけど 高いクリスマス🎄プレゼントですな(笑) 改札で働いてたとき 名前や性別、年齢が相違ないか よく見てたな。 昔、新幹線定期の中抜きを見つけて 摘発したっけ。 不正しようとする奴ほど 入出場記録がうまく付いてなくて窓口に来たり、券売機で引っかかったりして、発覚しがち(笑) twitter.com/jtt17643/st

    駅の改札口で「88万円なんて払えない!」と泣いている人を見かけたが、どうやら夫の定期券を1日借りたペナルティらしい
    tgk
    tgk 2023/12/26
    現代日本人のキーワード「ズルい」。ペーペーが数百円ちょろまかすのは「ズルい」から許せないしそいつが大損するとうれしい。権力者が1億円所得隠しするのは(偉いからその権利があるので)ズルくなくて腹が立たない
  • Databricksチューニングあれこれ (JEDAI 2023 X'mas/忘年会 Meetup!) - Qiita

    Databricksチューニングあれこれ (JEDAI 2023 X'mas/忘年会 Meetup!)SparkDatabricks性能評価登壇 はじめに 株式会社NTTデータグループ 技術革新統括技術開発部のnttd-kitabahです。 2023/12/8にデータブリックス・ジャパン株式会社主催のユーザ会、 JEDAI 2023 X'mas/忘年会 Meetup!で「Databricksチューニングあれこれ」というタイトルで従来のチューニングとDatabricksの新機能であるリキッドクラスタリング/Predictive IOを性能比較した結果をたのしくLTしてきました。 発表で使用した資料はこちらに掲載しております。 今回は登壇内容と会場の雰囲気をお伝えします! 登壇者ってだあれ? 左:北波 (nttd-kitabah) 普段はOSSを扱うチームに所属し、Apache Spar

    Databricksチューニングあれこれ (JEDAI 2023 X'mas/忘年会 Meetup!) - Qiita
    tgk
    tgk 2023/12/26
    databricks
  • 【悲報】ChatGPTが新車を1ドルで勝手に売ってくる事案が発生|パトル | AI x Biz

    こんにちは、パトルです。 2023年12月17日、カルフォルニアのシボレーの販売店で使われている顧客対応用のChatGPTが、プロンプトインジェクション(AIのハッキングみたいなやつ)にあって、多大な特典を付与したり、新車を1ドルで売ってしまう事案が発生しました。 今回は、このショッキングな事案の概要、どういうプロンプトインジェクションが用いられたのか、損害状況などを解説しながら、プロンプトインジェクションのリスクを勉強したいと思います。 概要今回の舞台はカルフォルニアのワトソンビルという地区にあるシボレーのディーラーのホームページに設置されていたセールチャットボットです。URLはこちらです。(残念ながら12/22時点ではChatGPTは外されています) https://www.chevroletofwatsonville.com/ChatGPTは、商品を説明するという位置づけで導入されて

    【悲報】ChatGPTが新車を1ドルで勝手に売ってくる事案が発生|パトル | AI x Biz
    tgk
    tgk 2023/12/25
  • OpenAI内紛劇の背後に「21世紀の優生思想」、EAコミュニティとe/accの危険性:朝日新聞GLOBE+

    CEOの突然の解任と復帰、理事会の再編劇 背後に「思想」対立? まずOpenAI内紛劇を簡単に「おさらい」しておこう。 OpenAIの理事会は11月17日にサム・アルトマンCEO(最高経営責任者)を解任。ところがわずか5日後、11月22日にアルトマンはCEOとして復帰すると発表された。 ただしアルトマンは理事の地位は失い、また自分の行動について独立した調査を受けることに同意した。OpenAIの理事会は再編となり、旧理事6名のうち、アダム・ダンジェロ(Quora CEO)だけが残り、ブレット・テイラー(元Salesforce 共同CEO、元Twitter 取締役会会長)、ローレンス・サマーズ(ハーバード大学教授、元財務長官)の2名を加えた3人態勢での再出発となった。 OpenAIのサム・アルトマン前最高経営責任者(CEO)=2023年11月6日、サンフランシスコ、五十嵐大介撮影 アルトマン解

    OpenAI内紛劇の背後に「21世紀の優生思想」、EAコミュニティとe/accの危険性:朝日新聞GLOBE+
    tgk
    tgk 2023/12/24
  • 老眼は他人事じゃない。AIを使った遠近両用メガネで世界が変わった話

    老眼は他人事じゃない。AIを使った遠近両用メガネで世界が変わった話2023.10.21 13:0050,063 三浦一紀 「なんだかスマホの文字が見づらいなー」なんて感じたこと、ありませんか? それ、老眼かもしれません。 老眼(老視)とは、年齢とともに目の機能が衰えることで近くのものにピントが合わなくなる生理現象。この老眼、人間であれば誰にでもいつか必ずやってきます。他人事ではありません。 はこのくらい離さないとピントが合わない。これでは文字が小さくて読みづらい。僕も45歳を過ぎたあたりからやスマホやPCの文字が見づらくなり、今では仕事をするときだけ老眼鏡をかける生活をしています。PCの画面や手元はよく見えて快適です。ただ、面倒くさいことも。 それは「着けっぱなしで生活できない」こと。老眼鏡は近くのものを見る専門のメガネ。クルマの運転や野球観戦といった、遠くを見る用途では視界がぼやけて

    老眼は他人事じゃない。AIを使った遠近両用メガネで世界が変わった話
    tgk
    tgk 2023/12/20
    ニコンメガネ南青山店
  • なぜ和歌山県で「1億円プレーヤー」の農家が増えているのか…東大教授が絶賛する「野田モデル」の画期的内容 直売所スタイルなのに、30店舗で一気に売り切れる

    「1億円プレーヤー」の生産者が現れはじめた 肥料や農業資材、エネルギー……、ありとあらゆるコストは上がるが、大手流通が支配する市場構造の下、小売価格は上がらない。だから農家は儲からない。それどころか生活すらままならない。 そうして誰も跡を継がず、生産者が減る。命を守る料のはずなのに、外圧に負けて輸入自由化だけを進め、国内生産の苦境に手を差し伸べない。結果、自給率は下がる一方――。 そんな悪循環に陥ってきた日の農業の現状を変えることはできるのか――。 処方箋を発見した。 和歌山県で「1億円プレーヤー」の生産者が現れはじめたのをご存じだろうか。 農林水産省がまとめている営農類型別経営統計(令和3年)によると農業で生計を立てている主業経営体の農業粗収益は1638.8万円(農業所得は433.5万円)。そんな中、和歌山県ではなぜ1億円に達するような売り上げを誇る農家が増えているのか。 和歌山の名

    なぜ和歌山県で「1億円プレーヤー」の農家が増えているのか…東大教授が絶賛する「野田モデル」の画期的内容 直売所スタイルなのに、30店舗で一気に売り切れる
    tgk
    tgk 2023/12/08
  • トランザクションの最先端研究 | 分離レベルの追跡・究明―TiDBの分離レベルを理解する(上) - Qiita

    はじめに 「トランザクションの最先端研究」は、トランザクションに関する最先端の研究内容を皆さんと共有することを目的とします。トランザクションは内容の専門性が高いことから、稿では順を追った説明を行っていくこととします。後の内容を理解するための土台とするため、まずはトランザクションの基礎理論から話を進めていきます。稿には次の三つの目的があります。 トランザクションの独立性を明らかにし、よくある認識の誤りについて説明すること。 トランザクションの複雑性について理解し、これを簡略化できるようにすること。 最先端の研究の焦点について理解し、業務・研究に関する示唆を得ること。 最初に共有する内容は、トランザクションの分離レベルの定義に着目したものです。後の内容は全てこれに基づくものであり、分離レベルの最新の学術的定義は広く受け入れられているものではないため、稿では分離レベルの定義が提示された順に

    トランザクションの最先端研究 | 分離レベルの追跡・究明―TiDBの分離レベルを理解する(上) - Qiita
    tgk
    tgk 2023/12/06
    read skewとwrite skewの例
  • データレイク関連の OSS - Delta Lake, Apache Hudi, Apache Kudu

    はじめに#前回のポストではデータレイクとはどういうものかというのを調べた。 今回はデータレイクの文脈でどのような OSS が注目されているのかを見ていきたい。 以下は NTT データさんによる講演資料であり、その中で「近年登場してきた、リアルタイム分析に利用可能なOSSストレージレイヤソフト」というのが3つ挙げられている。 Delta LakeApache HudiApache Kuduこれらはすべて論理的なストレージレイヤーを担う。 こちらの講演資料に付け足すようなこともないかもしれないが、このポストではデータレイクという文脈から自分で調べて理解した内容をまとめるということを目的にする。 当然 Hadoop, Hive, Spark 等もデータレイクの文脈において超重要だが、「データレイク」という言葉がよく聞かれるようになる前から普及していたのでこのポストでは触れないことにする。 Del

    データレイク関連の OSS - Delta Lake, Apache Hudi, Apache Kudu
    tgk
    tgk 2023/12/06
    「Delta Lake は Apache Spark の読み書きにACIDなtransactionを提供するストレージレイヤーのOSSである」
  • Mattermost integrations: Sending and receiving data with the Mattermost API

    Write some code By this point, you’ve done everything you needed to do to gain access to the Mattermost API. Now, it’s time to learn how to use the API in Python. We’ll be using the Mattermost Driver, and there are also drivers available for JavaScript, Go, and PHP. 1. First things first: Install the dependencies pip install mattermostdriver 2. Now, let’s build some magical Python code First, we i

    Mattermost integrations: Sending and receiving data with the Mattermost API
  • 【解決策】2024年2月よりGmailガイドラインが変更!1日5000件以上の配信は対応必須!|メール配信・メルマガ配信ならブラストメール

    ホーム › 迷惑メール対策 › 【解決策】2024年2月よりGmailガイドラインが変更!1日5000件以上の配信は対応必須! 2023年10月、Gmailのメール送信者ガイドラインがアップデートされました。 https://support.google.com/mail/answer/81126 このガイドラインでは2024年2月以降、Gmailアカウントに1日あたり5,000件を超えるメールを送信する送信者は、送信ドメインにSPFレコード・DKIM署名・DMARCメール認証の設定が必要と、記載があります。 さらには、SPFレコード・DKIM署名・DMARCメール認証が未設定の場合、メールが想定通りに配信されなかったり、迷惑メールに分類されたりする可能性があるとのことです。 昨今、なりすましメールによる詐欺被害やスパムメールによる個人情報の流出などで問題視されていることから、Google

    【解決策】2024年2月よりGmailガイドラインが変更!1日5000件以上の配信は対応必須!|メール配信・メルマガ配信ならブラストメール
    tgk
    tgk 2023/11/30
    2024/2/1から厳しくなる
  • ChatGPTに社内文書に基づいた回答を生成させる仕組みを構築しました - コネヒト開発者ブログ

    はじめに はじめまして、8月にコネヒトに入社したy.ikenoueです。 突然ですがみなさん、生成AIは使っておりますでしょうか? ChatGPTやStable Diffusionといった代表的な生成AIの発表から約1年が経過し、そろそろブームも落ち着くかと思っていたのですが、つい先日もOpenAI DevDayにてChatGPTに関する様々なアップデートが発表されるなど、相変わらず目まぐるしい日々が続いていますね。 弊社における生成AIの活用状況はというと、以前に下記の記事にて、Slack上でChatGPTと会話できる環境を社内提供しているという取り組みをご紹介しました。 tech.connehito.com 日は、上記の社内ツールに新たに追加した「社内文書の参照機能」についてご紹介します。 「社内文書の参照機能」の概要と開発動機 まずは「社内文書の参照機能」の概要と開発にいたった動機

    ChatGPTに社内文書に基づいた回答を生成させる仕組みを構築しました - コネヒト開発者ブログ
  • インボイス導入1カ月「想定以上に負担」 混乱続く企業 - 日本経済新聞

    インボイス(適格請求書)制度の開始から1カ月あまり。10月分の請求書の処理が格化するなか、中小・新興企業などで混乱が続いている。企業ごとに異なる請求形式の違いへの対応や、登録番号の確認作業で業務の負担が増している。10月に入っても企業の9割で今後の対応に懸念を持つとの調査も出ている。「アプリやソフトウエア販売、電子商取引(EC)販売を手掛ける事業者の一部で10月以降、急きょ自社でインボイス

    インボイス導入1カ月「想定以上に負担」 混乱続く企業 - 日本経済新聞
    tgk
    tgk 2023/11/04
    弊社ではグループ全体でシステム改修に1.1億かかって、オペレータの負担が前より増えました。今回の改正に賛成してた人に質問だけど「何かいいことありましたか?」
  • “想定外と誤算” 札幌冬季オリンピック 招致暗転の実像 | NHK | WEB特集

    「札幌の地に再び五輪の火を!」 2014年、当時の札幌市長が2回目の冬季オリンピック招致を表明してから9年、その活動は暗礁に乗り上げました。 災害による方針転換、そして東京オリンピックで不祥事が相次ぎ、市民の支持も広がらないなか、札幌市とJOC=日オリンピック委員会は今月11日、2030年大会の招致断念を表明。その直後には、34年大会の招致も極めて厳しいものになりました。 招致活動の裏側で何があったのか?関係者への取材をもとに、実像に迫ります。 ことし10月初旬、関係者からNHKの取材班にある情報が入りました。 「札幌市とJOCがまもなく、2030年大会の招致断念を表明する」 IOC=国際オリンピック委員会による30年大会の候補地の絞り込みは早くて年内、11月末から12月にかけての理事会で行われるとみられ、招致活動の停滞が続いていた札幌市などが、先に何らかの態度を表明する可能性があると考

    “想定外と誤算” 札幌冬季オリンピック 招致暗転の実像 | NHK | WEB特集
    tgk
    tgk 2023/11/01
    「決定的なダメージを与えたのが、2021年夏の東京オリンピック」「国民にオリンピックアレルギーともいえる不信感が広がりました」そんなぼんやりした理由で儲ける側が諦めるかねえ
  • Improving Query Optimization With Teradata IPE

    tgk
    tgk 2023/09/27
    "This request is eligible for incremental planning and execution (IPE) but does not meet cost thresholds."と言われてstatic planになってしまうとき、無理やりIPEを発動させる方法。"SET QUERY_BAND = 'DynamicPlan=SYSTEMX;' FOR SESSION;"するとIPEが発動する
  • Apache Iceberg とは何か - 流沙河鎮

    はじめに 概要 Apache Iceberg(アイスバーグ)とは [重要] Icebergの質はTable Specである Table Spec バージョン Icebergハンズオン Icebergの特徴 同時書き込み時の整合性担保 読み取り一貫性、Time Travelクエリ、Rollback Schema Evolution Hidden Partitioning Hidden Partitioningの種類 時間 truncate[W] bucket[N] Partition Evolution Sort Order Evolution クエリ性能の最適化 ユースケース Icebergのアーキテクチャ Iceberg Catalog Iceberg Catalogの選択肢 metadata layer metadata files manifest lists manifest f

    Apache Iceberg とは何か - 流沙河鎮
  • ホセ・リサール - Wikipedia

    署名 ホセ・プロタシオ・メルカード・リサール・アロンソ・イ・レアロンダ (スペイン語: Jose Protacio Mercado Rizal Alonzo y Realonda,1861年6月19日 - 1896年12月30日)は、フィリピンの革命家、医師、著作家、画家、学者。フィリピン独立運動に取り組んだことから「国民的英雄(Héroe Nacional)」と称される[1]。通称はホセ・リサール(スペイン語: José Rizal)。 生涯[編集] 少年期[編集] スペイン領東インドルソン島のカランバ(英語版)で父フランシスコ・メルカードと母テオドラ・アロンソの間に、11人兄弟の7人目の子として生まれた[2]。リサールには姉が5人、兄が1人、妹が4人いた[3]。 彼の家系はメスティーソといわれる中国人とフィリピン人の混血の一族であった[4]。父方の家系には、殷を倒し周を建国した中国人で

    ホセ・リサール - Wikipedia
    tgk
    tgk 2023/09/23
  • - Immediate out of spool space when doing ALTER TABLE - Lithium Redirect

    tgk
    tgk 2023/09/21
    alter tableした瞬間に 2644 No more room in database エラーが返る理由をDnothが説明している。オプティマイザがテーブルを複製する前に、領域が足りそうか計算して、足りないとみたら即エラー終了するとのこと
  • NZ鳥コンテスト、イワサザイが優勝 カカポ外しで物議も

    イワサザイ。バード・アンド・フォレスト提供(撮影日不明)。(c)David Hallett/Hedgehog House 【10月31日 AFP】ニュージーランドで31日、恒例の鳥の人気投票「バード・オブ・ザ・イヤー(Bird of the Year)」の結果が発表された。今年は山地に生息する小型鳥「イワサザイ」が予想外の優勝を果たした。 マオリ語で「ピワウワウ」と呼ばれるイワサザイは、体重約20グラムのニュージーランド固有種。下馬評は高くなかったが、コガタペンギンやケア(ミヤマオウム)といった人気の鳥を破り栄冠に輝いた。 イワサザイのファンはフェイスブック(Facebook)ページを作り、投票を呼び掛けていた。 バード・オブ・ザ・イヤーをめぐっては、2021年にコウモリが候補入りし、優勝までするなど、ここ数年は物議を醸してきた。今年は他の鳥にもチャンスを与えるため過去2度優勝のカカポ(フ

    NZ鳥コンテスト、イワサザイが優勝 カカポ外しで物議も
    tgk
    tgk 2023/09/20
    「バード・オブ・ザ・イヤーをめぐっては、2021年にコウモリが候補入りし、優勝までするなど、ここ数年は物議を醸してきた」「今年は過去2度優勝のカカポが候補から外され、非難の声が上がっていた」
  • Yahoo! Japanの大規模データウェアハウスを支えるテラデータの技術

    テラデータの大規模なデータウェアハウスとHadoopのデータレイクを併用 多くのユーザーがサービスを利用することで、Yahoo! Japanでは日々膨大なデータが生まれている。Webサイトやアプリケーションには1日に約610億ものリクエストが発生、そこから日々125テラバイトを越えるデータが生成される。これらユーザーのアクセスから生まれる大量データは、当然ながらYahoo! Japanのビジネスを最適化し、利用者の利便性の向上に使われる。 Yahoo! Japanがデータウェアハウスを構築したのは、2002年のことだった。当時のデータ量は6テラバイトほど、分析スキルの高いユーザーにのみアドホック分析の環境が公開された。 その後、Yahoo! Japanのデータウェアハウスは徐々に成長する。2016年には扱うデータ量は1.7ペタバイトにまで拡大、ユーザーからのデータ処理リクエストは、1日に3

    Yahoo! Japanの大規模データウェアハウスを支えるテラデータの技術
    tgk
    tgk 2023/09/07
    「2018年には、データウェアハウスは3.3ペタバイト規模に拡大、1日当たりのクエリー数は100万を超える」