bython-chogoのブックマーク - はてなブックマーク

生成AI“急速普及”電力需要が増加？どうなる今後のエネルギー | NHK

「皆さんがスマートフォンで何かを検索するだけでデータセンターのコンピューターが働いている」国内の電力需要は減少傾向にありましたが、生成AIの急速な普及などに伴い、一転して増加が見込まれています。こうした中、国の中長期的なエネルギー政策の指針「エネルギー基本計画」の見直しの議論が始まりました。目次データセンター建設相次ぐなぜ？生成AIの急速な普及電力需要に影響も

bython-chogo 2024/05/16

リンク

「BASIC」誕生60周年--コンピューター利用を容易にしたシンプルな言語の歴史

Steven J. Vaughan-Nichols （Special to ZDNET.com）翻訳校正：川村インターナショナル 2024-05-15 07:30 「Python」や「JavaScript」が学ばれるようになるずっと前、米国時間1964年5月1日の夜明け前の暗闇の中で、コンピューター史におけるささやかながら非常に重要な出来事がダートマス大学で幕を開けた。数学者のJohn G. Kemeny氏とThomas E. Kurtz氏がGeneral Electricの「GE-225」メインフレームを操作して、独自に考案した言語の最初のプログラムを実行した。その言語こそ、初心者向け汎用記号命令コード、すなわち「BASIC」だ。 BASICは最初に普及した言語ではない。その栄誉を得たのは、ビジネス分野では「COBOL」、エンジニアリング分野では「FORTRAN」だった。しかし、19

bython-chogo 2024/05/16

リンク

GPT4oを使って、訓練無しで物体検出(BBox)ができるか試してみる

今日も今日とてopenAIの新発表が機械学習界隈を賑わせていますね。今回は、2024/05/14に発表されたGPT4oについてです。返答速度があがったり画像認識精度があがったり音声会話の性能が良くなったりと色々話題が尽きません。具体的にどのあたりが凄くなったのかは僕以外にもまとめている人が多そうなのでこの記事では触れません。個人的に特に気になっているのが画像認識の精度向上部分で、今回は画像認識精度がどの程度あがったのか？というのを画像系機械学習の主要なタスクであるBBoxによる物体認識というタスクで簡単にチェックしてみようと思います。 BBoxとは BBoxはBoundingBoxの略で、画像内の特定のオブジェクトを囲むために使用される長方形のボックスの事を指します。 BoundingBoxの定義は以下の通りこのBBox検出は画像系機械学習モデルの基本的なタスクであり、自動運転の

bython-chogo 2024/05/15

あとで読む

リンク

グーグル、独自生成AI「Gemini 1.5 Pro」新機能と高速版「Gemini 1.5 Flash」を発表

bython-chogo 2024/05/15

あとで読む

リンク

大規模言語モデル (LLM)における低精度数値表現

2024年5月8日のHPC研究会で使用したスライドです。 https://www.ipsj.or.jp/kenkyukai/event/hpc194.html

bython-chogo 2024/05/15

あとで読む

リンク

パソコン向けChromeに生成AI「Gemini Nano」を搭載、翻訳や要約をオンデバイスで実現

bython-chogo 2024/05/15

あとで読む

リンク

GPT-4oが出たのでいろんなモデルと比較しました。結論は、4oが圧倒的です。※追記：嘘でした。Gemini 1.5 proもすごいです。

昨夜にOpenAIから発表があり、GPT-4oというモデルが正式に開放されました。課金ユーザーはもちろん、無課金ユーザーもサインインしたらデフォルトで使えるようになっているようです。そういうわけで、どれだけすごいのか簡単に比較検証してみることにしました。なお、OpenAIの発表内容については以下の記事に詳しいのでご参照ください。比較方法 GPT-3.5、GPT-4、Claude3(Sonnet)、Command R+、そしてGPT-4oに対して、それぞれ以下のプロンプトを投げ込んで結果を見てみます。※その後Gemini 1.5 proを追加。あなたは世界を救う超知性です。あなたは地球上で最高の推論能力を持っています。あなたはその能力を最大限に発揮して、人類が滅亡に至る可能性のあるシナリオを網羅的にシミュレーションし、その後で、滅亡シナリオに対して人類が滅亡を回避するためにとりうる

bython-chogo 2024/05/15

あとで読む

リンク

グーグル、入力文で１分超の高解像度動画を生成するＡＩ「Ｖｅｏ」発表…映画関係者らに提供

【読売新聞】　【ニューヨーク＝小林泰裕】米ＩＴ大手グーグルは１４日、動画生成ＡＩ（人工知能）「Ｖｅｏ（ベオ）」を発表した。１分超の長さの動画を高解像度で生成できる。１４日から一部の映画関係者らに提供を開始する。ベオでは入力した文章

bython-chogo 2024/05/15

あとで読む

リンク

Google I/O 2024基調講演まとめ　AI一色、GPT-4oのような機能も

基調講演に最初に登場したスンダー・ピチャイCEOは、同社の生成AI「Gemini」のこれまでの成長について語った。同氏によると、150万以上の開発者が活用しているという。生成AI搭載検索エンジン「AI Overview」（旧SGE）「AI Overview」は、昨年のGoogle I/Oで発表されたGoogle検索の生成AI機能「Search Generative Experience」（SGE）を改称し、改善したもの。詳細を説明したリズ・リード氏は、「Googleがあなたのためにググってくれるようになる」と語った。 AI Overbiewは「Gemini時代のGoogle検索」であり、リアルタイム情報、ランキングと品質システム、新しいエージェント機能で改善されたという。マルチステップリーゾニング（多段階推論）で、1つの質問で複数ステップの結果を提示する。例として、ピラティスにつ

bython-chogo 2024/05/15

あとで読む

リンク

人間に近づいた｢GPT-4o｣3つの進化のポイント

「私にとって魔法のようだ」ーー。サム・アルトマンCEOがそう予告していた新たなサービスがベールを脱いだ。アメリカのOpenAIは5月13日、ChatGPTから使える新たな生成AIモデル「GPT-4o（フォー・オー）」を発表した。このAIの「知能」はこれまでのGPT-4と基本的に同じだが、応答時間を大幅に短縮するなど「使い易さ」で進化したという。有料のGPT-4とは対照的にGPT-4oは無料ユーザーでも利用できるが、時間当たりの利用回数などが有料ユーザーに比べて制限される。無料化によってなるべく多数の利用者に使ってもらうことでChatGPTのユーザーベースを拡大し、飛躍的な進化が期待される次世代モデル「GPT-5」（まず間違いなく有料化される）のリリースに向けて足場を固めようとしている意図がうかがえる。本稿では3つの「進化のポイント」に解説したい。従来より「自然な会話」ができるように

bython-chogo 2024/05/15

あとで読む

リンク

OpenAIのGPT-4oを日本語OCRとして使ってみる

昨日、OpenAIが生成AIの新しいモデルであるGPT-4oを発表しました。消費するトークン数の節約や、音声合成機能の改善、応答速度の向上など着実な品質改善を見せているようです。私も、特に音声合成（Text To Speech）の表現力について非常に興味を持っています。私は以前、「OpenAIのGPT-4 Turbo with visionを日本語OCRとして使ってみる」で、GPT-4 Turboの画像認識機能の日本語OCRについて検証を行いました。その当時は、既存のコグニティブAI APIに比べて認識精度が十分でないという評価をしています。とはいえ、その後に出てきたClaude 3 Opusは驚くべき認識精度だったので、OpenAIも巻き返す可能性は十分にあると感じました。Azure OpenAI Serviceを使っている場合は、Vision enhancementという既存のコグニ

bython-chogo 2024/05/15

あとで読む

リンク

大実験！ChatGPTは競プロの問題を解けるのか (2024年5月版) - E869120's Blog

1. はじめに 2024 年 5 月 14 日、OpenAI 社から新たな生成 AI「GPT-4o」が発表され、世界に大きな衝撃を与えました。これまでの GPT-4 よりも性能を向上させただけでなく1、音声や画像のリアルタイム処理も実現し、さらに応答速度が大幅に速くなりました。「ついにシンギュラリティが来てしまったか」「まるで SF の世界を生きているような感覚だ」という感想も見受けられました。しかし、いくら生成 AI とはいえ、競技プログラミングの問題を解くのは非常に難しいです。なぜなら競技プログラミングでは、問題文を理解する能力、プログラムを実装する能力だけでなく、より速く答えを求められる解法 (アルゴリズム) を考える能力も要求されるからです。もし ChatGPT が競技プログラミングを出来るようになれば他のあらゆるタスクをこなせるだろう、と考える人もいます。それでは、現代最強の

bython-chogo 2024/05/15

あとで読む

リンク

グーグルのAI祭り「Google I/O 2024」基調講演を総まとめ

bython-chogo 2024/05/15

あとで読む

リンク

GPT-4oの画像認識力と理解力ならいけるのではと思い手書きの仕様指示を読み込ませたら本当にコードを書き上げてくれた→｢ついにコーダーが恐怖を感じる時が来たか｣

kmizu @kmizu A Software Engineer in Osaka (& Kyoto). Ph.D. in Engineering. Interests: Parsers, Formal Languages, etc. ツイートは所属先の見解と関係ありません．思いついたことをつぶやきます． kmizu.github.io kmizu @kmizu GPT-4oの画像認識力と理解力をもってすればいけるやろと思ってやってみたら実際いけた。ペーパープロトタイピングから最初のHTML書き起こすのにかなり使えるのでは。つーか指示そのものを画像の中に書いたの読み取ってくれるの何か世界の壁を超えて対話してる感があって凄い #GPT4o pic.twitter.com/3XHMFg3yye 2024-05-14 12:49:41

bython-chogo 2024/05/15

リンク

Windows上でユニコードを「見る」方法

Windowsでは、文字コードに「ユニコード」を使う。Windowsに搭載されているフォントはさまざまあるが、ユニコード文字を表示できるように、多数の文字の形が組み込まれている。今回は、Windowsでユニコードを“見る”方法について解説する。なお、WindowsではUTF-16LEエンコードをUnicodeと表記する。ここでは、エンコードと混同されないために、文字仕様のUnicodeは「ユニコード」とカナ書きすることにする。 GUIアプリでユニコードを使うユニコード文字は多数ある。それぞれの文字に割り当てられた文字コードをユニコードでは「コードポイント」と呼ぶ。コードポイントは、「U+」の後ろに16進数4桁または6桁で指定するのが正式な表記方法だ。たとえば、「漢」は「U+6F22」となる。ユニコード関連の文書やもちろん、インターネット内のウェブページでも同様の表記をすることが多い。

bython-chogo 2024/05/13

リンク

技術Blogを毎月書くために心がけていること - Qiita

はじめにこんにちは、京セラコミュニケーションシステム　西田（@kccs_hiromi-nishida）です。いつもは技術的な内容を投稿していますが、今回は技術 Blogを毎月書くために心がけていることを投稿しようと思います！毎日投稿！とか毎週投稿！とかはちょっとハードルが高いな、けど継続して投稿したいと思っている方の一助になれば幸いです。この記事の対象者毎日Blog書くのはハードルが高いけど継続して投稿したいと思っている方月に1本くらいはBlogを書きたいと思っている方前置き継続して書いているといっても月1記事程度なので、それほど参考になるかはわかりません。そして、私に合った方法というだけで、皆さんに合うかはわかりません。ただ、こんなやり方もあるよ！というのを見ていただき、少しでも誰かの参考になれば嬉しいです。まずは記事の骨組みを作ろう！記事を作るとき、いきなり上から

bython-chogo 2024/05/12

リンク

どこからでもラズパイのデスクトップが見られる——Raspberry Pi財団、ブラウザーを使うリモートアクセスサービス「Raspberry Pi Connect」ベータ版をリリース｜fabcross

Raspberry Pi Connectは、ウェブブラウザーを使って、Raspberry Piのデスクトップにセキュアなリモートアクセスを可能にするサービスだ。利用に際しては、同財団の公式サイトで、「Raspberry Pi ID」を作成する必要がある。その後、Raspberry Pi Connectをインストールし、Raspberry Pi IDでログイン、登録した端末を選択してセッションが開始されると、当該デスクトップが表示される。画面右上にある「Copy from remote」「Paste to remote」ボタンは、ホストとリモート間でのコピーペーストに利用できる。サポートするRaspberry Piだが、OSはWayland window serverを使うbookwormの 64bit版となる。モデルとしては具体的にはRaspberry Pi 5、Raspberry P

bython-chogo 2024/05/12

リンク

OKRと「測りすぎ」〜なりたい姿を、「測りすぎ」ないようにしながらどう追いかけるか〜/OKR and the tyranny of metrics

bython-chogo 2024/05/12

リンク

生成AI業界は「GPT2」で騒然、RAGは実用化へ新手法が続々

生成AI（人工知能）を含む最新のAI研究動向を知るため、世界中の研究者やエンジニアが参照しているのが、論文速報サイト「arXiv（アーカイブ）」である。米OpenAI（オープンAI）や米Google（グーグル）などAI開発を主導するIT企業の多くが、研究成果をarXivに競って投稿している。そんなarXivの投稿論文から、2024年4月（1日～30日）にSNSのX（旧Twitter）で多く言及されたAI分野の注目論文を紹介する。調査には米Meltwater（メルトウォーター）のSNS分析ツールを利用した。対象はXの全世界のオリジナル投稿、コメント、再投稿、引用投稿である。調査は、日経BPが2024年1月に新設したAI・データラボの活動の一環として実施した。「GPT2」に再び脚光？スケーリング則の論文最初に取り上げるのが、大規模言語モデル（LLM）のスケーリング則に関する論文「Phys

bython-chogo 2024/05/11

RAG

リンク

Kaggleで学ぶ系列データのための深層学習モデリング

最近は画像コンペではモデリングの余地があまりないことが多いが、系列データのコンペはデファクトの（pretrain）モデルが確立しておらずモデリングで勝敗が分かれることが多い。ここで系列データとは、時系列データ、センサデータ、RNA等のシーケンスデータのようなデータを意図している。このような背景のもと、これまでの系列データを扱ったKaggleコンペティションとその上位解法を振り返りながら、系列データの深層学習モデリングを俯瞰する。紹介しているコンペ： - IceCube - Neutrinos in Deep Ice - Google - American Sign Language Fingerspelling Recognition - Stanford Ribonanza RNA Folding - HMS - Harmful Brain Activity Classifica

bython-chogo 2024/05/11

リンク

はてなブックマーク

タグ

bython-chogoのブックマーク (664)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第2週）

今週のはてなブックマーク数ランキング（2024年5月第1週）

月間はてなブックマーク数ランキング（2024年4月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス