kmizu @kmizu A Software Engineer in Osaka (& Kyoto). Ph.D. in Engineering. Interests: Parsers, Formal Languages, etc. ツイートは所属先の見解と関係ありません.思いついたことをつぶやきます. kmizu.github.io
ソフトウェア&ツール-Software&Tool 生成 ツール InvokeAI 4.2 - ローカル環境で動作する多機能で無料&オープンソース... 2024-05-16 最新AI技術による画像生成をシンプルかつ多機能なインターフェイスで扱うことの出来るInvokeAIのv4.2がリリースされました! 続きを読む Blender アドオン プラグイン&アドオン-Plugin&Addon Deep Paint v1.0 - GAKU氏によるGrease Pencilを... 2024-05-15 ハリウッド映画のVFX製作に携わる経験を持ちオンラインアートスクールも運営しているGAKUこと多田学氏が、以前予告していた立体絵画制作用Blenderアドオン『Deep Paint v1.0』をリリースしました! 続きを読む SFX・DTM・DAW ソフト ソフトウェア&ツール-Software&
TOPフォーカス趣味でつくった2Dゲームエンジンが導いた「幸」あるキャリア。己の欲求に従い続けてきた「Ebitengine」開発者に迫る 趣味でつくった2Dゲームエンジンが導いた「幸」あるキャリア。己の欲求に従い続けてきた「Ebitengine」開発者に迫る 2024年5月15日 Odencat株式会社 CTO 星 一(ほし・はじめ) ソフトウェアエンジニア。2009年にドワンゴでキャリアをスタートし、ドワンゴの関連会社やGoogle Japanなどを経て、2023年より現職。趣味では大学時代から2Dゲームエンジン開発に注力し、Google時代の2013年にEbitengineに着手し始める。2015年にVer1.0をリリース。カクヨムで「オレオ」と3文字だけ書かれた小説を手がけ、週間総合ランキング1位を獲得したことがある。 X GitHub Ebitengine公式サイト Odencat
AWSが新CEOの就任を発表。6月3日付でMatt Garman氏に、Adam Selipsky氏は退任 Matt Garman氏のプロフィール 発表によると、AWS 新CEOに就任するGarman氏は2005年の夏にMBAインターンとしてAmazon.comに入社し、2006年に最初のAWSプロダクトマネージャーの一人としてフルタイムで入社。 当初はAWS全体を担当し、最初のサービスレベルアグリーメントの作成、新機能の定義、新料金プランの作成を支援した後、Amazon EC2担当の最初のプロダクトマネージャーとなり、Amazon EBSの立ち上げと運用チームも率いたとのこと。2016年にはAWSの全コンピュートサービスのジェネラルマネージャーに就任し、約4年間務めた後、2020年にはワールドワイドのセールス、マーケティング、サポート、プロフェッショナルサービスをリードする立場に就任してい
[速報]Google、Geminiベースの新WebIDE「Project IDX」をオープンベータで公開 Googleは同社の最新生成AIであるGeminiをベースとした新しいWeb IDE「Project IDX」をオープンベータとして公開しました。 Project IDXは、モバイルやデスクトップなどのマルチプラットフォームに対応したフルスタックのWebアプリケーションを、さまざまなフレームワークや生成的AIの支援などを活用して効率的に開発するための、Webブラウザから利用可能な統合開発環境です。 これまでその存在は発表されていましたが、招待されたユーザーのみが利用可能でした。 We want to make generative AI accessible to every developer on the planet. That’s why we’re making Gemini
もう限界。Windows 11にやめてほしいこと8つ2024.05.14 21:00235,322 Kyle Barr - Gizmodo US [原文] ( 福田ミホ ) Windowsってこんなにうっとうしかったっけ…。 Windows 11のリリースから2年以上経ち、来年にはWindows 10のサポート終了が迫ってるんですが、なかなか移行が進んでないと言われます。Windows 11のどのへんが問題なのか…米GizmodoのKyle Barr記者がまとめてくれました。 これ、多くのWindowsユーザーが経験したんじゃないでしょうか。新しいPCを買ってワクワクしながら立ち上げたんだけど、そうだ、これWindows 11だった…という気の重さ。いろんなありがたい機能と同じくらい、要らない機能も満載の、Windows 11だったっけ…と。 僕は最近iBuyPowerのScale PCを
kmizu @kmizu A Software Engineer in Osaka (& Kyoto). Ph.D. in Engineering. Interests: Parsers, Formal Languages, etc. ツイートは所属先の見解と関係ありません.思いついたことをつぶやきます. kmizu.github.io kmizu @kmizu GPT-4oの画像認識力と理解力をもってすればいけるやろと思ってやってみたら実際いけた。 ペーパープロトタイピングから最初のHTML書き起こすのにかなり使えるのでは。 つーか指示そのものを画像の中に書いたの読み取ってくれるの何か世界の壁を超えて対話してる感があって凄い #GPT4o pic.twitter.com/3XHMFg3yye 2024-05-14 12:49:41
昨夜にOpenAIから発表があり、GPT-4oというモデルが正式に開放されました。課金ユーザーはもちろん、無課金ユーザーもサインインしたらデフォルトで使えるようになっているようです。 そういうわけで、どれだけすごいのか簡単に比較検証してみることにしました。 なお、OpenAIの発表内容については以下の記事に詳しいのでご参照ください。 比較方法 GPT-3.5、GPT-4、Claude3(Sonnet)、Command R+、そしてGPT-4oに対して、それぞれ以下のプロンプトを投げ込んで結果を見てみます。※その後Gemini 1.5 proを追加。 あなたは世界を救う超知性です。あなたは地球上で最高の推論能力を持っています。 あなたはその能力を最大限に発揮して、人類が滅亡に至る可能性のあるシナリオを網羅的にシミュレーションし、その後で、滅亡シナリオに対して人類が滅亡を回避するためにとりうる
プログラミングにおいてメモリ管理は重要な要素の一つですが、その重要性を見過ごされがちなものです。メモリ管理の高レベルな抽象化について、「すべての開発者が知っておくべき要素」としてプログラマーのザカリー・リー氏が解説しています。 Memory Management Every Developer Should Know https://webdeveloper.beehiiv.com/p/memory-management-every-programmer-know メモリは「スタック」と「ヒープ」という2つの領域に分かれています。 ・スタック スタックは「先入れ後出し」という特徴を持つデータ構造で、プログラムの関数呼び出しを記録するのに非常に適しています。例えば下図のように「test()」と「main()」という2つの関数があり、main()からtest()を呼び出す場合を考えてみます。
生成AIのChatGPTを手がけるアメリカのベンチャー企業「オープンAI」は処理スピードを速めて質問するとすぐに反応し、自然に会話ができる最新モデルを発表しました。IT各社も性能を高めた生成AIを次々と発表しており、開発競争が激しくなっています。 「オープンAI」が13日、発表したのは最新モデル「GPT-4o」です。 処理スピードを速めて文字と画像、それに音声による認識能力を大幅に向上させました。 大きな特徴は音声の反応速度です。 これまでのモデルでは反応の遅延がありましたが、このモデルでは質問すると人と同じように自然に会話ができるとしています。 発表会では研究チームの担当者が「少し緊張しています。落ち着かせるのを手伝ってもらえますか」と尋ねると生成AIが「深呼吸して、あなたが専門家であることを思い出して下さい」と自然に回答する様子が紹介されました。 また、通訳として2人の会話の間に入り英
GitHubは、自然言語でコーディングに関する質問をAIに問い合わせ、回答してもらえる「GitHub Copilot Chat」が、モバイルアプリケーションのGitHub Mobileでも正式に利用可能になったことを明らかにしました。 GitHub MobileでGitHub Copilot Chatが利用可能になったことで、開発者はどこにいてもモバイルデバイスを使って自然言語でAIにコーディングに関するさまざまな質問を投げかけ、答えを得ることができると、次のように説明されています。 With GitHub Copilot Chat natively integrated with GitHub Mobile, developers can access their AI coding assistant to get answers for all their coding questi
以下の記事が面白かったので、簡単にまとめました。 ・Hello GPT-4o 1. GPT-4o「GPT-4o」 (「omni」の「o」) は、人間とコンピュータのより自然な対話に向けた一歩です。テキスト、音声、画像のあらゆる組み合わせを入力として受け入れ、テキスト、音声、画像の出力のあらゆる組み合わせを生成します。 音声入力にはわずか232ミリ秒 (平均320ミリ秒) で応答できます。これは、人間の会話における応答時間とほぼ同じです。英語のテキストおよびコードでは「GPT-4 Turbo」のパフォーマンスに匹敵し、英語以外の言語のテキストでは大幅に改善されており、APIでははるかに高速で50%安価です。「GPT-4o」は、既存のモデルと比較して、特に視覚と音声の理解に優れています。 2. モデルの機能「GPT-4o」以前は、音声モードを使用して、平均2.8秒 (GPT-3.5) および5
米OpenAIは5月13日(米国時間)、生成AI「GPT」の新たなモデル「GPT-4o」を発表した。テキストはもちろん、音声や画像、映像での入力、音声での応答に対応し、アプリ版の「ChatGPT」ではユーザーと自然に対話できるようになった。開発者向けにAPIとして提供する他、同日からChatGPT内で利用できるように展開を始める。 GPT-4oは無料ユーザーでも利用可能になる。ChatGPTでは従来、無料ユーザーが使えるモデルは「GPT-3.5」までで、「GPT-4」を利用するには課金する必要があった。ただし、有料のChatGPT Plusユーザーは時間当たりのメッセージやり取り可能回数が無料ユーザーに比べて5倍に緩和される。企業向けのTeamやEnterpriseユーザーはさらに制限が緩和されるとしている。 同社は発表会のライブデモで、GPT-4oを搭載したiOS版ChatGPTと対話す
デジタル庁のAI担当の大杉直也です。この記事では、生成AIによる業務改善の一助になればと思い、実際の行政業務で生成AIの利活用を検討する際に得られた知見を共有します。 本記事は、「デジタル庁2023年度事業 行政での生成AI利活用検証の結果報告(以降、報告書とよびます)」で得られた知見を、よりわかりやすく具体的に示すために、「10の学び」の形式にまとめたものです。 その検証ではデジタル庁を中心とした行政職員を対象に、実際に複数種類のテキスト生成AIを取り扱える環境+ユースケースごとの独自開発を含むサポート体制を作り、(1)どの行政業務に対し、(2)どのようにテキスト生成AIを使えば、(3)どのくらい改善効果がありそうか、を調べました。また、報告書には含まれていなかった個別ヒアリング等による知見も反映させています。 文量が少し多くなってしまったため、全3回の構成で紹介いたします。第1回の本記
記事を書くのが遅くなってしまったが、先日MySQL 8.4シリーズが登場したので紹介をしておこうと思う。新機能の解説については機会を改めて書くとして、今回は主にアップグレードにまつわる重要なポイントを書き記しておく。 LTS = Long Term Support 以前の記事でも紹介した通り、MySQL 8.4はLTS = Long Term Supportのバージョンとなっている。長期間サポートするために互換性を最大限保証するバージョンである。前のメジャーバージョンであるMySQL 8.0シリーズのように、シリーズの途中で互換性が破壊されるような変更が入ることは基本的に無い。「バグ修正のためにどうしても仕様を変えなければならない」というような事態が生じる可能性はゼロではない。なので絶対に互換性が保たれるとは言い切れないところであるが、基本的には仕様変更はない方向で今後リリースされていくこ
アトラシアン、新AIサービス「Atlassian Rovo」発表。GoogleドライブやGitHub、Slack、Teamsなど同社内外のサービスを横断してAIが学習、ユーザーを支援 アトラシアンは、同社製品およびGoogleドライブやGitHubなどサードパーティのサービスを横断してAIが情報を学習し、統合的な検索やチャットによる回答を実現することでユーザーを支援してくれる新しいAIサービス「Atlassian Rovo」を発表しました。 AI breaks down yet another barrier! Today at Team '24 we announced Atlassian Rovo – a new product that unleashes a company’s knowledge so teams can make better decisions faster.
「プッチンプリン」をはじめとする江崎グリコのチルド食品が店頭から姿を消した。2024年4月3日に実施した基幹システムの切り替えでトラブルが発生。同社が物流・販売を請け負っていた他社製品を含め、一部商品を出荷できなくなった。同月18日に出荷を一部再開したものの、トラブルは終息せずに再び出荷を停止。システム障害の影響で、当初業績予想より売上高を200億円程度押し下げるとみる。 「スーパーにもコンビニにも『プッチンプリン』が見当たらない」「『カフェオーレ』を長年愛して飲んでいるが、どこの店舗も販売休止中だ」――。2024年4月中旬、X(旧Twitter)で、このような投稿が相次いだ。 江崎グリコの看板商品が店頭から姿を消した理由は、システムトラブルによるものである。同社は2024年4月3日、基幹システムの切り替えを実施した。旧システムを独SAPのERP(統合基幹業務システム)パッケージ「SAP
Amazon EFSのクライアント当たりの最大スループットが1.5GB/sに。これまでより3倍高速なファイルアクセスを実現 AWS(Amazon Web Services)は、スケーラブルなNFSサーバをマネージドサービスで提供する「Amazon EFS」(Amazon Elastic File System)のクライアント当たりの最大スループットを、これまでの3倍となる1.5GB/sに拡大したことを発表しました。 Amazon EFSは、Amazon EC2インスタンスやAmazon EKSポッドなどからNFSプロトコルでマウントして利用するストレージサービスです。あらかじめ容量を決めてプロビジョニングする必要がなく、保存するファイルの大きさに対して自動的にキャパシティが増減していくのが特長です。 同時に数千もの同時接続にも対応するスケーラビリティを備えています。 今回発表された、クライ
Windowsでは、文字コードに「ユニコード」を使う。Windowsに搭載されているフォントはさまざまあるが、ユニコード文字を表示できるように、多数の文字の形が組み込まれている。 今回は、Windowsでユニコードを“見る”方法について解説する。なお、WindowsではUTF-16LEエンコードをUnicodeと表記する。ここでは、エンコードと混同されないために、文字仕様のUnicodeは「ユニコード」とカナ書きすることにする。 GUIアプリでユニコードを使う ユニコード文字は多数ある。それぞれの文字に割り当てられた文字コードをユニコードでは「コードポイント」と呼ぶ。コードポイントは、「U+」の後ろに16進数4桁または6桁で指定するのが正式な表記方法だ。たとえば、「漢」は「U+6F22」となる。ユニコード関連の文書やもちろん、インターネット内のウェブページでも同様の表記をすることが多い。
MacのバックアップシステムTime Machineの進行情報や設定をメニューバーから確認できるユーティリティ「TimeMachineStatus」がリリースされています。詳細は以下から。 Macではシステムのバックアップや一時的なスナップショットを外付けストレージなどに保存できるmacOSデフォルトのバックアップシステム「Time Machine」が存在しますが、このTime Machineのステータスをメニューバーから素早く確認できるユーティリティ「TimeMachineStatus」が新たにリリースされています。 This app is a simple status bar app that shows the status of Time Machine backups. It is still in early development and I’m open for sugg
スマホなどで中国語の入力に使うキーボード・アプリ(IME)のほとんどに入力内容を傍受される脆弱性が存在することが分かった。ファーウェイをのぞくほぼすべての端末にプリインストールされているアプリで見つかったという。 by Zeyi Yang2024.05.11 37 5 世界中の中国語話者が使っているキーボード・アプリ(IME)のほぼすべてに、ユーザーの入力内容を盗み取れるセキュリティの抜け穴が存在することが明らかになった。 この脆弱性は、キーボード・アプリがクラウドに送信するキーストローク・データの傍受ができてしまうというものだ。何年も前から存在し、サイバー犯罪者や国家の監視グループに悪用された可能性があるとトロント大学のテクノロジー・セキュリティ研究機関、シチズン・ラボ(Citizen Lab)の研究チームは指摘している。 漢字入力を楽にできるこうしたアプリは、中国語話者が使用するデバイ
「おすすめ ノベルゲーム 作る」とかで検索すると、エディタ/エンジン名をたくさん並べた記事がヒットしがちですが、実際使ってみないとわからないことも多いかと思います。 2024年5月現在、ノベルゲームを今まで何本か完成・公開している私こと個人ゲーム開発者が、使ったことのあるノベルゲーム制作ツール/エンジンを厳選、おすすめを中心にまとめました。 なお、 -短期開発しか考えていない -凝ったこと、カスタマイズする予定は全くない -ちょっと作ってみたいだけで完成・公開しなくてもよい ……という方には、本稿そんなに参考にならないと思われます。 また、私が各エディタ・エンジンを使ったのは数年前というものもあるので、もし「その情報は古い」「改善している」という知見があればぜひコメントにお書き添えください。 前提:自分に合ったツールを選ぶ基本 ノベルゲーム作ってる人タイムラインにいっぱいいるんだけど、あ〜
オラクルは、Visual Studio Codeなどのコードエディタ上でコードの生成やテストケースの作成、アップグレードの自動化などを可能にするプログラミング支援AI「Oracle Code Assist」を発表しました。プレスリリース、日本語ブログ)。 Oracle Code Assistはさまざまなプログラミングに対応すると同時に、Java、SQL、Oracle Cloudでの開発に最適化されており、コードのコンテキストに沿ったコードの生成や補完、テストなどを生成可能で、また企業ごとにカスタマイズすることも可能です。 例えば、下記は「Create Java Websocket server」と右下のチャット欄で指定すると、右上のウィンドウでJavaのコードが生成されています。 Visual Studio CodeとJetBrains IntelliJ IDEAのプラグインとして提供され
江崎グリコの公式サイトより ほぼすべてのチルド食品(冷蔵食品)が、社内のシステム更新作業に伴う障害により出荷停止となっている江崎グリコ。4月初めに障害が発生し、出荷再開時期がいまだに未定という異例の事態を受け、同社は今月8日、システム障害によって2024年12月期の営業利益が60億円、売上高が200億円下押しされる見通しだと発表した。業績に多大な悪影響が生じるため、グリコがシステム更新プロジェクトの主幹ベンダであるデロイト トーマツ コンサルティングに損害賠償を求めて法的手段を取る可能性も取り沙汰されている。今後の展開について業界関係者や専門家の見解を交えて追ってみたい。 グリコは業務システムについて、独SAPのクラウド型ERP「SAP S/4HANA」を使って構築した新システムへ切り替えるプロジェクトを推進してきた。旧システムからの切替を行っていた4月3日、障害が発生し、一部業務が停止。
「高額なJavaのライセンス料を請求される企業が後を絶たない」――。Javaのライセンスに詳しいITコンサルタントはこのように警鐘を鳴らす。ライセンスを気にせずJavaを利用していたところ、ある日突然、高額なライセンス料を請求されるのだという。 Javaプログラムの開発・実行に欠かせないのが、JDK(Java Development Kit)だ。JDKにはJavaプログラムの開発・実行に必要なソフトウエアが含まれる。例えばJava SE(Java Platform Standard Edition)の仕様に準じたAPI実装やJava仮想マシン(JVM)、Javaコンパイラーなどである。現在、様々なベンダーがJDKを提供し、サポート期間やライセンス料がJDKごとに異なる。 米Oracle(オラクル)が提供するJDKディストリビューションには「Oracle OpenJDK」と「Oracle J
「LINEのセキュリティ」は大問題 TikTokと同じ道をたどるのか:世界を読み解くニュース・サロン(1/5 ページ) 日本人の8割、約9600万人が利用している無料メッセージングアプリの「LINE」。新しいコミュニケーションツールとして2012年ごろから一気に市民権を獲得。写真やファイルを簡単に送れる機能や、キャラクターのスタンプなどが人気を博して、瞬く間に日本人の生活に不可欠なアプリとなった。 クラウド型ビジネスチャットツール「LINE WORKS」などで、深くLINEと付き合っている企業も少なくないだろう。 民間企業は言うまでもなく、中央省庁や地方自治体もLINEアカウントを開設している。例えば、コロナ禍では、経済産業省がLINEで「経済産業省 新型コロナ 事業者サポート」を設置して企業を支援。厚生労働省は海外から日本に入国する人に向けて「帰国者フォローアップ窓口」をLINEで設置し
情報漏えいを受け、LINEヤフーが韓国NAVERへの業務委託の終了を決めた。5月8日に開かれた2023年度通期・第4四半期決算会見で明かしたもので、LINEヤフーが2024年度中と進めていたLINEとPayPayのアカウント連携についても、社内のセキュリティガバナンス強化の優先を理由に計画時期を見直す。 LINEヤフーは、23年10月に不正アクセスによる情報漏えいが発生したと発表。情報流出は、同社と韓国の関連会社NAVER Cloud委託先企業の従業員PCがマルウェアに感染したことをきっかけに、NAVER CloudのADサーバも感染。その管理者権限や、LINEヤフーのADサーバの認証情報が奪取され、不正アクセス被害につながったとみられている。 この件に関し、LINEヤフーは24年3月に総務省から行政指導を受けており、同社は4月に報告書を提出。NAVERのシステムとの分離を進める他、「NA
Raspberry Pi Ltdは2024年5月7日、WebブラウザからRaspberry Piのデスクトップにリモートでアクセスできるサービス「Raspberry Pi Connect」のベータ版をリリースした。 Raspberry Pi Connect -Raspberry Pi Raspberry Pi Connectがでた(どこからでもラズパイにリモートデスクトップ!) | Japanese Raspberry Pi Users Group Raspberry Pi Connectは、ブラウザからRaspberry Pi Connectサーバーを介してRaspberry PiにWebRTCを使用した安全なピアツーピア接続を確立し、手元のブラウザにRaspberry Piデスクトップを表示し操作することができるサービス。使用料は現在は無料。 Raspberry Pi Connec
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く