並び順

ブックマーク数

期間指定

  • から
  • まで

161 - 200 件 / 10544件

新着順 人気順

Unicodeの検索結果161 - 200 件 / 10544件

  • Dockerのログ収集方法の調査 - Qiita

    すべてのログは標準出力・標準エラー出力に出力 ・Dockerのlogging driver ・ログの集約がしづらい ・Fluentdに転送設定 コンテナ起動時に既にFluentdが死んでいる場合、コンテナが起動できない など。詳細は以下のサイトを参照 Dockerコンテナ上のログ集約に関するまとめ Dockerのlogging driver: それぞれの特徴と使いどころ(json-file, syslog, journald, fluentd) 対象のログ リアルタイムに出力されるログが対象 ・Fluentd / fluentd-ui ・FluentBit ・Filebeat ・Logstash 既にあるログが対象 ・Embulk Fluentdのバッチ版Embulk(エンバルク)のまとめ Docker-composeを使ってEmbulk,Elasticsearch,Kibana環境を構築

      Dockerのログ収集方法の調査 - Qiita
    • SQLで始める自然言語処理 - やむやむもやむなし

      こちらの記事はRecruit Engineers Advent Calendar 2020の24日目の記事です。メリークリスマス! adventar.org 仕事の分析で使うデータはほとんどがBigQueryに保存されているため、基本的な分析作業の多くはBigQueryでSQLを書くことで行なっています。 BigQueryでテキストデータを扱おうと思うとSQLではできない or 取り回しが悪いことも多く、一度Pythonでスクリプトを書いてその結果を再度BigQueryのテーブルに格納し、Joinして分析に使うということをしていました。 しかしこのやり方だとテキストデータを分析したいときは毎回Pythonのコードを書きにいかねばならず、またPythonでのテキスト処理も決して早いとはいえず、せっかくBigQueryでさくさく分析しているのにどうしてもテキスト処理に部分が作業時間のボトルネッ

        SQLで始める自然言語処理 - やむやむもやむなし
      • ろるくん ☪︎.° ໒꒱ on Twitter: "まったくもってどういう商品かわからなくて怖い https://t.co/qgPLknAZly"

        まったくもってどういう商品かわからなくて怖い https://t.co/qgPLknAZly

          ろるくん ☪︎.° ໒꒱ on Twitter: "まったくもってどういう商品かわからなくて怖い https://t.co/qgPLknAZly"
        • UTF-8 の文字列をできる限り Shift_JIS に変換したい - きりきりやま

          Shift_JIS の CSV で連携する外部サービスがあり、DB では UTF-8 でテキストを持っていたため文字コードを変換する必要が生じた。 ところが UTF-8 に存在する多くの文字は Shift_JIS に対応がないため変換することができない1。 そこで、事前に NFKC 形式で Unicode 正規化することで変換可能な文字を増やすことを試みた。 まずは Unicode 正規化の前提として、Unicode の正準等価と互換等価について説明する。 以降の U+16進数 という表記は Unicode のコードポイント (文字に ID のようなものが割り当てられている) を示す。 また、コードポイントに対応する文字の詳細は https://codepoints.net/ といったサイトで確認することができる。 正準等価 例として、ひらがなの「が」について考える。Unicode では「

            UTF-8 の文字列をできる限り Shift_JIS に変換したい - きりきりやま
          • Go: A Documentary

            Go: A Documentary by Changkun Ou <changkun.de> (and many inputs from contributors) This document collects many interesting (publicly observable) issues, discussions, proposals, CLs, and talks from the Go development process, which intends to offer a comprehensive reference of the Go history. Disclaimer Most of the texts are written as subjective understanding based on public sources Factual and ty

            • ごめんの意味でよく使われている絵文字『🙏』は各国ではどういう意味で使われてる?「相手によっては別の捉え方をされるのか」

              天野彬|日経Think! 公式コメンテーター @akira_amano 🙏←これ手を合わせて「ごめん」してる絵文字だと思って使ってたんだけど、本当は「ハイタッチ」らしい。割と逆の意味で草 2022-02-03 14:04:44 ​め​ぐ​ぷ​に​ゅ​ 󠁀󠁍󠁥󠁧󠁐󠁵󠁮󠁹󠁵 @MegPunyu The Unicode Standard, Version 14.0 によると U+1F64F PERSON WITH FOLDED HANDS • can indicate sorrow or regret • can also indicate pleading, praying, bowing, or thanking とあるので元々は落胆や悔恨の様子を表してるらしいですね お願いや感謝という意味もついてるけどハイタッチはない twitter.com/mobile_neko/s

                ごめんの意味でよく使われている絵文字『🙏』は各国ではどういう意味で使われてる?「相手によっては別の捉え方をされるのか」
              • (プログラマのための)いまさら聞けない標準規格の話 第2回 文字コード実践編 | オブジェクトの広場

                プログラマがシステム開発において共通で必要となる、技術と業務の狭間の共通知識を解説します。連載第2回は文字コードの実践編です。 0. 前回の復習と今回の概要 システム開発で必要となる標準規格の話、前回 は文字コードの概要について説明しました。ざっくりまとめるとこんな内容でした。 「符号化文字集合」で文字集合と符号位置を定義し、「符号化方式」でバイト表現に変換していること。 日本では、しばらく文字集合 JIS X 0208 を、ISO-2022-JP、EUC-JP、Shift_JIS の符号化方式で利用してきたこと。 近年は、世界中の文字が扱える Unicode が主流となっており、UTF-8、UTF-16 などの符号化方式があること。 常用漢字、人名用漢字に限っても、字体を正確に扱おうとすると、JIS X 0208 の範囲では不十分であり、JIS X 0213、Unicode、サロゲートペ

                  (プログラマのための)いまさら聞けない標準規格の話 第2回 文字コード実践編 | オブジェクトの広場
                • エンジニアは4つのタイプに分けられる クレディセゾンCTOが説く、自分の強みを活かす「エンジニア風林火山論」

                  研修後すぐに希望のアメリカ支社で働けた理由 青野慶久氏(以下、青野):それでは最後のゲストをお招きしたいと思います。今回EGO&PEACEというテーマを掲げまして、どなたに登壇いただこうかと思っている時に、『その仕事、全部やめてみよう』という1冊の本がこの夏に流行りました。 私はこう思ったわけです。「なんというエゴの塊だと(笑)」。 この著者は小野和俊さんと言いまして、私も以前から仲良くさせていただいております。今日は小野さんにお越しいただいておりますので、お招きしたいと思います。小野さん、よろしくお願いします。 (会場拍手) 青野:ようこそお越しくださいました。 小野和俊氏(以下、小野):こんにちは。 青野:よろしくお願いします。たぶん小野さんのことを知っている方はたくさんいらっしゃると思うんですよね。でも、クレディセゾンの役員というより、DataSpider(※株式会社セゾン情報システ

                    エンジニアは4つのタイプに分けられる クレディセゾンCTOが説く、自分の強みを活かす「エンジニア風林火山論」
                  • ソースコードに脆弱性を潜ませられるUnicode悪用攻撃法「Trojan Source」を研究者が発表

                    英ケンブリッジ大学コンピュータ研究所は11月1日(現地時間)、「Trojan Source:Invisible Vulnerabilities」(リンク先はPDF)という論文を公開した。Trojan Sourceは、「人間のコードレビュアーには見えないターゲットを絞った脆弱性を作成するためのクールな新トリック」という。 研究者のロス・アンダーソン氏は、「Unicodeの方向性オーバーライド文字を使って、コードを別のロジックのアナグラムとして表示するこの攻撃は、C、C++、C#、JavaScript、Java、Rust、Go、Pythonに対して機能することを確認しており、他のほとんどの言語に対しても機能すると思われる」と説明する。 「人間が見るのと異なるロジックをコンパイラに示せるように、ソースコードファイルのエンコーディングを操作する方法を発見した」。コメントや文字列に埋め込まれた制御文

                      ソースコードに脆弱性を潜ませられるUnicode悪用攻撃法「Trojan Source」を研究者が発表
                    • Web フォントを使って contenteditable から脱出する - LINE ENGINEERING

                      LINE株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。 LINEヤフー Tech Blog こんにちは、LINE フロントエンド開発センターの玉田です。突然ですが、本日よりフロントエンド開発に携わる UIT のエンジニアが持ち回りで記事を公開する「UIT 新春 Tech blog」を開催します。 UIT のメンバーが普段の業務で得た知識や、年末年始でたまった知見などを共有していきます。本記事の公開から 1 月 28 日 (金) まで、平日の毎日違うメンバーが記事を公開していきます。ぜひ最後まで見に来てください! トップバッターは私から、フロントエンドエンジニアを悩ませる contenteditable からの脱却についてです。 contenteditable の呪い みなさんは contenteditable につい

                        Web フォントを使って contenteditable から脱出する - LINE ENGINEERING
                      • あなたのCSS力の助けになってくれる素晴らしいWebサイト12選 - Qiita

                        以下はAman Varma( Twitter / GitHub / stackoverflow / Webサイト )による記事、12 Super websites to help you with your CSS problems ☺の日本語訳です。 12 Super websites to help you with your CSS problems ☺ これらは、あなたのCSSをより楽しく簡単に装飾してくれる、そしてもしかしたらあなたが躓いているCSSの問題の多くを解決してくれるかもしれないWebサイトたちです。 1. Pixel art あなたもきっとピクセルアートが好きに違いありません。 90%の人はpngでピクセルアートを書いてサイトに追加していると思いますが、でもそのピクセルアートをCSSで書けたらもっといいと思いませんか? そこでPixel Art to CSSです。 書

                          あなたのCSS力の助けになってくれる素晴らしいWebサイト12選 - Qiita
                        • プロと読み解く Ruby 3.2 NEWS - クックパッド開発者ブログ

                          技術部の笹田(ko1)と遠藤(mame)です。クックパッドで Ruby (MRI: Matz Ruby Implementation、いわゆる ruby コマンド) の開発をしています。お金をもらって Ruby を開発しているのでプロの Ruby コミッタです。 昨日 12/25 に、恒例のクリスマスリリースとして、Ruby 3.2.0 がリリースされました(Ruby 3.2.0 リリース)。今年も Ruby 3.2 の NEWS.md ファイルの解説をします。NEWS ファイルとは何か、は以前の記事を見てください。 プロと読み解く Ruby 2.6 NEWS ファイル - クックパッド開発者ブログ プロと読み解くRuby 2.7 NEWS - クックパッド開発者ブログ プロと読み解くRuby 3.0 NEWS - クックパッド開発者ブログ プロと読み解く Ruby 3.1 NEWS -

                            プロと読み解く Ruby 3.2 NEWS - クックパッド開発者ブログ
                          • PDFから「使える」テキストを取り出す(第1回) - golden-luckyの日記

                            PDFからテキストを取り出すのは、意外と大変です。 それにはいくつかの理由があるのですが、もっとも根本的な点で真っ先に解決が必要になるのは、人間が雑に文字としてみなしている絵(「グリフ」)をコンピューターで扱えるような「文字」にする方法です。 これには2つのアプローチが考えられます。 PDFビューワーでファイルを開いた状態から何とかしてテキストを読み取る PDFファイルの中身を解析してテキストを抜き出す このうち2つめの話は明日以降にして、今日は1つめの話をします。 PDFビューワーでファイルを開いた状態から何とかしてテキストを読み取る方法 この方法は、言ってみれば、人間もしくは人間のように振る舞うソフトウェアによりPDFビューワーの表示を「視覚的に読む」ということです。 これはPDFの本来の使い道に即した手法です。 PDFというのは、グリフ(文字の形)をページ上に表示するための汎用の仕組

                              PDFから「使える」テキストを取り出す(第1回) - golden-luckyの日記
                            • Rust ツアー - Let's go on an adventure!

                              こんにちは、 Rust ツアーへようこそ。 これはプログラミング言語 Rust の機能を段階的にガイドすることを目的としています。 Rust は学習曲線が急な言語だと見なされることが多いですが、 複雑な事項に進む前に探ることがたくさんあると納得していただければと思います。 このガイドは以下の言語で見ることができます。 Deutsch English Español Français Interlingue Magyar Polski Português Brasileiro Română Русский 简体中文 繁體中文 日本語 한국어 Türkçe Українська ภาษาไทย Tiếng Việt コンテンツへの提案や翻訳に貢献したい場合、 Rust ツアーの github リポジトリをチェックしてください。 キーボードの ⬅️ と ➡️ でツアーをナビゲートできます。 この

                              • MySQL 8.0のクライアントでMySQL 5.7のサーバーに接続するとcharsetが設定されないかもしれない - かみぽわーる

                                mysql_options(mysql, MYSQL_SET_CHARSET_NAME, cs_name) だけして mysql_real_connect(mysql, ...) した後SHOW VARIABLESしてみたら接続のcharsetが設定済みの挙動をするんやけどmysql_real_connectからの一連のコード読んでもどこでそれが起きるのかわからん誰かたすけて🥲https://t.co/ZScoD3tIQ8— Ryuta Kamizono (@kamipo) February 20, 2021 MySQLのハンドシェイクパケットにcollation_idを1バイトだけ入れられるところがあって、charset name のデフォルトの collation_id を送っています。 クライアントとサーバーのバージョンが違うとデフォルトのcollation_idが違うことがあって

                                  MySQL 8.0のクライアントでMySQL 5.7のサーバーに接続するとcharsetが設定されないかもしれない - かみぽわーる
                                • ワンライナーで CSV に対して SQLite クエリを実行する - アルパカの徒然文

                                  One-liner for running queries against CSV files with SQLite という記事で紹介されていた、ワンライナーを使って CSV ファイルに対して SQL クエリを実行する方法。 $ sqlite3 :memory: -cmd '.mode csv' -cmd '.import taxi.csv taxi' \ 'SELECT passenger_count, COUNT(*), AVG(total_amount) FROM taxi GROUP BY passenger_count' ソース元に記述されてる通り、taxi.csv を GitHub からダウンロードして試すことができる。7z で圧縮されていて解凍する必要がある。 SQLite は通常ストレージディスク(SSD とか)上に保存して利用するのが一般的だが、SQLite 側で用意さ

                                    ワンライナーで CSV に対して SQLite クエリを実行する - アルパカの徒然文
                                  • 「新しいBing」の中華フォントを日本語フォントにする - ただいま村

                                    チャットAIが組み込まれた「新しいBing」に先行利用を申し込んで、3日ほどで使えるようになった。 新しい Bing - 詳細情報 さて、なにを聞いてみようかな。そうだ邪馬台国の場所を聞いてみよう。 いい感じの回答が出てきた。先行しているチャットAIの「ChatGPT」だとどうだろうか。 New chat ChatGPTに邪馬台国の場所を聞くとこんな調子である。 「ChatGPTはもっともらしい嘘をつく」の典型である。しかし人間も知らないことをあえて聞くのは意地悪だった。ChatGPTは聞かれたことに「知らない」と返すと鼻が伸びる奇病にかかっているため(嘘)、作り話をしてでもなにか答えを返そうとする。 新しいBingにまじめなことを聞いてみた。 いいですね。特にウクライナ侵攻や、6日に発生したトルコ・シリアの大地震という最新の情報が盛り込まれているのがよい。ChatGPTは2021年までの

                                      「新しいBing」の中華フォントを日本語フォントにする - ただいま村
                                    • 急なレスポンスタイム悪化から、オープンソースプロジェクトにPull Requestを送るまで - 弥生開発者ブログ

                                      こんにちは、Misoca開発チームの黒曜(@kokuyouwind)です。 最近はシャニマスのイベントシナリオ感想記事をnoteにまとめたりしています。 😨 急に本番のレスポンスタイムが悪化した話 Webエンジニアにとって、「本番障害」という4文字ほど見たくないものはないでしょう。 本番障害ほどではないにしても、「急なレスポンスタイム悪化」もあまり見たくない文字列ですね。まぁ、見たくなくても向こうからやってくるんですが… というわけで、今回は本番レスポンスが急に悪化したときの話です。いろいろ調べた結果、利用しているオープンソースプロジェクトが原因だったことがわかりPull Requestを送ったので、その流れをまとめてみたいと思います。 ❗️ レスポンスタイム悪化の検知 Misocaでは監視ツールとしてMackerelを、APMツールとしてSkylightを利用しています。 本番レスポン

                                        急なレスポンスタイム悪化から、オープンソースプロジェクトにPull Requestを送るまで - 弥生開発者ブログ
                                      • GoのAPIが厳格でない訳

                                        Windows対応の曖昧なAPIを非難する記事 この記事はGoが曖昧に扱うAPIについて非難していて、より厳格に扱うことのメリットを解説しています。 Goのこれらの指摘の挙動が実際にどの様なものかを解説していきます。 無視する挙動 Goの標準ライブラリのAPIはどちらかというとUnix/Posixに寄せていて、一部のWindowsに無い概念に関する処理(ファイルのパーミッション操作など)は黙って無視したりする。 これはUnix/Posix用の実装が同じソースコードのままWindowsでも動作するために必要なダミーです。ここでそのようなダミー実装をアプリケーション作成側の責任にすると実装やテストが大変面倒になってしまう。 逆に、GoではUnix/Posixにあるforkやthreadに関するAPIをサポートしません。特にforkというAPIはWindowsには全くない概念であり、互換性を取る

                                          GoのAPIが厳格でない訳
                                        • 僕は、なぜ絵文字の長さが、直感に反するのか理解したい...!! - Qiita

                                          対象者 UnicodeやUTF-16について、よくわかってない人 -> ここから "😀".split("")で文字化けする理由がわからない人 -> ここから [..."👨‍👩‍👧"].lengthが5になる理由がわからない人 -> ここから 文字コードについてもう一度 文字コードは以下の二つで構成されています 符号化文字集合: 文字と、その文字の位置を示す一意の番号の集合 文字符号化方式: 文字に振られた番号をバイト表現にエンコードする方法 符号化文字集合 符号化文字集合は、 文字 その文字の位置を示す一意の番号 この二つの組み合わせの集合のことを指します。 例えばASCIIでは 8bit(128通り) でラテン文字や英数字を表現しています。 しかしASCIIには日本語などの非英語圏の文字が収録されていません。 そのため、日本語を収録したShift-JISやアジア圏の文字を収録した

                                            僕は、なぜ絵文字の長さが、直感に反するのか理解したい...!! - Qiita
                                          • MySQLバージョンアップによるInnoDB性能劣化可能性事件簿

                                            一般論ですが、どんな基盤ソフトでもCPUスケールを上げようとすれば、何らかの排他制御を細かく行うことになるのでCPUのパイプライン処理にブレーキをかけるアトミックな処理が増えて、バージョンが上がるとある程度はシングルスレッドの処理は重くなっていきます。前エントリのような言語の高度化により遅くなる事情もあります。(中には、Redisのように並列を捨てて排他処理を完全排除する潔い逆振りプロダクトもありますが。) とはいえ、「これは(条件付きとはいえ)急に遅くなりすぎだろ!」と私も思うバージョン(回避策はある&一開発者の一存ではどうにもできない)があるので遡って何点か挙げて注意喚起したいと思います。 これらはある程度限られた条件で発生するので世間では怪奇現象扱いされている可能性もあります。 何故こんなことになるのかというと、基盤となるmysqld側の変更に上手くついていけなくなってるか、性能上メ

                                            • GitHub - wader/jqjq: jq implementation of jq

                                              123, .123, 1.23, 1.23e2, 1.23e+2, "abc", true, false, null Scalar literals Unicode codepoint escape "\ud83d\ude03" Handle surrogate pairs \ud800-\udfff, should translate to codepoint. Control code and quote escape "\"\n\r\t\f\b\\\/" "abc \(123)" String interpolation {key: "value"} Object literal {key} {"key"} {$key} {(f): f} {("a","b"): (1,2), c: 2} Multiple key/value outputs {"\("abc")": 123} Key

                                                GitHub - wader/jqjq: jq implementation of jq
                                              • Programmer's Pocket Reference はいいぞ…!

                                                本記事は【推し祭り】技術書典で出会った良書 Advent Calendar 2019の1日目として書かれた記事です。 vvakameです。 1日目ということで、熱っぽくやっていきたいと思います。 僕は技術書典7でNanoseconds Hunterさんが頒布したProgrammer’s Pocket Referenceを紹介します! 先に書いておきますが、現時点では上記リンクからBOOTHさん経由で電子版を購入することができます。 よかったですね。 時は技術書典7からおおよそ5日後、社で毎週金曜日に行われている社内勉強会で、僕が購入し、電子データがあった戦利品すべてに短評を述べ、みんなの購買意欲を煽る儀式をやりました。 そこで、あまりに熱のこもった本があったので気持ちになってしまった時のツイートがあるので引用しておきます。 社内で技術書典7で売ってたProgrammer’s Pocket

                                                  Programmer's Pocket Reference はいいぞ…!
                                                • Haskell書いてるときになんとなく気をつけていること - LugendrePublic

                                                  信頼性はない 都市伝説かもしれん 大体枕詞に特別な理由がなければがつく 思いついたら徐々に更新する それは違うよってことがあったら @Lugendre まで ghc 8.6.5の話(8.8.1は仕事で使ってなくてな......) コンパイル通るかの確認だけなら最適化オプションO0でコンパイルする stackでいうとstack build --fast 動かすときはO2ビルドしたほうがいいが,インライン展開に5億年消費する なんならこのくらいは静的解析に任せてもいいが,でかいプロジェクトだと一定時間動いてハングアップするのしか世の中にないのでオワリ VSCode のせい説もある ghcideに期待 haskell-language-serverがすべてを解決した CIするときは必ずキャッシュする 毎回一から依存関係やGHCのビルドが走って余裕で1時間超えるようになるので データ構造のフィール

                                                    Haskell書いてるときになんとなく気をつけていること - LugendrePublic
                                                  • FacebookのHermesというJSエンジンがエロい - Qiita

                                                    FacebookがHermesという組み込みのJSエンジンを公開したようです。 ReactNative用の組み込み用のJSエンジン(最新版だとオプション切り替えで使えるっぽい) MITライセンス プロプラなものとの組み合わせが発生しうる組み込みにおいては正義しかない ES2015をサポート(予定) 現時点ではクラスとかlet/constのブロックスコープは実装途中 Map/Setとかの組み込みクラス系は実装済み サイズの小ささをうたった処理系はES2015への対応はまだまだなのが多いので(Duktapeとか)良い 事前にJavaScriptのソースコードをパースして中間表現(LLVM IRをそのまま利用?)にしておいてロードする モバイルのCPUやバッテリー、メモリーにも優しい なお、エロいというのは強く感情が揺さぶられた結果が出てきたワードであってセクシャルな内容は一切含まれておりません

                                                      FacebookのHermesというJSエンジンがエロい - Qiita
                                                    • 日本の漫画やアニメやゲームはガラパゴスなのか? - 狐の王国

                                                      なにやら最近、日本のアニメやゲームや漫画をガラパゴスだとか言ったり、ガラパゴスでいいんだとか言ったりしてる人たちを散見する。結論から言おう。日本のアニメもゲームも漫画もまったくガラパゴスではない。 ガラパゴス化批判というのは主に日本の携帯電話に対して行われてきたものだ。 NEC docomo N-01G ブラック メディア: 俺がさんざん日本のケータイはガラパゴスだと言い続けてきたのは、日本におけるOSSの幻想――OSS界のガラパゴス諸島、ニッポンという2004年の記事が元である。 OSS振興の流れは出てきたが、こと日本はOSSに関して独自の進化(退化?)を遂げている部分があると同氏は指摘する。その原因としては、英語という大海で遮断された状況からくる甘えの精神構造、貧弱な開発力とコミュニケーション下手であることなどが挙げられるようだ。 (中略) 問題なのは、本流とかい離し、日本独自の動きを

                                                        日本の漫画やアニメやゲームはガラパゴスなのか? - 狐の王国
                                                      • EOL対応はシステム見直しを行うベストタイミングである - MonotaRO Tech Blog

                                                        今回のミッションと問題 テスト環境 テストの方針 全体像を知ったからできたこと テストを通じてあるべき姿を知る まとめ こんにちは。モノタロウで開発担当している竹原です。 皆さんは、EOL対応についてどのようなイメージをお持ちでしょうか? EOL(End Of Life)とは、ハードウェアやソフトウェア製品の販売や生産、ベンダーのサポートや修正・更新プログラムの提供終了を意味します。EOLを放っておくと脆弱性や不具合を抱えたまま運用することになりかねないため、基本的には対応必須です。 とは言いつつも、不具合を出すリスクもあり作業内容としては広範囲のテスト作業となるため、入れ替えるハードウェアやソフトウェアに劇的な機能向上が無ければ、コストに見合う価値が得られません。しかし、確認範囲が広いという点を逆手にとるとシステム全体を見直す良い機会でもあります。 今回、私のチームでPythonのEOL

                                                          EOL対応はシステム見直しを行うベストタイミングである - MonotaRO Tech Blog
                                                        • Kubeflow Pipelinesで日本語テキスト分類の実験管理 - やむやむもやむなし

                                                          機械学習ワークフロー管理ツールであるKubeflowのPipelines機能を使って日本語テキスト分類の実験管理を行います。 この記事ではKubeflowのチュートリアルに従ってKubeflowのクラスタを構築してPipelinesを動かし、最後に日本語のデータセットをKubeflow Pipelinesに実際に乗せて機械学習のワークフロー管理を行うところまでまとめていきます。 Kubeflow Kubeflowとは Pipelinesとは GKEでKubeflowクラスタの構築 クラスタ構築 Workload Identityの設定 Pipelinesの基本的な使い方 Pipeline/Experiment/Run PipelineとComponent PipelineとDSL 実験管理としてのKubeflow Pipelines 日本語テキスト分類 with Pipelines Pip

                                                            Kubeflow Pipelinesで日本語テキスト分類の実験管理 - やむやむもやむなし
                                                          • Everything you need to know from ES2016 to ES2019

                                                            JavaScript is a language in constant evolution and in the past few years many new features have been added to the ECMAScript specification. This article is an extract of my book Complete Guide to Modern JavaScript and it covers the new additions of ES2016, ES2017, ES2018, ES2019. At the end of the article you will find a link to download a cheatsheet that summarizes everything. Everything new in E

                                                              Everything you need to know from ES2016 to ES2019
                                                            • 本当に怖い、Babelの更新 - Chatwork Creator's Note

                                                              こんにちはー。突然ですが、聞いてくださいよー。 Babelのバージョンアップしたら「Chatworkのルーム切り替えが重くなった」と社内で言われてしまいました。 みんなの仕事の効率を悪くするわけにもいかないので、戻すしかありません。Babelの更新って、本当に怖いですよねー。 そんなわけで、こんにちは。フロントエンド開発部のひむら(id:eiel)です。 さて、この話自体は少し前のことなのですが、その際に原因を特定する余裕がなく、Babelの更新は後回しになっていました。 ルーム切り替え自体が歴史的経緯もあって、「とーっても」*1難易度が高くなっていて、最悪これを改善すれば更新できるだろうと期待もしてたりもしました。 ところが、うっかり再発させてしまったので、ここで気合をいれて改善することにしました。 今日はその話を記録しておきます。 要約 経緯 原因の特定 試しにIE11をターゲットから

                                                                本当に怖い、Babelの更新 - Chatwork Creator's Note
                                                              • エキスパートたちのGo言語 一流のコードから応用力を学ぶ

                                                                2022年1月7日紙版発売 2021年12月27日電子版発売 上田拓也,青木太郎,石山将来,伊藤雄貴,生沼一公,鎌田健史,上川慶,狩野達也,五嶋壮晃,杉田寿憲,田村弘,十枝内直樹,主森理,福岡秀一郎,三木英斗,森健太,森國泰平,森本望,山下慶将,渡辺雄也 著 B5変形判/400ページ 定価3,278円(本体2,980円+税10%) ISBN 978-4-297-12519-6 Gihyo Direct Amazon 楽天ブックス ヨドバシ.com 電子版 Gihyo Digital Publishing Amazon Kindle ブックライブ 楽天kobo honto 本書のサポートページサンプルファイルのダウンロードや正誤表など この本の概要 本書は,中級以上のGoプログラマーがツール開発・プロダクト開発で必要とされるプログラミングテクニックおよび周辺知識を学ぶための実践集です。 Go

                                                                  エキスパートたちのGo言語 一流のコードから応用力を学ぶ
                                                                • 絵文字×絵文字=カオス? 「Emoji kitchen」がSNSで話題 X上では大喜利状態に

                                                                  米Googleが提供する「Emoji kitchen」がSNSで話題だ。Emoji kitchenは2つの絵文字をミックスして新しい絵文字を生み出す機能。これまでAndroid向けキーボードアプリ「Gboard」で提供していたが、9月15日までにGoogle検索からも利用可能になり、X(元Twitter)ではカオスな絵文字を投稿するユーザーが相次いでいる。 Google検索版Emoji kitchenは「Emoji kitchen」と検索することで、PCとスマートフォンの両方で利用できる。選択できる絵文字は230種類以上あり、2つの絵文字を選ぶことで新しい絵文字を生成できる。 例えば「雨雲」と「にこやかな笑顔」を組み合わせると「にこやかな笑顔の雨雲」の絵文字を生成する。笑っている顔の代わりに「大声で泣いている顔」を組み合わせてやれば「大声で泣いている雨雲」ができるなど、ある程度パターン化さ

                                                                    絵文字×絵文字=カオス? 「Emoji kitchen」がSNSで話題 X上では大喜利状態に
                                                                  • 日本語の単語を適切な位置で区切って読みやすく改行してくれる軽量でオープンソースなライブラリ「BudouX」の機能&採用例&デモはこんな感じ、Chrome 119に実装予定で簡単に利用できる見込み

                                                                    日本語のページをブラウザで見ているとおかしな位置で改行されることが多いのですが、単語と単語の間にスペースを入れる英語などと異なり、日本語では分かち書きがされていないのが原因。単語の途中で文章が折り返されてしまう原因になっています。BudouXは機械学習モデルを利用して容量を抑えつつ、サードパーティーのAPIやライブラリに依存せずに分かち書きを行ってくれるオープンソースライブラリなので、読みやすい改行が実現できます。 Google Developers Japan: BudouX: 読みやすい改行のための軽量な分かち書き器 https://developers-jp.googleblog.com/2023/09/budoux-adobe.html BudouXの使用イメージは下図の通り。従来は画面幅によっては「最先端」や「テクノロジー」などの単語の途中で改行が行われてしまう事がありましたが、

                                                                      日本語の単語を適切な位置で区切って読みやすく改行してくれる軽量でオープンソースなライブラリ「BudouX」の機能&採用例&デモはこんな感じ、Chrome 119に実装予定で簡単に利用できる見込み
                                                                    • Pythonプログラマが30分でわかるR - Qiita

                                                                      Pythonで統計処理をしているが、Rでコードを書いたことがない方々のために、30分から1時間で読めるR入門を書きました。この記事の R Markdown 文書と実行環境は、こちらの GitHubレポジトリ にあります。 目次 準備 プログラミング言語Rの基本 基本型 演算 Assertion ベクトルの要素数とrange リスト DataFrame (tibble) Matrix 関数 いろいろな処理と込み入った話題 文字列処理 強制型変換 等差数列 集合演算 日時と時刻 クラス 参照渡しと copy-on-modify デフォルト値 Assertionで実行を止める コマンドライン引数を解析する CSVファイルを読んで集計する ディレクトリを作る CSVファイルを読む グラフを描く CSVファイルを加工する それぞれの行を集計する それぞれの列を集計する 行をグループ化する カテゴリ変

                                                                        Pythonプログラマが30分でわかるR - Qiita
                                                                      • MySQLのcollationの動作を体系的に理解する - shallowな暮らし

                                                                        はじめに collationとは二つの文字の間の順序を定義するものです。こう言われるととても単純に聞こえるのですが、MySQLのcollationの詳細な動作は実は結構複雑です。 この記事はcollationの挙動に関する体系的な解説と様々な具体例を元にcollationに対する理解を深め、collationの問題のトラブルシューティングの筋道を立てる事を目的としています。なお、この記事は大まかなcollationの動作の説明を目的としており、全てを網羅しているわけではありません。詳細な動作はMySQLの公式ドキュメントの方が丁寧ですので実際のトラブルシューティングではドキュメントもご活用ください。 なお、この記事での検証はMySQL8.0.31を利用しています。 collationの基礎 collationは冒頭で説明したように二つの文字の順序関係や同値関係を決めるものです。collat

                                                                          MySQLのcollationの動作を体系的に理解する - shallowな暮らし
                                                                        • Python関連記事まとめ | note.nkmk.me

                                                                          環境情報・設定 Pythonのバージョンを確認、表示(sys.versionなど) Pythonが実行されている環境のOSやバージョン情報などを取得 カレントディレクトリを取得、変更(移動) 実行中のファイルの場所(パス)を取得する__file__ 環境変数を取得・追加・上書き・削除(os.environ) 再帰回数の上限を確認・変更(sys.setrecursionlimitなど) コードの書き方・ルール Pythonはインデント(スペース4文字)でブロックを表す 識別子(変数名など)として有効・無効な名前、命名規則 キーワード(予約語)一覧を確認するkeyword 長い文字列を複数行に分けて書く メソッドチェーンを改行して書く pip(パッケージ管理) パッケージ管理システムpipの使い方 pipでrequirements.txtを使ってパッケージ一括インストール pip list /

                                                                            Python関連記事まとめ | note.nkmk.me
                                                                          • 【感想】『JavaScript Primer 迷わないための入門書』でモダンJS再入門 #jsprimer - Rのつく財団入り口

                                                                            JS完全に理解した……(し て ま せ ん) 見出しはエンジニア界隈でお馴染みのダニング=クルーガー曲線のアレでございます。2020年6月に出たばかりの最新のJS本を読んだので書評です。 570ページ余りの分厚さで電子版もあり。著者はECMAScriptの仕様にも関わっているazuさん、Angular日本ユーザー会代表のSuguru Inatomiさんと強力な布陣。ES2015(ES6)以降も進化を続けるJavaScriptについて、完全にES6をベースにしたモダンな入門書となっています。 コンテンツはGitHubで管理されてオープンソースとして執筆され、様々な人がコントリビュートした結果が反映される面白い作り方になっています。Web版もすべて無料で参照できるのですが、こういう体系的な情報はまとまった本で学ぶことにしているので電子版で読みました。 僕も2017-2018年ごろに掛けてJS&

                                                                              【感想】『JavaScript Primer 迷わないための入門書』でモダンJS再入門 #jsprimer - Rのつく財団入り口
                                                                            • 競技プログラマーからセキュリティエンジニアになった話 | Recruit Tech Blog

                                                                              はじめに このエントリは全5回を予定する19卒新人ブログリレーの第1回目です。 はじめまして、リクルートテクノロジーズ新卒二年目の藤原 巧と申します。 私は、競技プログラミングを強みとして入社し、現在はプラットフォームセキュリティグループという部署でセキュリティエンジニアとして活動しています。 競技プログラミングといえば、プログラムの高速化が得意といった、セキュリティとはあまり縁のないイメージを持つ方も多いと思います。 ここでは、そんな競技プログラマーの藤原がセキュリティエンジニアとして働く上で、競技プログラミングの経験がどう活きているのかについてご紹介したいと思います。 想定読者 この記事は、 競技プログラマーだけど将来のキャリアに悩んでいて、その一例を知りたい人 競技プログラマーがどんな人なのか、その一例を知りたい人 を対象に書いています。 そんな方々の参考になれば幸いです。 競技プロ

                                                                                競技プログラマーからセキュリティエンジニアになった話 | Recruit Tech Blog
                                                                              • Blue/Green デプロイを使用した、RDS MySQL/PostgreSQLのアップグレード

                                                                                TL;DR RDS の メジャーバージョンアップグレード を行なった PostgreSQL 11.6 -> 15.5 MySQL 5.7.44 -> 8.0.36 PostgreSQL は AWS CDK を利用した、自前での手動切り替えをベースにした Blue/Green デプロイによるアップグレードを行なった MySQL は AWS コンソールから AWSが提供している機能である RDS Blue/Green Deployments による MySQL のアップグレードを行なった nginx の ngx_http_proxy_module を活用してサービスのダウンタイムを防止した はじめに 初めまして。株式会社ジーニーの GENIEE CHAT開発チームのマネージャーを担当しています。 今回は、データベースのメジャーアップグレードを行った際の手順やポイントなどを書いていこうと思います

                                                                                  Blue/Green デプロイを使用した、RDS MySQL/PostgreSQLのアップグレード
                                                                                • Next steps toward Go 2 - The Go Programming Language

                                                                                  Robert Griesemer, for the Go team 26 June 2019 Status We’re well on the way towards the release of Go 1.13, hopefully in early August of this year. This is the first release that will include concrete changes to the language (rather than just minor adjustments to the spec), after a longer moratorium on any such changes. To arrive at these language changes, we started out with a small set of viable

                                                                                    Next steps toward Go 2 - The Go Programming Language