こんにちは。エムスリーデータ分析グループの中島です。 本記事ではマーケティングやデータサイエンスの文脈で重要度が高まっている統計的因果推論への足掛かりをデータ分析グループの業務と結び付けながらご紹介したいと思います。 1. はじめに「A→Bの因果関係がある」とは、Aへ介入する(Aを変化させる)ことよって、要因Bを変化させることができることを意味します。 具体例で考えると、投薬(A)の有無によって病気の治癒率(B)が変化する場合、投薬→治癒率の因果関係があるといえるわけです。 このような因果関係をデータを活用して解き明かそうとするのが統計的因果推論の目的ですが、大別するとさらに次の2つに分類されます。 (1) 因果の方向を既知のものとして因果の大きさを評価(因果推論) (2) 因果の方向の決定・探索(因果探索) これらの基本的な考え方と手法について紹介をしたいと思いますが、その前に重要な概念
「人の話が処理出来ない奴へのアドバイス」に関する補足元エントリにはてブが1700もつき、Twitterでも関連ツイートが千バズ、万バズになり、それらの閲覧数の合計が7桁になっていたのにはびっくりした。 「言語化されていないが切実な課題」だったのだな、と強く感じている。 そして、「自分の解釈を傍に置いて読む」ことができない人がたくさんいたのには、予想はしていたけどさすがに笑ってしまった。 まーそれが人間の仕組みだしね、とは思っているけど、やはり笑ってしまう。 その一方で、読めている人が、しっかり読んだ上で切れ味鋭くコメントしてきているのも事実。 世の中はすごい人がたくさんいるな、とも改めて思ったし、賢い人を甘く見てはいけない、という思いを新たにした。 ということで、フィードバックがあった点を中心に、情報を補足したほうが良いと思った点について、自分の考えを箇条書きで書いていく。 議論を理解する
はてぶの上位にちょいちょい載ってるTBS系のニュースサイト、newsdig.tbs.co.jpについて。 https://b.hatena.ne.jp/site/newsdig.tbs.co.jp/ 何がヤバいかって、くっそ巨大なCookie(LocalStorageとかも含むのか知らんけど)をしこたま保存してんのよ。 気付いた時点では640MBも占有してた。別に巡回チェックしてるわけでもなく、話題に挙がってたら見てみることもある程度のアクセス頻度なのだが。 Chromeユーザーはアドレスバーに↓コピペして確認してみてくれ。 chrome://settings/content/all?searchSubpage=tbs.co.jp&search=cookie 試しにCookie消去してから、ただ開いただけでサイト上で何の遷移もしてないのに279MBも保存された。 次点ではpresi
要約 Synthetic Monitoringに「外形監視」という訳語を当てている方がいるのですが、Syntheticの意味は「外形」ではありません。 Syntheticは「合成」という意味です。 ですから、日本語訳を付けるのであれば、「合成監視」です。 また、External Monitoringの訳語として、「外形監視」という訳語を当てて書いている人も見かけます。 正しくは、 Synthetic Monitoring ... 合成監視 External Monitoring ... 外部監視 です。 何故、Synthetic Monitoringは、「合成監視」なのでしょうか? その歴史と背景を解説します。 Synthetic Monitoringとは何か? Synthetic Monitoringとは、計測システムから、対象システムに対して能動的にアクセスして、性能や可用性に関するデ
————————————- ■取材概要 先日、ニュースで◯◯様がおこなっている取り組みを知り、非常に興味を持ちました。私自身もこんな経験があり、こんな思いがあることから、ぜひ記事として世に広めたいと思っております。 主に聞きたいことは以下の質問です ・取り組みの詳細 実際にどのようなことをおこなっていて、それは我々にどのような恩恵があるのか └こういう場合は? └こういう時のアドバイスはありますか? ・◯◯様が考える、この取り組みのメリット・デメリット └例)今までこうだったものがこうなり、困っている人が減る └例)こういった人にとっては手間が増えるかもしれない ・どのような思いで、いつ、この取り組みがスタートしたのか └どんなきっかけでこの取り組みをやってみようと思ったのでしょうか? └当時、周囲からどのように言われていましたか? ※取材の許可を頂けた場合、事前に詳細な質問集もお送り致し
Node.js v20 リリースされました。 V8 のバージョンが 11.3 まで上がったことで、いくつかの新しい ECMAScript の機能が使えるようになりました。v フラグが好きなのでうれしいです。 どのバージョンからどの機能が使えるようになったかとか忘れてしまうのでメモしておきます。 String.prototype.isWellFormed / String.prototype.toWellFormed 文字列が Well Formed Code Unit Sequence かどうか判定する isWellFormed と、それに変換する toWellFormed が追加されます。WebIDL の文脈では USV 文字列とか言われますね。 これは WebAssembly みたいな USV 文字列前提の環境とやり取りするときに便利。Babel みたいな JavaScript を解釈
人の話が処理出来ない奴へのアドバイス一時期、人の指示を全然処理できない40代を複数名、相手にしてた事がある。 その時の経験から、ちょっと気づいた事をアドバイスしてみるよ。 まず、自分の解釈を傍に置いて、最後まで読んでくれ。 いいか、読み終わるまで、自分の解釈は傍に置くんだぞ。 結論結論から言うと ・相手の話を出来る限り一字一句聞き取る練習をしろ ・その際、相手の言っていない事は絶対に書き取らない ・聞き取れなかった部分は、相手に質問する、録音を再生する、などして欠けた情報を埋める事 これを仕事の中で出来る限り愚直にやれ。最適なのは議事録を書くこと。 ※半年経っても伸びないなら小学・中学の国語ドリルを小学三年生分から全部やって、スキルアップをブーストさせる事。 判断した根拠そう判断した根拠は、次の文章にある。 今日も仕事で自分の提案資料に対して上司に指摘をうけたが、よくわからなくて途中から思
はじめに 最近Wasmの勢いがすごくて、ブラウザでPostgreSQLを動かせたり、DockerでWasmを動かせたりできます。 以前からWasm自体に興味があって、動作原理を知りたいと思ってchibiwasmというRuntimeを実装してみました。 Rustを選んだのは、最近Rustを勉強していてそれに慣れるためです。 苦労しましたが、*.wasmがどのようにして実行されるのかを理解できたので良かったです。 今回はWasmのバージョン1の仕様を満たすように実装して、テストスイートは正常系と実行時異常系のテストは通しましたが、バリデーションなどのテストはスキップしています。 また、少しだけバージョン2の命令とWASIを実装していて、RustからビルドしたHello Worldを標準出力するwasmバイナリも動きます。 本記事は実装したWasm Runtimeの概要と、実装を通して学んだこと
TLSの有無 言うまでもないことですが、httpsでは通信路をTLSを使って保護することが想定されています。[1][2] デフォルポート httpは80、httpsは443です。[3][4] 権威性 以降の説明に入る前に前提を確認します。本稿は「httpとhttpsの違い」と題されていますが、これはURLのスキーム部分のことを指しています。URLはリソースの所在を指すものであり、通信方法はそこから二次的に決まるものです。このことを前提に置きつつ権威性について説明します。 Webにおいて、所望のリソースにアクセスする方法はひとつではありません。このような方法のうち、リソースの所有者の制御下にある(第三者による加工などが行われていないと期待される)方法で取得することを権威的アクセスと呼びます。[5] どのようなアクセス方法が権威的とみなせるかについて100%客観的で統一的な指標があるわけではな
3 行まとめ Origin Private File System という名の通り、Origin に紐づくプライベートなファイルシステムが扱える API Firefox 111 で実装されたことで、主要ブラウザでほとんどの機能が使える[1] Origin Private File System は FileSystem Access API よりもファイル操作のパフォーマンスが良い Origin Private File System とは Origin と紐づき、ユーザには非公開なブラウザ上で扱えるファイルシステムです。 なぜ Origin Private File System を使うのか Origin Private File System を使わずとも Blob と URL.createObjectURL() を組み合わせて a 要素をクリックすることでファイルをダウンロードしたり
まえがき Web上で広く利用されるPNG(Portable Network Graphics)フォーマットは、デジタル画像を変化させずに小さいデータサイズへ変換する圧縮技術の一種です。PNGフォーマットはオリジナル画像を完全復元可能な可逆(lossless)圧縮ですから、JPEGフォーマットのように画像を歪めてしまう非可逆(lossy)圧縮ほどは小さくできません。それでもオリジナルのデジタル画像データの半分程度まではサイズ削減可能な画像圧縮アルゴリズムと言われています。[1] そげぶ いいぜ てめえが何でも思い通りに圧縮出来るってなら まずはそのふざけた幻想をぶち壊す!! (スペース都合によりAA省略) 本記事では、PNGフォーマットを画像データ圧縮(compress)用途で利用するのではなく、オリジナル画像データよりも遥かに巨大なPNGファイル を生成します。 PNGフォーマットでは任意
(※諸説あります) ざっくばらん「ざっくり」と「ばらり」という擬態語を合わせたもの。江戸時代から使われ出した 大根役者大根は滅多に食当たりをしない→当たらない役者という連想から チャック巾着に由来 ネコババ猫がうんちを砂をかけて隠すところから。ババはうんちのこと 大丈夫丈は1.7mであり、丈夫は成人男性の意。そこから、大丈夫は立派な男性→しっかりしている→間違いない と意味が派生した いかさま如何様(どのように)から、いかにもその通り→いかにも本物に見える→インチキ の意味になった 一か八か博打で、丁か半かの上部分が一と八に見えるから うんともすんとも「うん」は返事で、すんは語呂がいいから付け足された お節介すり鉢の溝の詰まりをとる道具を切匙(せっかい)といい、他人の内に入り込もうとする様から。節介は当て字 かかし田んぼのスズメを追い払うために魚や動物を焼いて追い払った「嗅がし」が語源 ご
本日4/17日(月)付でCloudflareに入社しました。ロールはDeveloper Advocate、日本法人との契約ですが、日本に限りません。入社へのプロセスではUS、ヨーロッパのメンバーとやりとりをして、入社後のボスはUSになります。「Developer Advocate」は日本はもちろんアジアでは初、Cloudflareの中でも新設される部です。扱うのは主にWorkers製品で、Honoなどのフレームワークやユースケースを示すアプリケーションの開発と、製品と開発者をつなぐことをやります。 経緯 Hono 僕がユーザーとしてCloudflare Workersに触れたのは、一昨年、2021年の10月です。ブログ記事を書いています。 Cloudflare Workers 面白い - ゆーすけべー日記 そして、同年の12月には、Cloudflare Workers向けのフレームワーク「
すべてがファイルというモデルの Linux (Unix) において、ファイル I/O (以降単に I/O と書く) を知っておいて損はない。 この記事では、基本的なファイルと関連する I/O について、対応する Linux システムコールも併せて説明する。 次回はこれらを実際に Linux 上で確認する予定。 ファイルUnix におけるファイルとは、普通「通常ファイル」のことを指し、バイトがリニアに並んだデータ (byte stream) のことである。 ファイル内のバイトは読み書きが可能で、指定されたバイトから開始する。この開始バイトはファイル内の「位置」と考えることができ、ファイルポジションまたはファイルオフセットという。 通常ファイルとは別に、スペシャルファイルというファイルとして表現されたカーネルオブジェクトがある。Linux では、スペシャルファイルとしてデバイスノード・名前付き
はじめに このブログに書かれていること 自己紹介 注意 Part1 古典暗号 2つの暗号方式 スキュタレー暗号 アルゴリズムと鍵 シーザー暗号 原理 頻度分析 アルベルティ暗号 ヴィジュネル暗号 如何にしてヴィジュネル暗号は破られたか Part2 近代暗号 エニグマ エニグマの登場 エニグマの基本構造 如何にしてエニグマは突破されたか 前提条件 必ず異なる文字に変換される性質を利用 ループを利用 まとめ 参考文献 採用情報 はじめに このブログに書かれていること 前半 古代暗号から始まる暗号の歴史 エニグマの構造と解読法について 後半(後半ブログは こちら) RSA暗号の基本 楕円曲線暗号の基本 自己紹介 こんにちは!株式会社ABEJAの @Takayoshi_ma です。今回のテックブログですが、ネタに5時間程度悩んだ挙句、暗号を取り上げることにしました!暗号化手法の解説にとどまらず、そ
日興アセットマネジメントは4月26日から、ネット販売専用の投資信託「Tracers MSCI オール・カントリー・インデックス(全世界株式)」の運用を開始する。10日に提出した有価証券届出書で明らかになった。 これまで最低コストだった“オルカン”の約半分のコストで登場するTracersオールカントリー。ただし「その他コスト」として、「利用する指数の標章使用料」などが記載されており、いわゆる“隠れコスト”がどのくらいになるかが注目される 最大の特徴は0.05775%という信託報酬の低さだ。全世界の株式に投資するインデックス型投信では、三菱UFJ国際投信が運用する「eMAXIS Slim 全世界株式(オールカントリー)」が0.11325%(引き下げは5月11日から)で最も低かった。Tracersオールカントリーは、従来の最低コストの半分近いコストで登場することになる。 販売会社は、有価証券届出
C10K 問題 (the C10K problem) は1999年に Dan Kegel が発表した文章、ならびにそこで提示された「問題」です。文章はその後も2000年代前半に何度か更新されているのですが、さすがに令和に読み返すと、当初の問題意識がわかりにくいところがあります。 2000年からの10年は、 ソフトウェア面では、select(2), poll(2) にかわる新しいシステムコールの実装と、それを使ったアプリケーションの普及 ハードウェア面では、x86 アーキテクチャの64ビット移行、仮想化命令の追加と、マルチコア化 さらにそこにクラウドも登場する、面白い時代でした。ここでは、それらの出来事を中心に、さらに、当時の雰囲気をつたえるような日本国内のブログやインタビュー記事をまとめることで、C10K 問題が、さまざまな側面から解決されていく流れを説明したいと思います。 書き足したいと
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く