yubessyのブックマーク - はてなブックマーク

Dockerコンテナが遅くなるもう一つの原因 | POSTD

前回のブログ記事では、Kubernetesの話と、 ThoughtSpot がKubernetesを開発インフラのニーズに合わせてどのように取り入れたかをご紹介しました。今回はその続報として、最近の興味深いデバッグ経験について少々駆け足になりますがお話ししていきます。本記事も「コンテナ化と仮想化はノットイコールである」という事実に基づいており、たとえcgroupの上限がどれも高くない値に設定されホストマシンで十分な演算能力が利用できるとしても、コンテナ化されたプロセス同士がリソースの競合を起こす場合があることを示したいと思います。 ThoughtSpotでは内部のKubernetesクラスタで多数のCI/CDや開発関連のワークフローを稼働させており、ある1点を除いては全てが順調でした。唯一問題だったのは、ドッカー化された製品コピーを起動すると、パフォーマンスが期待を極端に下回るレベ

yubessy 2018/04/28

リンク

PythonとKerasを使ってAlphaZero AIを自作する | POSTD

自己対戦と深層学習でマシンにコネクトフォー（Connect4：四目並べ）の戦略を学習させましょう。この記事では次の3つの話をします。 AlphaZeroが人工知能（AI）への大きなステップである2つの理由 AlphaZeroの方法論のレプリカを作ってコネクト4のゲームをプレイさせる方法そのレプリカを改良して他のゲームをプラグインする方法 Alpha Go→Alpha Go Zero→AlphaZero 2016年3月、DeepmindのAlpha Go（アルファ碁）が、囲碁の18回の世界王者、李世乭（イー・セドル）との五番勝負で、2億人の見守る中、4-1で勝利しました。機械が超人的な囲碁の技を学習したのです。不可能だとか、少なくとも10年間は達成できないと思われていた偉業です。 Alpha Go　対　李世乭の第3局このことだけでも驚くべき功績ですが、DeepMindは、2017年10月、

yubessy 2018/03/29

機械学習

リンク

優秀な面接者に共通するものとは？　数千の実例を調べてみました。- 後編 | POSTD

質問する面接後、私たちは候補者に対して、面接者が候補者を解決へと導く過程でどのくらい協力的だったかについて質問します。候補者に情報を与え過ぎることなく、不要な要素を取り除くようなヒントをタイミングよく与えるためには、多くの練習（そして多くの繰り返し）によって習得した繊細な技術が必要ですが、これはどの程度重要なのでしょうか。結論を言えば、これができるかどうかは大変重要です。候補者がその企業への就職を前向きに考慮するかどうかという点では、面接者が上手にヒントを与えられることには極めて高い有意性（効果量2.95でp < 0.00001）が見られました（前と同様に、面接がうまくいったかどうかを補正しました）。協力の度合いと積極的な関与について、候補者が面接者に対してどう感じたかを以下に記載したのでご覧ください。この特性を定量化するのは少々難しいのですが、実際のところ、ヒントの質とは、よ

yubessy 2018/02/24

仕事

リンク

モノリシックなバージョン管理の利点 | POSTD

以下は、私がよく交わす会話の一例です。人物A：FacebookやGoogleは、巨大なモノリシックリポジトリ（モノレポ）を使っているんだってよ。私：みたいだね。あれは本当に便利だと思う。人物A：僕に言わせれば最悪の愚行さ。全てのコードを単一のリポジトリに入れるのがヒドイ考えだと、FacebookやGoogleはなぜ思わないんだろうか。私：FacebookやGoogleのエンジニアたちも小さなリポジトリには精通しているだろうけど（濱野純（Junio Hamano）氏はGoogle勤務だし）、単一の大きなリポジトリの方が、きっと”ある理由”で好みなんだよ。人物A：なるほどね。僕としては、まだちょっと違和感はあるけど、モノレポが使われる理由は分かったような気がするよ。 “ある理由”はかなり長いので、同じ会話を何度も繰り返さなくていいように、ここに書き留めておこうと思います。シンプ

yubessy 2017/11/08

リンク

C/C++中規模プロジェクトのための超シンプルなMakefile | POSTD

私は多くの小規模プロジェクトで Make を使ってきましたが、より大きな規模のプロジェクトになると、それは非常にうんざりするようなものでした。最近までは、自分のビルドシステムに行いたいことが4つあったのですが、Makeでの方法が分かりませんでした。 out-of-sourceビルド（オブジェクトファイルが、ソースとは分離されたディレクトリにダンプ出力されます）自動生成される（かつ正確！）ヘッダの依存関係オブジェクト／ソースファイルのリストの自動的な決定インクルードディレクトリのフラグの自動生成以下にこれらの全てを行える、C、C++、およびアセンブリで動作するシンプルなMakefileを紹介します。 MAKEFILE TARGET_EXEC ?= a.out BUILD_DIR ?= ./build SRC_DIRS ?= ./src SRCS := $(shell find $(S

yubessy 2017/10/29

Makefile

リンク

Bashアプリケーションをテストする | POSTD

以前、bashスクリプトをテストする仕事に取り組んだことがあります。最初、Pythonユニットテストを使うことにしましたが、プロジェクトに外部技術を持ち込むのは気が進みませんでした。そこで、仕方なく、悪名高い bash で書かれたテスト用フレームワークを使いました。既存ソリューションの概要手に入るソリューションを探してGoogle検索しましたが、選択肢はほんの少ししかありませんでした。そのうちいくつかについて、詳しく見ていきましょう。重要になるのは、どんな基準でしょうか？依存関係： bass のテスト用フレームワークを選ぶときに、 python 、 lua などのシステムパッケージも一緒に引きずり込むのは嫌ですね。インストールの難しさ：継続的な開発の実装とTravis CIでの継続的な統合も仕事の1つだったので、私にとってインストールにかかる時間と手間数が妥当だということは、重要

yubessy 2017/09/28

bash

リンク

2017年JavaScriptのテスト概論 | POSTD

本稿は、JavaScriptのテストについて最も重要な根拠、用語、ツール、アプローチなどの知識を身に着けることを目的とした簡略版ガイドブックです。本稿で検討する数々の側面に関する最新の秀逸な記事も紹介しつつ、私たちが経験的に得たことも多少付け加えたいと思います。 Facebookによるテスト用フレームワークであるJestのロゴをご覧ください。見てお分かりのように、このフレームワークは「苦痛のない」JavaScriptのテストをスローガンに掲げています。しかし、 “次のように言う人” もいます。苦痛のないテストなんてあり得ない。実際、Facebookはこのスローガンを掲げるだけの素晴らしい理由があります。一般的にJSのデベロッパは Webサイトのテストにあまり満足していません。JSのテストには制限があり、実装が難しく、低速である傾向があります。一方、正しい戦略を立てて適切にツールを

yubessy 2017/07/20

リンク

機械学習のための仮説検定 | POSTD

統計学者は、さまざまな機械学習のモデルに関して、複雑な推論を行うべく多くの時間を費やしてきましたが、実は、これを完全に一般化できる非常に簡単で単純な方法があります。テストセットにある2つのモデルのパフォーマンスを、対応のあるt検定を使って比較するのです。以下に詳細を記載します。ある真の分散 $ (X,Y) $ から独立同分布で導かれた $n$ 対の $ (x,y) $ があるとしましょう。 “機械学習” は、 $ (x,y) $ の例が与えられた時、 $ x $ を使って $ y $ を推定しようとする問題です。最終的に、 $ y $ の妥当な推定と思われる関数 $ f(x) $ を生成します。典型的には損失関数 $ L(y,f(x)) $ を有していますが、この損失関数とは、推定がどれほど良好かを表すものです。推定量は、期待損失 $ L(f)=E[L(Y,f(X))] $ によ

yubessy 2017/05/08

リンク

アジャイルな開発には安全性が不可欠 : 現実世界の安全機構との3つのアナロジー | POSTD

(2016/7/15、著者プロフィールを修正いたしました。) 仮に、高速道路の自動車をより速く走らせることがあなたの務めだとします。もしあなたが、ドライバー全員にただ「アクセルを思いきり踏むように」と言ったら、一体どうなるでしょうか？結果は明らかに、大惨事となるでしょう。それなのに、ソフトウェアの構築を速めようとする時に、多くの開発者がまさにそんな態度を取っているのです。その理由として持ち出されるのは、以下のようなことです。「本当にアジャイルに進めたいので、デザインやドキュメントには時間をかけられない」「これは本番環境にすぐ反映しなきゃいけないから、テストを書く時間はない」「何もかも自動化する時間はなかったので、コードのデプロイは手作業でやる」自動車が高速道路を高速で走るには、安全性が欠かせません。より速く走るためには、ブレーキやシートベルト、エアバッグといった、いざという時にド

yubessy 2017/04/12

何度読んでも良い記事

リンク

#/usr/binとその同種の周辺を探る | POSTD

(注：2017/04/10、いただいたフィードバックを元に翻訳を修正いたしました。) はじめに私はLinuxが大好きです。コンピュータとのやりとりが楽しくなるし学ぶことも多くなります。OSとハードウェアの基盤となる基本原則を学びたい人にとって、Linuxはとてもいい出発点と言えるでしょう。ご存じのとおりLinuxとは大抵の場合プログラム（コマンド）を通してやりとりします。Linuxと他のUNIX系システムが持っている特徴は、コマンドラインと、パイプのコンセプトです。プログラムの提供する入力と出力を統合すれば、データを操作するのに非常にパワフルなプラットフォームになります。 Linuxのコマンド、プログラム、バイナリ（何と呼んでもいいのですが）の大部分は、/usr/bin、/usr/sbin/、/binそして/usr/local/binに存在しています。これらのディレクトリを見れば、プロ

yubessy 2017/04/05

Linux

リンク

ニューラルネットワークの動物園 : ニューラルネットワーク・アーキテクチャのチートシート(前編) | POSTD

新しいニューラルネットワークのアーキテクチャがその時々で誕生するため、それら全部を把握することは困難です。全ての略語を覚えようとすると、最初はその数の多さに圧倒されてしまうでしょう（DCIGNやBiLSTM、DCGANを知っている人はいますか？）。そんなわけで、これらのアーキテクチャの多くを盛り込んだチートシートを作ることにしました。そのほとんどはニューラルネットワークです。しかし、中には全く異なるアーキテクチャも潜んでいます。どれも独特で目新しいアーキテクチャばかりですが、ノードの構造を描くことで基本的な関係が分かりやすくなってきます。これらをノードマップとして描くことの問題点は、これらがどのように使われるかを明確に示していないという点です。例えば、変分オートエンコーダ（VAE）はオートエンコーダ（AE）と同じように見えますが、実際は訓練過程が全く異なりますし、訓練したネットワークの

yubessy 2017/03/11

リンク

Gitのスケーリング（と、その背景） | POSTD

数年前、Microsoftは、社内全体のエンジニアリングシステムを活性化させるため、数年間にわたる投資を行う決定をしました。私たちは山のような数のチームを抱える大企業です。チームはそれぞれ、担当のプロダクト、独自の優先順位、プロセス、ツールを持っています。”共通の”ツールもありますが、チームによって様々に異なる点も多く、内部で開発した単発のツールも数え切れないほどあります（「チーム」とは社の部門のようなもので、数千のエンジニアの集まりです）。この状況にはたくさんのマイナス面があります。似たようなツールを構築しているチームがいくつもあり、巨額の冗長な投資が生まれている「クリティカルマス（損益分岐点を超える生産量、普及率）」に向けた設備投資ができない皆がバラバラのツールやプロセスを用いているため、従業員が異動しにくい組織の垣根を越えてのコード共有が難しい “MS限定”ツールの過多のた

yubessy 2017/03/11

リンク

確率的プログラミング | POSTD

この数年で、プログラミング言語（PL）や機械学習のコミュニティは確率的プログラミング（PP）を用いて、それぞれに共通する研究の関心事を明らかにしてきました。その概念は、抽象化のような強力なPLのコンセプトを”エクスポート”し、現状では複雑で困難な作業である統計的モデリングに再利用することができるかもしれない、というところにあります。（講義ノートの最新版を閲覧したい方は、リンクをクリックしてください。ソースは GitHub に投稿してあります。誤りを発見した場合は、Pull Requestを送信してください。） 1. 何、そしてなぜ 1.1. 確率的プログラミングは○○○ではない直観に反して、確率的プログラミングとは確率的に振る舞うソフトウェアを書くことではありません。例えば、暗号のキー・ジェネレータやOSカーネルでの ASLR の実装、または回路設計のための焼きなまし法

yubessy 2017/01/22

リンク

技術的負債の返済 – レガシーコードをリファクタリングで救うには | プログラミング | POSTD

レガシーコードをうまく手なずけて、もう一歩成熟させるにはどうすればいいのでしょう？この投稿では、大規模なレガシーウェブアプリケーションと格闘してきた私が学んだことを紹介します。レガシーコードをうまく手なずけて、もう一歩成熟させるにはどうすればいいのでしょう？この投稿では、大規模なレガシーウェブアプリケーションと格闘してきた私が学んだことを紹介します。レガシーコードはリファクタリングで救出可能耳寄りなお知らせがあります！リスたちは毎年何千本もの木を植えてくれています。まあ自分たちが隠したドングリのありかを忘れてしまった結果ですけどね。そしてもうひとつ。あなたのプロジェクトも救出できるのです。ボスから任されたプロジェクトがどんなに醜い泥まみれのレガシーコードだったとしても、そこには必ず道があります。道は曲がりくねっていて、木陰にはモンスターが待ち構えていることでしょう。

yubessy 2016/12/31

開発

リンク

情報理論を視覚的に理解する (1/4) : | POSTD

世界を考察する新しい方法を手に入れたときの感覚が大好きです。特に好きなのは、いずれ具体的なコンセプトに形を変えるボンヤリとした考えがあるときです。情報理論は、その最たる例です。情報理論は、多くの物事を説明するための正確な言葉を与えてくれます。自分はどのくらい理解できていないのか？質問Aの答えを知ることが、質問Bを答えるのにどのくらい役立つのか？ある種の信念が他の信念とどの程度似ているのか？こういうことに対し、若くて未熟なころから自分なりの考えがありましたが、情報理論に出会って正確で強固な考えとしてはっきりと固まりました。その考えは、桁外れの、例えばデータの圧縮から量子物理学や機械学習、さらにはその間に広がる数多くの分野に応用が利くものです。残念なことに、情報理論は少々威嚇的に見えてしまうのですが、そう断定すべき根拠は全くないと思います。実際、情報理論の多くの重要な概念は完全に視覚的に説

yubessy 2016/10/19

あとで読む

リンク

Pythonに咬まれるな : 注意すべきセキュリティリスクのリスト | POSTD

Pythonは、習得が容易で、より大きく複雑なアプリケーションの開発にすぐに適用していけることから、コンピューティング環境に広く普及し、勢いを強めています。ただ、あまりに明瞭で親しみやすい言語なので、ソフトウェアエンジニアやシステムアドミニストレータが警戒を解いてしまい、セキュリティに重大な影響を及ぼすコーディングミスを誘発する可能性はあるかもしれません。主に、初めてPythonを使う人を対象とするこの記事では、この言語のセキュリティ関連のクセに触れます。ベテラン開発者にとってもその特異性を意識するきっかけになればと思います。入力関数 Python 2に多数存在するビルトイン関数の中で、 input はセキュリティの面で完全に難点です。この関数をひとたび呼び出すと、標準入力から読み込んだものが即座にPythonコードとして評価されます。 $ python2 >>> input() dir

yubessy 2016/10/15

なるほど

リンク

Pythonパッケージ間の共起関係を可視化してみる | POSTD

はじめに私は、 BigQueryのGitHubデータを使って、GitHubリポジトリにある上位3,500個のPythonパッケージの共起を抽出し、速度ベルレ積分を使ってd3のForceレイアウトを可視化してみました。また、 python-igraph にあるアルゴリズムを使ってグラフをクラスタ化し、 http://graphistry.com/ にアップデートしました。以下のスクリーンショットは、d3の可視化にあるNumPyのクラスタです（画像をクリックするとライブ版をご覧いただけます）。以下は、graphistrynによって抽出されたNumPyのクラスタです（画像をクリックするとライブ版をご覧いただけます）。グラフの特徴：各ノードは、GitHubで見つけることのできる、それぞれのPythonパッケージです。半径は、ノードのDataFrame セクションで計算されています

yubessy 2016/08/25

リンク

勾配降下法の最適化アルゴリズムを概観する | POSTD

(編注：2020/10/01、2016/07/29、いただいたフィードバックをもとに記事を修正いたしました。) 目次：さまざまな勾配降下法バッチ勾配降下法確率的勾配降下法ミニバッチ勾配降下法課題勾配降下法を最適化するアルゴリズム Momentum(慣性) Nesterovの加速勾配降下法 Adagrad Adadelta RMSprop Adam アルゴリズムの可視化どのオプティマイザを選ぶべき？ SGDの並列化と分散化 Hogwild! Downpour SGD SGDのための遅延耐性アルゴリズム TensorFlow Elastic Averaging SGD 最適化されたSGDに対する更なる戦略シャッフル学習とカリキュラム学習バッチ正規化早期終了勾配ノイズ結論参考文献勾配降下法は、最適化のための最も知られたアルゴリズムの1つです。これまではニューラルネット

yubessy 2016/07/31

機械学習

リンク

私がどのようにして、ソフトウェア開発とオープンソースへの情熱をパートタイムで博士号を取得することで満たしたか | POSTD

私がどのようにして、ソフトウェア開発とオープンソースへの情熱をパートタイムで博士号を取得することで満たしたか目次 1 この記事は何？ 2 注意 3 パートタイムの博士号を取得する理由 3.1 長年の夢をかなえる 3.2 より良いエンジニア、研究者になる 4 博士号取得までの道のり 5 パートタイムの課題と利点 6 博士号の研究計画 7 修士/博士進級レポート 8 最終論文 9 ツールと書籍 10 研究成果 10.1 オープンソースへの貢献 10.2 ポスター 10.3 プレゼンテーション 10.4 出版物 10.5 その他 11 まだ終わりではない 12 外見で中身を判断してはいけないこの記事は何？仲間の開発者を呼んでコードやスタックトレースを見せると、彼らは驚嘆して「これは何だ？」って叫ぶのですが、私はその瞬間が好きです。この質問の前後にあまり良くない言葉が発せられることもあります

yubessy 2016/06/26

リンク

Web Storage: セッショントークンのマシな手段 ― cookieとセキュリティ面を比較してみる | POSTD

最近、私は「セッショントークンを、cookieの代わりに Web Storage (sessionStorage/localStorage)に保存するのは安全ですか？」ということを尋ねられました。このことについてGoogleで検索したところ、検索結果の上位のほとんどが「Web storageはcookieに比べてかなりセキュリティが弱く、セッショントークンには不向きである」と断言していました。透明性のため、私はこの逆の結論に至った理論的根拠を公に書くことにしました。 Web Storageに関する議論の中核として言われるのは、「Web StorageはsecureフラグやHttpOnlyフラグといったcookie特有の機能をサポートしていないため、攻撃者が容易に盗み取ることが可能」というものです。path属性についても言及されます。私は、これらの機能それぞれについて調べてみました。そして、

yubessy 2016/06/19

リンク

はてなブックマーク

タグ

ブックマーク / postd.cc (64)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第2週）

今週のはてなブックマーク数ランキング（2024年5月第1週）

月間はてなブックマーク数ランキング（2024年4月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス