第8回 Data-Centric AI勉強会 ~Human-in-the-Loop機械学習 特別回~の発表内容です。 https://dcai-jp.connpass.com/event/315963/ 書籍「Human-in-the-Loop 機械学習」において、翻訳を担当した章(1,7,8,11,12章)の内容を抜粋して紹介します。Human in the loop 機械学習において重要な概念であるアノテーションとヒューマンコンピューターインタラクションについて、著者の機械学習エンジニアとしての実例を交えつつ説明します。 Amazon での書籍リンク https://amzn.to/47u5tFz
お正月って、あらゆる気力を奪われる時期なわけですよ 長期休みって意味では夏休みも変わらないはずなのに、 世間の空気感も含めて、全力で怠惰になるというか、 ゲームをやる気力すら削がれるというかc(・ω・`c )っ そのうち布団から出るのすら面倒になり、 布団の中で積んでいた漫画を崩した結果、読むものがなくなり、 ついに積んでいた技術書を崩し始める・・・そんな時期なのでございます ・・・というのがどこまで本当かはともかくとして、 お正月にだらだらと読んでいた本がこちらに(´・ω・)っ Rubyのしくみ -Ruby Under a Microscope- 作者: Pat Shaughnessy,島田浩二,角谷信太郎出版社/メーカー: オーム社発売日: 2014/11/29メディア: 単行本(ソフトカバー)この商品を含むブログ (1件) を見る Rubyist Magazine - 書籍紹介『Ru
TL;DR 2019年はがんばります 概要 2018年ももう終わりなので、今日は技術的な話ではなく「ブログ書いててどうだったか」について書こうと思います。 なぜ、毎日ブログを始めたのか 技術ブログを毎日書くきっかけとなったのは、「SOFT SKILLS ソフトウェア開発者の人生マニュアル」という本でした。 SOFT SKILLS ソフトウェア開発者の人生マニュアル 作者: ジョン・ソンメズ,まつもとゆきひろ(解説),長尾高弘出版社/メーカー: 日経BP社発売日: 2016/05/20メディア: 単行本この商品を含むブログ (5件) を見る この本はソフトウェアエンジニアにとってブログを書くことの重要性を一章丸々使って説いており、 ブログは、自分をマーケティングするための方法としては安くて簡単であり、しかも、自分の名前を外に出すために極めて役に立つ。 ブログを持っていると、より良い勤め先に落
能登さんが発行された技術系同人誌、「深層強化学習による東方AI」のダウンロード版を入手したので読みました。BoothとGumroadで販売されているおり、特に理由はありませんがGumroadで購入しました。 第13回 博麗神社例大祭で頒布した『深層強化学習による東方AI』のダウンロード版をBooth https://t.co/ZysBlu7LY4 およびGumroad https://t.co/HtgRa44sr6 にて販売しています. pic.twitter.com/7rDT2qG9uq — 何もわからん (@ntddk) 2016年5月8日 東方紺珠伝というシューティングゲームを、深層機械学習によってクリアさせようというものです。 この種の話でまず思い浮かぶのが、八重樫さんによるvArashiです。Linux Conference 2002にて発表された資料(PDF)もあります。今にな
はじめに 『評価指標入門〜データサイエンスとビジネスをつなぐ架け橋〜』という本を読んでみました。 CRISP-DMに沿った推論モデルの開発において、「評価指標の選定」と「開発した推論モデルが必要な精度を達成しているかを判断するための閾値をどう設定すれば良いか」がわからず、困ったことがあったからです。 ネットで評価指標について検索すると、評価指標はいろいろ出てくるのですが、例えばRMSEだと「小さければ小さいほど良いです。ただし、どのくらい小さいと良いのかはデータサイエンティストの経験によります。」とか書かれていて、「その経験の部分を知りたいんだけど…」と感じることが多かったです。 そもそも、回帰の問題だったらRMSEやMAE等の評価指標が小さければいいんでしょ的な考えがあり、教科書的な評価指標というかよく出てくる評価指標の閾値をどう考えるのかを知りたくて読み始めました。 本書は、第1章 評
購入してからだいぶ時間がかかってしまいましたがようやく一周読み終わりました。元々は原著であるDatabase Internalsを読んでいたのですが、邦訳が出るという話を聞いて読み進める気力を失ってしまっていたのでした。 詳説 データベース ―ストレージエンジンと分散データシステムの仕組み 作者:Alex PetrovオライリージャパンAmazon 内容についてですが、データベースといってもクエリ言語やクエリの最適化といった製品依存度の高いトピックについては触れられておらず、データベースの種類を問わず普遍的なトピックであるストレージおよび分散システムに関するかなり硬派な内容になっています。 邦訳になっていることで確かに原著よりも早い速度で読むことはできるのですが、特に後半に関しては取り扱っている内容自体の難易度もあり、日本語で読んだから理解しやすいかというとそういうわけでもない感じでした。
・<不良>のための文章術 カネになる文章の書き方を教える本だ。 <不良>は「天声人語」や小論文テストの良い子ちゃん文章術とは対極にある。 「クルマの運転にたとえてみましょうか。学校で習う文章や『文章読本』が教えるのは、教習所で満点をとれるような運転です。法規を守り、自動車のしくみや特性をよく理解して安全に走る。しかし、サーキットやラリーコースでそんな運転をしていたのでは、とてもレースに参加できません。路上では「割り込み」や「幅寄せ」はいけないことですが、レースではそんなことはいっていられません。もちろんスピード違反だって。」 「文章読本」系の本は大作家が書いたものでさえ「この本は名文の書き方を教える本ではありません。」なんて逃げ口上が最初に書いてあるものだが、この本は逃げない。ちゃんと売れる文章の書き方を教えるぞと書いている。フリーライターとしてプロを目指す人はこちらを読むべきである。 書
Crafting InterpretersはRobert Nystromによるインタプリタ方式のプログラミング言語処理系の作り方の解説本である。 ハードカバー・電子書籍が発売されているほか、著者のページでWeb版が無料公開されており、自作言語界隈では人気を博している。 Crafting Interpretersでは著者が考案したLox言語のインタプリタを実装していくこととなる。本の前半部分ではAST評価器を扱い、後半部分ではバイトコードVMを用いたインタプリタを実装する。 Lox言語はシンプルとはいえ、クロージャやクラスの継承といった高度な機能も備えたオブジェクト指向スクリプト言語であり、読者は小さなインタプリタからステップ・バイ・ステップでだんだんと完全な処理系を構築していく。 Crafting Interpretersの素晴らしいところには次の点が挙げられるだろう: 平易な文章に加えて
遅くなりました… www.kspub.co.jp @niszetが人生色々とgdgd進行しているため、読み終えるまでに時間かかってしまいましたが、最後まで読み終えたので読後の感想を書こうと思います。 なお、本書は id:u_ribo さんより GitHub Sponsorsのお礼という事で頂きました。ありがとうございました。なんかすみません…。 ちょっと雑多な文章になりますが、ご容赦ください。 感想 読後感としては、本文の文章が思ったより多く(付録をあわせて300ページを超えているので相応の分量ということですが)、基本は通して読むタイプなのでそれなりに腰を据えて読むのが良いと思いました。洋書にありがち?な、脇道に逸れたような話はないので純粋に説明の文章量が多いということでしょうから、悪い意味ではないです。 5章がデータの整形の話で、その前までが比較的基本的な可視化の話、6章がモデルデータ、
在宅の日々、だいたいラジオをきいて過ごしている。radikoだけでは飽き足らず、この世のすべてのラジオアプリをインストールし、Podcastをダウンロードし、耳から注入している。 shop.nikkeibp.co.jp 先週読んだCode Completeにおいて、複数の章で参考図書として紹介されていた。著者はGerald Weinberg氏で、ソフトウェア界における偉人の一人。著作では『ライト、ついてますか』も有名っぽい。 初版はなんと1971年。磁気テープを用いた開発や、プロジェクト例などは歴史を感じさせる。本筋であるプログラマの心理面の問題意識や実験結果、考察は、いま読んでも古さを感じない。そのこと自体が、本書のテーマが本質的な問題であることを示唆している。一方、プロとアマチュア、マネージャとプログラマ、また(職業人としての)男性と女性を区別した記述がやや軽薄に感じた。これは著者の不
「TODO リストはやめろ、スケジュール表に予定を入れろ」という説を初めて見たのはどこだったか覚えてないが印象に残っていて、改めて検索したところ本に書いてあることらしいと知ったのでその本を読んでみた。 1440分の使い方 ──成功者たちの時間管理15の秘訣 作者:ケビン・クルーズパンローリング株式会社Amazon この記事経由で本の存在を知った。 ToDoリストを使わずに、やるべきことをガンガン終わらせる方法を実践してみたら凄かった – PATE NOTE いま検索して見つけたこの記事を、過去に読んだような気もする。 あなたの常識が非常識に?「TO DOリスト」はもう不要かもしれない いわゆる時間管理術の本で、著名人や成功者のノウハウを断片的に紹介しつつ著者の主張としてどうにかまとめ上げようとしている、があまり纏まってない、という感じ。 TODO リストの話を含めて、以下の章の主張・内容は
Chiselとは? Chiselとは、VHDLやVerilog等と同じく、ディジタル回路設計用のハードウェア記述言語(HDL)の一種です(ただし、ハードウェアの設計をアジャイルに行う事を主目的としているので、シミュレーション等の機能は弱い)。Chiselで書かれたコードはVerilogのコードに変換され、そのVerilogコードを使って、FPGAをプログラムしたり、ASICの製造に用います。 有名な用途としては、オープンソースのCPU ISAのRISC-Vの実装でもっとも有名なものの一つのRocket Chipや、GoogleのEdge TPUがあります(講演の動画はこちら) Chiselの文法について知りたい方は、Chisel入門書「Digital Design with Chisel」1章の勉強記録から始まる記事を参照してください。 TD4とは? TD4とは、CPUの創りかたにて、設計
はじめに 無敵級ビリーバー3周年👑👑👑 nikkieです。 「お休みの日にしかできないことを」と追求した結果、最近のお休みは開発合宿感があります。 今回は気になっていた技術、BERT-CRFを触りました。 目次 はじめに 目次 ずっと引っかかっていたBERT-CRF 『大規模言語モデル入門』6章「固有表現認識」 BERT-CRFクイックツアーの感想 書籍への感想 サンプルコードへの感想 終わりに ずっと引っかかっていたBERT-CRF BERT-CRFという技術は固有表現認識でなかなかよいと聞いていました1。 ただずっと「具体的にどう実装すればいいの?」というところがよく分かりませんでした。 2018年に登場した機械学習モデルBERT2。 Transformer3というアーキテクチャを使って組み上げられたこのモデルは、1つのモデルで複数の自然言語処理タスクが解けるということで注目を集
(↑from scikit-learn User Guide Gradient Boosting Out-of-Bag estimates — scikit-learn 0.24.1 documentation) 当記事では勾配ブースティング(Gradient Boosting)について簡単に確認を行います。 勾配ブースティングについては少々フォーマルな記載が多く理解が大変なのですが、上記の「scikit-learnとTensorFlowによる実践機械学習」の記述が比較的わかりやすいので、こちらを元に簡単に確認したのちにWikipediaの記載を簡単に確認します。 以下、今回の目次になります。 1. 概要の把握 2. Wikipediaの確認 3. まとめ 1. 概要の把握 1節では「scikit-learnとTensorFlowによる実践機械学習」の記述を主に参考にしながら簡単な確認を行
突然ですが、5月始めに出る「マストドン本」に寄稿させて頂くことになりました。後半の技術パートの導入として、Mastodon の技術的な基盤である OStatus の章を担当しています。 本書の執筆には、mstdn.jp のぬるかるさんや pawoo.net の中の人に加えて、界隈では誰でも名前を知ってるような面々が勢ぞろいで、まさに Mastodon オールスターといった趣であり、わし本当にこんな所に混ざっていいのか…。まぁ、ともかく現在予約受付中です、買ってね! これがマストドンだ! 使い方からインスタンスの作り方まで (NextPublishing) 作者: マストドン研究会出版社/メーカー: インプレスR&D発売日: 2017/05/12メディア: オンデマンド (ペーパーバック)この商品を含むブログ (1件) を見る 思い返すになかなかの急展開ですが、最初、降って湧いた Masto
元ネタはプログラミングに関するものだけど、 プログラミングに限らず広い範囲に使えるメソッド発見。 WEB+DB PRESS vol.38「プログラミングの光景」(高林 哲)の中で 「バグの原因を見つけ出すにはこんな方法があるよね」 というのがいくつか挙げられていた。 その中で「そうそう、そうなんですよね」と激しく思ったのがこれ。 身近な人に相談する(説明しているうちに自分で原因に気づく) ある。 言うことを聞かないプログラムについて人に状況を説明していて 「ここでね、ほらちゃんと中身を置換してるはずでしょ、 なのにね、なぜか表示してもね、置き換わってない・・・ のは、二次元配列になっちゃってるからですね。」 と一方的に解決してしまうことはよくある。 これは何もプログラミングに限ったことではないように思う。 パズルをやっているにせよ人生の方向性に悩んでいるにせよ 自分でいくら考えてもどうにも
概要 Linux で動かしながら学ぶ TCP/IP ネットワーク入門を読みました。 感想を書きます。 Linuxで動かしながら学ぶTCP/IPネットワーク入門 作者:もみじあめAmazon 概要 前提 目的 事前知識 読了時間 感想 次に関連で勉強すること まとめ 前提 目的 本書を読んだ背景は以下です。 2023年10月〜12月の目標の注力分野の 1 つにネットワーク・Linux を掲げていた SRE に関心があるので、ネットワーク周りの知見を深めたかった ネットワークの知識はほとんど初心者で、学んだ知識も読み物ベースだったので、手を動かしながら学べる内容を優先した 事前知識 ネットワークの知識は以下ぐらいです。普段は Web アプリケーションエンジニアとして勤務しているため、基本的な HTTP の知識は持っています。 [改訂新版]3 分間ネットワーク基礎講座を読んだ Real Worl
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く