OpenAIが発表した言語モデルGPT-3はパフォーマンスの高さから各方面で注目されており、ついにはMicrosoftが学習済みモデルの利用を独占化しました。 私個人の所感としてこれまで学習済みモデルは無料公開するという流れを無視し、(アーキテクチャではなく)学習済みモデルが商品化するのはAIビジネスの一つの転換期と感じています。 深層学習による自然言語処理分野で巨大化していくモデルを十分に学習させるためにはWebデータの活用が大きな役割を果たしています。一方、その量に関する話題はあるものの、利用にあたっての細かな前処理に関する議論はあまりなされていない印象です。 そこで本記事は学習データの構築にフォーカスします。 GPT-3の論文でも言及されている通り、学習データはGoogle Researchが発表したT5のデータを踏襲したと書かれていますので、まずはT5のデータから見て行きましょう。
1月末で約2年ほど働いたIndeedを退職して、UbieというAI×医療のベンチャーに転職します。せっかくの節目なので、社会人になってからを振り返りたいと思います。 目次 ・リクルートについて ・Indeedへの異動に向けて ・Indeedについて ・Ubieへの転職のきっかけ ・これから リクルートについてもともとは新卒でリクルートにデータサイエンティストとして入社して社会人生活を始めました。リクルートは様々なデータを保有しており、データ分析のしがいがありました。また、上司、同期、後輩は優秀な人ばかりで、常に学ぶことばかりでした。特に、データにどのように向き合って、仮説をたてて分析するのか、また、データの裏側にいる実際のユーザーやクライアントの課題を把握してどうしたら解決ができるのかといったスタンス面の土台がこの頃にできたように思います。技術面においても、GCPやAWSを使って機械学習プ
18歳の頃、狂ったように午後の紅茶を飲んだ。朝から晩まで飲んだ。若さだった。情動だった。近くのコンビニにあった午後の紅茶は、ほとんど僕が消費していた。売り切れるのも珍しくなかった。店員からは間違いなく午後ティーと呼ばれていた。 午後の紅茶の中でも、ミルクティー味が好きだった。口に広がるミルクの甘みが、上京したばかりの僕の孤独を優しく癒した。初めての東京は全てが新しくて、僕の生活は何もかも変わってしまった。そこで唯一変わらなかったのが、地元の自販機でも売られていた午後の紅茶だった。午後の紅茶は田舎でも東京でも平等に同じ味がして、2つの生活に串を刺すみたいにつながりをもたらした。だから僕はいくらでも飲んだ。口にするたびに不安が和らぐ気がした。午後の紅茶は精神安定剤だった。 ※ 数年が経ち、東京での生活にもすっかり慣れた。友達も増え、孤独を感じることは少なくなった。午後の紅茶に頼ることも減ってい
PolarsというPandasを100倍くらい高性能にしたライブラリがとても良いので布教します1。PolarsはRustベースのDataFrameライブラリですが、本記事ではPythonでのそれについて語ります。 ちなみにpolarsは白熊の意です。そりゃあまあ、白熊と大熊猫比べたら白熊のほうが速いし強いよねってことです2。 何がいいの? 推しポイントは3つあります 高速! お手軽! 書きやすい! 1. 高速 画像はTPCHのBenchmark(紫がPolars)3。 日本語でも色々記事があるので割愛しますが、RustやApach Arrowなどにお世話になっており、非常に速いです。MemoryErrorに悩まされる問題も解決されます。開発者のRitchieがしゃれおつなツイートをしてるので、そちらも参考にどうぞ ↓ 4。 抄訳: (ひとつ目)Pandasは黄色くした部分でDataFram
https://b.hatena.ne.jp/entry/s/twitter.com/AtTheBlackLodge/status/1433117218393313280 これとかSpank!の件とかで「オタクの方が表現の自由を蔑ろにしている!」と言いたがるリベラルの人達をよく見るけど、あれってどういう意味なん? 「表現の自由等、憲法は国家権力を縛る為のもの」じゃなかったの? オタクは国家じゃないし政府でもないよね?ただの個人が表現の自由を侵害できる、と考えるのはその憲法の定義では不可能では? それともリベラルの中にも「表現の自由を個人が侵害する事も有るよ派」と「ないよ派」が有るんだろうか?ちなみに余裕があったらあなたはどっち派なのか教えて欲しい。 個人的には「あるよ派」にしないと、例えばBL作家にオタク達が凸しまくった事が確か前にあったけど、そういうものも「表現の自由の侵害とは言えない」
はじめまして、岩崎です!「APN AWS Top Engineers/APN Ambassadors Week」の4日目の記事を書かせて頂くことになりました。この度、元々モバイルアプリしか作ってこなかった私が、「2021 APN AWS Top Engineers」になることができました。ちょうど良い機会でもあるので、NRIネットコムに入社してから取り組んだことをざっくりと整理していきたいと思います。 はじめに 昨今、一口にフロントエンドエンジニアと言ってもアプリを開発するだけではなく、プロジェクト規模によってはCI/CDの仕組みを構築・管理したり、アプリに機能やコンテンツを提供するためのバックエンドを構築したり、はたまたプロジェクト管理もしてみたりと、エンジニア一人に要求される専門性がますます多様化しているように感じます。おそらく、多方面で起こっている「技術の民主化」の流れが進んでいくに
米ローリング・ストーン誌は「史上最も偉大なアルバム TOP500」の新ヴァージョンを公開。同誌は2003年に同リストを発表。その後、2012年に改訂版を発表しています。今回、300人を超えるアーティスト、プロデューサー、評論家、音楽業界の著名人が参加して新しいリストを編集しています。500枚のうち154枚のアルバムは、2003年または2012年のリストに含まれていなかった完全に新しい追加です ■Rolling Stone Top 50 Albums of All Time (2020): 1 | Marvin Gaye | What's Going On | 1971 2 | The Beach Boys | Pet Sounds | 1966 3 | Joni Mitchell | Blue | 1971 4 | Stevie Wonder | Songs in the Key of L
こんにちは、らくからちゃです。 先月は、半月遅れの前月まとめってどーなのよと、爆速で書いてみたら「気が付かなかった」なんてコメントをいただいてしまいました。というわけで、まあいいかと後回しにしていたら、案の定月中を過ぎてしまいました笑 また徐々に注目度が下がっているためそのうち打ち切られるだろうなんてお言葉もいただきましたが、これは自分のための趣味でやっているので時間の都合がつく限り、続けてみたいと思います。 でもどうせなら読んでもらえたほうが嬉しいよね。ということで、ちょっと別のトピックスも加えながら書いてみたいと思います。というわけで5月の「はてブで話題の記事&ブックマークのまとめ」になります。なお前回はこちら。 www.yutorism.jp 2020年5月度の注目記事ランキング ブックマークコメントへのスター数による2020年5月度のランキングは下記の通りとなりました。 なお B:
仕様に沿ったプログラミングができるようになったエンジニアが設計に取り組むために、その全体像と具体的な手順を解説した技術書が『はじめての設計をやり抜くための本 第2版』(翔泳社)です。本書では大きく外部設計と内部設計、さらにアーキテクチャについて取り上げ、システムをゼロから作り上げるためのノウハウを解説。今回は「第2章 設計の目的」から、そもそもエンジニアは何を設計するのかを説明したパートを紹介します。 設計ができるようになるには、設計とは何かを知る必要があります。世の中には、設計に関する書籍がたくさん出回っています。最近では、オブジェクト指向設計に関するものが多いようです。書店に行くと、「オブジェクト指向」「UML」「ユースケース」といった文字が目に留まります。他にも、「アーキテクチャ」「デザインパターン」「フレームワーク」などもよく見かけるでしょう。これから設計を学ぶ皆さんは、学ぶことが
これは先日、株式会社アイスタイルにて参加した社内むけで話した内容を清書したものです。 (現在は株式会社アイスタイルの社員ではありませんが技術顧問的な立場でサポートさせていただいてます) 対象として、初学者やエンジニアなりたての人向けではありませんが、 2、3年目の方とかが読むといいのかもしれません。 自分流のこれまでのやってきたものだったりマインド的な話だったりそういうもので、 これをやれば誰もがエンジニアとして成長できる!というわけではありません。 参考にできるところは参考にするか、ヒントにするとか息抜きに読むくらいがちょうど良いです。 加えて将来CTOだったり、技術顧問という立場になりたい、という方にもいいかもしれませんが、 自分のスタンスだったりが多く含まれていますので、 世間一般で求められてるCTOだったり技術顧問との乖離があったりするところもあると思います。 参考にできるところは
CD Projekt SAはポーランド語版『サイバーパンク 2077』の拡張パック「仮初めの自由」において、ポーランドの人気声優だった故Miłogost Reczek氏のボイスをAIで再現し収録していることを、米メディアのブルームバーグへ宛てた声明を通して述べました。なお、Game*Sparkによるローカライズ担当者へのインタビューでも同様の内容についてお話頂いているため、併せてご覧ください。 『サイバーパンク2077: 仮初めの自由』ローカライズの立役者にロングインタビュー。CDPR本国の担当ディレクター&日本語ローカライズマネージャー西尾さんに濃厚な話を訊いた | Game*Spark - 国内・海外ゲーム情報サイト 「ヴィクター・ベクターとしての素晴らしいパフォーマンスに敬意を表することができた」Reczek氏は『サイバーパンク 2077』でリパードクとしてVと関りの深い「ヴィクター
海外のPCゲームをプレイする際にお世話になる方も多い有志日本語化。今回は視点を変え、人間による翻訳ではなく機械翻訳の利便性を高めるアプローチに迫ります。 日本語化とは海外のゲームを日本語で遊べるようにすることです。その中でも、デベロッパーやパブリッシャーによる公式の日本語化ではない、ユーザーによる非公式な日本語化を有志日本語化(有志翻訳)と呼びます。一般的にボランティアで行われ、成果物は無償で配布されます。 連載第15回は、ゲーム画面の英語を読み取り自動的に翻訳するフリーソフト「PCOT」の作者ぬるっぽ氏に話を訊きました。 ヌルポインターストライク (翻訳支援ツールPCOTの配布サイト) PCOTの機能紹介 その1(基本機能) PCOTの使い方は簡単。翻訳したいゲームを選択し、好きなタイミングで位置を指定するだけです。すると自動的に英文が読み取られ、日本語に翻訳されて表示されます。 とある
LINE株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。 LINEヤフー Tech Blog LINEの開発組織のそれぞれの部門やプロジェクトについて、その役割や体制、技術スタック、今後の課題やロードマップなどを具体的に紹介していく「Team & Project」シリーズ。今回は、LINEの会計システムに関連する開発業務をしているチームを紹介します。 財務情報室の室長である呉世鎮(オ・セジン)、 会計システム企画運営チームのマネージャー瀧澤智大、 精算プラットフォームチームのマネージャーである藤田摂に話を聞きました。 (左から)藤田さん、呉さん、瀧澤さん ―― 皆さんの自己紹介をお願いします 呉:2012年に入社したタイミングで日本に来ました。入社以来ずっと社内情報システムを担当としていて、企業に必要な情報管理とそのた
JX通信社シニア・エンジニア兼データ基盤担当大臣の@shinyorke(しんよーく)です. 最近やった「ちょっとした贅沢」は「休日, 自宅で🍺片手に野球を見ながらUberEatsで注文したランチを楽しむ」です. ⚾と飲食を提供してくださる皆さまに心から感謝しております🙏 JX通信社では, 機械学習を用いたプロダクト開発・施策 プロダクト・サービスの改善に関する分析 日々のイベントをメトリクス化して可視化(いわゆるBI的なもの) を円滑かつ効率よく行うため, 昨年からデータ基盤を整備・運用しており, 現在では社員のみならず(スーパー優秀な)インターンの皆さまと一緒に活用し, 成果を出し始めています. ainow.ai なぜデータ基盤が必要か?どういった事をしているのか?...は上記のインタビューに譲るとして, このエントリーでは「データ基盤を支える技術 - ETL編」と称しまして, Py
アメリカ・ニュージャージー州にあるウェストフィールド高等学校の男子生徒らが、AIを使用して同級生の女子生徒のヌード写真を作成し、共有していたことがわかりました。この事件で警察は捜査を進めていますが、問題の画像にアクセスできず、偽のヌード写真の頒布が違法行為にあたるかどうかも不明なため、暗中模索の状況であると伝えられています。 AI-generated nudes of girls at NJ high school trigger police probe https://nypost.com/2023/11/02/news/ai-generated-nudes-of-girls-at-nj-high-school-trigger-police-probe/ Westfield High School student accused of creating AI nude images o
アメリカの弁護士で、過去の任天堂のアメリカ進出時に起こった『ドンキーコング』関連の裁判で活躍したことで知られるジョン・カービィ氏が、血液がんのため79歳でこの世を去ったことが海外メディアにて報じられました。 大きな写真で詳しく見る 訃報は、NYタイムスなどによって報じられました。カービィ氏は、かつて任天堂がファミコン(米国ではNintendo Entertainment System)を展開する前に米国で起こった『ドンキーコング』と「キングコング」の類似性を巡る裁判でも知られています。 当時ユニバーサルにより、「『ドンキーコング』が「キングコング」の著作権を侵害している」として訴えられた任天堂の弁護士として法廷に立った同氏は、「キングコング」自体の著作権が当時既に失効していることを説明し、大きな勝利を遂げました。この活躍により氏は後に「ドンキーコング」の名を冠したヨットを任天堂より送られて
探検! Python Flask Robert Picard, 濱野 司(訳) BareMetalで遊ぶ Raspberry Pi 西永俊文 なるほどUnixプロセス ― Rubyで学ぶUnixの基礎 Jesse Storimer, 島田浩二(翻訳), 角谷信太郎(翻訳) 知る、読む、使う! オープンソースライセンス 可知豊 きつねさんでもわかるLLVM 柏木餅子, 風薬 デザインディレクション・ブック 橋本 陽夫 現場のプロがやさしく書いたWebサイトの分析・改善の教科書【改訂3版 GA4対応】 小川 卓 解釈可能なAI Ajay Thampi(著), 松田晃一(翻訳) PowerPoint 目指せ達人 基本&活用術 Office 2021 & Microsoft 365対応 PowerPoint基本&活用術編集部 ランサムウェア対策 実践ガイド 田中啓介, 山重徹 TODによるサステナ
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く