タグ

ブックマーク / tech.preferred.jp (29)

  • PLaMo-13Bを公開しました - Preferred Networks Research & Development

    Preferred Networksでは、9月28日にPLaMo-13Bという大規模な言語モデル (LLM) を公開しました。公開されている他のモデルと比較して、日英2言語を合わせた能力で世界トップレベルの高い性能を示しています。実際に学習を回すまでの技術開発には自社スーパーコンピューターであるMN-2を利用し、学習はAI橋渡しクラウド(AI Bridging Cloud Infrastructure、ABCI) の”第一回 大規模言語モデル構築支援プログラム”を利用して行いました。 今後、PLaMo-13Bを基にした事前学習モデルや、指示学習を行ったモデルについても公開を予定しています。 PLaMo-13Bの概要 PLaMo-13Bは約130億個のパラメータからなる言語モデルです。 PLaMo-13Bは日語・英語の2つの言語のベンチマークタスクで高い性能を示しています。日で使われるL

    PLaMo-13Bを公開しました - Preferred Networks Research & Development
    kuenishi
    kuenishi 2023/09/28
  • 深層学習のための分散キャッシュシステム - Preferred Networks Research & Development

    エンジニアの上野です。Cluster Servicesチームという、PFNのKubernetesベースの機械学習基盤を開発・運用するチームに所属して、基盤の改善や新機能の開発に務めています。記事では、深層学習における学習データセット読み込み速度の改善を目指して開発し、現在もKubernetes上で運用中の分散キャッシュシステムを紹介します。 PFNの機械学習基盤については、ブログ「2022年のPFNの機械学習基盤」もご参照ください。 深層学習における学習データセット読み込み 深層学習を高速化するため、深層学習に向いたアクセラレータの開発が日々続けられています。PFNで開発しているMN-Coreシリーズや、NVIDIA社製GPUもそのひとつです。これらのアクセラレータは高速に行列演算を行うことができ、深層学習の1イテレーションにかかる時間を高速化、ひいては深層学習を活用する研究開発全体を加

    深層学習のための分散キャッシュシステム - Preferred Networks Research & Development
    kuenishi
    kuenishi 2023/07/18
  • Apache Ozoneをやっていた一年 - Preferred Networks Research & Development

    Why Apache Ozone? これまでPFNでは増え続けるデータやユースケースに対応するために、スケールアウト可能なストレージシステムをずっと模索し続けてきました。シミュレーションを基軸とした戦略を採用した[1]ことによりデータ量はさらに増加し、データ保管システムの重要性は高まっています。 Preferred Networks におけるHadoop – Preferred Networks Research で解説した基的な要件は今でも変わっていませんが[2]、現在メインのシステムとして運用している Hadoop (HDFS) にはいくつかのシステム運用上の課題があります。たとえば、一番大きなHadoopクラスタは現時点で物理的に10PB近くのディスク容量を持っていますが、Ubuntu 16.04で動作しています。OSのバージョンアップを伴うクラスタのIn-placeなアップグレー

    Apache Ozoneをやっていた一年 - Preferred Networks Research & Development
    kuenishi
    kuenishi 2021/12/10
    kaita
  • AI創薬技術によるSARS−CoV−2プロテアーゼ阻害薬の探索 - Preferred Networks Research & Development

    新型コロナウイルスのメインプロテアーゼ (紫色)に結合して増殖を阻害する薬剤 (黄色) はじめに 新型コロナウイルス感染症 (COVID-19) は、現在、ワクチンの開発と接種により、感染の拡大が抑えられることが期待されているものの、ウイルスのさらなる変異によるパンデミックの再発を防止するには、SARS-CoV-2を標的とした治療薬の開発が強く望まれています。 レムデシビルなどの核酸合成系を標的とする化合物やREGN-COV2のようなウイルスの抗体を直接注入する治療法は一定の臨床効果が報告され認可されていますが、限定的な用途に限られています。それ以外にも、多くの既存薬剤についてドラッグリポジショニングの研究が行われていますが、認可を得るまでには至っていません。また、変異ウイルスへの脅威に対応するためにも、多様なCOVID-19の治療薬の開発が望まれています。 3CLプロテアーゼ (Mpro

    AI創薬技術によるSARS−CoV−2プロテアーゼ阻害薬の探索 - Preferred Networks Research & Development
    kuenishi
    kuenishi 2021/09/06
  • PFN の Kubernetes クラスタにおける Uninterruptible Sleep との付き合い方 - Preferred Networks Research & Development

    Preferred Networks エンジニアの坂田です。普段は社内向けの GPU サーバークラスタの運用管理の業務などをやっております。 先日、DevOpsDays Tokyo 2021 というイベントで、弊社 須田と一緒に PFN が Kubernetes を使って GPU クラスタを運用する中で経験してきた障害とその対応の自動化や、Kubernetes クラスタそのものの管理・アップグレードの自動化の取り組みについてご紹介しました。 SlideShare: PFNのML/DL基盤を支えるKubernetesにおける自動化 / DevOpsDays Tokyo 2021 エントリでは、その中でご紹介した障害の事例の中から、コーナーケースとして対応に悩まされた Uninterruptible Sleep という状態に入ったプロセスの扱いについてご紹介します。 はじめに PFN のクラ

    PFN の Kubernetes クラスタにおける Uninterruptible Sleep との付き合い方 - Preferred Networks Research & Development
    kuenishi
    kuenishi 2021/06/14
    こういうのをコツコツずっとやっています
  • MN-3の高精度電力計測にむけた取り組み - Preferred Networks Research & Development

    はじめに 2020年11月17日早朝(日時間)に開催されたSC20のTOP500 BoFにおいて、今年2回目のTOP500/Green500ランキングが発表されました。PFNが構築・運用している深層学習用スーパーコンピュータMN-3は前回に続きリストに掲載されました。MN-3は電力効率指標 26.04GFlops/W、最大演算性能 1,652.9TFlops の記録でGreen500 世界第2位(TOP500 331位)になりました。 前回の世界第1位から順位は一つ後退してしまいましたが、前回の記録から23.3%の電力効率性能の向上を実現しておりMN-3の高い演算効率とポテンシャルを改めて証明した結果になりました[1]。 この発表に続いて、翌日2020年11月18日早朝(日時間)にはSC20のGreen500 BoFが開催されました。BoFでは今回のGreen500リストの詳細について

    MN-3の高精度電力計測にむけた取り組み - Preferred Networks Research & Development
    kuenishi
    kuenishi 2020/11/20
  • Preferred Networks at NeurIPS 2019 - Preferred Networks Research & Development

    kuenishi
    kuenishi 2019/12/10
  • Technologies behind Distributed Deep Learning: AllReduce - Preferred Networks Research & Development

    This post is contributed by Mr. Yuichiro Ueno, who were a Summer intern in 2017 and a part time engineer at PFN. If the mathematical expressions are not displayed correctly, please reload the page via this link. Hello, I am Yuichiro Ueno. I participated in a summer internship program at PFN in 2017, and I currently work as a part-time engineer. I am an undergraduate student at Tokyo Institute of T

    Technologies behind Distributed Deep Learning: AllReduce - Preferred Networks Research & Development
    kuenishi
    kuenishi 2018/07/17
  • DNN推論用ライブラリ「Menoh」リリースについて - Preferred Networks Research & Development

    Python以外も使いたくないですか?  特にDeepLearning界隈で. Menoh開発者の岡田です.この記事ではMenohの紹介と開発に至った動機について説明します. Menohのレポジトリ: https://github.com/pfnet-research/menoh Menoh(メノウ)は学習済みのDNNモデルをONNX形式から読み込んで動作させる推論専用のライブラリです.実装はC++で書きましたが,C言語のインターフェースを持たせて,他の言語用からもその機能を呼び出しやすくしてあります.リリース時点でC++版ラッパーとC#版ラッパー,Haskell版ラッパーがあり,Ruby版ラッパーとNodeJS版ラッパー,Java(JVM)版ラッパーが開発中です.バックエンドにはIntelの開発しているMKL-DNNを採用し,GPUが無くてもIntel CPUが使える環境で高速にモデルの

    DNN推論用ライブラリ「Menoh」リリースについて - Preferred Networks Research & Development
    kuenishi
    kuenishi 2018/06/21
    “宇宙”
  • ChainerMNのクラウド環境向け新機能とAWSにおける性能評価 - Preferred Networks Research & Development

    ※この記事はChainer Blogの抄訳です Chainer にマルチノードでの分散学習機能を追加するパッケージであるChainerMN に、ネットワークスループットが低いシステム向けの以下の2つの機能をv1.2.0とv1.3.0で追加しました。 Double bufferingによる通信時間の隠ぺい機能 半精度浮動小数点数(FP16)によるAll-Reduce機能 ChainerMNは高速なネットワークを持つスーパーコンピュータやMicrosoft Azureのようなシステムを想定して開発してきたため、高速なネットワークのない環境では高い並列性能を達成するのが難しいという問題がありました。しかし、これらの機能を使うことで、GTC2018で発表したようにAmazon Web Services (AWS)のような一般的なシステムでもChainerMNによって高い並列性能を達成することができ

    kuenishi
    kuenishi 2018/05/25
  • Preferred Research |「人間中心のAI社会原則検討会議」に参加しました。

    5/8に開催された内閣府主催の「人間中心のAI社会原則検討会議」に出席してきました。 土井と申します。普段は細々とネットワークの研究を行いつつクラスタ関係とりまとめをやっています。出身大学がinterdisciplinaryなところなので、いろいろな領域に首を突っ込んでいます。そのような活動の一環で、社内のslackAIと社会に関して考えるチャネルを作り、PFNフェローの丸山を中心として何人かの興味あるメンバーとで、社会動向のウォッチングや、必要な意見表明[1]などをしています。例えば、2017年頭に「AI開発ガイドライン(仮称)」へのパブリックコメントをPFN名で提出しましたが、そのパブリックコメントの最初のドラフトは私が書いたものでした。 そんな中、弊社丸山が掲題の「人間中心のAI社会原則検討会議」にお誘いいただきました。ただ、丸山は残念ながらこの日に外せない終日の予定が入っており、

    Preferred Research |「人間中心のAI社会原則検討会議」に参加しました。
    kuenishi
    kuenishi 2018/05/10
  • 「コンピューターサイエンスのすべての分野に精通していること」という応募資格に込めた想い | Preferred Research

    ※PFNの募集要項は、ブログの内容をふまえ、適切に意図が伝わるよう一部更新しました PFN代表の西川です。 今回は、SNS上でもたびたび話題(炎上?)になっているPFNの応募資格について、改めてご紹介したいと思います。 PFNの採用募集ページに書かれたリサーチャーの条件には、「コンピュータサイエンスのすべての分野に精通していること」という一文があります。この条件は、PFIの時から、リサーチャーの応募資格として常に掲げてきました。 その背景にある想いは、コンピュータサイエンスの研究をする上では、一つの分野だけでなく、幅広い分野について深い知見を有することが極めて重要である、ということです。たとえば、データベースの研究をする上では、トランザクション処理の理論や関係代数について詳しく知っているだけではなく、データベースを動かすコンピュータアーキテクチャ、ストレージ、また、今では分散データベース

    「コンピューターサイエンスのすべての分野に精通していること」という応募資格に込めた想い | Preferred Research
    kuenishi
    kuenishi 2018/02/27
  • 技術と時機 - Preferred Networks Research & Development

    2000年前後、クラウドという言葉が立ち上がった時、クラウドビジネスを立ち上げた企業の多くは失敗しました。 (例:opsware 彼らはその後システム運用ツール提供で生き残ることができました)。 クラウドという言葉はそれ以降あまり聞くことはなくなりました。2006年GoogleのErick Schmidtがクラウドという言葉を再登場させ、AmazonAWSを提供開始します。それ移行クラウドは爆発的に普及し、ITの戦場は全てクラウドに移行しつつあります。 (IBMですら、半導体部門を売却しクラウドに移行できるかに社運をかけています link) 自社運用やDC運用をしている企業もまだ多く存在しますが、パブリック・クラウドを利用している企業の競争力は増すため、今後10年ぐらいを考えるとパプリッククラウドの影響力はさらに増していくと考えられます。 IoTという言葉も1999年から存在します。私自

    技術と時機 - Preferred Networks Research & Development
    kuenishi
    kuenishi 2017/09/20
    声に出して読みたい種類の日本語です
  • 分散深層学習パッケージ ChainerMN 公開 - Preferred Networks Research & Development

    Chainer にマルチノードでの分散学習機能を追加するパッケージ ChainerMN のベータ版を公開しました。 GitHub ドキュメント ChainerMN とは ChainerMN は Chainer の追加パッケージで、Chainer を用いた学習を分散処理により高速化できます。柔軟で直感的に利用できる Chainer の利便性をそのままに、学習時間を大幅に短縮できます。1 ノード内の複数の GPU を活用することも、複数のノードを活用することもできます。既存の学習コードから数行の変更で ChainerMN を利用可能です。ChainerMN は既に社内の複数のプロジェクトで実証が行われています。 Chainer を用いた通常の学習における 1 イテレーションは下図のように Forward, Backward, Optimize の 3 つのステップからなります。 Chainer

    kuenishi
    kuenishi 2017/05/09
    (๑•̀ㅂ•́)و✧
  • 人工知能技術の健全な発展のために - Preferred Networks Research & Development

    4月10日の日経ITproの記事「 AIベンチャーの雄が総務省の開発指針に反対する理由」で、総務省主導で推進されているAIネットワーク社会推進会議とその開発原則分科会からPFNが離脱したことを、取り上げていただきました。私とのとりとめのないインタビューを適切にまとめてくださった日経ITpro浅川記者に深く感謝いたします。また、その記事に対して、はてなブックマーク、NewsPicks、FacebookなどのSNSを通して多くのコメントを下さった方にも感謝の意を表します。ありがとうございます。離脱の理由は記事にある通りですが、総務省の方々も私達の立場を真摯に受け止めてくださっていて、実りのある議論を続けてくださっています。その上で、今後の議論を深めるために、いくつかの点について補足したいと思います。 汎用人工知能と特化型人工知能 現在、人工知能という言葉は大雑把には、 汎用人工知能(「強い」人

    人工知能技術の健全な発展のために - Preferred Networks Research & Development
    kuenishi
    kuenishi 2017/04/12
    専門家の理想的な認識と態度
  • ChainerMN による分散深層学習の性能について - Preferred Networks Research & Development

    米サンフランシスコで開催された「Deep Learning Summit 2017」にて、PFN は Chainer のマルチノードでの分散学習対応への取り組みについて発表しました。記事では、その発表について詳しく説明していきます。 分散深層学習の重要性と現状 GPU の性能は継続的に向上していますが、より大きなデータを活用してより精度の高いモデルを実現するために、深層学習で使われるモデルのパラメータ数や計算量も増大しています。そのため、現在でも、Chainer を含む一般的なフレームワークを用いた標準的な学習では 1 週間以上かかってしまうようなユースケースが少なくありません。より大規模なデータを扱ったり、試行錯誤のイテレーションを効率化するために、複数の GPU を連携させ学習を高速化させることは重要な課題です。そこで、我々は Chainer にマルチノードでの分散学習の機能を追加す

    ChainerMN による分散深層学習の性能について - Preferred Networks Research & Development
    kuenishi
    kuenishi 2017/02/09
    いろいろなパラメータのトレードオフまで解説してあって素晴らしい。自社製品のベンチマークの公開としては理想的なやり方ですばらしい、BenchmarketingとかMicrobenchmarkやってるところは見習ってほしい
  • PFI/PFNのパーティーでプログラミングビンゴ大会を開催しました - Preferred Networks Research & Development

    海野です。先週の金曜日に、PFIの設立10周年およびPFI/PFNのオフィス移転を記念してパーティーを行いました。主に、株主様や取引先様、また社員のご家族を呼んだパーティーで、ホテルのパーティー会場を借りて行いました。 この中でプログラミングコンテストビンゴ大会という、おそらく日で(世界で?)類を見ない余興を実施しました。 今日は当日の様子と、開催の経緯をお伝えしようと思います。 まず、プログラミングコンテスト(競技プログラミング)をご存じない方のために解説します。 プログラミングコンテストは、課題となる問題が与えられて制限時間内にその課題を解くプログラムを作成します。 問題は複数与えられるのが普通で、解いた問題数や、解くのにかかった時間で勝敗が決定します。 課題と言ってもソフトウェア開発的なものではなく、数学の試験に近いものが多く、その場で時間・空間計算量を見積もってアルゴリズムを考案

    PFI/PFNのパーティーでプログラミングビンゴ大会を開催しました - Preferred Networks Research & Development
    kuenishi
    kuenishi 2016/06/17
  • 新入社員の丸山(宏)です - Preferred Networks Research & Development

    新入社員の丸山(宏)です。4/1に入社してから、一週間が経ちました。PFNにはもう一人先輩社員の丸山さんがいて、なのでもう先生ではないですが、「まるやませんせい」と社内で呼ばれたりもしています。 今回の転職は私にとっては3回めの転職になります。外資系のIBM、国内大手のキヤノン、それに政府の研究機関である統計数理研究所、それぞれに大きく環境や文化が違って、転職の度に「おおっ」と思うことがありました。PFNは4つ目の職場ですが、やはり大きく違います。なんと言っても、最大の違いは意思決定のスピードでしょう。私は入社時には「エグゼクティブ・フェロー」という肩書をいただいていましたが、翌週には「Chief Strategy Officerをやってください」、と言われてその場で肩書が変わりました。さらに、この一週間のうちに、どんどん会社の方針も変わっていくのを目の当たりにしました。大学共同利用機関法

    新入社員の丸山(宏)です - Preferred Networks Research & Development
    kuenishi
    kuenishi 2016/04/12
  • データ解析作業の救世主! 超絶☆実験ビルドシステムmafをOSS公開しました - Preferred Networks Research & Development

    Photo by midiman under Creative Commons License (original) メリークリスマフ! 得居です。今日はクリスマスですね。皆様昨日はいかがお過ごしでしたでしょうか? クリスマスということで、今日は私たちから皆様に、特にデータ解析や論文執筆、手法の比較検証のために計算機上で様々な実験をしている方々に、プレゼントがあります! Github – pfi/maf 今日、実験結果を「ビルドする」ためのツールmafを公開しました! mafは、PFIでもよく使われているPythonベースのビルドツールwafを実験に使うための拡張です。大まかな使い方を学ぶために、ドキュメントとサンプルも公開しています。 maf — maf 0.1 documentation サンプル 実験手順をビルドだと思って宣言的に書くこと自体はwaf等既存のビルドツールで可能です。m

    データ解析作業の救世主! 超絶☆実験ビルドシステムmafをOSS公開しました - Preferred Networks Research & Development
    kuenishi
    kuenishi 2013/12/25
    「mafは辛い実験生活をサポートしてくれる縁の下の力持ち的な存在」
  • 【ステマでは】日本語入力を支える技術【ありません】 - Preferred Networks Research & Development

    徳永です。 日本語入力を支える技術というを書きましたので今回はその宣伝をします。なお、自体は技術評論社から2/8に発売されております。 もう既に個人ブログで 2回 ほど 書いたのですが、なんとかそれとはかぶらないネタをひねりだいたいと思います。 まず、日本語入力を支える技術がどのような用途に使えるかをリストアップしてみます。 日本語入力の入門書として 自然言語処理の入門書として 機械学習の入門書として 鍋敷きとして ちり紙として 折り紙として 胸ポケットに入れておくと銃弾を止められるかもしれない (大変危険ですので実験はおやめ下さい) ちり紙以降はそのような利用も不可能ではない、という程度の利用可能性ではありますが、著者としてはすべての可能性を挙げておきたいと考え、記述しました。このように、色々な用途に役に立ちます。書名に「日本語入力」と入っていますが、日本語入力以外にも使いまわせる内

    【ステマでは】日本語入力を支える技術【ありません】 - Preferred Networks Research & Development
    kuenishi
    kuenishi 2012/02/18
    ステマではなく堂々とした宣伝。無事に積んだのでそのうち読む