タグ

ブックマーク / www.rd.ntt (3)

  • NTT版大規模言語モデル「tsuzumi」 | NTT R&D Website

    近年、ChatGPTを始めとする大規模言語モデル*1に大きな注目が集まっておりますが、これらは膨大な知識をモデル内に有することで高い言語処理性能を示す一方、学習に要するエネルギーは、原発1基1時間分の電力量が必要*2とも言われており、また、運用には大規模なGPUクラスタを必要とし様々な業界に特化するためのチューニングや推論にかかるコストが膨大であることから、サステナビリティおよび企業が学習環境を準備するための経済的負担面で課題があります。 NTTでは、これらの課題を解決する研究開発を進め、今回、軽量でありながら世界トップレベルの日語処理性能を持つ大規模言語モデル「tsuzumi*2」を開発しました。「tsuzumi」のパラメタサイズは6~70億と軽量であるため、市中のクラウド提供型LLMの課題である学習やチューニングに必要となるコストを低減します。「tsuzumi」は英語と日語に対応し

    NTT版大規模言語モデル「tsuzumi」 | NTT R&D Website
  • IOWN|NTT R&D Website

    IOWN構想とは? IOWN(Innovative Optical and Wireless Network)構想とは、あらゆる情報を基に個と全体との最適化を図り、多様性を受容できる豊かな社会を創るため、光を中心とした革新的技術を活用し、これまでのインフラの限界を超えた高速大容量通信ならびに膨大な計算リソース等を提供可能な、端末を含むネットワーク・情報処理基盤の構想です。2024年の仕様確定、2030年の実現をめざして、研究開発を始めています。 IOWNは次の3つの主要技術分野から構成されています。 オールフォトニクス・ネットワーク(APN: All-Photonics Network) <情報処理基盤のポテンシャルの大幅な向上> デジタルツインコンピューティング(DTC: Digital Twin Computing) <サービス、アプリケーションの新しい世界> コグニティブ・ファウンデ

    IOWN|NTT R&D Website
  • 単語親密度データベース|NTTコミュニケーション科学基礎研究所|NTT R&D Website

    単語親密度とは語のなじみ深さを被験者実験により評定したものです。単語親密度は、1から7の間の数値で表されており、大きな数値になるほどなじみ深い語であることを示しています。 NTTでは1995年から単語親密度の調査をはじめ、約8万語の調査結果をまとめたものが1999年にNTTデータベースシリーズ「日語の語彙特性」第1巻として三省堂から刊行されました。 また、2002年には、第1巻に含まれなかった約3万語の追加調査を実施し、同シリーズの第9巻として刊行されました(いずれも絶版。以下「平成版」と呼びます)。 これらは広く利用されてきましたが、初期の調査から時間が経ち、単語親密度の経年変化の可能性があること、 これまでのデータベースに含まれない語が多く出てきていることなどから、この度、第1巻、第9巻に含まれるすべての語の再調査と、新しい語の追加調査を、 合わせて16万語以上について行い、「令和版

    単語親密度データベース|NTTコミュニケーション科学基礎研究所|NTT R&D Website
  • 1