並び順

ブックマーク数

期間指定

  • から
  • まで

41 - 48 件 / 48件

新着順 人気順

Databricksの検索結果41 - 48 件 / 48件

  • Databricksで日本語DollyデータセットによるDollyのトレーニングを試す - Qiita

    こちらでもトレーニング用のスクリプトが公開されたので、日本語データセットでトレーニングしてみました。 データセットの準備 データセットは引き続きこちらを活用させていただきました。 ただ、トレーニング用のスクリプトで前提としているJSONのカラム名と上のJSONのカラム名が異なっているので変換しています。変換したものはこちらに公開しています。jsonl形式です。 変換処理はこちら。 import json json_open = open("/dbfs/FileStore/shared_uploads/takaaki.yayoi@databricks.com/dolly/databricks_dolly_15k_ja.json", 'r') json_load = json.load(json_open) new_json_list = [] for element in json_load

      Databricksで日本語DollyデータセットによるDollyのトレーニングを試す - Qiita
    • Databricks vs. Snowflake: An Honest Comparison in 2024

        Databricks vs. Snowflake: An Honest Comparison in 2024
      • Databricks Certified Machine Learning Associate 合格体験記 - Qiita

        学習方法 1. 公式eラーニングによる勉強 下記のサイトでログインして、"Machine Learning Practitioner Learning Plan"を検索して"ENROLL"します。 https://www.databricks.com/learn/training/login このeラーニングでは6つのレッスンがありますが、最初の3つはDatabricks Certified Machine Learning Associateの範囲となります。 Certification Overview: Databricks Certified Machine Learning Associate Exam このレッスンは一番最初に実施するのがおすすめです。 試験の概要やトピックが説明されるので、試験の全体像を掴むに役立ちます。 特にトピックは非常に重要です。試験ではこれらのトピック

          Databricks Certified Machine Learning Associate 合格体験記 - Qiita
        • Databricks におけるデータエンジニアリング

          Databricksにおけるデータエンジニアリングについて説明します。

            Databricks におけるデータエンジニアリング
          • GoogleがDatabricksをクラウドプラットフォームに導入

            Spring BootによるAPIバックエンド構築実践ガイド 第2版 何千人もの開発者が、InfoQのミニブック「Practical Guide to Building an API Back End with Spring Boot」から、Spring Bootを使ったREST API構築の基礎を学んだ。この本では、出版時に新しくリリースされたバージョンである Spring Boot 2 を使用している。しかし、Spring Boot3が最近リリースされ、重要な変...

              GoogleがDatabricksをクラウドプラットフォームに導入
            • Databricks記事のまとめページ(その1) - Qiita

              これまでに自身で翻訳した or 投稿したDatabricks記事をまとめています。随時更新していきます。 Apache Spark徹底入門 2024/4/12に翔泳社よりApache Spark徹底入門を出版しました! Apache Spark徹底入門を出版しました! 以下では書籍で触れているサンプルをウォークスルーしています。 Sparkでテキストの行数を数える SparkでM&M'Sを数える Sparkデータフレームのスキーマ定義、エクスプレッションの活用 SparkのUDF、Spark SQL Sparkのデータソース Sparkのテーブル Sparkのユーザー定義関数、高階関数 SparkデータフレームとSpark SQLの一般的なリレーショナルオペレーター Sparkのベクトライズドユーザー定義関数 Sparkにおけるデータキャッシュ SparkによるAirbnbデータセットのク

                Databricks記事のまとめページ(その1) - Qiita
              • Databricksの認定資格 全部とってみたので体系的にまとめる - Qiita

                はじめに 株式会社NTTデータ デザイン&テクノロジーコンサルティング事業本部 の nttd-saitouyun です。 最近はDatabricksを勉強してみたいという話をよく聞くようになってきました。その中で必ずと言っていいほど話題に上がるのが「認定資格」です。 「難しいの?」「実用的なの?」「AWSの試験と何が違うの?」「ラーニングパスは?」等々、様々な質問を受けてきました。今回はDatabricksの全7認定(2024年4月時点)に合格した経験から認定試験の全体像について記載します。 注意 難易度や実用性等の評価はあくまで主観となりますのでご注意ください。目線としてはデータエンジニアに近いと思います 本文中に、AWS Certified Data Analytics – Specialty (DAS)について言及する記載がありますが、4/8に試験としては廃止されています。すでに当該

                  Databricksの認定資格 全部とってみたので体系的にまとめる - Qiita
                • DatabricksからGCPのCloud Translation Basicで翻訳を行う - Qiita

                  作業の過程で使えるのかなと思った次第で。普通に使えました。 事前準備 Cloud Translation APIの有効化 サービスアカウントの作成 キーの取得: ローカルにjsonファイルをダウンロードします。ここでは、credential.jsonとします。 { "type": "service_account", "project_id": "my-project", "private_key_id": "...", "private_key": "-----BEGIN PRIVATE .... def translate_text(target, text): """Translates text into the target language. Target must be an ISO 639-1 language code. See https://g.co/cloud/tr

                    DatabricksからGCPのCloud Translation Basicで翻訳を行う - Qiita