Spark シェルは、Scala REPL (Read-Eval-Print-Loop) がベースになっています。このシェルを使用すると、Spark プログラムをインタラクティブに作成し、作業をフレームワークに送信できます。Spark シェルには、SSH を使用してプライマリノードに接続し、spark-shell を呼び出すことでアクセスできます。プライマリノードへの接続の詳細については、「Amazon EMR 管理ガイド」の「Connect to the primary node using SSH」を参照してください。次の例では、Amazon S3 に格納された Apache HTTP Server アクセスログを使用します。