Overview
Programming Guides
Quick Start RDDs, Accumulators, Broadcasts Vars SQL, DataFrames, and Datasets Structured Streaming Spark Streaming (DStreams) MLlib (Machine Learning) GraphX (Graph Processing) SparkR (R on Spark) PySpark (Python on Spark)
API Docs
Scala Java Python R SQL, Built-in Functions
Deploying
Overview Submitting Applications
Spark Standalone Mesos YARN Kubernetes
More
Configuration Monitoring Tuning Guide Job Scheduling Security Hardware Provisioning Migration Guide
Building Spark Contributing to Spark Third Party Projects

Decision trees

This section has been moved into the classification and regression section.