Spark Performance Optimization Series: #1. Skew, by Himansu Sekhar, road to data engineering

Description

In Spark cluster data is typically read in as 128 MB partitions which ensures even distribution of data. However, as the data is transformed (e.g. aggregated), it is possible to have significantly…

Cranking the Voltage on Spark: Achieve Peak Performance with Optimization, by BlackRockEngineering

Spark Performance Optimization Series: #1. Skew, by Himansu Sekhar, road to data engineering

Performance optimization lessons from Spark+AI and Data+AI Summits on - articles about Apache Spark

Azarudeen S on LinkedIn: #spark #apachespark #spark #optimization #interviewpreparation

Spark Performance Tuning .pdf

Performance optimization lessons from Spark+AI and Data+AI Summits on - articles about Apache Spark

Optimizing Apache Spark Performance: Tackling Data Skew for Faster Big Data Processing, by VivekR

Data engineering and intelligent computing : proceedings of IC3T 2016 978-981-10-3223-3, 9811032238, 978-981-10-3222-6

Cranking the Voltage on Spark: Achieve Peak Performance with Optimization, by BlackRockEngineering

1.5 Years of Spark Knowledge in 8 Tips, by Michael Berk