Spark SQL

Tutorial de Spark SQL

Apache Spark es una computación en clúster ultrarrápida diseñada para computación rápida. Se construyó sobre Hadoop MapReduce y amplía el modelo MapReduce para usar de manera más eficiente más tipos de cálculo, incluidas las consultas interactivas y la transmisión. Este es un tutorial rápido que explica los conceptos básicos de la programación Spark SQL.

La audiencia

Este tutorial ha sido preparada para profesionales que buscan aprender los conceptos básicos del análisis de big data utilizando Spark Framework y convertirse en desarrolladores de Spark. También será útil para analistas y desarrolladores de ETL.

Prerrequisitos

Antes de continuar con este tutorial, asumimos que ya está familiarizado con la programación de Scala, los conceptos de bases de datos y cualquier versión del sistema operativo Linux.

🚫