Tutorial de Apache Pig

Tutorial de Apache Pig

Apache Pig es una abstracción de MapReduce. Es una herramienta / plataforma que se utiliza para analizar grandes conjuntos de datos, representándolos como flujos de datos. El cerdo se suele utilizar con Hadoop; podemos hacer toda la manipulación de datos en Hadoop usando Pig.

La audiencia

Este tutorial está destinado a todos los profesionales de Hadoop que deseen realizar operaciones de MapReduce sin tener que introducir un código Java complejo.

Prerrequisitos

Para aprovechar al máximo este tutorial, debe tener una buena comprensión de los conceptos básicos de los comandos de Hadoop y HDFS. Sin duda le ayudará si es bueno en SQL.

🚫