Apache Pig es una abstracción de MapReduce. Es una herramienta / plataforma que se utiliza para analizar grandes conjuntos de datos, representándolos como flujos de datos. El cerdo se suele utilizar con Hadoop; podemos hacer toda la manipulación de datos en Hadoop usando Pig.
Este tutorial está destinado a todos los profesionales de Hadoop que deseen realizar operaciones de MapReduce sin tener que introducir un código Java complejo.
Para aprovechar al máximo este tutorial, debe tener una buena comprensión de los conceptos básicos de los comandos de Hadoop y HDFS. Sin duda le ayudará si es bueno en SQL.
🚫