Tutorial de HCatalog

Tutorial de HCatalog

HCatalog es una herramienta de gestión de almacenamiento de tablas para Hadoop que proporciona datos de tablas de metastor de Hive a otras aplicaciones de Hadoop. Permite a los usuarios con varias herramientas de procesamiento de datos (Pig, MapReduce) escribir datos fácilmente en la cuadrícula. HCatalog garantiza que los usuarios no tengan que preocuparse por dónde y en qué formato se almacenan sus datos. Este es un pequeño tutorial que solo explica los conceptos básicos de HCatalog y cómo usarlo.

La audiencia

Este tutorial está dirigida a profesionales que buscan una carrera en análisis de big data utilizando Hadoop Framework. Los desarrolladores de ETL y los profesionales de la analítica en general también pueden utilizar este tutrial para su beneficio.

Prerrequisitos

Antes de continuar con este tutorial, necesita un conocimiento básico de Core Java, los conceptos de bases de datos SQL, el sistema de archivos Hadoop y cualquier versión del sistema operativo Linux.

🚫