Tutorial de Apache Tajo

Tutorial de Apache Tajo

Apache Tajo es un marco de almacenamiento de datos distribuido de código abierto para Hadoop. Tajo fue fundada originalmente por Gruter, una empresa de infraestructura basada en Hadoop en Corea del Sur. Posteriormente, especialistas de Intel, Etsy, NASA, Cloudera, Hortonworks contribuyeron al proyecto. Tajo en coreano significa avestruz. En marzo de 2014, Tajo recibió el proyecto Apache de código abierto de alto nivel. Este tutorial explorará los conceptos básicos de Tajo y luego explicará la configuración del clúster, el contenedor de Tajo, las consultas SQL, la integración con otras tecnologías de big data y finalmente concluye con algunos ejemplos.

La audiencia

Antes de continuar con este tutorial, debe tener un buen conocimiento del kernel de Java, cualquier sistema operativo Linux y cualquier DBMS.

Prerrequisitos

Este tutorial ha sido preparada para profesionales que buscan carreras en Big Data Analytics. Este tutorial le dará suficiente conocimiento sobre Apache Tajo.

🚫