Hadoop

Cómo instalar y configurar Apache Hadoop en un solo nodo en CentOS 7
Apache Hadoop es una compilación de marco de código abierto para el almacenamiento distribuido de Big Data y el procesamiento de datos en clústeres de...
Instalar y configurar el programador de flujo de trabajo Apache Oozie para CDH 4.X en RHEL / CentOS 6/5
Oozie es un programador de código abierto para Hadoop, simplifica el flujo de trabajo y la coordinación entre trabajos. Podemos definir la dependencia...
Instale Hadoop Multinode Cluster usando CDH4 en RHEL / CentOS 6.5
Hadoop es un marco de programación de código abierto desarrollado por apache para procesar big data. Usa HDFS (Sistema de archivos distribuido Hadoop)...
Cómo ejecutar Hadoop sin usar SSH
La empezar-todo.sh y para todo.sh Los scripts en el directorio hadoop / bin usarán SSH para lanzar algunos de los demonios de Hadoop. Si por alguna ra...
Cómo modificar el nivel de registro de Hadoop
De forma predeterminada, el nivel de registro de Hadoop está configurado en INFO. Esto puede ser demasiado para la mayoría de los casos, ya que genera...
Comprender el marco de Hadoop MapReduce
Esta publicación presenta el marco MapReduce que le permite escribir aplicaciones que procesan grandes cantidades de datos, en paralelo, en grandes gr...
Preguntas del examen de práctica de HDPCA y detalles de la configuración de la instancia de AWS
Antes de realizar el examen HDPCA, puede familiarizarse con el examen utilizando el examen de práctica HDPCA en la nube de AWS. El examen de práctica ...
Cómo configurar las colas del programador de capacidad mediante YARN Queue Manager
Nota: Esta publicación es parte de la serie de objetivos del examen HDPCA El programador de capacidad está diseñado principalmente para tenencia múlti...
Objetivo del examen HDPCA configurar HiveServer2 HA (Parte 2 configurar HA)
Nota: Esta publicación es parte de la serie de objetivos del examen HDPCA Hive comenzó con HiveServer1. Sin embargo, esta versión del servidor Hive no...