El sistema Apache Hadoop

El sistema Apache Hadoop es el software más comúnmente asociado con Big Data. Está diseñado para tratar desde servidores individuales a cientos de ordenadores. Funciona como un marco para procesar grandes volúmenes de datos a través de grupos de ordenadores usando modelos de programación sencillos.

El sistema Apache Hadoop está diseñado para tratar desde servidores individuales a cientos de ordenadores, cada uno ofreciendo computación local y almacenamiento. Este sistema se basa en Java y permite fragmentar tareas de cálculo en diferentes procesos y distribuirlos en los nodos de un grupo interrelacionado de ordenadores, de forma que puedan trabajar en paralelo. De hecho pueden usarse miles de ordenadores, lo cual resulta más rentable porque no se necesita una máquina de última generación, sino varios servidores estándar.

En lugar de depender del hardware para ofrecer alta disponibilidad, Apache Hadoop está diseñado para detectar y gestionar fallos en la capa de aplicación.

Hadoop es un paquete muy amplio de software y por esa razón a veces se le denomina ecosistema Hadoop. Este paquete incluye, junto a los componentes centrales (Core Hadoop), una gran variedad de extensiones (Pig, Chukwa, Oozie o ZooKeeper) que añaden un gran número de funciones adicionales al framework y sirven para la manipulación de grandes volúmenes de grupos de datos.

La base del ecosistema Hadoop es el Core Hadoop. Sin embargo, el proyecto incluye los siguientes módulos:

Hadoop Common: las utilidades en común que apoyan a otros módulos de Hadoop.

Hadoop Distributed File System (HDFS): un sistema de distribución de archivos que provee alto acceso a datos de aplicación.

Hadoop YARN: un marco para agendar trabajo y agrupación de gestión de recursos.

Hadoop MapReduce: un sistema basado en YARN para procesamiento en paralelo de grandes volúmenes de datos.

El módulo básico Hadoop Common, el Hadoop Distributed File System (HDFS) y un motor MapReduce son los componentes de la primera versión. A partir de la versión 2.3 este último fue sustituido por la tecnología de gestión de grupos de ordenadores interconectados YARN, también denominada MapReduce 2.0.

Este es el configurador avanzado de cookies propias y de terceros. Aquí puedes modificar parámetros que afectarán directamente a tu experiencia de navegación en esta web.

Cookies técnicas (necesarias)

Estas cookies son importantes para darte acceso seguro a zonas con información personal o para reconocerte cuando inicias sesión.

Consultar

Denominación	Titular	Duración	Finalidad
gobp.lang	BBVA	1 mes	Preferencia de idioma
aceptarCookies	BBVA	1 año	Configuración Cookies aceptadas
_abck	BBVA	1 año	Ayuda a protegerse contra los ataques de sitios web maliciosos
bm_sz	BBVA	4 horas	Ayuda a protegerse contra los ataques de sitios web maliciosos
ADRUM_BTs	Salesforce Marketing Cloud	Sesión	Requerido para la supervisión del servicio, inherente al SFMC
ADRUM_BT1	Salesforce Marketing Cloud	Sesión	Requerido para la supervisión del servicio, inherente al SFMC
ADRUM_BTa	Salesforce Marketing Cloud	Sesión	Requerido para la supervisión del servicio, inherente al SFMC
ADRUM_BT	Salesforce Marketing Cloud	Sesión	Requerido para la supervisión del servicio, inherente al SFMC
xt_0d95e	Salesforce Marketing Cloud	Sesión	Recordar las preferencias del usuario (si las hay)
__s9744cdb192d044faa1bf201d29fafd1e	Salesforce Marketing Cloud	Sesión	Recordar las preferencias del usuario (si las hay)
wpml_browser_redirect_test	WPML	Sesión	Traducción de textos del portal
wp-wpml_current_language	WPML	24 horas	Traducción de textos del portal

No quiero cookies de Analítica

Permiten medir, de forma anónima, el número de visitas o la actividad. Gracias a ellas podemos mejorar constantemente tu experiencia de navegación.

Con tu selección no podemos ofrecerte una mejora continua en la experiencia de navegación.

Ver listado completo de este tipo de cookies

Denominación	Titular	Duración	Finalidad
AMCV_***	Adobe Analytics	Sesión	ID de visitante único que se usan en las soluciones de Marketing Cloud
AMCVS_***	Adobe Analytics	2 años	ID de visitante único que se usan en las soluciones de Marketing Cloud
demdex (safari)	Adobe Analytics	180 días	Crear y almacenar identificadores únicos y persistentes
sessionID	Adobe Analytics	Sesión	Cookie interna de Launch usada para identificar al usuario
gpv_URL	Adobe Analytics	Sesión	plugin Adobe Analytics: getPreviousValue Capturar el valor de una determinada variable en la siguiente vista de página, en este caso la prop1
gpv_level1	Adobe Analytics	Sesión	Cookie utilizada para almacenar el levl1 del DataLayer de la página anterior.
gpv_pageIntent	Adobe Analytics	Sesión	Cookie utilizada para almacenar el pageIntent de la página anterior.
gpv_pageName	Adobe Analytics	Sesión	Cookie utilizada para almacenar el pagename de la página anterior.
aocs	Adobe Analytics	Sesión	Cookie que almacena los primeros valores recogidos al inicio de un proceso.
TTC	Adobe Analytics	Sesión	Cookie usada para almacenar el tiempo transcurrido entre el evento App Page Visit y App Completed.
TTCL	Adobe Analytics	Sesión	Cookie usada para almacenar el tiempo transcurrido entre el evento LogIn y App Completed.
s_cc	Adobe Analytics	Sesión	Determinar si las cookies están activas
s_hc	Adobe Analytics	Sesión	Cookie usada por Adobe con propositos de analítica.
s_ht	Adobe Analytics	Sesión	Cookie usada por Adobe con propositos de analítica.
s_nr	Adobe Analytics	2 años	Determinar el número de visitas de usuario
s_ppv	Adobe Analytics	Persistente	plugin Adobe Analytics: getPercentPageViewed Determinar el procentaje de página que visualiza un usuario
s_sq	Adobe Analytics	Sesión	Funcionalidades ClickMap/ActivityMap
s_tp	Adobe Analytics	Sesión	Cookie usada por Adobe con propositos de analítica.
s_visit	Adobe Analytics	2 años	Cookie usada por Adobe para saber cunado una sesión se ha iniciado.

No quiero cookies de Publicidad

Permiten que la publicidad que te mostramos sea personalizada y relevante para ti. Gracias a estas cookies no verás anuncios que no te interesen.

Con tu selección pierdes la personalización de la publicidad, solo verás anuncios genéricos.

Ver listado completo de este tipo de cookies

Denominación	Titular	Duración	Finalidad
OT2	VersaTag	90 días	Cookie de VersaTag usada para almacenar un id de usuario y el numero de visitas del usuario.
u2	VersaTag	90 días	Cookie de VersaTag en la que se almacena el ID del usuario
TargetingInfo 2	MediaMind	1 año	Cookie que sirve para asignar un número unico random que genera MediaMind.

No quiero cookies de Personalización

Estas cookies están relacionadas con características generales como, por ejemplo, el navegador que utilizas.

Con tu selección no podemos ofrecerte una navegación y contenidos personalizados.

Ver listado completo de este tipo de cookies

Denominación	Titular	Duración	Finalidad
mbox	Adobe Target	9 días	Cookie usada por Adobe Target para hacer test de personalizacion de experencia del usuario.

El sistema Apache Hadoop

También podría interesarte

Qué es una API, tipos de APIs y cómo funcionan

Qué es y para qué sirve la automatización de procesos empresariales

Gestión de procesos administrativos y cómo automatizarlos con las APIs