Las siete ‘V’ del Big Data

Las nuevas cadenas de valor son las de los datos. Big Data es un concepto que describe el gran volumen de datos, tanto estructurados como desestructurados, que hoy por hoy inunda el mundo de los negocios. No obstante, lo más importante no es la cantidad de datos, sino lo que se hace con ellos.

El Big Data es un término que se ha acuñado para referirse a la manipulación de una gran cantidad de datos y puede ser analizado para obtener información o insights que a largo plazo lleven a mejores decisiones y estrategias empresariales. Beneficia a áreas tan variadas como las relaciones con los clientes, la optimización de operaciones y la prevención de fraude. El volumen masivo, la variedad y la velocidad que ahora toma la información hace imprescindible capturar, almacenar y analizar todo este complejo engranaje. Por ello, al Big Data le caracterizan las denominadas ‘cinco V’:

Volumen

Los datos almacenados en los depósitos de las empresas ha pasado de ocupar megabytes a gigabytes y luego a petabytes. El 90% de toda la información existente se ha creado en los últimos 2 años. Para hacernos una idea, Google procesaba más de 20 petabytes al día ¡en 2008!

Se estima que este año se procesarán en el mundo 40 zettabytes de datos y se prevé que la cantidad de datos en el mundo se duplicará cada dos años. Un gran contribuyente del volumen de datos es el Internet de las Cosas (IoT por sus siglas en inglés), el cual obtiene una cantidad ingente de información a través de sensores.

Velocidad

La velocidad del movimiento, proceso y captura de datos dentro y fuera de la empresa ha aumentado significativamente. Los modelos basados en inteligencia de negocios generalmente suelen tardar días en procesarse, frente a las necesidades analíticas de hoy en día que requieren la captura y procesamiento de datos “casi” en tiempo real, gracias al flujo de datos a alta velocidad.

La velocidad prácticamente a tiempo real es gracias a la ubicuidad y la disponibilidad de dispositivos conectados a internet, sean estos inalámbricos o no. Hoy por hoy, la velocidad de transmisión de la información es extraordinaria. Por ejemplo, se estima que se suben 500 horas de vídeo a YouTube por minuto y que en ese mismo tiempo se envían 200 millones de correos electrónicos.

Variedad

La diversidad de datos ha explotado, pasando de ser datos almacenados y estructurados, guardados en bancos de datos empresariales, a ser desestructurados, semiestructurados y con distintos formatos (audios, vídeos, XMLs, etc.). A modo de ejemplo, más de 3,5 miles de millones de personas realizan llamadas, mandan mensajes de texto, tuitean y navegan por internet con teléfonos móviles.

Se estima que hoy por hoy, el 90% de los datos son generados de manera desestructurada. Y no todos los métodos de análisis valen para todo tipo de datos, por lo que estos deben adecuarse a la naturaleza de la información en cuestión.

Veracidad

Se busca promover la búsqueda de la veracidad de los datos para la obtención de información confiable. A los datos veraces se les puede sacar un mayor provecho por el grado de calidad que presentan. Esto resulta particularmente relevante para organizaciones que centran su negocio en la información.

No obstante, ante la gran cantidad de información existente, hay quienes consideran la veracidad una característica secundaria del Big Data.

Valor

Hace referencia a la rentabilidad resultante de la gestión de los datos. La clave del Big Data no es la cantidad ingente de información, sino el uso y/o manejo que se haga de ella. Aunque la implementación de infraestructuras informáticas para lidiar con los grandes volúmenes de datos es costosa, esta puede proporcionar a las empresas importantes ventajas competitivas.

Una referencia habitual que se suele tener en cuenta cuando se habla del valor del Big Data es el número de personas conectadas a Internet en el mundo: 3.149 millones de usuarios hiper-conectados, lo cual supone una gran bolsa de datos cuyo rendimiento aún está por estimar en muchos sectores.

Dos ‘V’ adicionales

Además de las ‘V’ mencionadas anteriormente, hay expertos que proponen incluir también otros aspectos. Como Mark Van Rijmenam, uno de los 10 influencers globales relacionados con esta temática, que asegura que deben agregarse variabilidad y visualización de los datos a las 5 ‘V’ anteriores:

La variabilidad hace referencia a la variabilidad en el significado, en el léxico. Esto es relevante a la hora de llevar a cabo análisis de percepciones. Los algoritmos deben ser capaces de comprender el contexto y descifrar el significado exacto de cada palabra en su respectivo entorno. Este análisis semántico resulta mucho más complejo.

La visualización es lograr que toda la cantidad de datos recolectados y analizados sean comprensibles y sencillos de leer. Sin una visualización adecuada, no se puede sacar el máximo rendimiento y aprovechamiento de los datos en bruto.

¿Te interesan las APIs financieras? Descubre todas las que te ofrece BBVA

También podría interesarte

Qué es una API, tipos de APIs y cómo funcionan

Una API es el mecanismo más útil para conectar dos softwares entre sí para el intercambio de mensajes o datos en formato estándar como XML o JSON. Así es como se convierte en un instrumento para buscar ingresos, abrirse al talento, innovar y automatizar procesos.

APIs , Banking as a service , Desarrollo de negocio , Transformación Digital / 18 diciembre 2023
Qué es y para qué sirve la automatización de procesos empresariales

Las APIs pueden ser un gran apoyo a la hora de automatizar procesos empresariales Las empresas, a menudo con foco en las PYMES, dedican demasiadas horas-persona a procesos empresariales que consumen un tiempo precioso, incurriendo con ello en errores que una máquina jamás tendría. ¿Cómo puede la automatización de procesos empresariales (BPA) ayudar a estas […]

APIs , Banking as a service , Transformación Digital / 07 septiembre 2023
Gestión de procesos administrativos y cómo automatizarlos con las APIs

Las APIs tienen un enorme potencial a la hora de automatizar procesos administrativos y simplificar las gestiones internas. Automatizar procesos administrativos es más fácil a medida que las APIs evolucionan y permiten más y más integración tanto a nivel interno (API privada) como externo (pública). ¿Qué puede hacer una API por la gestión interna? ¿Es […]

APIs , Banking as a service , Desarrollo de negocio , Ecosistema digital , Transformación Digital / 14 febrero 2023

Denominación	Titular	Duración	Finalidad
gobp.lang	BBVA	1 mes	Preferencia de idioma
aceptarCookies	BBVA	1 año	Configuración Cookies aceptadas
_abck	BBVA	1 año	Ayuda a protegerse contra los ataques de sitios web maliciosos
bm_sz	BBVA	4 horas	Ayuda a protegerse contra los ataques de sitios web maliciosos
ADRUM_BTs	Salesforce Marketing Cloud	Sesión	Requerido para la supervisión del servicio, inherente al SFMC
ADRUM_BT1	Salesforce Marketing Cloud	Sesión	Requerido para la supervisión del servicio, inherente al SFMC
ADRUM_BTa	Salesforce Marketing Cloud	Sesión	Requerido para la supervisión del servicio, inherente al SFMC
ADRUM_BT	Salesforce Marketing Cloud	Sesión	Requerido para la supervisión del servicio, inherente al SFMC
xt_0d95e	Salesforce Marketing Cloud	Sesión	Recordar las preferencias del usuario (si las hay)
__s9744cdb192d044faa1bf201d29fafd1e	Salesforce Marketing Cloud	Sesión	Recordar las preferencias del usuario (si las hay)
wpml_browser_redirect_test	WPML	Sesión	Traducción de textos del portal
wp-wpml_current_language	WPML	24 horas	Traducción de textos del portal

Denominación	Titular	Duración	Finalidad
AMCV_***	Adobe Analytics	Sesión	ID de visitante único que se usan en las soluciones de Marketing Cloud
AMCVS_***	Adobe Analytics	2 años	ID de visitante único que se usan en las soluciones de Marketing Cloud
demdex (safari)	Adobe Analytics	180 días	Crear y almacenar identificadores únicos y persistentes
sessionID	Adobe Analytics	Sesión	Cookie interna de Launch usada para identificar al usuario
gpv_URL	Adobe Analytics	Sesión	plugin Adobe Analytics: getPreviousValue Capturar el valor de una determinada variable en la siguiente vista de página, en este caso la prop1
gpv_level1	Adobe Analytics	Sesión	Cookie utilizada para almacenar el levl1 del DataLayer de la página anterior.
gpv_pageIntent	Adobe Analytics	Sesión	Cookie utilizada para almacenar el pageIntent de la página anterior.
gpv_pageName	Adobe Analytics	Sesión	Cookie utilizada para almacenar el pagename de la página anterior.
aocs	Adobe Analytics	Sesión	Cookie que almacena los primeros valores recogidos al inicio de un proceso.
TTC	Adobe Analytics	Sesión	Cookie usada para almacenar el tiempo transcurrido entre el evento App Page Visit y App Completed.
TTCL	Adobe Analytics	Sesión	Cookie usada para almacenar el tiempo transcurrido entre el evento LogIn y App Completed.
s_cc	Adobe Analytics	Sesión	Determinar si las cookies están activas
s_hc	Adobe Analytics	Sesión	Cookie usada por Adobe con propositos de analítica.
s_ht	Adobe Analytics	Sesión	Cookie usada por Adobe con propositos de analítica.
s_nr	Adobe Analytics	2 años	Determinar el número de visitas de usuario
s_ppv	Adobe Analytics	Persistente	plugin Adobe Analytics: getPercentPageViewed Determinar el procentaje de página que visualiza un usuario
s_sq	Adobe Analytics	Sesión	Funcionalidades ClickMap/ActivityMap
s_tp	Adobe Analytics	Sesión	Cookie usada por Adobe con propositos de analítica.
s_visit	Adobe Analytics	2 años	Cookie usada por Adobe para saber cunado una sesión se ha iniciado.

Denominación	Titular	Duración	Finalidad
OT2	VersaTag	90 días	Cookie de VersaTag usada para almacenar un id de usuario y el numero de visitas del usuario.
u2	VersaTag	90 días	Cookie de VersaTag en la que se almacena el ID del usuario
TargetingInfo 2	MediaMind	1 año	Cookie que sirve para asignar un número unico random que genera MediaMind.

Denominación	Titular	Duración	Finalidad
mbox	Adobe Target	9 días	Cookie usada por Adobe Target para hacer test de personalizacion de experencia del usuario.

Las siete ‘V’ del Big Data

Las nuevas cadenas de valor son las de los datos. Big Data es un concepto que describe el gran volumen de datos, tanto estructurados como desestructurados, que hoy por hoy inunda el mundo de los negocios. No obstante, lo más importante no es la cantidad de datos, sino lo que se hace con ellos.

Dos ‘V’ adicionales

También podría interesarte

Qué es una API, tipos de APIs y cómo funcionan

Qué es y para qué sirve la automatización de procesos empresariales

Gestión de procesos administrativos y cómo automatizarlos con las APIs